开源AI模型 | AI-magic

DeepSeek-R1：开源AI模型的革命性突破与英伟达的挑战

DeepSeek-R1的开源推理模型在海外引发巨大反响，甚至导致英伟达单日市值蒸发近6000亿美元。这一创新不仅为AI领域注入新活力，还可能打破英伟达在AI硬件市场的...

AI快讯

3个月前

DeepSeek-V3是一款采用混合专家架构的低成本高效率AI大模型，其在推理能力、训练效率和成本控制方面表现出色。本文详细解析了DeepSeek-V3的技术创新、性能优...

AI快讯

3个月前

DeepSeek-R1 是一款由中国杭州深度求索公司开发的高性能AI推理模型，专注于数学、代码和自然语言推理任务。在SWE-bench基准测试中，DeepSeek-R1 以49.2%的得...

AI快讯

3个月前

DeepSeek-R1 是由中国杭州深度求索公司开发的高性能AI推理模型，专注于数学、代码和自然语言推理任务。通过强化学习技术训练，该模型在多个基准测试中表现出...

AI快讯

3个月前

DeepSeek-R1 是由中国杭州深度求索公司开发的高性能AI推理模型，专注于数学、代码和自然语言推理任务。该模型通过强化学习技术进行训练，并在AIME 2024等基准...

AI快讯

3个月前

本文深入探讨了开源AI模型LLaMA与Ollama的区别与应用场景，介绍了如何通过Ollama平台快速部署和管理大型语言模型，并提供了实际操作指南。文章还讨论了AI模型...

AI快讯

3个月前

Llama 3.1作为Meta公司推出的开源AI模型，凭借其高效能和多领域应用潜力，成为AI技术发展的新里程碑。本文将探讨Llama 3.1的技术特点、鸿海基于Llama 3.1开发...

AI快讯

3个月前

本文探讨了Meta最新发布的Llama 3开源AI模型，特别是其增强的语音功能和对多语言的支持。文章还分析了Meta在AI领域的战略布局，以及全球AI技术的发展趋势和未...

AI快讯

3个月前

Meta即将发布的Llama 4模型将专注于语音功能，支持多模态数据处理，并借鉴中国AI实验室DeepSeek的成功经验。全球约7,000种语言的多样性为AI模型提供了广阔的...

AI快讯

3个月前

苹果公司作为DataComp-LM项目的研究机构之一，发布了DCLM-7B开源模型，性能超越Mistral-7B，并逼近Llama 3和Gemma。该模型不仅开源权重，还提供训练代码和数...

AI快讯

3个月前