开源大模型竞赛：中国DeepSeek引领全球AI新潮流

0 0

开源大模型：全球AI竞赛的新焦点

近年来，开源大模型在全球人工智能领域掀起了一股新的技术浪潮。中国人工智能初创公司DeepSeek推出的开源大模型DeepSeek-V2.5和DeepSeek-V3，凭借其卓越的性能和技术创新，成为这一领域的领军者。与此同时，前谷歌首席执行官埃里克·施密特在巴黎的AI行动峰会上发出警告，呼吁西方国家加大对开源AI技术的投入，以免在全球竞赛中落后。

开源大模型竞赛：中国DeepSeek引领全球AI新潮流

DeepSeek的技术突破

DeepSeek-V2.5是DeepSeek推出的一个重要版本，它成功融合了通用对话能力和代码处理能力，在多个评测集上表现优异。例如，在中文和英文的通用能力评测中，DeepSeek-V2.5的表现均优于前代版本，并在安全性和代码生成能力上实现了显著提升。此外，DeepSeek-V2.5在HumanEval Python和LiveCodeBench等测试中展现了强大的代码处理能力，为用户带来了更智能、高效的使用体验。

随后推出的DeepSeek-V3更是将技术推向新的高度。作为自研的MoE模型，DeepSeek-V3拥有671B参数，在多项评测中超越了其他开源模型，如Qwen2.5-72B和Llama-3.1-405B，并与GPT-4o和Claude-3.5-Sonnet等顶尖闭源模型不相上下。在长文本处理、代码生成和数学能力等方面，DeepSeek-V3均表现优异，尤其是在算法类代码场景中，其表现远超其他非o1类模型。

开源大模型竞赛：中国DeepSeek引领全球AI新潮流

开源精神与全球AI格局

DeepSeek的成功不仅在于其技术实力，更在于其坚定的开源精神。DeepSeek-V2.5和DeepSeek-V3均已在HuggingFace平台开源，为全球开发者提供了强大的工具和资源。这种开源策略不仅推动了技术的普及，也为全球AI社区的发展注入了新的活力。

然而，西方国家对开源AI技术的投入相对不足。埃里克·施密特指出，美国大部分顶级AI大语言模型，如谷歌的Gemini、Anthropic的Claude和OpenAI的GPT-4，都是闭源的。这种闭源策略虽然保护了商业利益，但也可能限制技术的传播和科研进展。施密特强调，如果西方国家不对开源技术进行投资，可能会在全球AI竞赛中逐渐落后。