开源大模型 | 第 5 页

零一万物Yi-34B：国产开源大模型的崛起与多模态未来

李开复创立的零一万物发布开源大模型Yi-34B，该模型在Hugging Face和C-Eval评测中表现优异，成为首个登顶全球开源模型排行榜的国产模型。本文探讨Yi-34B的技...

AI快讯

3个月前

Anthropic推出的Claude 3.7混合推理模型和Claude Code智能体编程工具，标志着AI技术的又一重大突破。本文深入探讨Claude Code的功能、应用场景及其在跨平台开...

AI快讯

3个月前

Vega-9B是一款结合图神经网络与深度学习的开源大模型，适用于高维数据解析与复杂结构推理任务。其在自然语言处理、图像识别等领域表现卓越，并通过知识图谱增...

AI快讯

3个月前

国家超算互联网平台推出“AI生态伙伴加速计划”，提供DeepSeek API接口免费使用和千万卡时算力资源池，助力AI技术在各行业的深入应用。DeepSeek等国产大模型有...

AI快讯

3个月前

本文深入探讨了阿里云通义千问大模型的开源策略及其在AI领域的重要地位。文章详细介绍了通义千问的技术特点、产业应用以及阿里云在AI大模型竞赛中的领先地位...

AI快讯

3个月前

2024年12月26日，深度求索发布开源大模型DeepSeek V3，其在性能和成本上均优于硅谷顶级大模型，标志着中国AI创新力的崛起。本文探讨了DeepSeek团队的研究能力...

AI快讯

3个月前

DeepSeek V3作为中国AI领域的最新成果，以其卓越的性能和低成本优势，成为全球生成AI市场的焦点。本文将深入探讨DeepSeek V3的技术特点、市场影响以及中国AI...

AI快讯

3个月前

阶跃星辰与清华大学联合发布Open Reasoner Zero (ORZ)模型，该模型在响应长度上仅需约17%的训练步骤即可赶上DeepSeek-R1-Zero 671B。DeepSeek开源了推理模型...

AI快讯

3个月前

DeepSeek开源了推理模型的RL训练方法，仅需1/30的训练步骤即可达到与DeepSeek-R1-Zero相同尺寸的蒸馏Qwen模型的性能。阶跃星辰与清华大学联合发布了Open Reas...

AI快讯

3个月前

本文深入探讨了Llama 3.2在开源大模型领域的最新进展，分析了其对中国AI生态的影响，以及开源与闭源之争的未来趋势。文章还结合阿里巴巴和DeepSeek的开源实践...

AI快讯

3个月前