标签:开源大模型
零一万物Yi-34B:国产开源大模型的崛起与多模态未来
李开复创立的零一万物发布开源大模型Yi-34B,该模型在Hugging Face和C-Eval评测中表现优异,成为首个登顶全球开源模型排行榜的国产模型。本文探讨Yi-34B的技...
Claude Code:混合推理模型与智能体编程的新纪元
Anthropic推出的Claude 3.7混合推理模型和Claude Code智能体编程工具,标志着AI技术的又一重大突破。本文深入探讨Claude Code的功能、应用场景及其在跨平台开...
Vega-9B:开源大模型推动AI技术新浪潮
Vega-9B是一款结合图神经网络与深度学习的开源大模型,适用于高维数据解析与复杂结构推理任务。其在自然语言处理、图像识别等领域表现卓越,并通过知识图谱增...
DeepSeek引领AI平权时代:国家超算互联网平台启动“AI生态伙伴加速计划”
国家超算互联网平台推出“AI生态伙伴加速计划”,提供DeepSeek API接口免费使用和千万卡时算力资源池,助力AI技术在各行业的深入应用。DeepSeek等国产大模型有...
通义千问:阿里云开源大模型的崛起与未来展望
本文深入探讨了阿里云通义千问大模型的开源策略及其在AI领域的重要地位。文章详细介绍了通义千问的技术特点、产业应用以及阿里云在AI大模型竞赛中的领先地位...
深度求索DeepSeek V3:中国AI创新力的崛起与全球竞争新格局
2024年12月26日,深度求索发布开源大模型DeepSeek V3,其在性能和成本上均优于硅谷顶级大模型,标志着中国AI创新力的崛起。本文探讨了DeepSeek团队的研究能力...
DeepSeek V3:中国AI创新的里程碑
DeepSeek V3作为中国AI领域的最新成果,以其卓越的性能和低成本优势,成为全球生成AI市场的焦点。本文将深入探讨DeepSeek V3的技术特点、市场影响以及中国AI...
阶跃星辰开源大模型技术:Open Reasoner Zero引领AI新潮流
阶跃星辰与清华大学联合发布Open Reasoner Zero (ORZ)模型,该模型在响应长度上仅需约17%的训练步骤即可赶上DeepSeek-R1-Zero 671B。DeepSeek开源了推理模型...
开源大模型的新里程碑:DeepSeek与Qwen的技术突破
DeepSeek开源了推理模型的RL训练方法,仅需1/30的训练步骤即可达到与DeepSeek-R1-Zero相同尺寸的蒸馏Qwen模型的性能。阶跃星辰与清华大学联合发布了Open Reas...
Llama 3.2:开源大模型的新篇章与AI生态的变革
本文深入探讨了Llama 3.2在开源大模型领域的最新进展,分析了其对中国AI生态的影响,以及开源与闭源之争的未来趋势。文章还结合阿里巴巴和DeepSeek的开源实践...