标签:开源大模型

零一万物Yi-34B:国产开源大模型的崛起与多模态未来

李开复创立的零一万物发布开源大模型Yi-34B,该模型在Hugging Face和C-Eval评测中表现优异,成为首个登顶全球开源模型排行榜的国产模型。本文探讨Yi-34B的技...

Claude Code:混合推理模型与智能体编程的新纪元

Anthropic推出的Claude 3.7混合推理模型和Claude Code智能体编程工具,标志着AI技术的又一重大突破。本文深入探讨Claude Code的功能、应用场景及其在跨平台开...

Vega-9B:开源大模型推动AI技术新浪潮

Vega-9B是一款结合图神经网络与深度学习的开源大模型,适用于高维数据解析与复杂结构推理任务。其在自然语言处理、图像识别等领域表现卓越,并通过知识图谱增...

DeepSeek引领AI平权时代:国家超算互联网平台启动“AI生态伙伴加速计划”

国家超算互联网平台推出“AI生态伙伴加速计划”,提供DeepSeek API接口免费使用和千万卡时算力资源池,助力AI技术在各行业的深入应用。DeepSeek等国产大模型有...

通义千问:阿里云开源大模型的崛起与未来展望

本文深入探讨了阿里云通义千问大模型的开源策略及其在AI领域的重要地位。文章详细介绍了通义千问的技术特点、产业应用以及阿里云在AI大模型竞赛中的领先地位...

深度求索DeepSeek V3:中国AI创新力的崛起与全球竞争新格局

2024年12月26日,深度求索发布开源大模型DeepSeek V3,其在性能和成本上均优于硅谷顶级大模型,标志着中国AI创新力的崛起。本文探讨了DeepSeek团队的研究能力...

DeepSeek V3:中国AI创新的里程碑

DeepSeek V3作为中国AI领域的最新成果,以其卓越的性能和低成本优势,成为全球生成AI市场的焦点。本文将深入探讨DeepSeek V3的技术特点、市场影响以及中国AI...

阶跃星辰开源大模型技术:Open Reasoner Zero引领AI新潮流

阶跃星辰与清华大学联合发布Open Reasoner Zero (ORZ)模型,该模型在响应长度上仅需约17%的训练步骤即可赶上DeepSeek-R1-Zero 671B。DeepSeek开源了推理模型...

开源大模型的新里程碑:DeepSeek与Qwen的技术突破

DeepSeek开源了推理模型的RL训练方法,仅需1/30的训练步骤即可达到与DeepSeek-R1-Zero相同尺寸的蒸馏Qwen模型的性能。阶跃星辰与清华大学联合发布了Open Reas...

Llama 3.2:开源大模型的新篇章与AI生态的变革

本文深入探讨了Llama 3.2在开源大模型领域的最新进展,分析了其对中国AI生态的影响,以及开源与闭源之争的未来趋势。文章还结合阿里巴巴和DeepSeek的开源实践...
1 3 4 5 6