标签:月之暗面
从Long2Short技术看中国AI大模型的自主创新之路
中国AI大模型创业公司月之暗面和深度求索在技术创新上取得重大突破,尤其是月之暗面的Kimi k1.5模型通过Long2Short技术显著提升了推理效率。这一技术不仅超越...
Kimi k1.5:中国AI大模型的新里程碑
月之暗面发布的Kimi k1.5多模态思考模型在多个任务上大幅超越全球领先模型,标志着中国AI技术迈向自主创新的新阶段。本文将深入探讨Kimi k1.5的技术突破、应...
多模态与长文本推理:月之暗面Kimi的AI技术革新之路
月之暗面凭借Kimi大模型在AI领域崭露头角,专注于多模态和长文本推理能力。2025年,该公司计划通过强化学习进一步提升SOTA结果,推动AI技术的创新与落地。本...
DeepSeek冲击波下的大模型洗牌:AGI时代的挑战与机遇
在DeepSeek的冲击下,大模型行业面临洗牌,头部企业如百川智能和月之暗面纷纷调整战略。与此同时,金融科技和智能家居领域也在加速智能化升级,AGI(人工通用...
Kimi智能助手:引领大模型长文本处理的新时代
随着国内AI大模型产品的密集发布,Kimi智能助手凭借其卓越的长文本处理能力,成为行业焦点。华泰证券指出,长上下文支持能力是大模型的重要迭代方向,Kimi智...
Kimi k1.5:多模态AI的革新与突破
月之暗面发布的Kimi k1.5多模态模型在数学、代码和多模态推理能力上全面对标OpenAI的o1模型,并通过long2short方法、强化学习技术创新等显著提升了性能。本文...
Kimi k1.5长思考模型:AI技术的新里程碑
月之暗面推出的Kimi k1.5长思考模型,以其128k的上下文长度和强大的AI生成能力,标志着AI技术的新突破。尽管目前暂不支持API调用,但其在图片理解和自动上下...
MaaS浪潮席卷AI大模型:DeepSeek引领行业变革,初创企业如何破局?
随着AI大模型技术的快速发展,模型即服务(MaaS)正成为行业主流趋势。DeepSeek凭借低成本、高性能的推理模型迅速崛起,对月之暗面等初创企业带来巨大冲击。...
月之暗面强化学习战略:多模态与长文本推理的未来布局
月之暗面将“持续拿到SOTA结果”作为核心目标,并计划在2025年强化多模态和长文本推理能力。面对DeepSeek的竞争,月之暗面可能将强化学习作为重点方向,探索闭...
月之暗面技术创新:Muon优化器助力大规模预训练模型突破
月之暗面团队通过改进Muon优化器,成功将其应用于大规模预训练模型,显著降低算力需求并提升模型性能。这一技术突破不仅验证了Muon在大规模训练中的可行性,...
1
2