标签:月之暗面

长文本推理的革新:月之暗面与DeepSeek的技术竞逐

月之暗面与DeepSeek在长文本推理领域展开激烈竞争,双方分别提出MoBA和NSA注意力机制,旨在提升大语言模型处理长上下文的能力。月之暗面计划加强多模态和强化...

月之暗面与DeepSeek:多模态与长文本推理的技术竞争

月之暗面将“持续拿到SOTA结果”作为核心目标,并计划在2025年加强多模态和长文本推理能力。与DeepSeek在闭源与开源、预训练与蒸馏技术等方面的差异,引发了业...

长文本推理能力的突破:DeepSeek与月之暗面的技术革新

本文探讨了DeepSeek与月之暗面在长文本推理能力上的技术突破,重点关注其注意力机制的创新。通过分析NSA与MoBA架构,揭示了这两家公司在AI大模型领域的技术竞...

强化学习与多模态技术:月之暗面公司的未来布局

月之暗面公司将强化学习作为重要方向,并计划在2025年继续强化多模态和长文本推理能力。本文探讨了多模态技术的应用场景及其与强化学习的结合,为人工智能的...

月之暗面与DeepSeek的SOTA之争:技术为王还是商业化先行?

月之暗面在DeepSeek的冲击下,将“持续拿到SOTA结果”作为核心目标,计划强化多模态和长文本推理能力。本文探讨了月之暗面与DeepSeek在技术路线与商业化策略上...

月之暗面聚焦SOTA:AI大模型的技术突围之路

月之暗面将“持续拿到SOTA结果”作为核心目标,计划在2025年强化多模态和长文本推理能力,以应对DeepSeek等竞争对手的挑战。本文探讨其技术战略与行业影响。

注意力机制与大模型:国产AI研究的新突破

深度求索最新论文探讨注意力机制对大模型的影响,创始人梁文锋署名,第一作者为北大硕士袁景阳。同时,国内大模型独角兽“月之暗面”对马斯克的大模型思路提出...

月之暗面仲裁风波与技术创新:AI大模型公司的挑战与机遇

月之暗面因创始人杨植麟和联合创始人张宇韬在未获循环智能投资方同意豁免书的情况下启动融资并创立公司,被循环智能及其投资方在香港提起仲裁。本文探讨了仲...
1 2