标签:多模态

长文本推理的革新:月之暗面与DeepSeek的技术竞逐

月之暗面与DeepSeek在长文本推理领域展开激烈竞争,双方分别提出MoBA和NSA注意力机制,旨在提升大语言模型处理长上下文的能力。月之暗面计划加强多模态和强化...

月之暗面与DeepSeek:多模态与长文本推理的技术竞争

月之暗面将“持续拿到SOTA结果”作为核心目标,并计划在2025年加强多模态和长文本推理能力。与DeepSeek在闭源与开源、预训练与蒸馏技术等方面的差异,引发了业...

2024年AI生成模型的前沿进展与未来展望

2024年AI生成模型领域取得重大突破,涵盖大语言模型、图像生成、多模态与智能体等技术。OpenAI、Claude、xAI等公司推动技术发展,DeepSeek CEO梁文峰强调开源...

大模型与运维场景的深度融合:新炬网络的创新实践

新炬网络通过集成大语言模型、人工智能代理、检索增强生成及多模态技术,构建大模型智能平台,结合ITIL4、ITSS、AIOps等运维理论,推出金融科技数字员工解决...

月之暗面聚焦SOTA:AI大模型的技术突围之路

月之暗面将“持续拿到SOTA结果”作为核心目标,计划在2025年强化多模态和长文本推理能力,以应对DeepSeek等竞争对手的挑战。本文探讨其技术战略与行业影响。
1 2