开源大模型 | AI-magic

Aurora-6B：开源大模型在多任务与跨领域中的创新应用

Aurora-6B 是一款突破性的开源大模型，专为解决多任务和跨领域挑战而设计。它具备自适应训练机制，能够在自然语言处理、计算机视觉和语音识别等领域表现出色...

AI快讯

4个月前

DeepSeek R1作为一款开源推理模型，凭借其创新的GRPO算法和极低的算力消耗，彻底颠覆了大模型训练的技术逻辑。它不仅推动了中国在大模型领域的领先地位，还为...

AI快讯

4个月前

DeepSeek R1作为一款开源大模型，凭借MoE架构、MLA多头潜在注意力机制和MTP多令牌预测等创新技术，实现了低算力下的高效推理能力。其开源策略不仅推动了AI行...

AI快讯

4个月前

商汤科技推出的LazyLLM，是一款开源低代码大模型应用开发框架，旨在通过极简代码快速构建复杂多Agent应用，降低AI应用开发门槛。本文将深入探讨LazyLLM的核心...

AI快讯

4个月前

本文探讨了腾讯接入DeepSeek大模型后对搜索业务和广告收入的深远影响，分析了各大科技公司在AI大模型领域的竞争格局。文章还深入解读了微信作为超级AI平台的...

AI快讯

4个月前

本文深入探讨了梁文锋从量化投资到AI技术领域的创业历程，详细介绍了其创立的DeepSeek如何在开源大模型领域实现技术突破，并分析了其对中国AI产业的影响。文...

AI快讯

4个月前

DeepSeek作为中国AI领域的新星，凭借其创新的技术和成本优势，正在挑战OpenAI的霸主地位。本文深入探讨了DeepSeek的技术背景、发展历程及其在AI领域的影响力...

AI快讯

4个月前

本文探讨了AI技术如何通过推理AI和开源大模型实现超摩尔定律的突破。文章分析了英伟达Blackwell架构的革新、DeepSeek R1的开源影响，以及大模型研发成本的降...

AI快讯

4个月前

DeepSeek创始人梁文锋凭借其量化投资背景和AI技术积累，带领团队推出萤火一号AI集群，为DeepSeek大模型的崛起奠定算力基础。萤火一号不仅助力DeepSeek在全球A...

AI快讯

4个月前

本文探讨了全球人工智能领域的竞争格局，重点关注中国和美国在AI研究和应用方面的表现。中国在AI研究出版物数量上领先，但在影响力和私营部门参与方面落后于...

AI快讯

4个月前