多模态基础模型:AI时代的核心驱动力

AI快讯3个月前发布 admin
0 0

#

随着人工智能技术的飞速发展,多模态基础模型正成为AI时代的核心驱动力。近日,全球顶尖AI科学家许主洪正式加入阿里巴巴,出任集团副总裁,负责AI To C业务的多模态基础模型及Agents相关研究与应用解决方案。这一任命标志着阿里巴巴在AI领域的进一步深化布局,同时也展现了中国在全球AI技术竞争中的领先地位。

许主洪的加入与阿里巴巴的AI战略

许主洪是新加坡管理大学信息系统学院的终身教职,国际知名的人工智能专家,研究方向包括机器学习的基础研究和人工智能多个领域的应用研究。他的加入将进一步提升阿里巴巴在AI应用C端产品上的端到端闭环能力,并组建顶级AI算法研究和工程团队。

阿里巴巴集团CEO吴泳铭表示,未来三年,公司将投入超过3800亿元,用于建设云和AI硬件基础设施,总额超过去十年的总和。这一巨额投资将加速阿里巴巴在AI领域的创新与应用,特别是在多模态基础模型和AI To C业务上的布局。

多模态基础模型的技术突破

多模态基础模型能够同时处理文本、图像、音频和视频等多种数据类型,实现跨模态的内容生成与转换。阿里巴巴在这一领域的技术突破尤为显著:

  • 通义千问QwQ-32B:该模型在数学、代码及通用能力上整体比肩DeepSeek-R1,部署成本仅为R1的1/10。
  • 万相2.1:阿里云视频生成大模型,支持文生视频和图生视频任务,在VBench评测中以86.22%的性能领先,成为全球最受欢迎的开源模型之一。

开源策略与生态构建

阿里巴巴通过开源策略,加速了多模态基础模型的技术普惠化。以下是阿里巴巴在开源领域的主要成果:

模型名称 特点 应用场景
通义千问QwQ-32B 高性能、低成本 数学、代码、通用任务
万相2.1 文生视频、图生视频 影视、营销、教育
夸克大模型 多模态、千亿级参数 搜索、医疗健康、职场办公

AI To C业务的应用落地

阿里巴巴在AI To C业务上的布局也取得了显著进展。夸克作为阿里巴巴的AI旗舰应用,已全面升级为“AI超级框”,整合了AI对话、深度思考、深度搜索、深度研究、深度执行等功能,满足用户在工作、学习、生活中的各类AI需求。

  • 夸克AI超级框:用户输入指令后,夸克智能中枢将自动识别意图,规划梳理后调动各种不同模型和Agent模块,帮助用户完成任务。
  • 夸克大模型:基于Transformer架构,全部技术均为自研,参数规模达千亿级,应用场景包括医疗健康、教育学习和职场办公等垂直领域。

未来展望

阿里巴巴通过开源策略和技术创新,推动AI技术在C端市场的广泛应用。许主洪的加入将进一步加速阿里巴巴在AI To C业务上的技术突破与应用落地。未来,阿里巴巴将继续加大在AI基础设施、基础模型平台及AI原生应用上的投入,推动中国AI技术从“追赶”向“引领”跨越。

多模态基础模型作为AI时代的核心驱动力,将在未来的技术变革中发挥越来越重要的作用。阿里巴巴在这一领域的布局与创新,不仅展现了其技术自信,也为全球AI技术的发展提供了新的思路与方向。

© 版权声明

相关文章

暂无评论

暂无评论...