2024年3月6日,阿里云通义千问正式发布了全新的推理模型QwQ-32B。这款模型仅有320亿参数,但其性能却可与拥有6710亿参数的DeepSeek-R1相媲美,展现了小模型大智慧的技术突破。QwQ-32B的推出不仅为资源有限的开发者提供了新的选择,更在推理能力、部署成本和开源生态上树立了新的标杆。
性能卓越:小模型也能比肩巨无霸
QwQ-32B在多项权威评测中表现优异:
-
在数学推理的AIME24评测集和编程能力的LiveCodeBench测试中,QwQ-32B与DeepSeek-R1表现相当,远超o1-mini及相同尺寸的R1蒸馏模型。
-
在Meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench、谷歌提出的指令遵循能力IFEval评测集以及加州大学伯克利分校提出的BFCL测试中,QwQ-32B甚至超越了DeepSeek-R1,展现出全面的优势。
这些成绩得益于阿里云通义团队在QwQ-32B上实施的大规模强化学习(RL)训练。模型针对数学和编程任务进行两轮RL训练,基于校验答案正确性和代码执行结果评估反馈,显著提升了推理能力。
部署便捷:消费级硬件也能轻松运行
QwQ-32B不仅性能强劲,还大幅降低了部署成本。用户可在消费级显卡上实现本地部署,极大降低了硬件门槛。通过Ollama平台,开发者仅需两条命令即可快速启动QwQ-32B:
-
安装Ollama:
curl -fsSL https://ollama.com/install.sh | sh
-
启动QwQ-32B:
ollama run qwq
此外,Java开发者还可通过Spring AI Ollama将QwQ-32B集成到自己的应用中,进一步拓展其应用场景。
开源生态:推动AI技术普惠化
阿里云采用Apache 2.0开源协议,将QwQ-32B模型免费向全球开放。开发者可通过Hugging Face、ModelScope等平台下载并使用该模型,甚至将其用于商业用途。截至目前,通义千问的衍生模型数量已突破10万,成为全球最大的开源模型族群。
未来展望:探索更高智能
QwQ-32B的发布是阿里云通义团队在大规模强化学习增强推理能力方面的第一步。未来,阿里云计划将更强大的基础模型与规模化计算资源相结合,探索智能体与强化学习的集成,以实现长时推理,推动人工通用智能(AGI)的发展。
用户体验:通义App全面升级
QwQ-32B已接入通义App和网页版,用户可通过“Qwen-QwQ-32B”智能体入口直接体验其强大功能。通义App还新增了拍照讲题等实用功能,进一步丰富了智能体生态,为用户带来更高效的生活、办公和学习体验。
阿里云通义千问QwQ-32B的推出,不仅展现了小模型在性能上的巨大潜力,更为AI技术的普惠化和应用落地提供了新的可能。未来,随着强化学习和智能体技术的深入探索,QwQ-32B及其后续版本将继续推动AI技术迈向新的高度。