所有AI工具AI学习网站AI开发框架AI编程工具

QwQ-32B官网 – 阿里开源的高效推理模型

QwQ-32B 是阿里云 Qwen 团队开发的开源推理模型,基于 Qwen 系列,专注于提升 AI 的推理能力。该模型在数学推理和编码任务中表现突出,性能可能与 DeepSeek R1 相当,甚至在某些基...

标签:

AI交流(进群备注:QwQ-32B)

QwQ-32B 是阿里云 Qwen 团队开发的开源推理模型,基于 Qwen 系列,专注于提升 AI 的推理能力。该模型在数学推理和编码任务中表现突出,性能可能与 DeepSeek R1 相当,甚至在某些基准测试中超过 OpenAI 的 o1-mini。模型通过强化学习技术,能够自我检查答案并形成关键“思考习惯”,支持长上下文处理(最多 131,072 tokens)。QwQ-32B 对本地算力要求较低,仅需 4 张 NVIDIA 4090 GPU 即可运行,适合普通企业和开发者使用。

QwQ-32B的特点:

  • 1. 因果语言模型(Causal Language Models)
  • 2. 参数数量总计 32.5 亿,非嵌入参数 31.0 亿
  • 3. 支持长上下文处理,最多 131,072 tokens
  • 4. 通过 YaRN 技术优化长输入处理
  • 5. 适合数学问题和多项选择题

QwQ-32B的功能:

  • 1. 生成深思熟虑的输出,适合数学问题和多项选择题
  • 2. 支持长输入处理,通过 YaRN 技术优化
  • 3. 推荐设置:温度(Temperature)0.6,TopP 0.95,MinP 0,TopK 20-40,存在惩罚(presence_penalty)0-2
  • 4. 确保模型输出以 “\n” 开始,使用 apply_chat_template 并设置 add_generation_prompt=True
  • 5. 长输入需在 config.json 中添加特定配置,支持 vLLM 部署

相关导航

暂无评论

暂无评论...