AI交流(进群备注:rStar)

微软推出的数学推理项目,旨在展示小型语言模型(SLM)在数学推理方面可以通过自我演化的深度思考(Deep Thinking)过程达到与大型模型相当甚至更好的性能。
rStar的特点:
1. 基于蒙特卡洛树搜索(MCTS)算法
2. 结合了SLM的策略模型和奖励模型
3. 支持在没有从优化模型中获得指导的情况下进行自我演化
4. 提升数学问题解决能力
rStar的功能:
1. 使用rStar进行数学推理任务
2. 结合SLM模型进行深度思考的研究
3. 探索小型模型在复杂数学问题上的应用
相关导航
暂无评论...