START(Self-Taught Reasoner with Tools)是一种创新型大型语言模型,通过整合外部工具(如 Python 解释器)提升其推理能力。它采用“Hint-infer”和“Hint-RFT”技术,自学如何更有效地使用这些工具,从而在科学问答、数学问题解决和代码生成等任务中表现出色。特别是在博士级科学问答 GPQA 和竞赛级数学基准测试中表现优异,成绩达到或超过现有开源模型的最新水平。