TURN 是一种用于优化大型语言模型(LLMs)温度参数的方法,旨在提高数学问题求解和代码生成等任务的性能。它通过分析生成文本的熵拐点来自适应地选择最佳温度,无需特定验证数据,高效且有效。TURN 在多样本推理场景中表现出色,特别是在数学问题(如 MATH 数据集)和代码生成任务(如 MBPP 数据集)上。