标签:Safe-RLHF

Safe-RLHF:大模型对齐技术的新里程碑

北京大学对齐小组团队在强化学习方法及大模型的后训练对齐技术方面取得了一系列重要成果,包括Aligner、ProgressGym和Safe-RLHF等。近期,该团队对OpenAI的o1...

北京大学对齐小组:大模型对齐技术的前沿探索与突破

北京大学对齐小组团队在强化学习方法及大模型的后训练对齐技术方面取得了一系列重要成果,包括Aligner、ProgressGym和Safe-RLHF等。近期,该团队对OpenAI的o1...