标签：Safe-RLHF

Safe-RLHF：大模型对齐技术的新里程碑

北京大学对齐小组团队在强化学习方法及大模型的后训练对齐技术方面取得了一系列重要成果，包括Aligner、ProgressGym和Safe-RLHF等。近期，该团队对OpenAI的o1...

AI快讯

3个月前

北京大学对齐小组团队在强化学习方法及大模型的后训练对齐技术方面取得了一系列重要成果，包括Aligner、ProgressGym和Safe-RLHF等。近期，该团队对OpenAI的o1...

AI快讯

3个月前

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。