Warning: Undefined variable $main_title in /www/wwwroot/msbd/wp-content/themes/onenav/sidebar-sitestop.php on line 26
AI交流(进群备注:)

该项目基于Pleias-350m多语言基础模型,采用强化学习中的Group Relative Policy Optimization (GRPO)方法优化诗歌生成效果。
模型支持英语、法语等8种欧洲语言的诗歌创作,无需额外指令微调即可生成结构合理、重复率低的诗歌。
通过GRPO方法动态评估生成质量,在减少计算资源消耗的同时提升诗歌的韵律和语言流畅性。
RL_Reasoning_Writing_GRPO_on_base的特点:
- 1. 基于350M参数的Pleias-350m多语言基础模型
- 2. 采用GRPO强化学习方法优化生成效果
- 3. 支持8种欧洲语言的零样本诗歌生成
- 4. 自动减少文本重复并改善诗歌结构
- 5. 可在CPU环境部署,无需GPU压缩损失
- 6. 训练数据来自公共领域文学作品
RL_Reasoning_Writing_GRPO_on_base的功能:
- 1. 多语言创意写作辅助工具(如英语/法语诗歌生成)
- 2. 教育场景中的跨语言文学创作教学
- 3. 数字人文领域的自动化诗歌分析
- 4. 结合RAG技术构建文学知识问答系统
- 5. 低资源环境下的轻量级文本生成实验
- 6. 参数建议:温度0-0.3,重复惩罚1.1-1.2
相关导航
暂无评论...