Warning: Undefined variable $main_title in /www/wwwroot/msbd/wp-content/themes/onenav/sidebar-sitestop.php on line 26
AI交流(进群备注:)

TongGu-LLM 是一个由华南理工大学深层学习与视觉计算实验室(SCUT-DLVCLab)开发的大型语言模型,专注于古典中文的理解和处理。该模型基于 Baichuan2-7B-Base 模型,通过多阶段指令微调和冗余感知调整(RAT)方法,增强了与古典中文相关的下游任务性能。其训练数据包括2.41亿个古典中文文本和400万古典中文对话数据,功能涵盖古文标点、翻译、赏析和诗词创作,适用于非商业研究。
TongGu-LLM的特点:
- 1. 基于 Baichuan2-7B-Base 模型,在2.41亿个古典中文文本上进行无监督增量预训练
- 2. 在400万古典中文对话数据上进行指令微调
- 3. 功能包括古文标点、成语解释、古典与现代中文互译以及古诗创作
- 4. 在古典中文理解和处理任务上超越现有模型
- 5. 采用 Redundancy-Aware Tuning (RAT) 方法,防止灾难性遗忘
- 6. 提出 CCU Retrieval-Augmented Generation (CCU-RAG) 技术,减少幻觉生成
TongGu-LLM的功能:
- 1. 古文标点和注释
- 2. 古典与现代中文的互译
- 3. 古文赏析
- 4. 诗词创作
- 5. 辅助古籍研究,智能识别和修复古籍中的文字错误
- 6. 生成教案、教学PPT或设计课堂互动环节
- 7. 快速检索和分析古籍内容
相关导航
暂无评论...