AI交流(进群备注:llama-chunk-基于Llama)

一个基于Llama-70B的创新文本分块策略,针对RAG应用优化,使用中文字符’段’作为特殊标记,实现自动语义分块。
llama-chunk的特点:
1. 使用中文字符’段’作为特殊标记
2. 自动进行语义分块,无需正则表达式或人工规则
3. 在法律文本基准上表现优于传统naive方法和语义分块方法
4. 更高的检索率和信噪比
llama-chunk的功能:
1. 对法律文本进行高效的语义分块
2. 在RAG应用中优化文本处理
3. 为大模型提供自动化的文本分块解决方案
相关导航

adapter-transformers开源项目 – 轻量级Transformer适配器工具库
adapter-transformers是一个开源工具库,支持在Transformer模型中添加和训练适配器(Adapter)。适配器是一种轻量级的模块,可以在不修改原始模型参数的情况下,对模型进行微调。该工具库支持多种任务,包括文本分类、命名实体识别等,并且可以与Hugging Face的Transformers库无缝集成。它提供了统一的接口,支持高效微调和模块化迁移学习,支持多种适配器方法,如Bottleneck Adapters、AdapterFusion、LoRA等,并支持适配器合并和组合,为NLP任务的参数高效迁移学习提供了强大的工具。
暂无评论...