LeNLP是一个为Python开发的自然语言处理工具箱,旨在通过Rust优化提升性能,集成高性能并行化功能,从而简化Python中的各种NLP任务。
tf-transformers是基于Tensorflow 2.0实现的最先进的自然语言处理架构,旨在提供更快的自动递归译码,支持多种前沿的NLP模型,如BERT、RoBERTA、T5、Albert和mt5等。其设计简化了API,便于用户使用和扩展,适合各种NLP任务。
深言科技联合清华大学NLP实验室开源的语鲸-8B模型,其能力大致介于ChatGLM2和3之间。该模型支持多种自然语言处理任务,适用于各种应用场景。
Sweephy是一个无代码的数据清洗、准备和机器学习平台,帮助企业从原始数据中获取价值。它专注于为各种业务案例开发定制解决方案,并提供本地安装选项以增强数据隐私。
LLaMa2Lang是一个用于微调LLaMa2-7b模型的工具,旨在提升其在非英语语言中的对话能力。由于LLaMa2模型主要基于英语数据进行训练,因此在其他语言上的表现较差。本项目旨在改善这一问题,使LLaMa2能够更好地处理各种语言的对话需求。
DB-GPT是一款AI原生数据应用开发框架,支持本地化部署,不依赖外部服务器或云服务,确保数据隐私和安全性。它具备多模型管理、Text2SQL效果优化、RAG框架优化、Multi-Agents框架协作等功能,助力企业数字化转型与业务增长。DB-GPT在自然语言转SQL准确率达92.8%,并在TPC-H基准测试中超越GPT-4大模型。
WordLlama是一个快速、轻量的自然语言处理工具包,能够处理模糊去重、相似度评估和排名任务,优化了CPU硬件并且具有最小的推理时间依赖性。
EurekaLabsAI的n-gram语言模型:基于统计学原理的文本生成工具,通过学习字符序列的概率分布来生成新文本,适用于自然语言处理和机器学习的基础训练。
TigerBot 是一个基于 BLOOM 的多语言多任务大规模语言模型(LLM),在模型架构和算法上进行了多项优化,旨在提供高效的自然语言处理能力,支持多种语言和任务,具有强大的可扩展性。
TinyLLaMA是一个专为轻量语言模型设计的开源框架,为开发者提供在资源受限环境下构建高效模型的工具。