一个自然语言处理任务与实例集,提供多种NLP任务的实现和示例。
bricks是一个模块化的自然语言处理工具,包含分类器、提取器和生成器等众多基础模块,支持多种NLP任务,具有开源和易于扩展的特点。
Jlama是一个纯Java实现的大规模语言模型推理引擎,支持多种模型格式,能够提供高性能和低内存占用,易于集成到各种应用中。
transformers_zamba2是一个为自然语言处理打造的先进工具库,提供数千个预训练模型,支持文本分类、问答、翻译等多种语言任务,让NLP技术更易用。该库不仅可以处理文本数据,还支持视觉和音频模态,适用于多种应用场景。
PatrickStar使得更大、更快、更环保的预训练模型在自然语言处理领域成为可能,推动AI的普及。
一个包含多种自然语言处理教程的项目,涵盖了Transformer等模型的实现和应用。
该项目旨在展示如何在中文环境中使用Transformers库进行自然语言处理(NLP)任务,提供了丰富的示例和详细的文档,以帮助用户理解和应用相关技术。
只依赖pytorch、transformers、numpy、tensorboardX,专注于文本分类、序列标注的极简自然语言处理工具包
Cybertron是一个纯Go语言包,为前沿的自然语言处理(NLP)技术提供了简单易用的接口,支持多种预训练模型,具备高性能的文本处理能力,易于集成到现有的Go项目中。
海外中文开源大语言模型,基于 Llama-7B, -13B, -33B, -65B 进行中文领域上的持续预训练,使用了接近15M条数据,并针对推理能力在中文benchmark上进行了评测。
Flair是一个非常简单的框架,旨在提供最先进的自然语言处理技术,支持多种预训练模型,并拥有简单易用的API,适用于多种语言的文本处理,同时可以与其他深度学习框架(如PyTorch)无缝集成。
Linly是基于Falcon模型的增强版本,通过扩充中文词表并在中英文数据上进行增量预训练,旨在提升自然语言处理任务的效果。
ark-nlp是一个旨在收集和复现学术与工作中常用的自然语言处理模型的平台,支持多种NLP任务,并提供丰富的预训练模型,适合研究人员和开发者使用。
该项目是Azure OpenAI服务的示例代码库,旨在补充OpenAI的食谱,展示如何使用Azure OpenAI服务,涵盖多种使用场景,如文本生成和对话系统,提供易于理解的文档和示例,支持多种编程语言和框架。
基于预训练语言模型的零样本和少样本NLP的教程,提供了一系列的示例和实用工具,用于帮助研究人员和工程师理解和应用这些技术。
Transformers.js 是一个 JavaScript 库,允许用户在浏览器中直接运行预训练的 Transformer 模型,支持自然语言处理、计算机视觉、音频处理和多模态任务。它使用 ONNX Runtime 在浏览器中高效运行模型,并支持将 PyTorch、TensorFlow 或 JAX 模型转换为 ONNX 格式。
该项目集成了基于 transformers 库实现的多种自然语言处理任务,支持用户使用各种预训练模型,进行文本分类、生成、命名实体识别、机器翻译等操作,并且允许用户自定义数据集,易于使用和扩展。
Graph4NLP是一个库,旨在简化图神经网络在自然语言处理中的应用,支持多种任务和模型的灵活使用。
TaiChi是一个开源库,专注于少样本学习,可以支持多种自然语言处理任务,具有灵活的API设计和强大的可扩展性,适合研究者和开发者使用。
Sweephy是一个无代码的数据清洗、准备和机器学习平台,帮助企业从原始数据中获取价值。它专注于为各种业务案例开发定制解决方案,并提供本地安装选项以增强数据隐私。
Pocket LLM是一个平台,旨在使复杂的大语言模型和其他先进的人工智能技术对所有人都可访问。它提供定制化、私密的人工智能解决方案,这些解决方案在普通硬件上训练,具有超低延迟推理,消除了对GPU、TPU或定制ASIC的需求。用户可以在没有高级配置或GPU的情况下,仅使用CPU构建和部署数十亿参数的模型。
Giti.AI是一个强大的语言模型,能够生成模仿人类写作的文本,适用于文本摘要、问答和文本生成等多种自然语言处理任务。其关键特性是能够理解提示的上下文,并生成个性化的响应。
OpenChatKit是一个开源项目,提供强大的基础以创建专用和通用的聊天机器人,适用于各种应用场景。
Sonar是一个社交数据洞察平台,通过自动化社交聆听和机器学习驱动的语义分析,帮助用户揭示社交媒体数据背后的意义。它能够判断情感,分类文本为正面、负面或中性,并分析单词和短语之间的关系。
EnergeticAI是为无服务器功能优化的TensorFlow.js,提供快速冷启动、小模块大小和预训练模型,非常适合在Node.js应用中集成开源AI。