InternLM 是一个高效的语言模型开源平台,旨在为开发者提供构建高性能模型的便捷工具,支持从研究到应用的完整生命周期。最新版本书生·浦语2.0(InternLM2)经过2.6万亿token高质量语料训练,包含7B及20B两种参数规格,支持超长上下文和优秀的数学推理能力。
该项目汇集了多个开源的中文预训练语言模型及其对应的指令数据集,旨在为中文自然语言处理提供丰富的资源。
Qwen是阿里通义千问开源的多语言处理框架,支持多种自然语言处理任务,提供高效的模型推理和友好的用户接口。它兼容多种开发环境,旨在为开发者提供高效构建语言模型的工具,支持广泛的语言覆盖与任务适配,帮助解决全球化场景下的文本处理需求。最新的720亿参数版Qwen-72B和Qwen-72B-Chat在多个任务上超越LLaMA2-70B和GPT系列模型。
这是复旦大学王一老师开源的一个高效GPT实现,经过2.5年的努力,旨在单个GPU上成熟且高度优化。
llama4micro是一个在单片机上运行的LLaMA模型,专为资源受限的环境设计,支持15M参数模型,内存占用约60MB,能够以每秒约2.5个token的速度生成文本,特别适合生成小故事,优化用于单片机平台。
项目描述:表格+大型语言模型(LLM)相关论文整理,汇集了大量关于如何利用大型语言模型处理表格数据的论文,涵盖表格问答、表格到文本、文本到SQL等多种任务,为研究人员提供了一个全面的资源库。
该项目演示了如何使用HuggingFace和DeepSpeed对EleutherAI的GPT-Neo模型进行微调,以生成Netflix电影描述,整个过程仅需47行代码,便于实现高效的文本生成。
Maya是一款能够理解和生成多种语言的文本和图像内容的大型语言模型,特别适合需要跨语言交互的应用场景。
Nanbeige-16B(南北阁-16B)是南北阁大模型实验室研发的160亿参数规模的大语言模型,采用了2.5T Tokens进行预训练,数据包含大量互联网高质量语料、各类书籍、代码等领域脱敏文本,在各个权威测评数据集上都取得了不错的效果。本次发布包含有 Base、Chat 以及扩展上下文长度的 Base-32k、Chat-32k 版本。
ERNIE是百度开发的自然语言处理框架,旨在通过持续学习和预训练技术提升语言理解与生成能力。它支持多种自然语言处理任务,包括文本分类、问答系统、文本生成等,并在多种任务中实现了最先进的性能。ERNIE基于Transformer架构,具备高效的模型优化和训练策略,支持多语言处理,适用于中文及其他语言的自然语言处理任务。
Grok-1是xAI推出的开源大语言模型,拥有3140亿参数,适用于NLP任务,并提供JAX示例代码,便于加载、运行和微调。
ark-nlp是一个旨在收集和复现学术与工作中常用的自然语言处理模型的平台,支持多种NLP任务,并提供丰富的预训练模型,适合研究人员和开发者使用。
在桌面上运行大语言模型的桌面应用,提供了强大的语言处理功能,包括文本生成、语法纠正、改写句子、摘要生成、数据提取等,注重隐私保护,所有任务都在本地设备上处理,不会共享数据给外部服务器。
该项目是Azure OpenAI服务的示例代码库,旨在补充OpenAI的食谱,展示如何使用Azure OpenAI服务,涵盖多种使用场景,如文本生成和对话系统,提供易于理解的文档和示例,支持多种编程语言和框架。
基于预训练语言模型的零样本和少样本NLP的教程,提供了一系列的示例和实用工具,用于帮助研究人员和工程师理解和应用这些技术。
Aquila语言大模型是在中英文高质量语料基础上从0开始训练的开源语言模型,具备更高效的训练效率和优秀的性能。
Yi是一个专为高效语言模型设计的开源框架,支持从零开始训练的大型语言模型。它包含两款双语模型Yi-6B及Yi-34B,均自研训练,参数规模分别为6B和34B。Yi通过优化算法与资源管理,提供从实验到部署的完整流程,支持多种语言的文本生成、对话系统和问答任务。
该项目集成了基于 transformers 库实现的多种自然语言处理任务,支持用户使用各种预训练模型,进行文本分类、生成、命名实体识别、机器翻译等操作,并且允许用户自定义数据集,易于使用和扩展。
Graph4NLP是一个库,旨在简化图神经网络在自然语言处理中的应用,支持多种任务和模型的灵活使用。
TaiChi是一个开源库,专注于少样本学习,可以支持多种自然语言处理任务,具有灵活的API设计和强大的可扩展性,适合研究者和开发者使用。
LLMFarm是一个基于GGML库构建的项目,支持在iOS和MacOS平台上离线运行多个大语言模型,提供用户友好的界面和高效的模型加载与推理功能。
YaLM-100B是Yandex推出的一个开源大型语言模型,参数达到100亿,旨在支持多种自然语言处理任务。它能够生成高质量的文本,并广泛应用于对话系统、文本生成和补全等领域。
GPT-3是一个由OpenAI开发的自然语言处理模型,具有1750亿个参数,能够生成与人类相似的文本。它凭借强大的文本生成能力和高效的上下文理解,广泛应用于对话、写作、编程等多个领域。
OpenICL是一个开源的框架,旨在支持上下文学习,提供多种算法和灵活的接口,便于集成到现有的自然语言处理模型中。
IntelliGeniusAI是一个综合性的AI平台,提供多种服务来生成AI内容,包括文本、图像、代码和聊天生成器。用户只需登录,选择需要的生成器,必要时自定义设置,然后点击'立即生成'即可创建AI内容。
该项目利用ChatGPT API,通过反复运行相同的提示,分析大型语言模型如何为下一个词分配概率,从而生成完整的文本。
awesome claude prompts 是一系列特定的输入或指令,旨在为生成预训练变换器语言模型提供上下文,以生成相应的文本输出。用户可以通过明确而具体的指令与模型交互,逐步生成和优化文本。
Google Gemma是由谷歌开发的一款轻量级、最先进的开源语言模型,能够处理多种语言处理任务。用户可以通过Kaggle、Google Colab或Google Cloud等平台访问和使用该模型。
HandyAI是一款开源应用,利用最新的AI工具,包括先进的语言模型和图像模型,旨在为用户提供便捷的人工智能服务。该应用通过强大的AI能力,帮助用户处理各种任务,提升工作效率和生活质量。
Xboard是一款基于AI技术的键盘应用,旨在帮助用户更智能、更快速和更高效地输入文本。它利用人工智能生成消息、电子邮件、内容和搜索查询,极大地方便了用户的日常文字输入。