LLaMA是Facebook研究开发的一款先进语言模型,旨在处理多种自然语言处理任务,声称在性能上优于GPT-3。它具备高质量文本生成能力,支持多种规模以满足不同的部署需求,同时采用高效的训练技术,能够先进地处理上下文信息。
GPT-2 是 OpenAI 发布的一个强大的自然语言处理模型,能够执行多种任务,如文本生成、翻译、摘要和问答等。
中科闻歌研发的新一代开源大语言模型,采用了超过 2 万亿 Tokens 的高质量、多语言语料进行预训练。
Auto-GPT-ZH是中文版AutoGPT,旨在提供一个中文环境下的自动化GPT应用,支持多种API扩展,用户可以自定义任务和目标,具有高效的文本生成和对话能力,界面友好,适合各种中文场景的应用。
基于Andrej Karpathy的GPT-2实现和训练,添加大量注释以帮助理解模型原理,计划逐步增加更多功能。
由vivo AI全球研究院自主研发的大规模预训练语言模型,具有更大量的优质数据、更优的效果及长文本支持。
MiniGPT-4-ZH 是一款专为中文用户设计的自然语言处理模型,能够高效生成和理解中文文本,适用于多种应用场景,包括对话系统、内容生成、文档翻译等。该模型易于部署,适合开发者和企业快速集成,提升用户体验。
WonderWorker是一个用于增强Slack工作区的工具,通过将GPT模型无缝集成,整个团队可以协作并利用GPT模型的强大功能。用户只需安装Slack应用并授权访问工作区,即可直接在Slack中使用GPT模型生成文本、回答问题和协助各种任务。
Anima是第一个开源的基于QLoRA的33B中文大语言模型,旨在支持大规模中文处理,促进社区参与与贡献,具备高效的模型训练与推理能力。
Cybertron是一个纯Go语言包,为前沿的自然语言处理(NLP)技术提供了简单易用的接口,支持多种预训练模型,具备高性能的文本处理能力,易于集成到现有的Go项目中。
轩辕模型是一种开源的自然语言处理模型,旨在提供高效的文本生成和理解能力,支持多种语言,并可定制化模型参数,适用于多种文本处理任务。
LMQL是一种专门为大型语言模型(LLMs)设计的查询语言,结合了自然语言提示和Python的表达能力。它提供了约束、调试、检索和控制流等功能,以便于与LLMs的交互。
WaveCoder是一个广泛且多才的项目,专注于增强指令调优和精炼数据生成,采用经过精心调优的代码语言模型和生成器-判别器框架,从开源代码中生成高质量、非重复的指令数据,显著提升大型语言模型在与代码相关任务中的表现和泛化能力。
Quick GPT Search Chrome Extension是一个免费的Chrome扩展,提供简化和更快速的方式访问OpenAI的ChatGPT。用户可以将其添加到Google Chrome或Microsoft Edge浏览器中,安装后可以通过独立网页或弹出窗口访问ChatGPT。可以通过持续可用、手动触发或使用问号来唤醒ChatGPT,用户可以随时提问并获得即时回答。
Web LLM 是一个可以在浏览器中直接运行大型语言模型的工具,支持通过 WebGPU 加速。它支持多种大型语言模型,包括 Llama 2 7B/13B、Mistral 7B 和 WizadMath,并能够在设备内存为 64GB 的情况下运行 Llama 2 70B 模型。利用 WebGPU 提供更快、更流畅的模型运行体验,仅需约 6GB 的显存即可运行 Llama 7B 和 Vicuna-7B。
Awan LLM是一个云服务提供商,专注于大语言模型的推理,致力于提供高性价比和可靠性。与其他按token计费的服务不同,Awan LLM采取按月计费的方式,有效控制了用户的使用成本。通过在战略城市部署数据中心,Awan LLM能够为客户提供稳定且高效的服务。
GPTSidekick是一个由GPT-4和Claude 3驱动的AI助手,提供多种功能,适合内容创作、研究辅助、语言翻译和数据分析等需求。用户可以通过简单的注册流程,选择合适的套餐,便捷地访问其强大的功能。
Giti.AI是一个强大的语言模型,能够生成模仿人类写作的文本,适用于文本摘要、问答和文本生成等多种自然语言处理任务。其关键特性是能够理解提示的上下文,并生成个性化的响应。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型