Llama Models 是由 Meta 推出的开源大语言模型,旨在为开发者、研究人员和企业提供构建、实验和扩展生成式 AI 的平台。Llama 模型作为基础系统的一部分,为全球社区的创新提供了支持。其特点包括开放的访问权限、广泛的生态系统以及对信任与安全的重视。Llama 模型支持多种规模,适用于不同场景,并通过 Hugging Face 等平台提供下载和使用。
GPT-Neo是一个基于深度学习的开源大语言模型,专注于文本生成和自然语言理解任务。它通过使用Transformer架构,实现了大规模文本生成,广泛应用于对话系统、内容创作等领域。作为一个开源替代品,它为开发者提供了一个高效的方式来创建和定制自己的大语言模型。
百川智能开发的首个专为医疗场景优化的开源大语言模型,旨在通过先进的技术手段助力医疗领域的智能化升级。该模型经过20万亿token高质量数据的训练,具备卓越的性能,尤其在医疗推理能力上提升了5倍,能够精准高效地处理复杂的医疗任务。此外,其创新的模型结构使其在长序列任务中表现更为出色,能够更好地应对医疗数据中的长序列问题。
MiniMax 发布的首个开源大语言模型,采用MoE模型,具有456B参数,支持大规模参数激活,能够处理长达1M的文本,并在长文本召回测试中表现优异。
中科闻歌研发的新一代开源大语言模型,采用了超过 2 万亿 Tokens 的高质量、多语言语料进行预训练。
百川智能推出的新一代开源大语言模型,采用 2.6 万亿 Tokens 的高质量语料训练。在多个权威的中文、英文和多语言的通用、领域 benchmark 上取得同尺寸最佳的效果。
一个简单易懂的AI代理示例项目,展示了如何通过模型上下文协议(MCP)连接开源大语言模型(如Llama 3、OpenAI或Google Gemini)和SQLite数据库,帮助开发者快速上手AI代理开发。
Grok-1是xAI推出的开源大语言模型,拥有3140亿参数,适用于NLP任务,并提供JAX示例代码,便于加载、运行和微调。
AgentLLM是一个基于开源大语言模型的自主智能体项目,旨在证明嵌入式LLM能够以可接受的性能处理复杂的目标导向任务,且完全在浏览器中运行。
Ubdroid AI Answer Engine 是一个利用开源大语言模型提供即时答案和无限知识访问的平台。用户只需在搜索框中输入问题或查询,即可快速获得准确的答案和信息。
Mistral 7B是Mistral AI发布的首个大型语言模型,具备强大的适应性和自然编码能力,支持8k序列长度,超越Llama 2 13B的所有基准测试,采用Apache 2.0许可证,可免费使用。
H2O.ai的开源大语言模型GPT项目,旨在创建世界上最好的开源GPT模型,提供强大的自然语言处理能力,支持多种任务,适用于大规模应用。
StableLM是Stability AI最新开源的大语言模型,目前开放的是3B和7B的版本,后续会开放更大规模的模型,适合商用。
Yi是一个专为高效语言模型设计的开源框架,支持从零开始训练的大型语言模型。它包含两款双语模型Yi-6B及Yi-34B,均自研训练,参数规模分别为6B和34B。Yi通过优化算法与资源管理,提供从实验到部署的完整流程,支持多种语言的文本生成、对话系统和问答任务。
GPT-3 是一个具有 1750 亿参数的强大语言模型,展示了更大的模型在多种实际任务中表现更好的现象。它在自然语言处理领域具有显著的优势,能够理解和生成多种形式的文本。
ChatGPT Français是OpenAI开发的高级语言模型的法语版本,基于GPT-4技术,允许用户直接使用,无需注册,提供即时的文本生成和交互功能。
DeepSeek LLM是一款拥有670亿个参数的先进语言模型,通过庞大的包含2万亿标记的数据集在英语和中文上进行了从零开始的训练,旨在提供高质量的自然语言处理能力。
ReaderLM-v2是一款增强文本理解能力的语言模型,支持多种语言,能够快速响应并高效提取信息。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型