Oumi 是一个一站式端到端的开源AI平台,专注于构建和部署最先进的基础模型。它支持从数据准备到生产部署的全流程,特别适合研究人员和开发者。Oumi 支持从10M到405B参数的模型训练和微调,集成了多种推理引擎,推理效率提升超过10倍。此外,Oumi 还提供了零模板代码,帮助用户快速入门,减少开发障碍。
Oumi 是一个全栈开源平台,旨在简化和加速端到端的大模型开发流程。它涵盖了从数据准备、模型训练到评估和部署的整个生命周期,为开发者提供了一套统一且灵活的工具链。Oumi 支持多种训练技术、广泛的模型类型、数据合成与管理、高效部署、全面评估、跨平台运行和灵活集成。无论是从笔记本电脑开发、在集群上启动大规模实验,还是在生产环境中部署模型,Oumi 都提供了所需的工具和工作流。
Llama Stack 是一个开源项目,旨在将 LLM 应用构建生成周期的所有组件打包,包括训练、微调、产品评估、观测、Agent & Memory、合成数据生成等,并支持 9+ 提供商。
《动手学大模型》是一本开源书籍,共12章节,涵盖从基础到高级的大语言模型内容,包括语言模型介绍、文本分类、提示词工程、语义搜索、微调模型、多模态模型等。书中包含大量代码示例,可直接在Colab运行,帮助读者更好地理解和应用大语言模型。此外,书中还提供了丰富的实践代码,旨在帮助读者掌握大型语言模型的使用和应用,适合初学者和有经验的开发者。
专为物理AI设计的世界基础模型平台,旨在帮助物理AI开发者更好更快地构建物理AI系统。
这是国内第一个真正的开源、可下载、可运行的 LLaMA2 模型,提供中文版 Llama2模型及中英文 SFT 数据集,兼容适配所有针对原版 llama-2-chat 模型的优化。
Grok-1是xAI推出的开源大语言模型,拥有3140亿参数,适用于NLP任务,并提供JAX示例代码,便于加载、运行和微调。
Auto-GPT-ZH是中文版AutoGPT,旨在提供一个中文环境下的自动化GPT应用,支持多种API扩展,用户可以自定义任务和目标,具有高效的文本生成和对话能力,界面友好,适合各种中文场景的应用。
Asian Bart是一个专为亚洲语言设计的BART模型,支持英语、汉语、韩语、日语等多种语言,适用于文本生成、翻译和摘要等多种自然语言处理任务,并提供预训练模型以便于研究和应用。
OpenChat是一个基于LLaMA架构的开源大语言模型,通过6K GPT-4对话数据进行微调,旨在在推理效率和表现力上达到与ChatGPT相当的水平。它利用自然语言对话数据和强化学习方法,在混杂质量数据下进行训练,克服了labels标注难题,是开源领域内表现最出色的模型之一。
一个用纯C语言实现的项目,旨在训练GPT-2模型,代码量仅为1000行,具有高效的内存管理和性能优化,方便扩展和修改。
FreeWilly1 是一个基于 LLaMA 65B 的自然语言处理模型,在一些评测中表现优异,适合多种语言生成和理解任务。
UniMoCap是一个社区实现,旨在统一文本-动作数据集(HumanML3D、KIT-ML和BABEL)以及全身动作数据集(Motion-X)。
LMQL是一种专门为大型语言模型(LLMs)设计的查询语言,结合了自然语言提示和Python的表达能力。它提供了约束、调试、检索和控制流等功能,以便于与LLMs的交互。
H2O LLM Studio是一个用户友好的图形界面工具,允许用户轻松微调大型语言模型(LLM),无需编程技能。
智析是浙江大学基于Llama架构开发的13B参数规模的大型模型,专注于知识抽取,具备高效的自然语言处理能力,能够处理复杂的信息提取任务。
SuperCLUE-Llama2-Chinese是基于SuperCLUE的OPEN基准,为Llama2开源模型提供全方位的中文评估,支持多种评测指标,致力于推动中文自然语言处理的发展。
基于GPT-2模型的中文文本生成项目,旨在为中文自然语言处理提供强大的文本生成能力,支持预训练和fine-tuning,适用于多种场景,如创作、对话等。