OLMo开源项目 – AI2的开放语言模型

OLMo是一个由科学家设计的开源语言模型仓库，旨在训练和使用AI2最先进的开放语言模型。它采用两阶段训练程序，第一阶段在大约4T令牌的网络语料库上训练，第二阶段在约50-100B令牌的高质量目标语料库上微调。OLMo已用于各种自然语言处理任务，包括文本生成、问答和翻译。

OLMo的特点:

1. 两阶段训练程序，确保模型在高质量数据上微调
2. 支持多种模型变体，如7B、13B和32B
3. 提供Hugging Face格式的模型检查点
4. 支持量化推理，优化模型性能
5. 提供详细的训练配置和步骤，便于复现

OLMo的功能:

1. 用于文本生成任务
2. 用于问答系统
3. 用于机器翻译
4. 通过Hugging Face进行模型推理
5. 在Modal.com上托管模型，提供API服务

相关导航

ERNIE开源项目 – 百度知识增强预训练模型

ERNIE是百度发布的知识增强的预训练模型，旨在提升中文自然语言处理（NLP）任务的性能，超越BERT等现有模型。它结合了大规模的知识图谱数据，增强了模型的理解能力，在各项中文NLP任务中表现优异，支持多种自然语言处理任务。

DeepSeek LLM官网 – 开源语言模型的扩展

DeepSeek LLM 是一个专注于长期主义的开源语言模型项目，旨在通过扩展和优化现有模型来提升自然语言处理的能力。该项目支持大规模语言模型的训练，并致力于在长期发展中保持模型的先进性和实用性。

word-GPT-Plus开源项目 – 集成ChatGPT的Word文本插件

word-GPT-Plus是一个第三方文本插件，将ChatGPT模型集成到微软Word中，能够根据文档中已有的文本生成新内容，提供翻译、总结、润色等功能，甚至可以从零开始撰写文档。

Transformers开源项目 – 支持多种深度学习架构

Transformers和相关的深度网络架构在此进行了总结和实现，涵盖了自然语言处理和计算机视觉等多个领域。

Grok-1开源项目 – 开源的AI文本模型

Grok-1 是一个开源的AI模型，基于大量文本数据进行训练，未针对特定任务进行微调。

LLM Zoo开源项目 – NLP领域的语言模型信息汇集

LLM Zoo收集了各种开源和闭源语言模型的信息，包括发行时间、模型大小、支持的语言、领域、训练数据以及相关资源链接。旨在为自然语言处理(NLP)领域的研究人员提供参考，以帮助其选择适合其需求的模型。

LightEval开源项目 – 轻量级的LLM评估工具

LightEval是一个轻量级的LLM评估套件，Hugging Face在内部使用，并与最近发布的LLM数据处理库datatrove和LLM训练库nanotron集成。

BrowserAI开源 – 浏览器本地AI模型运行平台

BrowserAI 是一个开源项目，允许用户在浏览器中直接运行本地 AI 模型，无需服务器支持，从而实现快速推理并保护隐私。该项目特别适合需要隐私保护和低成本解决方案的用户，支持现代浏览器如 Chrome 113+ 或 Edge 113+。BrowserAI 提供了多种功能，如文本生成、语音识别、文本转语音等，并且支持 WebGPU 加速和离线使用，确保高性能和便捷性。

FraxAI官网 – 生成式AI模型与工具平台

FraxAI是一个提供生成式AI模型、工具、提示工程技术、资源、指南和教程的平台，支持Stable Diffusion和ChatGPT等技术。用户可以探索各种可用模型和工具，利用提示工程技术创建有效的提示，以生成文本、图像、代码、音频、视频等。同时，平台还提供指南和教程，帮助用户深入了解生成式AI和提示工程。

Recos.官网 – 将音频内容转录为文本的网页应用

Recos是一个利用OpenAI的Whisper API将音频内容转录为文本的网页应用，提供稳定且可扩展的体验，确保您的内容绝对保密。用户只需登录网站并上传支持格式的音频文件（如MP3、WAV、M4A、FLAC），可以使用自己的OpenAI API密钥或登录以使用积分。每个积分允许生成1分钟的音频转录，转录完成后可下载文本输出。

大型语言扩散模型官网 – 基于扩散技术的文本生成模型

大型语言扩散模型采用扩散技术，通过逐渐掩码输入部分文本并加噪，模型学习一次性预测被掩码内容以恢复原始文本。该技术不同于传统的逐步（自回归）方法，能够同时预测多个标记，解决传统语言模型无法逆向生成内容的问题，并在多个测试中表现优异，超过Llama-2 7B，与Llama-3 8B相当。