rLLM开源项目 – 大语言模型强化学习开源框架

rLLM是Agentica项目团队开发的开源框架，旨在为大语言模型(LLM)提供完整的强化学习(RL)解决方案。
该项目通过开源训练脚本、模型参数、数据集和评估日志，实现了对DeepSeek R1和OpenAI O1/O3等先进模型的复现。
核心创新包括支持32K-64K长上下文训练、异步流水线优化技术(verl-pipe)，以及发布DeepCoder-14B/1.5B等高性能代码生成模型和DeepScaleR数学推理模型。
项目由伯克利Sky Computing实验室和BAIR研究院支持，与Together AI合作开发。

rLLM的特点:

1. 开源完整的RL训练方案(脚本/参数/数据集/日志)
2. 支持32K→64K长上下文扩展训练
3. verl-pipe异步流水线技术(训练加速2倍)
4. DeepCoder-14B代码模型(LCB 60.6%媲美O3-mini)
5. DeepScaleR-1.5B数学模型(超越7B基线)
6. 多节点分布式训练支持
7. 完整的评估体系(LCB/Codeforces/AIME等)

rLLM的功能:

1. 代码生成任务训练(使用DeepCoder脚本)
2. 数学推理模型开发(基于DeepScaleR方案)
3. 长上下文RL实验(支持32K→64K扩展)
4. 分布式RL训练(多节点Ray集群)
5. 训练流程优化(verl-pipe流水线加速)
6. 模型性能评估(集成LCB/Codeforces等基准)

相关导航

TACO开源项目 – 高质量算法代码生成数据集

关于算法代码生成的数据集，具有更大规模、更高质量和更精细标签的特点，旨在提供一个更具挑战性的训练数据集和评估基准，用于代码生成模型领域

StreamingLLM开源项目 – 无缝处理无限文本的语言模型

StreamingLLM 是一种语言模型，能够顺利处理无尽的文本而不会失去上下文信息流，从而实现与人工智能助手的深度对话和长文本总结。

Awesome One-Click Deployment开源项目 – 一键部署各种Github开源AI项目

该项目旨在提供快速体验，允许用户一键部署多种Github开源AI项目，简化了部署过程，减少了用户的配置时间，并提供易于使用的界面和文档，同时定期更新以添加新的项目和功能。

Fiora开源项目 – 开源跨平台聊天应用

Fiora是一个基于Node.js、React和Socket.io开发的开源即时通讯应用，支持Windows、Linux和macOS系统。它提供了丰富的功能，包括注册登录、群组聊天、私聊、多种消息类型（文本、表情、图片、代码、文件、命令）、通知推送、主题定制、管理员管理等。Fiora支持源码安装和Docker安装，适合搭建个人聊天服务或集成即时通讯功能。

Mirageml官网 – 企业资产搜索工具

Mirageml是一个企业资产搜索工具，通过消除手动标记、过滤器或无限滚动的需求，提升公司的资产库。它通过理解自然语言提供人类级别的响应，彻底改变用户搜索资产的方式。

Cradle开源项目 – 提升基础智能体控制计算机的能力

Cradle 是一个 AI 框架，旨在提升基础智能体的能力，使其能够通过统一的接口执行复杂的计算机任务。该框架使用屏幕截图作为输入，键盘和鼠标操作作为输出，能够控制日常软件、专业软件以及多款游戏。目前支持自动操作 Chrome、Outlook、剪映、美图、飞书等软件，以及《荒野大镖客2》、《星露谷物语》、《都市：天际线》、《当铺人生2》等游戏。

GPT-4V-API-自托管的GPT开源项目 – 4V API解决方案

GPT-4V-API是一个允许用户自托管GPT-4V模型的API，提供高效的API调用和多种输入格式支持，便于与现有应用的集成和灵活配置，满足不同用户的需求。

TinyTroupe开源项目 – 多角色模拟工具

TinyTroupe是一个基于大语言模型（LLM）的多智能体人物模拟库，旨在增强想象力和商业洞察力。它能够模拟具有特定性格、兴趣和目标的虚拟人物，这些人物可以在模拟的环境中进行互动和行动。TinyTroupe特别适合广告测试、软件测试和产品管理等场景，为企业提供独特的研究视角和决策支持。

Function Calling Studio官网 – 快速构建和测试函数调用方案

Function Calling Studio 是一个允许用户构建和测试函数调用方案的平台。用户可以设置函数及其参数，并一次性运行一组测试提示。这使得用户能够快速迭代他们的函数并观察其性能。

Wizlink AI官网 – AI优化的移动落地页构建工具

Wizlink AI是一个专为移动端优化的落地页构建器和链接汇总工具，旨在简化内容生成和页面设计。用户可以通过该平台创建各种类型的页面和内容，提升项目的在线展示效果。

Learn Java ASM开源项目 – 深入学习Java字节码操作

ASM 是一个用于操作字节码的开源 java 库。本项目旨在系统地介绍如何学习Java ASM的知识，主要涉及Core API、OPCODE和Tree API等内容。至于学习的预期目标就是，用一个形象的说法来讲，让字节码在你的手中“跳舞”：看看你的左手，一个完整的ClassFile拆解成不同粒度的字节码内容；看看你的右手，不同粒度的字节码内容又重新组织成一个ClassFile结构。

TianMu开源项目 – 开源的大模型客户端，支持多种AI交互

TianMu是一个支持文心一言、通义千问、LLaMa、ChatGPT等多种大模型的开源客户端，能够在多个平台上运行，提供丰富的文档格式支持和多模态交互，用户可以通过持续对话和自定义命令与AI模型进行灵活交互。