RAGEN开源 – 首个开源DeepSeek-R1强化学习框架

RAGEN 是 DeepSeek-R1 强化学习训练框架的首个开源复制品，专注于训练大型语言模型（LLM）推理代理。它支持多轮统一处理，避免批量大小不稳定，提供世界建模能力，并帮助智能体进行规划。特别适用于交互式和随机环境中的多步任务训练，如 Sokoban 谜题和 FrozenLake 环境。

RAGEN的特点:

1. 支持多种强化学习算法：PPO、GRPO、BRPO
2. 支持代理模型的多轮在线 RL 训练
3. 易于扩展到其他 Gym 环境
4. 使用马尔可夫决策过程（MDP）公式化代理任务
5. 采用 RICO 算法优化整个轨迹分布
6. 提供渐进式奖励归一化策略：ARPO、BRPO、GRPO

RAGEN的功能:

1. 使用提供的脚本设置环境
2. 创建训练数据
3. 使用指定的 RL 算法训练模型
4. 可视化训练过程

相关导航

Swark开源项目 – 自动生成代码架构图的VS Code扩展

Swark是一个VS Code扩展，使用大型语言模型(LLMs)从代码自动创建架构图，让复杂代码一目了然。

Awesome Graph Universe开源项目 – 一站式图技术资源库

Awesome Graph Universe 是一个全面的图技术资源库，专注于图数据库、知识图谱和图分析领域。它为用户提供了丰富的工具和库，涵盖了60多种图数据库和工具，以及图分析和可视化的资源。该项目是开源的，持续更新，旨在帮助开发者、研究人员和技术爱好者更高效地探索和应用图技术。

Naive UI Admin开源项目 – 基于Vue3的中后台解决方案

Naive UI Admin 是一款完全免费且可商用的中后台解决方案，基于 Vue3.0、Vite、Naive UI 和 TypeScript 构建。它集成了最新的前端技术栈，提供了二次封装组件、动态菜单、权限校验等功能，适用于快速搭建企业级中后台项目。项目具有响应式设计、多主题支持、强大的鉴权系统，并且持续更新页面模板和交互设计，简化页面构建流程。

LightGBM Transformation Library – LightGBM数据转换工具库

LightGBM Transformation Library 是微软为LightGBM模型提供的一个数据转换工具库，旨在增强LightGBM模型的数据预处理能力。该库支持多种数据转换技术，能够无缝集成到LightGBM的现有流程中，提供高效且可扩展的转换解决方案，帮助用户更好地处理数据并提升模型性能。

Vlogger开源项目 – AI生成一分钟级vlog

Vlogger是一个通用的人工智能系统，专门用于生成用户描述的一分钟级视频博客(vlog)。该系统利用大型语言模型(LLM)作为导演，将vlog的长视频生成任务分解为四个关键阶段，从而突破现有视频生成方法的瓶颈，提升生成效率和质量。

Social Learning官网 – 模仿人类社交学习的AI技术

Social Learning 是 Google 推出的一种 AI 技术，旨在模仿人类通过社会互动学习的方式。该框架由教师模型和学生模型组成，教师模型通过自然语言向学生模型传授知识，学生模型则通过这些互动来学习和改进。这种方法减少了对传统机器学习中大量数据和复杂算法的需求，并更好地保护用户隐私。Google 已在语言翻译和图像识别等任务中测试了该框架，但具体研究主要聚焦于大型语言模型（LLMs），如垃圾邮件检测、数学问题和问答。

Aperture开源项目 – Stable Diffusion注意力层可视化工具

Aperture 是一个专门用于可视化 Stable Diffusion 中注意力层的工具，特别设计用于可视化 UNet 中每个词在每一层的注意力分布。它支持 Stable Diffusion 2.1 和 Flux Dev 模型，并提供了完整的前端和后端代码，便于用户进行定制和进一步开发。

COMO开源项目 – 将 Gitee 项目备份到 GitHub

COMO 是一个将 gitee.com 上的 COMO 项目搬到 github.com 的备份工具，旨在提供更好的代码管理和协作体验。

pyocr开源项目 – Python OCR工具

pyocr是一个Python封装库，支持Tesseract和Cuneiform两种OCR引擎，提供了简单易用的接口，用于实现光学字符识别（OCR）。它支持多种语言，允许用户轻松将OCR功能集成到Python项目中，并提供了图像预处理选项以提高OCR的准确性。

SkyReels-V1开源项目 – 以人为中心的电影级视频生成模型

SkyReels-V1是昆仑万维开源的首个以人为中心的视频生成模型，具备电影级画质，支持多种面部表情和自然动作组合。该模型使用好莱坞级影视数据进行训练，具有专业的构图和摄影效果，并采用自研的数据清洗和标注流程。它能够处理多人场景中的空间关系，支持文本生成视频(T2V)和图像生成视频(I2V)，并且支持多GPU推理和用户级GPU部署。

Lightning IR开源项目 – 基于PyTorch Lightning的信息检索库

Lightning IR 是一个基于 PyTorch Lightning 的库，专门用于微调和运行基于 transformer 的语言模型进行信息检索任务。它提供了完整的解决方案，支持多种信息检索任务和数据集，简化了模型训练和推理过程，同时易于扩展和定制。

dive开源项目 – Docker镜像分析工具

dive 是一款用于分析 Docker 镜像每一层空间使用情况的工具。它提供了可视化的镜像层信息，支持快速浏览镜像内容，帮助用户优化 Docker 镜像大小，并提供镜像层的详细元数据。通过 dive，用户可以深入了解镜像的结构，从而更有效地管理和优化 Docker 镜像。

Awesome-Token-Merge-for-MLLMs开源项目 – 优化MLLM的Token处理效率

该项目是一个精选论文列表，专注于为多模态大语言模型（MLLM）提供高效的Token合并、减少、重采样和丢弃方法。通过整合多篇相关论文，帮助开发者和研究人员理解和实现高效的Token管理策略，从而优化多模态大语言模型的Token处理效率。

Sherlock开源项目 – 跨网站搜索用户名

Sherlock是一个用于在多个社交媒体和网站上搜索用户名的工具，能够快速检查用户名的可用性，并提供详细的搜索结果。用户可以自定义用户名列表，开源且易于使用，适合需要监控或分析用户名的用户。

vue-pure-admin开源项目 – 基于Vue3的开源中后台管理系统

vue-pure-admin 是一款开源免费且开箱即用的中后台管理系统模版，采用最新的 Vue3、Vite、Element-Plus、TypeScript、Pinia、Tailwindcss 等技术开发。它完全遵循 ECMAScript 模块（ESM）规范，提供精简版本，适合实际项目开发，支持国际化，打包后体积小，性能优异。项目还提供了丰富的文档、视频教程和多种版本（如 Tauri、Electron 等），帮助开发者快速上手和定制开发。

暂无评论

暂无评论...