Namo-R1开源项目 – CPU友好的实时视觉语言模型

Namo-R1是一款仅需CPU即可实时运行的500M参数视觉语言模型，能够轻松超越Moondream2和SmolVLM。它不仅支持多语言OCR和图像描述等复杂任务，还完全开源，提供训练脚本和数据，便于用户进行二次开发和部署。

Namo-R1的特点:

1. CPU友好，无需GPU即可快速运行
2. 500M参数却能实现多语言OCR、图像描述等复杂任务
3. 完全开源，训练脚本和数据一应俱全

Namo-R1的功能:

1. 实时运行视觉语言模型
2. 多语言OCR任务
3. 图像描述生成
4. 训练和部署视觉语言模型

相关导航

PE3R开源项目 – 快速生成交互式3D场景

PE3R（Perception-Efficient 3D Reconstruction）是一个创新项目，能够仅通过2-3张照片生成交互式3D场景。该项目支持基于文本的虚拟世界探索，极大简化了3D重建的流程，适用于多种场景和应用。

R1-Searcher开源 – 提升LLM搜索能力的强化学习框架

R1-Searcher 是一个两阶段强化学习框架，旨在提升大型语言模型（LLM）的搜索能力。该框架通过结果导向的奖励机制工作，无需依赖过程奖励或知识蒸馏。研究表明，它允许 LLM 在推理过程中自主调用外部搜索系统，整合外部知识来解决知识密集型查询。在某些基准测试中，R1-Searcher 的表现显著优于现有的检索增强生成（RAG）方法，甚至与闭源模型（如 GPT-4o-mini）相当或更优。

MachineLearning开源项目 – 常见机器学习算法实现代码

该项目提供了多种常见机器学习算法的实现代码，包括深度学习教程、PCA、kNN、逻辑回归、流形学习、SVM、GMM、决策树、K-Means、朴素贝叶斯等。

CMU_MATH-AIMO开源项目 – AI数学奥林匹克竞赛的开源项目

卡内基梅隆大学团队在首届AI数学奥林匹克竞赛(AIMO)中获得亚军的开源项目，包含完整的训练数据集(AIME、AMC、Odyssey-Math)、验证集、模型微调代码和数据收集脚本，为研究AI解决数学问题提供了宝贵资源

Meta-Transformer开源项目 – 统一处理多模态数据的框架

Meta-Transformer是一个用于多模态学习的统一框架，能够处理各种模态如自然语言、2D图像、3D点云、音频、视频、时间序列和表格数据。它采用冻结的编码器进行多模态感知，并且可以在没有配对的多模态训练数据的情况下进行训练，同时可学习的数据预处理器能够处理每个输入模态，生成共享的嵌入表示。

Bootstrap开源项目 – 快速构建响应式网页的前端框架

Bootstrap 是一款流行的开源前端框架，帮助开发者快速构建美观且响应式的网页和Web应用程序。它基于 HTML、CSS 和 JavaScript 构建，提供响应式网格系统和丰富的组件，适合构建各种类型的网页。Bootstrap 5 是其最新版本，提供了更多现代化的功能和改进。

Forgetting Transformer (FoX)开源 – 改进的Transformer，增强长文本处理

Forgetting Transformer (FoX) 是一种改进的 Transformer 模型，通过在 Softmax 注意力机制中加入遗忘门，增强了处理长文本和序列任务的能力。它的设计目标是提升长文本建模、长度外推和短文本任务的性能，同时保持长上下文处理能力，并解决标准 Transformer 缺乏显式数据依赖遗忘机制的问题。FoX 通过数据依赖的方式下调未归一化的注意力分数，命名为“遗忘注意力”（Forgetting Attention）。研究表明，FoX 在长上下文语言建模、长度外推和短上下文下游任务上优于标准 Transformer，而在长上下文下游任务上表现相当。此外，FoX 兼容 Flash Attention 算法，且无需位置嵌入，保留了 Transformer 相对于循环序列模型（如 Mamba-2、HGRN2 和 DeltaNet）在长上下文能力上的优势。

可解释机器学习系列公开课开源项目 – 深入了解人工智能可解释性分析

该课程包含人工智能可解释性分析领域的导论、算法综述、经典论文精读、代码实战和前沿讲座，由B站知名UP主“同济子豪兄”主讲，课程视频免费开源。

Sycamore开源项目 – LLM驱动的非结构化数据搜索与分析平台

Sycamore 是一个基于大型语言模型（LLM）的搜索与分析平台，专门用于处理非结构化数据，如文档、幻灯片、音频等。它通过先进的LLM技术，帮助用户高效地搜索、分析和提取非结构化数据中的信息，支持多种数据类型，并且是一个开源平台。

Together AI官网 – 高效灵活的生成式AI平台

Together AI是一个领先的云平台，专为生成式AI设计，提供超快、可扩展和高效的AI模型构建、部署和优化解决方案。它包含多个产品，如Together Inference、Together Fine-tuning、Together Custom Models和Together GPU Clusters，适用于个人开发者和大型企业。

SmallTalk官网 – 一个开源的AI语言学习应用

SmallTalk是一个开源的AI语言学习网页应用，支持所有主流浏览器，包括移动端和桌面端。它具备语音功能，用户体验流畅，目前仍处于早期阶段。

code2prompt开源项目 – 代码库转提示词工具

code2prompt 是一个开源工具，旨在将代码库快速转换为适合与大型语言模型（LLM）交互的提示词。它通过遍历项目目录，构建树结构，收集每个文件的信息，并自动生成格式化的 Markdown 提示词文档，从而简化与 AI 模型的沟通过程。支持多种自定义选项，如模板生成、文件过滤、Git 信息集成等。