AI开源项目 | 第 30 页

rasa_chatbot_cn是一个基于Rasa框架构建的中文对话系统，旨在提供自然语言理解和对话管理功能。它支持中文对话交互，适用于多种应用场景，如客服机器人、智能助手、教育领域的智能问答等。项目具有高度的可扩展性，便于添加新的意图和对话流程，并支持与外部API集成，以增强对话功能。此外，它提供了一个完整的示例，便于开发者学习和理解Rasa框架的使用，同时可以作为中文对话系统开发的基础。

0

Rasa框架中文对话系统客服机器人对话管理

Omni Owl for Visual Studio Code开源项目 – VS Code 暗黑主题

Omni Owl 是一款专为 Visual Studio Code 设计的暗黑主题，支持斜体显示，特别优化了 Dank Mono 和 Operator Mono 等字体的显示效果，提升代码可读性，并提供可自定义的配色方案。

0

Visual Studio Code主题代码可读性暗黑主题自定义配色方案

Moxin-LLM开源项目 – 完全开源的大模型

Moxin-7B是一个在模型开放框架（Model Openness Framework）指导下完全开源的大模型，不仅开源了预训练代码、配置文件、训练和微调的数据集，还公开了中间检查点。训练数据集综合了SlimPajama、DCLM-BASELINE文本数据和the-stack-dedup的编程代码数据，支持32K的上下文长度，并采用了GQA、Sliding Window Attention、Rolling Buffer Cache等先进技术。

0

开源大模型编程代码生成自然语言处理长上下文处理

pyvis开源项目 – Python交互式网络图工具

pyvis是一个用于创建和可视化交互式网络图的Python包。它支持自定义节点和边的样式，提供丰富的布局选项，并可以将网络图导出为HTML文件。pyvis易于集成到现有的Python项目中，广泛应用于数据科学、社交媒体、生物信息学、金融和教育等多个领域。

0

Python交互式网络图工具数据可视化网络分析

SocialGym 2开源项目 – 多机器人社交导航的轻量级模拟器

SocialGym 2 是一个基于 ROS 和 OpenAI gym 的轻量级多机器人社交导航模拟器和基准测试工具。它提供了一个高效的模拟环境，支持多机器人社交导航任务的开发和测试。通过集成 ROS 和 OpenAI gym，用户可以方便地进行强化学习任务的训练和社交导航算法的基准测试。该项目适用于机器人技术和人工智能领域的研究、开发和教育。

0

多机器人社交导航模拟器强化学习训练社交导航算法基准测试

av-diarization开源项目 – 简化多说话者场景下的说话人识别

av-diarization是一个用于创建VoxConverse数据集的音视频说话人识别管道，旨在简化多说话者场景下的说话人识别。它结合了高精度的音视频同步技术和多种语音活动检测模型，适用于多种场景，并提供直观的视觉结果展示说话人信息。

0

VoxConverse数据集多说话者场景语音活动检测音视频说话人识别

fossil-notebook-demo开源项目 – 基于Fossil SCM的笔记系统

fossil-notebook-demo是一个基于Fossil SCM的笔记管理系统，旨在通过Fossil的版本控制和协作功能，提供简单高效的笔记管理体验。它集成了Fossil内置的Wiki和问题跟踪系统，支持Markdown格式的笔记，并且轻量级易于部署。

0

Fossil SCMMarkdown协作工具版本控制

smartcat开源项目 – 智能终端助手

smartcat是一款为Unix命令行注入智能的工具，旨在让语言模型成为用户的终端助手。它通过集成多种语言模型API，如OpenAI和Anthropic，提供强大的文本处理能力。用户无需复杂配置即可快速上手，同时支持完全可配置的提示模板，满足个性化需求。

0

Unix命令行工具文本处理智能终端助手语言模型集成

LayoutReader开源项目 – OCR文本框阅读顺序优化

LayoutReader 是基于 LayoutLMv3 的先进模型，专门用于将 OCR 识别出的文本框按照阅读顺序进行排序。该模型在处理速度上进行了优化，能够快速处理多种文档布局，提升文档的可读性和处理效率。LayoutReader 可以广泛应用于需要文档布局分析的场景，并能够无缝集成到现有的文档处理流程中，为自动化文档内容提取和排序提供强大支持。

0

OCR文本框阅读顺序优化文档布局分析自动化文档内容提取

Knowledge-R1开源项目 – 提升知识检索与推理协同的框架

Knowledge-R1是一个旨在增强知识检索与推理能力协同的框架，解决推理模型中知识不足和复杂推理优化的挑战。它通过多轮知识交互逐步提升模型的理解和决策能力，并利用强化学习动态优化知识与推理的协同。该框架已在Qwen-1.5B-Instruct模型上成功复现了显著的改进效果。

0

AI模型增强强化学习优化知识检索与推理框架

EXO Private Search开源项目 – 隐私保护的本地搜索工具

EXO Private Search是一款专注于隐私保护的本地LLM搜索工具，确保用户在搜索时查询内容完全隐藏，服务器无法得知用户搜索内容。通过使用PIR技术和本地生成嵌入向量，数据处理更加安全，同时通过集群优化，大幅提升搜索速度，适用于大规模数据搜索。

0

LLM搜索工具PIR技术本地生成嵌入向量隐私保护的本地搜索工具

VTM开源项目 – 现代化文本桌面环境

VTM是一款基于文本的桌面环境，旨在将传统终端界面升级为现代化的交互体验。它通过文本单元格组成的TUI矩阵表示用户界面，支持无限嵌套和跨平台兼容，覆盖Windows、Linux、macOS等操作系统。VTM提供丰富的文档支持，涵盖架构、构建、用户界面等多方面，使其成为终端环境的现代化替代品，适用于多任务处理、跨平台开发和文本界面的开发与测试。

0

TUI矩阵渲染多任务处理文本桌面环境跨平台开发工具

Tesseract开源项目 – 开源OCR引擎

Tesseract是一个开源的OCR（光学字符识别）引擎，专门用于从图像中提取文本。它能够处理多种语言的文本识别，广泛应用于扫描文档的数字化、自动化表单填写等任务。Tesseract支持超过100种语言，采用深度学习优化的OCR技术，具有高精度识别的特点。同时，它提供简单的API接口，便于与其他应用集成，且完全开源，支持社区的持续更新和贡献。

0

图像文字识别多语言文本识别开源OCR引擎自动化表单填写

Ferron开源项目 – 高性能Rust Web服务器

Ferron是一个用Rust编写的正在开发中的Web服务器。它旨在实现内存安全、高效和高度可定制，使其成为寻找现代Rust服务器解决方案的开发人员和管理员的理想选择。

0

Rust Web服务器内存安全可扩展服务器高性能服务器

EasySpider开源项目 – 无需代码的可视化网络爬虫

EasySpider 是一款可视化、无需代码的网络爬虫工具，允许用户通过图形界面设计和执行网络爬取任务，而无需编写任何代码。它特别适合没有编程知识的用户，支持复杂的网页抓取任务，并且操作友好，易于上手。

0

可视化网络爬虫无需代码网页抓取工具

Gaga开源项目 – 高效开放世界3D场景编辑工具

Gaga 是一种基于 3D 感知记忆库的高效分组工具，专门用于开放世界场景中多视图一致的高斯分割和场景编辑。它通过先进的 3D 感知技术，提升分割一致性和编辑效率，适用于多种数据集，并提供开源支持和详细的使用指南。

0

3D场景编辑工具场景编辑开放世界3D分割开源项目

深入理解 CPython 虚拟机开源项目 – 解析 CPython 内部机制

该项目深入探讨了 CPython 虚拟机的内部机制，包括数据结构、对象系统和字节码的详细分析，帮助开发者更好地理解 Python 的底层实现。

0

CPython虚拟机Python底层实现字节码分析对象系统

Duck-UI开源项目 – 浏览器端DuckDB数据分析界面

Duck-UI是一个基于Web的高性能界面，专为与DuckDB交互而设计。它利用DuckDB的WebAssembly（WASM）能力，使用户能够在浏览器中无缝进行数据分析。该界面提供了丰富的功能，包括SQL编辑器、数据导入导出、数据探索、查询历史记录、主题切换以及键盘快捷键，旨在提升用户的数据分析效率和体验。

0

DuckDBSQL编辑器WebAssembly数据导入导出

XAIcluster开源项目 – 集群AI任务开源框架

XAIcluster是一个专为集群AI任务设计的开源框架，旨在为开发者提供高效利用多节点资源的工具。它支持分布式模型训练与推理，能够优化大规模计算任务，提升集群资源利用率，并确保任务运行的稳定性。

0

分布式模型训练计算优化集群AI任务开源框架集群推理

OpenMMD开源项目 – 将真人视频转换为3D动画

OpenMMD 是一款基于 OpenPose 的应用程序，能够将真人视频转换为可直接用于 3D 模型（如 Miku, Anmicius）的运动文件 (.vmd)，从而实现 3D 模型的动画制作。该工具高效且准确，支持多种 3D 模型，广泛应用于动画制作、虚拟现实（VR）和增强现实（AR）项目中的角色动画生成。

0

3D模型动画OpenMMDOpenPose视频转3D动画

meson-raytracer开源项目 – 用meson.build编写的轻量级光线追踪器

meson-raytracer 是一个用 meson.build 语言编写的简单光线追踪器。它提供了一个轻量级的实现，支持基本的光线追踪算法，并且易于与 Meson 构建系统集成。该项目适合用于学习光线追踪的基础知识，也可以集成到需要基本光线追踪功能的项目中。用户可以根据具体的渲染需求对其进行定制和扩展，或者在轻量级环境中尝试不同的光线追踪技术。

0

meson.build光线追踪器开源项目轻量级实现

mac-studio-server开源项目 – Mac Studio优化LLM服务器配置

mac-studio-server是为Mac Studio及其他Apple Silicon Mac优化的Ollama LLM服务器配置。支持无头设置、自动启动、资源优化，并通过SSH进行远程管理。

0

LLM服务器配置Mac Studio优化资源优化远程管理

tesserocr开源项目 – Python的OCR库

tesserocr是一个Python库，封装了tesseract-ocr的API，提供了简单高效的方式来处理OCR任务。它支持多种图像格式，能够从图像中提取文本，并支持多语言和配置。此外，它还提供了OCR结果的详细信息，包括置信度等。

0

OCR库Python图像处理文本提取