AI开发框架 | 第 51 页

sparrow 是一个利用机器学习技术从扫描文档中提取结构化数据的工具。它支持多种文档格式，并提供了一个用户友好的演示界面，方便用户测试和验证文档提取模型。该项目是开源的，代码托管在GitHub上。

SpecStory开源项目 – Cursor IDE的AI编程历程记录工具

SpecStory是专为Cursor IDE设计的Visual Studio Code扩展，能够自动保存每一次Cursor聊天和编程会话到本地项目的.specstory目录中，确保AI编程历程的可追溯性。它帮助开发者轻松管理和回顾编程过程，特别适合需要追踪AI编程进展的用户。

0

AI编程历程记录工具Cursor IDE扩展SpecStory开源项目

Qwen2.5-VL开源项目 – 强大的多模态语言模型

Qwen2.5-VL是一款功能强大的多模态语言模型，擅长视觉-语言任务，具备增强的文档解析、物体定位和视频理解能力。

0

多模态语言模型文档解析物体定位视频理解

r1_vlm开源项目 – 高效训练视觉语言模型的工具包

r1_vlm是一个专为训练视觉语言模型（VLM）设计的高效工具包，旨在简化模型训练过程并提升任务执行效率。该工具包采用了基于GRPO的高效训练方法，在解码任务上能够达到96%的准确率，支持多种任务，包括信息解码和数字识别。

0

信息解码数字识别视觉语言模型训练工具高效训练方法

GLM-4开源项目 – 全面超越LLaMA 3的智谱开源模型

GLM-4是智谱开源的一个系列模型，包含基座模型、不同上下文长度的Chat模型和视觉模型。该系列模型在性能上全面超越LLaMA 3 8B，具备更快的速度和更低的价格。GLM-4支持1M无损上下文和26种语言，函数调用能力提升40%，视觉模型GLM 4V 9B的能力比肩GPT 4V。

0

GLM-4开源模型函数调用对话系统视觉模型

translation-agent-webui开源项目 – 吴恩达翻译项目的Web界面

translation-agent-webui是吴恩达translation-agent翻译项目的一个基于gradio的Web用户界面。它能够自动检测输入文本的语言，支持文本分词展示，并突出显示不同翻译版本之间的差异，帮助用户更直观地理解和比较翻译结果。

0

GradioWeb界面吴恩达项目翻译工具

DeepMind Lab2D开源项目 – 专为强化学习设计的2D虚拟环境平台

DeepMind Lab2D是由DeepMind开发的2D虚拟环境平台，专为强化学习（RL）和智能体训练设计。它提供了一个高度可定制且高效的训练环境，支持研究人员在各种AI任务中进行实验和优化。

0

2D虚拟环境AI训练开源项目强化学习

personal-ai开源项目 – 本地化个人AI助手

Personal AI 是一个利用 Apple Shortcuts、Cloudflare Workers 和 Llama 3 组装的本地 AI 助手，无需额外硬件或月费。它通过 Apple Shortcuts 提供 ASR、TTS 和 HTTP 请求功能，并通过 Cloudflare Workers 处理文本和函数调用。该助手支持与 Llama 3 的集成，比所有 AI 可穿戴设备更快，并且可扩展以支持更复杂的函数调用和内存管理。

0

AI集成Apple ShortcutsCloudflare WorkersLlama 3

DCLM-7B开源项目 – 苹果开源的大型语言模型

DCLM-7B是由苹果开源的一个大型语言模型，其能力接近LLaMA3 8B。该项目完全开源，包括模型和数据集，但上下文长度限制为2K。该模型在Huggingface上提供，适用于多种自然语言处理任务，如文本生成、翻译和问答。此外，它还可作为基础模型进行微调以适应特定任务，并在研究和开发中用于探索大型语言模型的性能。该项目也适用于教育和学习目的，帮助理解大型语言模型的工作原理。

0

开源大型语言模型教育工具文本生成模型微调

OpenCV Zoo开源项目 – OpenCV深度学习模型集合

OpenCV Zoo是由OpenCV提供的预训练深度学习模型和算法集合，适用于各种计算机视觉任务。该项目包含了多种预训练模型，支持多种深度学习框架，如TensorFlow、PyTorch和ONNX，并提供了易于使用的API，方便将模型集成到应用中。项目开源且社区驱动，定期更新新模型和改进。

0

OpenCV Zoo深度学习框架计算机视觉预训练深度学习模型

OvercookedGPT开源项目 – 多智能体任务规划评估环境

OvercookedGPT是一个OpenAI Gym环境，旨在评估大型语言模型（如GPT-4和Claude）在动态多智能体环境中的长期推理和任务规划能力。它提供了一个交互式的2D游戏环境，支持多种LLM，并生成时间序列任务，适用于复杂场景下的AI模型训练与评估。

0

AI模型训练与评估OpenAI Gym环境多智能体任务规划评估环境大型语言模型评估

RLAMA开源项目 – 本地文档AI问答工具

RLAMA是一个强大的文档AI问答工具，能够连接本地Ollama模型。它支持创建、管理和交互RAG系统，满足各类文档处理需求。支持超过30种文档格式，包括文本、代码和常见办公文件，且无需复杂配置，仅需Ollama即可在本地运行。

0

Ollama模型RAG系统RLAMA开源项目本地文档AI问答工具

transbridge开源项目 – 开源多模型翻译工具

transbridge 是一款专为调用大模型接口进行翻译而设计的开源、免费软件。它在大模型的基础上提供增值服务，支持二次开发，适用于多种专业领域的翻译。项目支持多提供商、多模型加载均衡、多级缓存机制，并兼容 DeepL API 接口格式，具备高性能和跨平台特性。

0

API兼容多模型翻译工具开源翻译软件跨平台翻译

samurai开源项目 – 零样本视觉跟踪项目

基于SAM 2模型的零样本视觉追踪框架，引入了运动感知记忆机制，能够在视频中实时追踪和分割目标物体，适用于复杂动态环境。

0

SAM 2模型实时视频处理目标物体追踪运动感知记忆

Dive-into-DL-TensorFlow2.0开源项目 – TensorFlow 2.0深度学习实践

《动手学深度学习》原书中MXNet代码实现的TensorFlow 2.0版本，适合喜欢TensorFlow的用户参考学习。该项目将《动手学深度学习》中的MXNet代码转换为TensorFlow 2.0实现，提供了深度学习基础知识的TensorFlow实现示例，代码结构清晰，易于理解和扩展。

0

TensorFlow 2.0深度学习实践动手学深度学习深度学习参考项目

dinov2-finetune开源项目 – DINOv2编码器微调助手

DINOv2编码器微调助手利用低秩适应（LoRA）技术对视觉任务进行编码器权重微调，简化新任务适配过程，显著提高模型在图像分割等视觉任务上的表现。该项目支持DINOv2编码器的微调，优化视觉任务的性能，适用于计算机视觉领域的各种任务。

0

DINOv2编码器微调LoRA技术图像分割计算机视觉

AIRS开源项目 – 科学AI研究开源工具集

AIRS（Artificial Intelligence Research for Science）是由德克萨斯农工大学DIVE实验室发布的开源软件工具、数据集和基准测试的集合，旨在推动人工智能在量子物理、化学、分子模拟、药物发现和材料科学等科学领域的应用。

0

分子模拟化学材料科学科学AI研究开源工具集

DeepSentinel官网 – AI安全防护平台

DeepSentinel是一个强大的AI安全平台，旨在通过高级数据隐私保护、合规性监控和实时威胁检测来保护AI工作流程。它提供全面的保护，确保数据安全，同时为各种规模的企业提供经济实惠且可扩展的解决方案。

0

AI安全防护平台合规性监控实时威胁检测数据隐私保护

AI Codex开源项目 – Cursor AI的自我提升系统

AI Codex是Cursor AI的自我提升系统，类似于其'学习笔记'，能够帮助AI从错误中吸取教训，不断提升自身能力。该系统通过记录、分析和学习错误，避免重复犯错，从而提高AI的编程能力和效率。

0

AI编程错误分析AI自我学习系统Cursor AI提升工具

Yi-Coder开源项目 – 开源代码语言模型

Yi-Coder是一系列开源代码语言模型，以少于100亿参数的规模提供最先进的编码性能。它支持52种主要编程语言，包括Java、Python、JavaScript和C++，并具备长文本理解能力，最大上下文长度为128K token。

0

代码生成与补全开源代码语言模型编程生产力提升软件开发辅助

blurr开源项目 – 集成Hugging Face与fastai的NLP库

blurr是一个将Hugging Face Transformers与fastai v2框架无缝集成的库，旨在简化在fastai中使用最先进的自然语言处理（NLP）模型的过程。它支持广泛的Hugging Face Transformer模型，并提供了数据预处理和模型评估的实用工具，使得在自定义数据集上微调Transformer模型变得非常容易。

0

fastaiHugging Face TransformersNLP文本分类

Diamond Env开源项目 – Minecraft强化学习标准化环境

Diamond Env是一个为强化学习设计的标准化环境，基于Minecraft中的Diamond任务。它提供了一致的实验条件，支持多种强化学习算法，并允许用户自定义任务和奖励机制。该环境适用于研究Minecraft中的智能体行为，并可作为基准环境进行性能评估。

0

Minecraft强化学习性能评估智能体行为研究

Iterra AI官网 – 无代码iOS应用开发平台

Iterra AI 是一个无代码平台，用户只需描述他们的想法，即可创建iOS应用程序。通过利用AI技术，它能够即时生成SwiftUI代码，实现快速应用开发，无需任何编程技能。用户可以实时预览他们的应用，在Xcode中自定义生成的代码，并轻松将应用程序部署到App Store。

0

AI生成SwiftUI代码iOS应用开发无代码开发平台

Nanobrowser开源项目 – 开源AI网页自动化工具

Nanobrowser是一款开源的AI网页自动化工具，作为OpenAI Operator的替代品，支持在本地浏览器中运行，注重隐私保护。它基于多智能体系统，能够自主完成复杂的网页任务，支持信息提取和自动化操作。用户可以使用自己的LLM API密钥，灵活选择不同的模型为智能体提供支持。该工具完全免费，无需订阅费用，数据永不外泄，适合需要隐私保护和高度自定义的用户。

0

LLM API密钥任务自动化多智能体系统开源AI网页自动化工具

book.fast.ai开源项目 – fastai书籍的补充资源

book.fast.ai是为阅读fastai书籍的读者提供的信息平台，包含代码示例、教程以及深度学习从业者的资源。项目定期更新，提供新内容和改进，帮助用户更好地理解和应用深度学习概念。

0

fastai书籍补充资源代码示例深度学习教程

Awesome Isaac Gym开源项目 – 机器人学习与强化研究资源集合

Awesome Isaac Gym 是一个精心整理的 NVIDIA Isaac Gym 相关框架、论文、软件和资源列表，旨在帮助机器人学习和强化学习研究。它提供了丰富的学习材料和视频教程，支持多种强化学习框架，以加速机器人开发。

0

NVIDIA Isaac Gym开源项目强化学习机器人学习

blender-mcp开源项目 – AI辅助3D建模工具

blender-mcp 是一个开源项目，通过 MCP（Model Control Protocol）实现 Claude AI 直接与 Blender 进行对话和控制，用户可以通过文字提示快速创建和调整复杂的 3D 场景。该项目简化了 3D 建模流程，提高了创作效率，适用于快速原型设计、自动化建模任务以及教育和演示用途。

0

AI辅助3D建模工具Blender插件Claude AI集成快速原型设计

fastbook2e开源项目 – 深度学习入门与实践

《Fastai & Pytorch深度学习入门》第二版代码，由fast.ai提供，目前正在开发中。该项目旨在通过提供深度学习的入门教程和代码示例，帮助初学者和进阶学习者快速掌握深度学习的基础知识和实践技能。项目基于PyTorch框架，易于上手，包含丰富的实践案例和项目，持续更新，紧跟最新技术发展。

0

PyTorch框架开源项目深度学习入门教程