AI开源项目 | 第 82 页

STORM是斯坦福大学开发的创新型AI写作工具，结合GPT-4和Bing搜索，能够自动深挖资料、生成大纲、模拟专家对话，并逐步完成整篇文章或结构化报告的撰写。它支持多模型协作、文献引用管理、本地知识库集成，并能一键导出PDF或LaTeX格式，广泛应用于学术研究、市场调研等领域，显著提升写作效率和数据准确性。

0

LLM驱动研究工具多模型协作学术论文写作辅助深度主题分析

S3LLM开源项目 – 提高科学软件理解的语言模型框架

S3LLM，一种基于大型语言模型的框架，旨在提高对大规模科学软件的理解。该框架能够通过用户友好的界面，与用户进行交互式对话，同时分析源代码、代码元数据以及技术报告。

0

S3LLM开源项目交互式对话代码分析科学软件理解

LongSpec开源项目 – 高效解码长文本场景

长文本场景下的高效解码方案，让大语言模型推理不再卡顿。

0

大语言模型优化长文本解码高效推理

PaddleNLP开源项目 – 开源自然语言处理工具包

PaddleNLP是一个开源的自然语言处理工具包，集成了ERNIE 3.0等预训练模型，支持零代码实现文本生成、信息抽取等多种任务，中文任务的F1值可达92.1%。

0

PaddleNLP企业知识图谱信息抽取多语言翻译

Z-Ant开源项目 – 简化微控制器上神经网络的部署

Z-Ant（Zig-Ant）是一个开源SDK，旨在简化在微控制器上部署神经网络（NN）。Zant使用Zig语言编写，优先考虑跨兼容性和效率，提供导入、优化和无缝部署NN的工具，专为特定硬件量身定制。

0

Zig语言开源SDK微控制器神经网络部署性能优化工具

Magma开源项目 – 微软开源的多模态AI Agent基础模型

Magma是微软开源的多模态AI Agent基础模型，能够处理图像、视频、文本等多种数据类型，并具备心理预测功能，跨越数字和物理世界。它为虚拟与现实世界的交互提供强大支持，适用于复杂的交互任务，如UI导航和机器人操作，并在这些任务上达到SOTA性能。Magma还具备从海量未标注视频中学习的能力，展现出强大的泛化能力。

0

UI导航复杂交互多模态AI Agent机器人操作

深入挖掘 Llama 3 的从零实现开源项目 – 从零实现Llama3模型的详细教程

该项目是一份详细的教程，旨在帮助用户从零开始理解和实现Llama 3模型。教程基于naklecha/llama3-from-scratch的增强版本，进行了全面的改进和优化。通过清晰的目录结构、大量详细的代码注释、完整注解的矩阵维度变化、丰富的原理类说明和细节推导，用户可以轻松掌握Llama 3模型的实现原理和推理流程。此外，项目还提供了中英双语的代码文件，确保学习无障碍。

0

AI模型推理流程Llama 3模型实现教程中英双语代码文件从零实现Llama 3

Overcomplete开源项目 – 视觉SAE工具箱，助力可解释性研究

Overcomplete是一个基于视觉的自编码器工具箱，为深度学习模型的可解释性研究提供强大支持，旨在帮助研究人员更好地理解和分析复杂的视觉模型。

0

可视化方法概念提取深度学习模型可解释性研究视觉自编码器工具箱

Grounding Visual Representations with Texts for Domain Generalization – 合规预测与不确定性量化

一种合规预测和在无分布假设下评估不确定性的介绍性框架。

0

3D单对象跟踪6D物体姿态估计合规预测与不确定性量化对抗概念消除

On Pitfalls of Test-time Adaptation – 2023论文实现

本项目实现了2023年的论文，利用大型语言模型探索数学与电气工程课程的内容和结构。

0

大型语言模型课程探索数学与电气工程课程分析课程选择支持

SurveyX开源项目 – 自动化学术调研与论文生成工具

SurveyX 是一个基于大语言模型的开源工具，旨在自动化生成高质量学术论文和调研报告。用户只需提供论文标题或关键词，即可快速生成符合主题的学术内容。该工具支持多个领域，如计算机视觉、医学影像、网络安全等，并提供了30多个已生成的论文示例，帮助用户进行学术研究和文献调研。

0

AI生成论文的工具学术内容生成自动化学术调研工具论文撰写辅助工具

Web-Check开源项目 – 强大的网站分析工具

Web-Check 是一款功能强大的开源网站分析工具，能够快速、准确地扫描并分析任何网站的 IP 信息、SSL 链、DNS 记录、Cookie、域名信息、服务器位置、网站性能等。它支持在线使用，无需安装，完全免费，适用于网站管理员、开发者以及网络安全审计人员。

0

AI驱动的漏洞预测开源网站安全检测工具网站安全性提升自动化渗透测试方案

Ray开源项目 – 分布式AI计算引擎

Ray是一个由UC Berkeley开源的分布式计算框架，专注于简化大规模机器学习模型的训练与部署。它提供灵活的任务调度和资源管理，支持高效的资源利用和成本节约，让开发者能轻松扩展计算能力，处理复杂模型训练任务。Ray还具备弹性伸缩、异构调度和容错机制等特点，确保计算稳定性和效率。

0

Ray多模态模型大规模分布式计算容错机制

Roboflow Object Tracking Example – 基于AI的智能目标跟踪

该项目实现了基于Roboflow推断API、DeepSort和OpenAI CLIP的目标跟踪功能，适用于各种实时监控和图像分析场景。

0

AI目标跟踪DeepSort算法OpenAI CLIP技术Roboflow推断API

EasyR1开源项目 – 高效多模态强化学习训练框架

EasyR1是一个基于veRL的高效、可扩展的多模态强化学习训练框架，旨在帮助AI开发者高效训练各种模型，提供灵活的实验和开发环境。

0

AI模型训练Docker环境搭建多模态强化学习训练框架

Story-Flicks开源项目 – AI生成高清故事短视频

Story-Flicks是一款利用AI技术，根据输入的故事主题自动生成完整视频的工具。它能够一键生成包含故事内容、图片、音频和字幕的高清视频，特别适合制作儿童故事、营销视频和教育内容。支持多种文本和图像生成模型，如OpenAI、阿里云和DeepSeek，并允许用户自定义故事段落数量、配音风格和视频语言。

0

AI生成短视频自动化视频创作工具高清故事视频制作

Local Augmentation for Graph Neural Networks – 风险管理的新方法

一种利用符合预测技术进行风险管理的方法论。

0

不确定性量化符合预测金融投资组合风险管理

Awesome-RL-based-Reasoning-MLLMs – 多模态推理大模型资源库

为多模态研究者提供强化学习驱动的推理大模型（MLLM）资源库。汇集了多模态大模型推理领域的前沿论文和开源项目，提供了丰富的模型资源和代码链接，助力研究者快速上手，覆盖从文本到图像生成的多种应用场景。

0

多模态大模型推理资源库强化学习驱动的推理框架文本与图像生成结合应用

ChatPilot开源项目 – 智能对话助手

ChatPilot是一款基于LangChain的智能对话助手，集成了Google搜索、文件网址对话（RAG）和代码解释器功能，复现了Kimi Chat的交互体验。支持OpenAI/Azure API，提供前后端分离的服务架构，前端使用Svelte，后端使用FastAPI。

0

Google搜索Python代码解释器文件网址对话智能对话助手

hl-gauss-pytorch开源项目 – 基于PyTorch的高斯直方图损失函数

hl-gauss-pytorch是一个基于PyTorch实现的高斯直方图损失函数（HL-Gauss），为回归任务提供了全新的视角，能够有效提升模型的性能。

0

PyTorch回归任务强化学习模型性能提升

Minions开源项目 – 本地小模型与云端大模型高效协作

Minions是一个通信协议，旨在实现本地小模型与云端大模型之间的高效协作，能够显著降低云端处理成本，同时灵活适配多种模型以满足不同需求。该项目结合了最新的研究成果，支持Ollama和OpenAI等前沿技术，极大地提升了模型的处理效率和灵活性。

0

OllamaOpenAI本地小模型与云端大模型协作模型优化

LUCY开源项目 – 专注于语言理解与控制的AI项目

LUCY是一款专注于语言理解和控制的AI项目，致力于打造早期阶段的智能交互系统。它能够通过情感控制和自然对话能力，使用户体验更加丰富和人性化，并支持高效的功能调用演示来完成复杂任务。

0

LUCY开源项目复杂任务自动化情感控制智能交互系统

DiffTSR开源项目 – 基于扩散的盲文本图像超分辨率

DiffTSR是一个专注于使用扩散模型进行盲文本图像超分辨率的项目，旨在提高低分辨率文本图像的细节和清晰度，提升图像质量，为计算机视觉和图像处理任务提供支持。

0

基于扩散的盲文本图像超分辨率提升低分辨率文本图像质量计算机视觉支持

CVAE-GAN-zoos-PyTorch-Beginner开源项目 – 适合初学者的生成模型库

该项目为初学者提供了学习变分自编码器（VAE）、生成对抗网络（GAN）以及条件变分自编码器-生成对抗网络（CVAE-GAN）的最佳起点。项目包含自编码器（AE）、去噪自编码器（DAE）、变分自编码器（VAE）、生成对抗网络（GAN）、条件生成对抗网络（CGAN）、深度卷积生成对抗网络（DCGAN）、WGAN、WGAN-GP、VAE-GAN和CVAE-GAN，所有模型均基于PyTorch框架实现。

0

CVAE-GANGANPyTorchVAE

Open-Reasoner-Zero开源项目 – 开源的强化学习项目，助力大规模推理模型训练

Open-Reasoner-Zero是一个开源的强化学习项目，旨在支持大规模推理模型的训练。该项目提供了一个高效的训练框架，能够在较少的训练步骤下实现卓越的性能，从而推动AI智能化应用的发展。

0

AI智能化应用开发大规模推理模型训练开源强化学习项目

DeepSeek Profile Data开源项目 – 深度学习性能分析工具

DeepSeek Profile Data 是一个深度剖析计算与通信重叠策略的工具，旨在分析 V3/R1 版本中计算与通信重叠的策略，并提供了详细的性能分析数据。它通过 PyTorch Profiler 采集数据，支持在浏览器中直接可视化，帮助用户优化训练和推理框架的性能。

0

PyTorch Profiler分布式AI系统性能分析深度学习性能分析工具训练与推理框架优化

Awesome-Latent-CoT开源项目 – 大语言模型隐空间推理资源库

大语言模型在隐空间推理的论文库，汇集了LLMs隐空间推理的前沿研究，覆盖预训练、微调、多模态等多个方向，定期更新，紧跟最新学术动态，提供丰富的论文链接和代码资源，助力研究与实践。

0

LLMs隐空间推理资源库代码资源学术论文链接研究与实践

Roboflow Notebooks开源项目 – 一站式计算机视觉教程宝库

Roboflow Notebooks 是一个全面的计算机视觉教程集合，涵盖了从基础架构到前沿模型的各类内容。项目提供了47个前沿模型教程，如YOLO11、SAM 2等，以及20种计算机视觉技能实战，如车辆速度估计、自动化标注。此外，项目每周更新视频教程，确保用户能够紧跟技术前沿。

0

SAM 2YOLO11开源项目技能实战

Llama Cookbook开源项目 – 一站式LLaMA模型开发指南

Llama Cookbook是一个全面的指南，旨在帮助开发者轻松掌握LLaMA模型的推理、微调以及端到端应用的开发，适合从初学者到高级用户。

0

AI应用开发Llama CookbookLLaMA模型开发指南多模态推理

Claude Code开源项目 – 终端智能编程助手

Claude Code 是 Anthropic 开源的一款在终端中运行的 AI 编程助手，旨在帮助开发者理解和操作本地代码库。它能够执行基本编码任务、解释复杂的代码逻辑、处理 Git 工作流程（包括冲突解决、自动合并、提交和 PR 创建）、修复代码错误、进行自动化测试、代码格式化等。通过自然语言命令，开发者可以快速执行常规任务，简化复杂代码段，并自动化 Git 流程。

0

AI编程助手Git工作流程自动化代码格式化工具代码错误修复