mcp-go是Model Context Protocol (MCP)的Go语言实现,旨在为LLM(大型语言模型)应用与外部数据源和工具的无缝集成提供强大支持。通过简化服务器管理和减少代码量,mcp-go帮助开发者快速构建高效的LLM应用。
SWE Arena 是一个开源平台,旨在为自动化软件工程提供强大的代码执行和评估能力。它支持多种编程语言,提供安全的沙箱环境,自动管理依赖,并支持实时代码修改与反馈,从而显著提升开发效率。
AI迷思录是一份详细的人工智能应用与安全指南,旨在帮助用户从零基础成长为具备实战能力的人工智能安全专家。项目涵盖了人工智能的基础知识、相关法律法规、经典AI模型分析、AI漏洞与攻击探讨、防御方法与策略、安全开发与运维指导、相关框架与工具推荐、会议讲座资源整理以及实践实验室提供。
LLM Scraper 是一个开源的 TypeScript 库,利用大型语言模型(LLMs)从任何网页中提取结构化数据。它支持多种 LLM 提供商和输入格式,包括 html、markdown、text 和 image。此外,它还支持流式传输对象,并新增了代码生成功能,以提高数据处理的效率。
Phantasm 是一个为AI工作流实时监控与指导提供‘人在回路’审批层的开源工具。它通过Web界面实时管理审批流程,支持多语言客户端,能够快速集成到任何AI框架中,帮助用户创建人类在环(HITL)工作流,并实时监控AI工作流的执行情况。
FastGPT是一个企业级知识库系统,支持RAG+LLM的私有化部署方案,具有高准确率的文档解析和快速的问答响应时间。它采用混合检索引擎,结合BM25关键词和ColBERT语义搜索技术,提供高效的信息检索能力。此外,FastGPT还提供了操作流设计,允许用户可视化构建数据处理链路,并支持多模型兼容,可以灵活切换本地或云端的AI大模型。
Jupyter Copilot是为JupyterLab设计的GitHub Copilot扩展,提供原生的GitHub Copilot自动补全功能,支持多语言编程,与JupyterLab无缝集成,利用copilot.vim提供的语言服务器和@jupyter/completer模块实现自动补全,旨在让编程更加便捷高效。
MetaChain是一个零代码创建LLM Agent的全自动化框架,旨在让AI开发变得像聊天一样简单。它允许用户通过自然语言创建工具、Agent和工作流,无需编写任何代码。MetaChain集成了多种LLM,支持OpenAI、Anthropic等,并在GAIA基准测试中展现出卓越的性能,超越了行业领先方案。
MHA2MLA项目通过实现DeepSeek的多头潜在注意力机制(MLA),旨在使任何基于Transformer的大型语言模型(LLM)的推理过程更加经济高效。该项目支持多种Transformer架构,结合FlashMLA框架,理论内存节省可达80%以上,显著降低GPU内存占用。
BodyShapeGPT是一个通过文字描述生成逼真3D人体模型的工具,利用LLM技术,仅需文本输入即可生成高精度的3D人体模型,支持SMPL-X模型,提供21,000条文本描述与模型参数数据,助力深度学习与优化,让虚拟角色定制化变得前所未有的简单。
VideoFusion是一款开源免费的一站式视频批量处理工具,专为无经验的视频创作者设计。用户只需点击几下即可实现视频优化,无需关心复杂参数,轻松完成视频预处理。
Wave Terminal 是一个跨平台的开源终端,将文件预览、网页浏览和 AI 助手等图形功能无缝集成到传统终端中,让开发者在终端中无缝切换工作流。它支持多种文件格式的预览和编辑,内置代码编辑器,提供丰富的个性化选项,并集成多种 AI 模型,帮助开发者提高工作效率。
gh200-llm是一个专为NVIDIA GH200芯片优化的大型语言模型训练与部署解决方案。它支持多种架构,包括H100和GH200,并集成了VLLM、XFormers和Flash Attention等先进技术,能够轻松部署和微调8B模型。此外,该解决方案还支持在单个GH200节点上以fp8模式全上下文长度部署70B或72B模型,为大规模语言模型的应用提供了高效、灵活的解决方案。
Libredesk 是一款开源的自托管客户支持桌面应用程序,提供单一二进制文件,支持多渠道对话管理、自动化规则、客户满意度调查、宏命令、组织管理、自动分配、服务水平协议管理、商业智能连接以及人工智能辅助的回复改写等功能。
Awesome-LRM-Safety是一个专注于收集大型推理模型(LRM)安全相关研究的精选资源库。它涵盖了热门模型如DeepSeek-R1和OpenAI o1的安全性,提供最新arXiv论文的自动更新,内容涉及安全风险、缓解策略和伦理问题。项目还涵盖多个关键领域,如自动驾驶、医疗保健和金融安全,为研究人员、开发者和教育机构提供全面的资源支持。
ragas是一个专门用于评估检索增强生成(Retrieval Augmented Generation,RAG)性能的框架。它基于最新的研究提供工具,帮助用户评估语言模型生成的文本,并提供有关RAG管道性能的深入洞见。
OmniTools 是一个一站式在线工具集合,旨在让日常任务变得轻松简单。它提供了超过20种实用工具,涵盖图像处理、文本编辑、数学计算等多个领域。该项目支持自托管,用户可以轻松将其部署到本地服务器,满足个性化需求。OmniTools 完全免费,开源代码,用户可以自由扩展和定制。
AniLines-Anime-Line-Extractor是一款专门用于从动漫图片和视频中提取清晰线稿的工具。它提供了两种处理模式,包括基础模式和细节模式,后者能够提取更多背景和边缘线条。此外,该工具还支持视频处理,可以直接生成线稿视频,并支持二值化输出,满足动画制作的需求。
Hugging Face Kernels 是一个用于加载计算核心(kernels)的库,这些核心可以直接从 Hugging Face 的 Hub 中动态加载。它支持多个 Python 版本和不同的 PyTorch 构建配置,使 Python 应用能够直接从 Hub 加载计算内核,从而大幅提升性能和灵活性。
该项目提供了一个具有骨骼和肌肉的非刚性手模型,能够进行生物力学仿真和实时动画,适用于动画和游戏开发。
wdoc是一款强大的文档查询与总结工具,旨在一站式解决海量异构文档的检索与分析问题。它支持多种文件类型,结合LLM技术,能够高效处理数万份文档,并提供深度总结功能,帮助用户快速理解文档的核心逻辑与思路。
Kura 是一款基于语言模型的用户行为分析工具,旨在帮助用户深入理解用户行为,同时确保不泄露个人隐私。它通过递归聚类和自定义元数据提取等功能,满足个性化需求,并且是开源的,可以自由应用于各类数据。
JarvisBase是一个基于OpenAI的GPT-3.5-turbo模型、DeepLake向量数据库和Whisper API语音转录的智能语音问答聊天机器人。它能够通过语音与用户进行实时交互,提供智能问答服务,并支持多种语言的语音识别和生成音频响应。
Canopy是一套完整的基于检索增强生成(RAG)架构的知识图谱建立和查询引擎,利用Pinecone向量数据库技术,能快速构建自定义的RAG模型,随时查询文档库给出相关回答。它实现了完整的RAG工作流程,包括文档的切分、embedding、会话记录管理、查询优化、上下文检索以及增强生成,帮助开发者快速构建自己领域的问答系统,并支持迁移现有基于OpenAI API的应用。
Audiobook Creator 是一款将文字转换为有声书的工具,支持 EPUB、PDF、TXT 格式的书籍,能够一键转换成多角色配音的有声书,利用 NLP 和 LLM 技术智能识别角色并分配声音,提供单声道和多声道配音模式,支持多种输出格式,如 M4B、MP3 等,让阅读体验更加生动。
SuperGPQA是字节的豆包团队推出的评测项目,旨在为大语言模型(LLM)提供全面的研究生级学科评估框架。该项目覆盖285个研究生学科,通过创新的人机协作过滤机制确保题目高质量,并提供详细的模型性能对比,助力模型优化。
这是一个精心整理的关于图与自监督学习在推荐系统中应用的资源列表,涵盖了基于图的推荐系统、自监督学习技术、资源整合与整理以及多种推荐算法的支持。
Kaneo-app 是一个开源的项目管理平台,旨在让团队协作变得简单高效。它支持自托管,确保用户对数据的完全掌控,并提供极简的界面设计,专注于核心功能。此外,Kaneo-app 还提供丰富的定制选项,以满足不同团队的个性化需求。
腾讯混元Turbo S是腾讯推出的新一代快思考模型,已在腾讯元宝上灰度上线。该模型在知识、数理、创作等多个领域表现出色,具有快速响应能力,同时大幅降低了部署成本,推动了大模型应用的普及。
Arc Virtual Cell Atlas 是一个加速虚拟细胞模型创建的高质量数据集宝库,汇集了超过3.3亿细胞数据,涵盖观察性和干预性数据。项目提供Tahoe-100和scBaseCamp两大核心数据集,并且数据持续更新,助力生命科学研究。