一个专注于挖掘多模态视觉语言模型潜力的开源项目,支持从2B到34B不同规模的密集和MoE大型语言模型,具备图像理解、推理和生成的能力。
LightMirrors是一个轻量级的缓存镜像站服务,旨在加速内网环境中的软件包下载和镜像拉取,基于Aria2实现了下载进度的实时显示,适用于DockerHub、PyPI、PyTorch、NPM等多个镜像源。
融合图像聊天、分割和生成/编辑的AI应用概念验证项目,基于LLaVA、SEEM和GLIGEN三个相关开源项目实现。
discuit 是一个功能完善的开源项目,旨在作为 Reddit 社区的替代方案,拥有良好的用户体验和可扩展性。它的后端使用 Go 构建,前端基于 React,数据存储依赖 MariaDB,临时数据管理则使用 Redis。
RQABench是一个开源的检索问答基准工具,旨在评估检索增强生成(RAG)系统,具有灵活性、可复现性和可追溯性等特点,支持多种RAG模型的评估并提供标准化的基准测试。
通过ROS 2和Gazebo仿真学习机器人基础知识的开源项目,适合初学者入门机器人编程和自主导航。该项目提供了一个丰富的仿真环境,让用户能够在不需要实际硬件的情况下进行学习和实验,包含了多种示例和教程,帮助用户理解机器人编程的基本概念和实现算法的细节。
这个贪吃蛇游戏的体积仅为56字节,比一条微博还小,极具趣味性与挑战性。
Llama Stack 是一个开源项目,旨在将 LLM 应用构建生成周期的所有组件打包,包括训练、微调、产品评估、观测、Agent & Memory、合成数据生成等,并支持 9+ 提供商。
OpenBiomechanics是一个开源项目,提供高质量的棒球投手动作捕捉数据,旨在促进运动科学和生物力学研究。该项目支持数据的可视化与分析,用户可以根据需要进行定制和扩展。
zLib-Web是一个用于自建搜索应用的开源项目,提供了多个相关源码,便于用户根据自己的需求进行定制和部署。
这是一个汇集了新兴编译器和架构相关的教程、论文、演讲及开源项目的资源列表。
SurfSense 是一款个人 AI 助手,旨在帮助用户记录和检索他们在互联网上看到的内容,包括社交媒体、聊天记录、日历邀请、重要邮件、教程和食谱等。通过跨浏览器扩展程序,它能提供便捷的记录与检索功能,支持本地 LLM,并且是开源的,用户可以选择自行部署。
一个开源免费的 NSFW 内容检测器,使用 Google 模型,准确度高,支持多种文件类型的检测。
E2M是一个强大的开源工具,可将多种文件类型如doc、docx、epub、html、htm、url、pdf、ppt、pptx、mp3、m4a等转换为Markdown格式,便于数据检索增强生成(RAG)及模型训练或微调,支持自定义配置,易于安装和使用。
这是一个正在开发中的SQLite扩展,旨在使用llama.cpp生成文本嵌入,适用于文本语义搜索和分析。
AI 代码工具 Bolt.new 是一个开源项目,旨在帮助开发者更高效地编写代码,支持多种编程语言,提供智能代码补全和实时预览等功能,用户界面友好,方便开发者使用。
SimpleAutomation是一个开源机器人自动化项目,旨在简化重复性任务的自动化过程,提供了一系列基于LeRobot仓库的辅助脚本,支持多模型联动以解决复杂的机器人任务。
Apollo是一个多语言医学模型、数据集、基准和代码的开源项目,旨在为英语、中文、法语、印地语、西班牙语和阿拉伯语提供医学领域的自然语言处理能力。
为ChatGLM/LLaMA等多种LLM提供了一个好用的基于PDF问答的图形界面,用户可以通过上传PDF文件与模型进行交互,获取所需的信息,界面友好,操作简单,适合各类用户使用。
利用 AI 进行实时语音绘图的工具,通过语音输入生成图像,支持语音控制绘图。
Perplexica是一个由AI驱动的搜索引擎,是Perplexity AI的开源替代品,利用先进的机器学习算法理解用户查询,从网络中寻找答案,同时保护用户隐私。
卡内基梅隆大学团队在首届AI数学奥林匹克竞赛(AIMO)中获得亚军的开源项目,包含完整的训练数据集(AIME、AMC、Odyssey-Math)、验证集、模型微调代码和数据收集脚本,为研究AI解决数学问题提供了宝贵资源
一个 Chrome 扩展程序,用于将论文PDF的Tab重命名为更具信息性的标题,帮助用户更好地管理和识别浏览器中的多个PDF标签,提升学术研究和资料整理的效率。
Data Prep Kit 是一个开源项目,旨在为大型语言模型应用程序的开发者提供高效的数据准备和处理工具。该项目支持多种规模的数据处理,从个人电脑到数据中心级别,兼容代码和自然语言等多种数据模式,帮助用户简化数据准备流程。
GitHub Copilot的最佳实践指南,由社区驱动的开源项目,旨在帮助开发者理解和整合AI工具,以提高产品开发效率。该项目汇集了多位开发者的经验,提供了优化使用GitHub Copilot的最佳实践和模式,帮助开发者在提高代码生成效果的同时,也提升了产品的开发效率和质量。
从零开始实现 Stable Diffusion,系统性讲解其工作原理和背后的数学,并提供训练一个扩散模型的步骤。
Whisper Web 是一个开源项目,允许用户在浏览器中运行基于机器学习的语音识别,无需后端服务器。它利用 WebGPU 技术实现加速,用户可以轻松进行语音转文本,并支持将识别结果导出为 TXT 和 JSON 文件格式,完全开箱即用。
Plate 是一个基于 React 的富文本编辑器框架,提供了 50+ 个插件可以直接开箱即用,支持与现有系统无缝集成,同时也允许进行组件的定制开发,满足不同用户的需求。
这个开源项目将GraphRAG与Ollama本地LLM结合,并提供可视化的知识图谱UI和监控。
使用不到 500 行代码构建对话式搜索引擎!实现了类似 Perplexity 的效果,完整的前后端代码,已在 GitHub 上开源,可商用。