这个开源项目的主要功能是利用本地托管的大型语言模型编写代码和单元测试,旨在加强开源人工智能模型的能力。
ChineseLyrics是一个包含超过10万首中文歌词的数据库,歌词数据结构化,便于查询和使用,支持多种编程语言的接入,易于扩展和更新。
为研究人员提供在HuggingFace数据集上微调Qwen 2视觉语言模型的脚本集合,支持通过Gradio网页界面和命令行进行模型训练,具有交互式训练和批量处理功能。
一款开源的自动化 AI 播客生成工具,能够自动抓取网络新闻内容,并生成听起来自然流畅的叙述性音频播客。
H2ONet 是一个专注于手部遮挡和方向感知的网络,能够实时进行3D手网格重建,基于深度学习的高效算法,使其在各种应用中表现出色。
CNwoman-bot是一个详尽的项目,旨在对恶人进行盘点和分析,提供用户友好的界面和多种查询方式,帮助用户获取恶人相关信息及行为模式。
Gemini多模态试炼场是一个用于构建实时语音和视频代理的 Python 应用,借助 Google 的新 Gemini 2.0 模型,支持实时语音和视频输入以及音频回应。该应用程序提供两种版本:完整的全栈 web 应用程序和独立的 Python 脚本,方便用户根据需求选择。
一款完全免费基于搜索的问答 AI 工具,可本地运行且无需 GPU 硬件支持,能很好确保隐私安全。
OpenLM是一个与OpenAI兼容的库,可以调用其他供应商(如HuggingFace,Cohere等)的LLM。它的使用方式与OpenAI的Completion API相似,返回的响应结构也相似。
这是一个包含Docker实践、教程和示例的集合,旨在帮助初学者有效学习Docker。
EdgeVLA是一个开源的边缘视觉-语言-行动模型,旨在增强机器人对视觉信息的理解和执行指令的能力。该项目专为边缘计算环境设计,支持社区贡献和改进。
AsrTools 是一款智能语音转文字工具,集成了剪映、快手、必剪的官方接口,支持高效的批量处理,提供用户友好的界面,无需 GPU,可以免费使用大厂的 ASR 服务,支持 SRT 和 TXT 格式的输出。
PeterCat是一个GitHub项目库的智能问答机器人,旨在提升代码维护者与社区用户之间的问答效率。它能够自动抓取GitHub上的文档和issue,作为知识库,支持多种集成方式,并提供丰富的功能,如项目信息查询、Discussion回复、PR总结、代码审查和issue管理。基于AWS与Supabase架构,支持私有化部署,采用TypeScript和Python双语言开发,确保代码质量和文档完备性。
NewHope是一个专注于编程的语言模型,基于llama-2-13b进行微调,结合了GPT-4的编程能力,旨在高效处理各种编程任务,支持多种编程语言,提升开发者的工作效率。
21st是为设计工程师打造的npm,汇集了最佳的shadcn UI风格React Tailwind组件、模块和钩子,帮助开发人员快速构建高质量的用户界面。
Search-o1是一个增强大型推理模型的搜索工具,类似于为模型装上“搜索引擎”,使其在思考过程中能够随时查找知识,从而减少错误和不确定性,提升完成复杂任务的能力。
ocrmac 是一个用于从 Mac 系统上的图像中提取文本的 Python 封装库,利用 Apple 系统的视觉框架,能够高效地识别并提取图像中的文本内容。该库专为 macOS 10.15 及以上版本设计,能够提供文本的置信度和边框信息,方便开发者在应用程序中集成 OCR 功能。
event_logger_rails是一个Rails gem,用于将记录的事件编织成可供分析的整体,帮助开发者更好地管理和分析应用中的事件数据。
这是DoctorWkt在github上开的一个编译器教程,强调实践操作,提供详细步骤和解释,旨在编写一个能够自我编译的编译器。