深度求索发布的开源代码大模型,33B版的性能显着优于现有的开源代码LLM。该项目包含多个规模的代码语言模型,从10亿到330亿标记不等,经过预训练,使用16,000标记的窗口大小和额外的填空任务,支持项目级别的代码补全和填充,在多种编程语言和各种基准测试中取得最先进性能。
PearAI是一个集成多种顶级AI工具的统一平台,提供统一的用户界面,方便用户使用不同的AI工具。该项目包含VSCode fork和Continue fork两大核心功能模块,支持AI代码编辑和AI聊天功能,基于TypeScript/Electron.js开发。
DB-GPT是一款AI原生数据应用开发框架,支持本地化部署,不依赖外部服务器或云服务,确保数据隐私和安全性。它具备多模型管理、Text2SQL效果优化、RAG框架优化、Multi-Agents框架协作等功能,助力企业数字化转型与业务增长。DB-GPT在自然语言转SQL准确率达92.8%,并在TPC-H基准测试中超越GPT-4大模型。
mcts-llm是一个集成了蒙特卡洛树搜索(MCTS)和提示工程技术的轻量级项目,旨在提高大型语言模型(LLMs)的性能。该项目通过结合MCTS算法与大型语言模型,优化提示工程,来提升模型的响应质量。其轻量级的设计使得该项目易于集成和使用,并且支持多种语言模型,适用于各种自然语言处理任务。
Marsha是一个功能强大、基于英语的高级编程语言,通过LLM编译成经过测试的Python软件,旨在简化编码和开发过程。它支持函数式编程,允许用户使用自然语言编写程序,并提供多种智能功能,提升开发效率。
AubAI是一个开源的Flutter/Dart包,旨在为移动应用提供先进的本地生成式AI(gen-AI)模型,包括离线文本生成等功能。
《理解深度学习》是由Simon J.D. Prince编写的一本关于深度学习的专业书籍,内容涵盖深度学习的理论基础、性能评估、卷积网络、Transformers、图神经网络、生成对抗网络(GANs)、扩散模型(Diffusion Models)、强化学习等主题。书中提供了深入的理论和实践指导,并附有大量练习题,适合初学者和有经验的研究人员。
Roo-Cline 是一个开源项目,提供Cursor的功能,支持命令行交互和基于AI的浏览器测试,能够创建或编辑文件、执行命令、使用浏览器等,每一步操作都需要用户授权。
ShellAI是一款极简但功能强大的AI Shell助手,旨在帮助开发者快速查找和执行各种shell命令和代码片段,同时提供高效的语法高亮和简洁的响应格式,从而提升开发效率和代码可读性。
DeepSeek-R1是一个通过强化学习训练的671B参数推理模型,旨在在数学、代码和推理任务上与OpenAI-o1实现相当的性能。它基于Llama和Qwen蒸馏的六个稠密模型,支持32K上下文窗口与多模态扩展。在GSM8K数学推理测试中准确率达92.3%,在1.2TB代码数据上预训练,程序生成准确率提升27%。通过RLHF与宪法AI技术实现可控输出,表现出色,尤其在数学、编程和推理任务上。
用于交互式检查神经网络模块输入、输出、参数和梯度的工具,可以与Weights and Biases集成,也可以作为独立的解决方案运行
Notebook Intelligence (NBI) 是一个为JupyterLab设计的AI编码助手和可扩展的AI框架。它在底层使用GitHub Copilot,受其设计原则的启发。NBI通过GitHub Copilot提供的AI支持,显著提高了JupyterLab用户的工作效率。
RightTyper是一个Python编程助手,能够快速生成函数参数和返回值的类型注解,帮助提升代码运行效率,并且几乎不增加内存负担。该工具特别适合与pytest结合使用,以增强测试代码的可读性和可靠性。
GitDigest是一款将GitHub代码仓库转化为LLM友好文本的工具,支持一键分析代码库并生成优化后的提示文本。它能够提供代码目录结构、进行代码统计、生成仓库摘要,并且拥有简洁的Web界面,非常适合开发者进行代码分析和AI提示工程。
Open_Duck_Mini是一个开源项目,旨在制作一个迪士尼BDX机器人的迷你版,结合了现代机器学习技术与详细的设计和组装指南,让爱好者能够轻松制作并训练自己的机器人。
gemma-cookbook是一个关于谷歌Gemma模型的全面指南,提供详细的使用说明和多种示例,帮助用户快速上手、训练和评估模型,同时包含最佳实践和优化建议,易于集成到现有的机器学习工作流中。
MLE-Agent是一个智能助手,旨在为AI工程和研究提供无缝支持,包括自动化基线创建、智能调试等功能,助力用户高效管理机器学习项目。
《机器学习100天》是一个旨在通过100天的练习来帮助学习者掌握机器学习的项目,包含实用的代码示例和学习资源。项目涵盖机器学习的多个主题和算法,适合初学者和中级学习者,逐步引导学习,并提供每日练习和示例代码,帮助巩固学习内容。
Agent.exe 是一款开源的 Electron 应用程序,旨在让 Claude 3.5 Sonnet 能够直接控制本地计算机,并提供了简单易懂的安装和使用指南。
vit.cpp是一个使用纯C/C++实现的视觉变换器(ViT)推理库,结合ggml库进行优化,旨在提供高效的图像分类解决方案,易于集成和使用,适用于各种项目和嵌入式系统。
txtai是一个基于Python的库,结合了Hugging Face Transformers、Sentence Transformers和FastAPI,旨在方便开发AI驱动的语义搜索应用。它允许用户构建强大的搜索引擎,支持多种文本嵌入模型,并提供快速的API接口,适用于实时搜索和索引。
functionary是一个开源项目,基于LLaMA 2模型,具备理解和调用函数的能力,提供类似OpenAI API的功能,支持多种编程语言,具有很强的可扩展性和易于集成的特性。
Git-Aid是一个AI辅助的GitHub工具集合,旨在改善开发者在GitHub上的体验。它提供了一系列实用功能,包括查找重复问题、生成问题回复、提取仓库信息以及协助审核拉取请求,帮助用户更高效地管理项目和沟通。
本项目旨在利用合成数据,通过大语言模型从非结构化文档生成查询和相关文档,从而创建合成数据集,以微调开源嵌入模型。这样可以显著提高信息检索的准确性和效率,同时增强模型在特定领域的理解能力。
StarCoder是一款专为代码生成和补全设计的AI模型,支持多种编程语言,如Python、JavaScript、C++等。它能够理解代码上下文,提供智能补全、函数生成、代码优化等功能,大幅提升开发效率。基于大规模代码数据集训练,具备强大的语义理解能力,适用于自动化编码、代码审查和开发助手等应用场景。
CopilotKit是一个开源框架,专为构建自定义AI助手而设计,如应用内AI聊天机器人、AI代理和AI驱动的输入框。它支持生成式UI,允许AI聊天机器人通过插件与应用程序的前端、后端以及第三方服务进行交互。此外,它提供了直接替代<textarea />的人工智能辅助文本生成功能,使代理能够访问实时应用程序上下文并在应用程序内执行操作。用户还可以观察和干预应用内AI代理的操作。
OpenBB Terminal 是一个开源的股票和加密市场命令行工具,利用 Python 提供集成环境,让普通交易员能够使用数据科学和机器学习技术进行交易,支持多种数据源和实时市场数据,适合投资者和分析师使用。
llama2.go是一个基于LLAMA-2模型的纯Go语言实现,提供高性能的机器学习功能,易于集成,支持多种数据格式,适合在Go项目中使用。
DI-star是一个开源项目,旨在为StarCraft II提供决策人工智能,通过多种决策算法和可扩展的架构,支持自定义代理和策略的开发与实验,提供高效的训练和测试环境。
Flex 是一个强大的工具,能够将用户用自然语言编写的描述转换为高效的可执行代码。它支持多种自然语言输入,具备良好的扩展性和用户友好的命令行界面,能够为开发者提供实时编译和错误处理反馈。