这是一本由李宏毅老师和Datawhale团队出品的电子书,整理了李老师的视频教程,涵盖深度学习的理论与实战,提供丰富的学习资源和配套代码,适合各层次的学习者。
一个开源项目,旨在将 GPT macOS 应用功能提供给 Windows 和 Linux 系统使用。该助手集成了多种功能,帮助用户更高效地利用 GPT 技术,无论是在编程、语音输入还是知识管理上,都能提供强有力的支持。
RaySystem 是一个多功能的工具集,涵盖笔记目录树生成、系统监控、分布式计算和 AI 全栈副业生存系统等多个领域。它支持 Flutter 框架,提供美观的 UI 设计和开源代码,适用于多种开发场景。RaySystem 还包括状态栏系统信息监控、macOS 系统资源监控、分布式应用框架等功能,帮助用户高效管理和监控系统资源,提升开发效率。
一套评估大语言模型AI研发能力的任务集合,包含7个具有挑战性的任务,涵盖Rust代码编程、GPT-2微调、嵌入修复、LLM训练优化、GPU内核优化等领域,每个任务都有明确的评分标准和基准分数,用于测试AI代理与人类专家的能力对比
LLM-Tuning 是一个专注于简化大语言模型(LLM)微调过程的工具,支持多种模型与数据集,旨在帮助用户轻松实现模型训练与评估。
一个 Python 库,用于创建和处理自然语言处理 (NLP) 数据集,以便训练大型语言模型 (LLM)。该库包含一些可扩展的模块,允许 NLP 研究人员从无标注 Web 采集高质量文本,并提供 GPU 加速功能。
FastMCP是一个快速构建Model Context Protocol(MCP)服务器的Python框架,提供了简洁的API接口来构建LLM上下文服务。它支持工具函数、资源访问、提示词模板等功能,特别适合为Claude等LLM应用提供数据和功能支持。
为苹果的mlx机器学习库提供的非官方Rust绑定,支持在Rust程序中便捷地使用苹果的机器学习技术,特别适合希望在苹果生态中进行机器学习开发的开发者。
Delta是一个用Rust语言开发的开源机器学习框架,包含神经网络层、激活函数、损失函数、优化器等组件,并提供数据处理工具。
AURORA是一个免费的API,基于GPT-3.5模型,旨在提供易于集成和高效的文本生成服务,支持多种语言,适用于多种应用场景。
Llama Coder是一款旨在取代Github Copilot的工具,提供更强大的本地化AI支持,使用Ollama和Codellama技术,使得代码自动完成可以在用户的硬件上运行,适用于VS Studio Code,具备与Copilot相媲美的功能。
这是一个精心策划的Rust工具、库和框架列表,旨在帮助开发者在大型语言模型(LLM)、GPT和人工智能(AI)领域进行工作。该项目提供了全面的Rust库集合,专为LLM和AI开发而设计,注重性能和效率,并且定期更新新工具和资源。
Gorilla是一个擅长调用各类API的大语言模型,能够通过自然语言查询生成语义和语法正确的API调用。
MobileCPM是一个旨在帮助开发者将大型语言模型无缝集成到移动应用中的工具集,能够实现多种用例的本地模型能力,支持在移动设备上运行并提供多种功能,简化了开发者的集成过程。
将20美元的Cursor或Windsurf升级成接近Devin的智能编程体验。该项目通过智能流程规划与自我进化能力,使用户能够高效地进行编程,集成多种工具,支持自动化执行,提升开发效率。
llama-utils是一个便捷高效的工具,旨在支持用户在本地或边缘设备上运行定制和优化的语言模型(LLM)。它提供简单的操作方式,帮助用户快速部署和管理模型,同时确保高效的性能和资源利用。
Github Copilot是一个为VS Code设计的扩展,提供智能代码补全和实时建议,帮助开发者更高效地编写代码。它利用AI技术,根据上下文提供代码片段、函数实现等,支持多种编程语言,是提升编程体验的得力工具。
Alpaca 是斯坦福大学基于 LLaMa-7B 训练的开源语言模型,其性能可与 173B 的 GPT-3.5 媲美。通过优化数据集,Alpaca 能够在微调 7B 和 13B 参数的语言模型时显著提高效果。
用GPT-4o和思维链(CoT)创建类似o1的推理链,帮助AI模型通过可视化的步骤“思考”和解决逻辑问题。
高级检索增强生成(RAG)技术合集,包含10种先进RAG实现方案的详细教程。从基础的Naive RAG到高级的Adaptive RAG,提供完整的代码实现和评估方法。使用LangChain、Pinecone等主流工具,适合研究人员和开发者学习和实践RAG技术
qlora-pipe是一个开源脚本,旨在通过在四块4090 GPU上进行定制训练,以高效的方式训练大型语言模型(LLM)。它支持多块GPU的并行训练,并提供多种配置选项以优化训练流程,确保用户能够根据不同的需求灵活调整训练参数。
openai-forward是一个专为大型语言模型设计的高效转发服务,支持OpenAI API的反向代理功能,旨在提升请求处理效率,简化集成过程。
汇集语音语言模型和端到端语音对话系统的论文、代码和资源,旨在为研究人员和开发者提供全面的支持和参考。
UMbreLLa是一个使大型语言模型在普通设备上高效运行的工具,通过独特的技术组合,使得70B级别的模型在RTX 4070Ti上能够达到类似人类阅读速度的性能,尤其擅长处理编程任务。
GitHub Copilot for Xcode 是一个强大的 Xcode 扩展,旨在为开发者提供 AI 编程助手功能。在编码过程中,它能够根据上下文提供实时的代码建议,帮助开发者更高效地编写代码。该工具支持多种编程语言,极大地提高了开发效率和代码质量。
Aider.nvim是一个为Neovim设计的AI编码助手插件,允许用户在Neovim内部通过终端窗口与AI进行交互,极大地简化了开发者与AI编码助手的互动,提升了编码效率。该插件支持多种编程语言,并提供实时代码建议和自动补全功能,帮助开发者更快速地完成编码任务。
Void是cursor的一个开源替代,使用AI工具写代码,对数据有完全的控制,支持对接不同的LLM大模型,能够索引本地文件,变成AI搜索引擎。
一个基于MuJoCo的项目,旨在实现高效的接触动力学模拟,特别适用于机器人手臂和抓取任务的研究。
RectifiedFlow是一个简单统一的PyTorch代码库,专注于扩散和流模型,提供易于使用的平台用于训练和推理,强调简洁性、灵活性和快速原型设计。
Sudoku-RWKV是一款专门用于解决数独问题的神经网络模型,基于RWKV-v6架构,通过约2百万个数独样本训练而成。模型参数量约1270万,具有8层结构和320维度,能够有效解决任意有解的数独题目。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型