从零开始编写并训练大语言模型的教程,旨在为对语言模型和深度学习感兴趣的开发者提供系统的学习资源。
康奈尔大学的Applied Machine Learning课程的执行课程笔记和幻灯片(2024年秋季版),讲授机器学习、数据挖掘和信号处理中的关键概念。
Upsy是一个开源的Slack机器人,旨在记住用户的对话,以便在用户有问题时提供快速、准确的答案。它通过统一的内存管理和隐私保护来提升用户体验,同时集成了OpenAI API,以便利用先进的人工智能技术进行支持。Upsy使用Node.js作为后端,结合Upstash Vector和Upstash Redis进行数据存储,并利用Langchain进行大语言模型的编排,确保部署简单且具有高度的定制性。
为深度学习爱好者提供从基础到进阶的实践教程,包括Jupyter Notebook形式的代码,支持在云平台上执行,涵盖神经网络、变分自编码器等多个深度学习主题
nki-samples是一个为AWS Trainium和Inferentia芯片优化的机器学习编程环境,提供高性能的NKI语言和指令集架构,支持深度优化,包含23个示例内核,适用于从基础到高级的优化示例,并集成Neuron Profiler,用于性能瓶颈分析。
EasyRL4Rec是一个全面且易于使用的库,专门为基于强化学习的推荐系统设计,旨在帮助开发者构建高效的个性化推荐模型。
Apple Silicon开发环境配置指南,为开发者提供在Apple Silicon芯片上安装和配置PyTorch、TensorFlow和JAX的指导,助力在M1/M2芯片上高效运行机器学习框架
一个为机器学习研究量身定制的GitHub模板,帮助研究人员快速搭建高效、规范的项目架构。
推荐系统入门指南,全面介绍了工业级推荐系统的理论知识,如何基于TensorFlow2训练模型,如何实现高性能、高并发、高可用的Golang推理微服务。
这本书帮助读者系统地解决机器学习问题,通过“边学边编码”的方式强化对机器学习建模过程的理解,涵盖数据处理、特征工程到模型优化的全流程,并通过实际案例引导读者掌握正确的思维方式。
Prototype是一个快速启动的Docker化模板,用于在几秒钟内设置带有OpenAI集成的Django项目。它允许用户通过一个命令创建复杂的项目,且是免费且开源的,用户可以轻松克隆和使用。
一个 Flutter 库,用于运行 ONNX 模型,可以将 Pytorch、Tensorflow 等主流机器学习框架训练的模型轻松转换为 ONNX 格式,并可在 iOS、Android、Web、Linux、Windows 和 macOS 等平台上原生运行,无需进行任何修改。
Graphiti是一个基于知识图谱的AI代理记忆系统,能够从不断变化的商业数据和聊天历史中自动构建丰富的图谱,使Python代理能够快速访问相关且准确的数据,适应不断变化的环境。
JAX是由Google开发的开源数值计算库,专为研究者和开发者设计,结合了数值计算和机器学习。它支持自动微分与硬件加速,在Transformer模型训练中性能较PyTorch提升30%,广泛应用于AlphaFold等前沿研究。JAX通过XLA编译器优化计算图,支持并行计算和动态控制流,使代码既高效又灵活。
一个比较Apple Silicon GPU上PyTorch和MLX性能的基准测试项目,通过5个不同场景的测试(包括Transformer语言模型训练、BERT微调、Whisper推理等),全面对比两个框架在M1/M3系列芯片上的性能表现,为苹果设备上的AI项目选型提供参考
一组优化性能的先进机器学习模型,可在高通®设备上部署,涵盖视觉、语音、文本和生成式 AI 等领域。
AnyModal是一个基于PyTorch的灵活多模态语言模型框架,支持轻松集成图像、音频等多种输入模态。它提供了模块化的架构设计,便于添加新的输入模态处理器和分词器,并拥有丰富的预训练模型库。AnyModal框架将多种输入模态直接融入大语言模型,适用于多模态数据的复杂任务。
supertree是一个强大的Python决策树可视化工具,专为在Jupyter Notebooks等环境中提供交互式决策树展示而设计。它支持缩放、展开和折叠节点、全屏显示等功能,并且兼容scikit-learn、LightGBM、XGBoost等主流机器学习库的决策树模型。通过supertree,用户可以直观地探索和分析决策树的结构,适用于教学、演示和数据分析报告等多种场景。
LangChain Swift是一个专为Swift语言优化的库,旨在支持iOS、macOS、部分watchOS和beta版本的visionOS,帮助开发者构建和优化AI应用,提供强大的工具和灵活性。
一个用于机器学习模型文件检查、验证、签名和验证的实用工具。支持safetensors、ONNX、GGUF和PyTorch等主流格式,具备模型内容检查、Ed25519签名验证、推理图生成等功能,特别注重安全性,PyTorch模型在隔离的Docker容器中运行以防止代码执行漏洞。
NVIDIA开发的高性能神经网络库,帮助构建尊重对称性的神经网络模型,提升模型的数据效率。该库通过优化的CUDA内核和全面的API,支持构建高效的等变神经网络,确保与主流深度学习框架的兼容性。
DigiQ 是一个利用人工智能技术,帮助用户通过少量数据训练高效的设备控制智能体的项目。它创新性地结合了视觉语言模型(VLM),显著提升了学习效果,并提供了完整的代码和预训练模型,方便用户复现和使用。
SALT是一个用于训练分割网络的框架,通过条件概率建模数据中的层次关系,支持医学影像分割并提供灵活的标签树结构。
Build Your Own X 是一个开源技术学习平台,旨在帮助用户从零开始构建各种技术项目,涵盖编程语言解释器、数据库、操作系统、网络协议、机器学习框架、游戏引擎等多个领域。项目提供丰富的学习资源和实践教程,适合初学者和有经验的开发者,旨在通过动手实践提升技术理解和应用能力。
该项目一步步教你用Python实现一个语法风格类似于PyTorch的深度学习框架。本教程将使用Python的基础语法和NumPy来实现深度学习领域的一些基础算法,包括但不限于反向传播、随机梯度下降、Adam优化器、Dropout层等。本项目还会介绍如何实现包括CNN、RNN、LSTM、ResNet、Transformer等在内的模型。
ChatGPT-On-CS 是一个开源且易用的AI客服工具,支持与Dify和FastGPT等AI平台无缝对接,可接入多个社交和电商平台,提供高效的AI客服解决方案,提升客户服务体验。
为LangChain和LangGraph提供全面、易懂的开源教程,面向全球用户,支持多语言学习,深入讲解最新功能,涵盖前沿特性,提供丰富的实战案例,助力新手快速上手。
本项目展示了如何使用 LangChain.js、TypeScript 和 Azure 创建一个无服务器的 ChatGPT 应用,旨在实现信息检索与生成的结合,提供灵活且可扩展的对话系统解决方案。
Attention Gym是一个基于PyTorch的灵活注意力机制工具集,为研究人员和开发者提供实验不同注意力机制的实验场,包含多种注意力变体的实现、性能比较和辅助功能。
用 Rust 语言实现的 LangChain,提供了 LLM、Embeddings、VectorStores、Chain、Agents、Tools 等功能,并支持多种 LLM 和 VectorStores