Shumai是一个开源的、快速的、网络连接的可微分张量库,适用于TypeScript和JavaScript。
taco(张量代数编译器)用于对稀疏和密集张量进行高效的张量表达式计算,支持优化计算性能,适用于多种应用场景。
Bend 是一个将现代高级语言功能编译为 Apple Silicon 或 NVIDIA GPU 上的本机多线程的工具。它支持复杂的构造,如具有完全闭包的 lambdas、无限制递归和分支、folds、ADTs 等。Bend 编译为 HVM2,这是用 Rust 实现的线程安全运行时,旨在提供高效的并行计算能力。
该项目提供了多种梯度下降算法的实现,旨在高效优化机器学习模型的训练过程。
SkyPilot 是一个用于简化和优化机器学习工作负载的工具,允许用户在多种云环境中高效地运行和管理计算任务。它支持多种云提供商,包括 AWS、GCP 和 Azure,并提供自动化资源管理与调度、高效的工作负载分配与监控、与 SGLang 集成支持高吞吐量服务,以及简单易用的命令行界面。
Taichi是一种嵌入在Python中的领域特定语言,旨在加速Python代码执行,使其运行速度接近C++甚至CUDA,提供高性能的计算能力,同时保持Python的灵活性和简洁性。它支持多种硬件平台,包括CPU和GPU,并内置自动微分功能,具有强大的并行计算能力,适合各类高性能计算任务。
该项目实现了简单的梯度下降问题,支持Python、Numpy、JAX、C++和Mojo等多种编程语言,展示了Mojo的性能优势,代码结构易于理解和扩展,适用于机器学习和优化问题的基础。
从自动微分开始完全从头开始GPT-2训练,一个快速且功能完备的深度学习库,使用Python和NumPy编写
该教程是连接基础微积分与深度学习实践的桥梁,适合希望摆脱“黑箱”使用框架、深入理解模型数学本质的开发者。
taichi.js是一个现代化的JavaScript GPU计算框架,旨在提供高性能的计算能力,使开发者能够轻松地进行图形渲染、物理模拟、机器学习任务等。它支持多种数据类型,拥有易于使用的API,且具备跨平台兼容性,适用于多种应用场景。
testIT 是一个利用人工智能为模型仿真和仿真建模提供样本的工具。它通过聊天和模型创建机器人来实现更复杂的仿真,同时注重用户驱动的创新。
dvc.ai 是一套用于机器学习数据管理、实验追踪和管道自动化的工具,旨在提升机器学习项目的效率和可重复性。它允许用户对数据和实验进行版本控制,自动化计算资源的管理,并跟踪和管理机器学习实验的过程。
Mermaid Chart是一个协作式的基于文本的图表工具,由Mermaid开源项目驱动,旨在简化代码文档、提升团队工作流程,并使用AI生成复杂思想的可视化图形。
miniLLMFlow是一个极简的LLM框架,仅用100行代码实现,旨在使大型语言模型能够进行自我编程。该框架提供了简洁易用的接口,并支持高效的模型训练和推理,适合研究和应用开发。
DiscoGrad是一个自动区分C++程序中条件分支的自动微分工具,支持通过自动微分和蒙特卡洛采样等方法进行梯度估计。它能够与神经网络集成,广泛应用于交通、人群管理、流行病学等领域的程序优化和控制问题。
Sparse-Marlin是一个优化工具,专为4bit量化权重的2:4稀疏性推理核设计,旨在提升深度学习模型的计算效率和存储效率,适用于各种深度学习应用。
QuickPod是一个提供经济高效的GPU和CPU租赁服务的平台,用户可以从全球市场选择各种GPU和CPU供应商,支持动态定价,用户可以根据需求选择不同型号的设备,如H100、RTX 4090或RTX 3090。