最小化的分布式训练框架,专为教育目的设计,让你轻松学习并实验预训练Llama类模型
ColossalAI是一个开源的分布式AI大模型训练框架,旨在降低大规模AI大模型的训练成本和复杂度。它通过先进的并行计算技术,让开发者在有限硬件资源下也能高效训练超大规模大模型。支持多种并行策略、混合精度训练、内存优化等技术,广泛应用于大规模模型训练、科研实验和企业部署。
Perceiver IO是DeepMind的Perceiver IO的非官方PyTorch实现,支持分布式训练,具有通用输入处理能力,适用于图像、文本和音频等多种任务,设计高效,能够处理大规模数据。
Helibrunna是一个兼容Hugging Face的xLSTM训练框架,旨在探索xLSTM在AI领域的潜力,提升模型训练效率并支持实验性研究。
mimictest是一个专注于机器人操控策略开发和测试的简单环境,支持多GPU训练和快速模拟环境搭建,旨在简化机器人学习的过程,帮助开发者更高效地验证和优化控制策略。
Phygital+ 是一个基于节点的AI工具,旨在帮助创作者在无需编写代码的情况下使用神经网络。它提供了可视化界面和直观的工作流程,使用户能够轻松构建和修改神经网络,同时配备优化和可视化工具,以增强对神经网络内部工作的理解。
本书旨在概述大型语言模型的基本概念并介绍相关技术,重点在于大型语言模型的基础方面,而不是全面覆盖所有前沿方法。
一个全面的移动端和PC端智能代理相关资源集合,包含最新论文、数据集和基准测试。收录了各类移动端智能代理系统的训练方法、输入类型、模型架构等详细对比,以及主流数据集的详细信息统计。
一个探索Flux Dev模型层级效果的工具,允许用户通过修改不同层的强度来研究模型行为,支持注意力层、双重块、单一块等多种层级的调整与实验
Higgsfield是一个专注于AI模型创建和训练的平台,旨在为AI爱好者、开发者和研究人员提供工具和资源,促进智能系统的开发。该平台鼓励社区合作,分享数据集、模型和见解,推动AI研究的进步。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型