CachedEmbedding开源项目 – 动态管理嵌入表内存

基于ColossalAI的软件缓存方法来动态管理CPU和GPU内存空间中的极大嵌入表，能够在单个GPU上高效训练包括91.10 GB嵌入表的DLRM模型，仅需分配3.75 GB的CUDA内存，适用于大规模数据集。
CachedEmbedding的特点:
1. 动态管理CPU和GPU内存空间
2. 支持极大嵌入表的高效训练
3. 在单个GPU上处理大规模数据集
4. 基于ColossalAI的高效内存使用

CachedEmbedding的功能:
1. 用于训练DLRM模型
2. 适用于Criteo 1TB数据集
3. 可与PyTorch的EmbeddingBag结合使用

相关导航

Pocket LLM官网 – 简化大语言模型的使用

Pocket LLM是一个平台，旨在使复杂的大语言模型和其他先进的人工智能技术对所有人都可访问。它提供定制化、私密的人工智能解决方案，这些解决方案在普通硬件上训练，具有超低延迟推理，消除了对GPU、TPU或定制ASIC的需求。用户可以在没有高级配置或GPU的情况下，仅使用CPU构建和部署数十亿参数的模型。

hl-gauss-pytorch开源项目 – 基于PyTorch的高斯直方图损失函数

hl-gauss-pytorch是一个基于PyTorch实现的高斯直方图损失函数（HL-Gauss），为回归任务提供了全新的视角，能够有效提升模型的性能。

Zero-to-Wan开源项目 – 极简可定制的Wan视频生成微调代码库

Zero-to-Wan是一个极简且可高度定制的代码库，专门用于微调Wan视频生成模型。它提供了从数据准备、模型训练到视频生成的完整流程，支持简单特效的微调，助力视频创作。基于PyTorch实现，易于扩展和修改，适合开发者进行自定义修改和扩展。

Deep-Learning开源项目 – 深度学习项目与实践教程

这是一个专注于深度学习项目和教程的仓库，提供了各种深度学习技术的实际实现和深入见解。通过全面的教程、神经网络的实际实现、真实场景中的深度学习应用示例、易于理解的代码片段和笔记本，以及支持TensorFlow和PyTorch等流行深度学习框架，帮助用户深入学习和应用深度学习技术。

Real-time 3D Multi-person Pose Estimation Demo开源项目 – 实时多人3D姿态估计

这是一个基于PyTorch的实时3D多人姿态估计演示项目。它支持使用OpenVINO后端进行快速的CPU推理，适用于实时应用。项目具有轻量级和高效的特点，能够在视频流中实时检测和估计多人的3D姿态，并提供3D姿态可视化。

Deep Learning Applications开源项目 – 基于PyTorch的深度学习应用库

这是一个包含多个基于PyTorch的深度学习应用的库，旨在为圣路易斯华盛顿大学课程提供教育资源和实例，帮助理解深度学习概念。

few-shot开源项目 – PyTorch实现的小样本学习框架

few-shot是一个基于PyTorch实现的小样本学习机器学习项目仓库。它提供了一个模块化和可扩展的框架，支持多种小样本学习任务，如分类和回归。项目包含预训练模型和数据集，便于快速实验，并提供数据加载、预处理和评估的实用工具。

LLaMA-O1开源项目 – 大型推理模型框架

LLaMA-O1 是一个大型推理模型框架，专为 PyTorch 和 HuggingFace 设计，支持训练、推理和评估。它集成了蒙特卡洛树搜索（MCTS）、自我对弈强化学习、PPO 和类似 AlphaGo Zero 的双策略范式，适用于大型语言模型的开发和应用。

makeMoE开源项目 – 稀疏专家混合语言模型实现

makeMoE 是一个从头开始实现的稀疏专家混合语言模型，基于 PyTorch 框架，采用自回归字符级语言模型架构。该项目灵感来源于 Andrej Karpathy 的 makemore 项目，旨在通过稀疏专家混合架构实现高效的语言模型训练和推理。它涵盖了模型的基本组成、自注意力机制、专家网络、Top-k 路由、噪声 Top-k 路由等核心组件的代码实现，并提供了模型的初始化方法、训练循环以及文本生成示例。makeMoE 不仅适用于研究和学习稀疏专家混合语言模型的实现，还可作为自回归字符级语言模型的参考实现，适用于自然语言处理领域的实验和开发。

openpi开源项目 – 开源智能机器人项目

openpi是一个开源的机器人模型和工具包，旨在实现智能视觉、语言和动作的一体化。它提供多种预训练模型和微调示例，支持多种机器人平台，如ALOHA和DROID。项目具备高参数模型，支持复杂的物理操作任务，适用于家庭自动化、物理智能研究以及复杂操作算法的开发和测试。

OpenLLaMA开源项目 – LLaMA模型的开源复现

OpenLLaMA是LLaMA模型的开源复现，基于RedPajama数据集进行训练，采用与LLaMA一致的预处理步骤、超参数设置、模型结构、上下文长度、训练步骤、学习率调度和优化器，旨在提供一个高效且可访问的语言模型。

machina开源项目 – 基于PyTorch的深度强化学习框架

machina是一个基于PyTorch构建的深度强化学习框架，旨在简化和加速深度强化学习算法的研究和开发。它提供了多种深度强化学习算法的支持，并具备高效的并行计算能力。框架采用模块化设计，便于扩展和定制，同时提供了丰富的文档和示例代码，帮助用户快速上手和深入理解强化学习原理。

PyTorch开源项目 – 开源深度学习框架

PyTorch是一个开源的深度学习框架，广泛用于计算机视觉和自然语言处理等领域。

Modular Diffusion开源项目 – 易于使用的模块化扩散模型

Modular Diffusion 是一个易于使用的模块化 API，旨在使用 PyTorch 设计和训练自定义扩散模型，适合多种应用场景，包括图像生成和去噪处理。

RunPod官网 – 全球分布的AI云平台

RunPod是一个全球分布的云平台，专门用于运行AI推理和训练。它提供GPU实例，支持流行的框架如TensorFlow和PyTorch，使得AI工作负载的处理变得简单便捷。用户可以通过注册账号并登录，部署基于容器的GPU实例，选择不同的GPU类型和区域以满足特定需求。RunPod还提供无服务器GPU计算、各种应用的AI端点以及增强隐私和安全性的安全云选项。

gan-manifold-reg开源项目 – GAN与流形正则化的半监督学习

gan-manifold-reg是一个结合生成对抗网络（GANs）和流形正则化（Manifold Regularization）技术的半监督学习项目。它旨在通过GANs生成额外的训练数据，并利用流形正则化技术提高模型在半监督学习任务中的性能。该项目基于PyTorch实现，支持自定义数据集和模型架构，适用于图像分类等半监督学习任务，尤其在医学图像分析等需要大量标注数据的领域中表现出色。

暂无评论

暂无评论...