一个深度学习论文的学习项目,包含超过60篇论文的代码实现和详细注释,支持在线阅读和中文版。
本项目为2024年PyCon会议准备,提供关于现代深度学习基础知识及PyTorch的深入教程材料,旨在帮助参与者掌握深度学习的核心概念和实用技能。
ExLlamaV2是一个高效的推理库,旨在让用户能够在现代消费级GPU上本地运行各种大型语言模型(LLMs),并优化内存使用,以实现快速推理。
Magnetron是自制的迷你版PyTorch,从零开始构建,旨在提供一个简单而强大的深度学习框架,适合研究和生产使用。它的设计初衷是帮助用户更好地理解深度学习的基本原理,并在此基础上进行模型的构建与训练。
OpenThought ARC-AGI-2是一个开源项目,旨在构建认知核心,以解决人工智能领域中的各种挑战。该项目专注于开发能够自我改进和进行推理的智能系统,为推动人工智能的进步提供基础。
miniLLMFlow是一个极简的LLM框架,仅用100行代码实现,旨在使大型语言模型能够进行自我编程。该框架提供了简洁易用的接口,并支持高效的模型训练和推理,适合研究和应用开发。
nanoGPT是一个从零开始构建的深度学习语言模型,旨在复现Karpathy的GPT-2模型。该项目提供了详细的代码与视频讲解,帮助用户深入理解并实现深度学习语言模型,特别适合初学者学习深度学习与自然语言处理。