MAPE-PPI 项目旨在通过微环境感知的蛋白质嵌入技术,提升蛋白质相互作用预测的有效性和效率。该项目结合了深度学习和生物信息学,能够准确预测蛋白质之间的相互作用,为生物研究和药物发现提供重要支持。
Stick-breaking Attention 是一种基于 Triton 的变长序列注意力机制实现,旨在通过优化计算方式提升在 GPU 上的性能,适合多种深度学习任务,易于与现有框架集成。
整理了AI工程师相关知识和面试题列表,涵盖深度学习、机器学习、自然语言处理、推荐系统、搜索系统等相关知识内容,内容非常详细且图文并茂,方便在线阅读。
JFLUX是Black Forest Labs的Flux.1系列模型的JAX实现,支持FLUX.1的多个变体,并鼓励社区参与进一步的性能优化和功能增强。
这是一个基于TensorPack框架的实现与模型集锦,包含多种预训练模型,适用于图像处理和计算机视觉任务,易于扩展和自定义。
voltaML-fast-stable-diffusion是一个轻量级库,通过简单的一行代码实现对Stable Diffusion模型的加速,速度提升可达10倍,支持Dreambooth的快速推理,方便用户进行机器学习和深度学习项目的快速部署和集成。
利用 TripoSR 模型从 2D 图像中推断出 3D 形状和纹理数据。该项目通过深度学习技术,能够从单张2D图像生成高质量的3D网格,支持用户进行手动几何编辑和纹理烘焙,极大地提高了生成效果和灵活性。
Towhee 是一个开源的嵌入框架与社区,旨在帮助用户使用深度学习的方法处理非结构化数据,如图片、视频和自然语言。
该模型在全球首届 AI 数学奥林匹克竞赛(AIMO)获得了第一名,开源,可以在本地电脑上直接跑。它是基于 deepseek-math-7b-base 的微调版本,经过两阶段微调以达到排行榜获胜解决方案,并使用思路链 CoT 提示进行模板化,同时采用 MSFT 的 ToRA 格式进行 GPT4 输出并执行代码,具备与 Transformers 集成的能力。
RLx2是清华大学团队提出的一种强化学习专用的稀疏训练框架,能够完全基于稀疏网络训练深度强化学习模型。
MoveNet是一个基于深度学习的高效姿态检测模型,能够在PyTorch环境中实时估计人体姿态,支持多种输入格式,并能在多个设备上运行,包括移动设备。
基于Triton语言实现的Flash Attention, 采用OpenAI团队发布的Fused Attention代码,优化了注意力机制,适用于大规模数据处理,支持快速训练和推理,兼容多种深度学习框架。
该项目提供了现代深度学习技术在自然语言处理中的应用,包括多种模型和算法,结合实用代码示例,适用于多种NLP任务,文档易于理解,同时持续更新最新研究成果。
VGGSfM是基于运动的视觉几何深层结构,旨在从输入图像中提取2D轨迹,通过图像和轨迹特征重建摄像机,初始化点云并应用捆绑调整层进行重建细化。
通过蒸馏技术将复杂模型中的知识转移到更小的模型中,以便在资源受限的设备上有效运行AI模型。
一站式AI开发平台,支持机器学习、深度学习和大模型开发。它提供从数据管理到模型部署的全流程支持,涵盖在线开发、分布式训练、推理服务等功能,帮助企业和开发者高效构建AI应用。
LLM101n是由AI领域知名专家Andrej Karpathy开发的一个综合性AI课程,专注于大型语言模型(LLM)的教学。课程从基础知识到高级应用,涵盖深度学习和自然语言处理技术,旨在帮助学习者全面掌握AI技术,并构建类似于ChatGPT的可运行Web应用程序。课程内容包括Python、C、CUDA编程实现,反向传播技术,Transformer架构,注意力机制,分词技术,模型优化,分布式训练,监督微调,强化学习,以及模型部署和多模态技术应用。
基于PyTorch的时间序列预测工具,它能帮助用户轻松实现高精度的时间序列预测,无论是专业人士还是初学者都能快速上手,为实际应用和研究提供强大支持
CSTS是一个专为中文设计的自然语言推理与语义相似度数据集,包含多种推理场景,提供丰富的标注数据,旨在支持机器学习和深度学习模型的训练,帮助提升中文文本的理解和处理能力。
imgfind是一个基于Rust、candle和CLIP构建的图像搜索工具,旨在提供高性能的图像检索体验。它利用深度学习技术和CLIP模型,支持多种图像格式,并具备用户友好的命令行界面,适用于各种图像搜索需求。
包含真实场景级视频和场景标注的大型数据集,具有10,510个多视角场景,51.2百万帧,分辨率为4k,还包括140个用于新视角合成(NVS)的基准视频以及来自SOTA NVS方法的训练参数,为深度学习的3D视觉任务提供了丰富的场景和标注信息
基于PyTorch的GPT-2模型训练器,优化效率和代码简化,实现现代技术如旋转嵌入,以更少的token达到相同验证损失。该项目专注于提升模型训练的效率,使得用户能够在多种深度学习任务中更便捷地使用GPT-2架构。
DeepBattler是一个基于深度学习的AI项目,旨在自动玩炉石战旗游戏。它通过实时分析游戏状态,智能选择策略,并提供用户友好的界面,让玩家能够轻松配置和优化游戏表现。
flash-attention是一个基于FlashAttention优化的Transformer实现,其训练速度在GPT2和GPT3上比Huggingface的实现快3-5倍,显著提升了训练效率,同时优化了内存使用,并支持多种硬件加速。
SDT是一个基于深度学习的笔迹模仿模型,能够支持多种书写风格的生成和实时调整,兼容多种输入设备,旨在提升用户的书写体验。
一个包含双曲嵌入、双曲模型和双曲应用相关论文的综合资源库,旨在提供最新的研究成果和实用工具,帮助研究者和开发者更好地理解和应用双曲表示技术。
Epoching-Blog是一个集成了PyTorch、fastai和HuggingFace的自然语言处理实战教程,旨在帮助用户通过实践深入理解深度学习及其在NLP领域的应用。项目提供了丰富的代码示例和详细的教程,适合希望提升NLP技能的学习者。
该项目提供了一个系统的路线图,帮助学习者在2024年掌握生成人工智能的各个方面,包括Python编程、基本机器学习、自然语言处理、深度学习、高级NLP概念以及生成式AI的应用和部署方法,同时还介绍了向量数据库和存储的相关内容。
FaceChain是一个由阿里达摩院开发的开源工具,允许用户通过上传少量照片生成个性化数字分身。它结合了多种先进的图像生成模型和面部理解模型,支持在本地和云上运行,适用于个人头像、艺术创作、研究开发等多种场景。
‘英特尔创新大师杯’深度学习挑战赛赛道3专注于中文自然语言处理中的地址相关性任务,提供了一种基于深度学习的高效解决方案,包含模型训练、评估及开源实现,旨在促进社区的使用与贡献。