OSEA Mobile 是一款基于 Flutter 开发的开源跨平台应用,专注于完全离线的鸟类物种识别。它采用预训练的深度学习模型(如 ResNet34 和 MetaFGNet),支持识别超过 10,000 种鸟类,准确率高达 87.6%(验证集)。项目包含移动端应用和命令行工具,特别适合野外生物多样性监测和学术研究。核心数据集 DIB-10K 经过严格清洗,模型通过高性能计算训练,技术方案发表于生态学预印本论文。
AniPortrait是腾讯开源的一个项目,能够根据音频和静态人脸图像生成逼真的人脸动画,支持说话、唱歌等多种动态效果。该项目通过音频驱动,自动生成与口型一致的人脸动画,并且支持多种语言、面部重绘和头部姿势控制。AniPortrait的核心框架结合了深度学习模型,能够生成高质量的动画,并且支持通过视频进行人脸重绘。
EasyVolcap是一个基于PyTorch的库,专注于加速神经体积视频的研究,特别是在体积视频捕获、重建和渲染领域。它提供了预构建的深度学习模型,支持自定义网络构建,允许研究人员灵活地创建新算法。通过协同优化器、采样器和渲染器的设计,实现了高效的模型训练和渲染。此外,EasyVolcap还提供了预训练模型和数据集,以加速研究过程,并已被广泛应用于神经体积视频算法的研究和开发。
GraphCast是由Google DeepMind开发的一个基于图神经网络的中短期天气预测模型。它通过捕获地球大气层的复杂物理过程,生成高精度的天气预报。该模型在多个标准指标上表现出色,平均绝对误差比传统方法低15%。项目提供了预训练模型权重、归一化统计数据和示例输入数据,并支持在Google Cloud上运行和训练模型。
DeepJ 是一款 AI 驱动的 DJ 模型,能够实时以端到端的形式合成特定风格的钢琴曲。它不仅能够学习不同的音乐风格,还能捕捉并应用曲子的动态变化,提供高质量的音乐输出。
Timm是一个开源的计算机视觉库,专注于提供高效且易用的深度学习模型,涵盖了图像分类、目标检测、语义分割等任务,支持多种预训练的模型,广泛应用于各类视觉任务。
TextMatch是一个基于Pytorch的中文语义相似度匹配模型,专注于中文文本的语义相似度计算。它支持多种深度学习模型,包括ABCNN、Albert、Bert、BIMPM、DecomposableAttention、DistilBert、ESIM、RE2、Roberta、SiaGRU和XlNet。该项目提供了多种预训练模型,易于扩展和自定义模型,适用于各种自然语言处理任务。
ChatGLM.cpp是ChatGLM-6B的C++实现版,专为在macBook等设备上运行而设计。它通过C++实现优化了性能和资源使用,使其能够在资源受限的环境中高效运行,同时保持与ChatGLM-6B模型的兼容性。
ncnn-android-depth_anything是一个基于ncnn库和OpenCV的Android应用示例,旨在利用大规模未标记数据进行深度感知。该项目展示了如何释放深度学习的潜力,并支持动态输入形状的模型,适用于各种深度感知场景。
PlateRecognition是一个高精度车牌识别系统,支持12种车牌类型的检测与识别。该系统集成了yolov5、yolov7、yolov8等深度学习模型,识别准确率高达99.5%,适用于多种场景下的车牌识别需求。
Deep Knowledge Tracing (DKT) 是一种利用循环神经网络 (RNNs) 来追踪学生知识状态的深度学习模型。该模型由 Chris Piech 等人在 NIPS 2015 的论文中提出,旨在通过分析学生的学习历史来预测其未来的表现。DKT 能够处理大规模的教育数据,并提供对学习过程和知识获取的深入见解。此外,该模型的开源实现可在 GitHub 上获取。
该项目是Kaggle TGS Salt Identification Challenge 2018的第四名解决方案,专注于使用先进的深度学习模型进行盐体识别。项目包括数据预处理和增强技术,提供全面的训练和评估流程,并利用集成方法提高性能。此外,项目还提供了详细的文档和代码注释,便于理解和使用。
Model Zoo for MindSpore 是一个为MindSpore深度学习框架提供预训练模型和示例的仓库。它包含了多种深度学习任务的模型,如图像分类、目标检测和自然语言处理等,支持用户快速集成到MindSpore框架中。该仓库定期更新,提供详细的文档和使用示例,帮助用户更好地理解和使用这些模型。
smalldiffusion 是一个用于训练和采样扩散模型的简单易读的代码库,支持从最简单的玩具模型到最先进的预训练模型的实验。其核心代码只有不到100行,基于PyTorch框架,非常适合快速理解和实验。
YOLOv9 是一种实时对象检测模型,超越了所有基于卷积和Transformer的模型。它引入了可编程梯度信息(PGI)和通用高效层聚合网络(GELAN)来提高准确性。该模型在基于 MS COCO 数据集的目标检测上验证了优异的性能,并且仅使用传统的卷积算子即可实现更好的参数利用率。YOLOv9 适用于从轻型到大型的各种模型,能够从头开始训练的模型比使用大数据集预训练的state-of-the-art模型获得更好的结果。
SALT是一个用于训练分割网络的框架,通过条件概率建模数据中的层次关系,支持医学影像分割并提供灵活的标签树结构。
该项目一步步教你用Python实现一个语法风格类似于PyTorch的深度学习框架。本教程将使用Python的基础语法和NumPy来实现深度学习领域的一些基础算法,包括但不限于反向传播、随机梯度下降、Adam优化器、Dropout层等。本项目还会介绍如何实现包括CNN、RNN、LSTM、ResNet、Transformer等在内的模型。
Atomic AI是一个创新平台,专注于利用机器学习和结构生物学提升RNA药物发现,旨在改善RNA靶向小分子和RNA药物的设计与发现,简化RNA研究与药物开发的复杂过程。
AviaryAI是一个专为信用社设计的人工智能工具,利用先进的AI语音代理,优化外部联系,提高会员服务和运营效率,旨在帮助信用社员工自动化任务,让团队专注于更具战略性的工作。
该项目专注于通过投影器集成方法增强特征蒸馏技术,以提高模型性能和特征提取能力。
本文介绍了一个实用的最先进深度学习模型的实现,以便利用智能手机集成麦克风对笔记本键击进行分类。该模型能够在多种环境中准确捕捉和分析声音数据,评估用户的输入行为。
PLAID是一个蛋白质设计辅助工具,通过人工智能技术辅助蛋白质结构预测和设计,提高科研效率和准确性。它利用深度学习模型进行结构预测,支持多种设计任务,并提供可视化工具,以帮助研究人员理解和分析设计结果。
这是一个基于PyTorch的库,旨在加速在分布外(OOD)检测方面的研究,支持多种检测方法,并提供易用的API设计。该项目结合深度学习模型进行OOD任务,提供数据集和基准测试,且可与PyTorch深度学习框架无缝集成。
PrimeQA是一个先进的多语言问答研究与开发的主要资源库,支持最新的深度学习模型,易于扩展和定制,并提供多种数据集与基准测试,适用于实时问答和批量处理场景。
一个自然语言处理任务与实例集,提供多种NLP任务的实现和示例。
基于Rust语言实现的多语言文档OCR工具包,结合修改版Segformer、OpenCV和donut transformer,提供高效的文档识别与处理功能。
nGPT是NVIDIA开发的标准化Transformer模型,基于nanoGPT进行改进,旨在提升训练效率和处理能力。它通过在超球面上的表示学习和标准化过程,实现了对低精度运算的更好鲁棒性,并在不同的上下文长度设置中提供了显著的训练加速。
Jax GPT是对Karpathy的nanoGPT的重写,基于Jax和Flax框架构建,旨在提供高效的文本生成能力,支持快速训练和推理,具有易于扩展和修改的架构,能够充分利用高性能的并行计算。
该项目是一个基于SAM的显微镜分割和跟踪工具,旨在通过自动化技术提高显微镜图像分析的效率。它集成了先进的深度学习模型,能够支持显微镜图像的自动分割和细胞在时间序列中的变化跟踪,适合处理大规模数据集,并提供用户友好的界面。
Stable Diffusion是一个用于生成高质量图像的深度学习模型,经过1.5版本更新,具有更好的性能和功能。