SurgicalSAM是一个高效的手术工具分割项目,支持类提示,旨在提升手术视频分析和医疗图像处理的效率。
Aidoc是一个旨在通过先进的AI影像分析提升放射学效率的工具,帮助放射科医生实时检测和优先处理急性异常,从而加快诊断和治疗决策。
CheXagent是一个基于视觉和语言的基础模型,专注于胸部X光片的解读,旨在解决医学图像领域中大规模视觉-语言数据集的有限性等挑战。该模型利用大规模的指令微调数据集CheXinstruct,设计了一个临床大型语言模型(LLM)和一个用于表示X射线图像的视觉编码器,同时连接视觉和语言模态的网络,提供了新的评估基准CheXbench用于系统评估。
arivis Cloud是一个配备AI工具包的平台,允许研究人员训练AI模型,自动化和自定义他们的图像处理任务。用户可以注册账户,上传图像或数据,使用AI工具包选择所需任务,训练AI模型或应用预训练模型,定制工作流程,自动化图像处理。
SKY ENGINE AI 是一个前沿平台,专为数据科学家、AI开发者和研究人员设计,利用合成数据进行视觉AI深度学习。它能够在虚拟环境中生成和训练定制的AI模型,适用于汽车、医疗和国防等需要高保真视觉数据模拟的领域。
Track Anything 是一个高效的目标跟踪项目,旨在实现视频中物体的准确跟踪与抠图,具有出色的实时性能和用户友好的界面。
MIMIC-CXR-VQA是一个复杂、多样且大规模的医学领域视觉问答(VQA)数据集,基于MIMIC-CXR数据库,旨在推动医学图像理解和问答系统的研究与应用。数据集包含多种类型的问题和答案,适用于模型的训练和评估,支持多种视觉问答任务。
Lunit Inc. 是一家利用人工智能开发癌症筛查和治疗先进技术的公司。其AI解决方案能够实现癌症的早期检测和治疗反应预测,最终拯救生命。
本地部署全功能版stable diffusion,支持多种配置和功能,适用于深度学习图像生成任务。该项目允许用户在本地环境中生成高质量的图像,支持多种输入方式和参数设置,能够满足不同的生成需求。
DSTA 是一种基于视频的人体姿势估计的新方法,能够将输入直接映射到输出关节坐标。它通过解耦时空聚合网络和联合局部感知注意机制,灵活捕获关节的空间和时间信息,在 PoseTrack2017 数据集上实现了显著的性能提升。
M6Doc是用于现代文档布局分析研究的数据集,包含9,080张现代文档图像,涵盖科学文章、教材、试卷、杂志、报纸、笔记和书籍等七个子集,提供了多样的数据来源和详细的文档布局标注标签。
利用医学图片训练开源CLIP模型,以实现医学图像检索,支持多种图像格式和高效的图像与文本匹配,具有强大的可扩展性,适用于各种医学应用场景。