自动分割

MONAI Vision Language Models开源项目 – 致力于医学应用的视觉语言模型

MONAI Vision Language Models开源项目 – 致力于医学应用的视觉语言模型

一个致力于医学应用的视觉语言模型集合，旨在解决通用模型在医学领域的挑战，并与专家分割和分类模型集成。

分类模型医学影像分析医学数据处理自动分割

med-flamingo开源项目 – 执行少样本医学视觉问答任务

med-flamingo开源项目 – 执行少样本医学视觉问答任务

med-flamingo是一个基于OpenFlamingo-9B和LLaMa-7B构建的模型，能够在医学领域执行少样本的视觉问答任务。该项目结合了CLIP ViT/L-14视觉编码器，并使用约4.7K本医学教科书进行训练，包含0.8M张图像和548M个token，支持1.6M个图像字幕对的生物医学数据集。

医学图像分析医学视觉问答少样本学习文本生成

SKY ENGINE AI官网 – 革新合成数据的深度学习平台

SKY ENGINE AI 是一个前沿平台，专为数据科学家、AI开发者和研究人员设计，利用合成数据进行视觉AI深度学习。它能够在虚拟环境中生成和训练定制的AI模型，适用于汽车、医疗和国防等需要高保真视觉数据模拟的领域。

AI模型训练合成数据生成数据科学工具深度学习平台

Gradio官网 – 简化机器学习模型交互

Gradio是一个强大的工具，旨在简化机器学习应用的构建和共享，提供用户友好的网络界面，使得任何人都能轻松与机器学习模型互动，无需复杂的编码知识。

Gradio医学图像分析教育演示数据可视化

clip-image-search开源项目 – 利用医学图片进行图像检索

clip-image-search开源项目 – 利用医学图片进行图像检索

利用医学图片训练开源CLIP模型，以实现医学图像检索，支持多种图像格式和高效的图像与文本匹配，具有强大的可扩展性，适用于各种医学应用场景。

医学图像检索医学应用图像与文本匹配开源CLIP模型

Infini-Megrez开源项目 – 端侧全模态理解模型

Infini-Megrez开源项目 – 端侧全模态理解模型

Infini-Megrez是全球首个端侧全模态理解模型，能够同时处理图像、音频和文本数据，具备强大的多模态理解能力。该模型以其高精度、高速度和简单易用性为核心价值，支持场景理解、OCR、中英文语音输入及多轮对话等功能，适用于多种复杂场景下的数据理解和分析。

图像识别文本理解端侧全模态理解模型音频信号分析

VGSE开源项目 – 视觉基础的零样本学习工具

VGSE开源项目 – 视觉基础的零样本学习工具

VGSE是一个用于零样本学习的工具，利用视觉基础的语义嵌入技术，能够在没有标记示例的情况下进行图像分类和视觉数据的语义理解。

图像分类视觉基础的语义嵌入语义理解零样本学习工具

Lunit官网 – 利用AI进行癌症筛查与治疗

Lunit Inc. 是一家利用人工智能开发癌症筛查和治疗先进技术的公司。其AI解决方案能够实现癌症的早期检测和治疗反应预测，最终拯救生命。

AI治疗反应预测AI癌症筛查精准肿瘤学

C2FViT开源项目 – 基于变换器的医学图像配准

C2FViT开源项目 – 基于变换器的医学图像配准

C2FViT是一个用于医学图像配准的项目，采用粗到细的注册方法，利用变换器架构提高图像对齐的精度，适用于医疗应用中的图像处理。

医学图像配准变换器架构图像对齐

AI-magic收录了大量国内外AI工具箱，包括AI写作、图像、视频、音频、编程等各类AI工具，以及常用的AI学习、技术、和模型等信息，让你轻松加入人工智能浪潮。

Copyright © 2025 AI-magic 浙ICP备19008543号-3