一个致力于医学应用的视觉语言模型集合,旨在解决通用模型在医学领域的挑战,并与专家分割和分类模型集成。
med-flamingo是一个基于OpenFlamingo-9B和LLaMa-7B构建的模型,能够在医学领域执行少样本的视觉问答任务。该项目结合了CLIP ViT/L-14视觉编码器,并使用约4.7K本医学教科书进行训练,包含0.8M张图像和548M个token,支持1.6M个图像字幕对的生物医学数据集。
SKY ENGINE AI 是一个前沿平台,专为数据科学家、AI开发者和研究人员设计,利用合成数据进行视觉AI深度学习。它能够在虚拟环境中生成和训练定制的AI模型,适用于汽车、医疗和国防等需要高保真视觉数据模拟的领域。
Gradio是一个强大的工具,旨在简化机器学习应用的构建和共享,提供用户友好的网络界面,使得任何人都能轻松与机器学习模型互动,无需复杂的编码知识。
利用医学图片训练开源CLIP模型,以实现医学图像检索,支持多种图像格式和高效的图像与文本匹配,具有强大的可扩展性,适用于各种医学应用场景。
Infini-Megrez是全球首个端侧全模态理解模型,能够同时处理图像、音频和文本数据,具备强大的多模态理解能力。该模型以其高精度、高速度和简单易用性为核心价值,支持场景理解、OCR、中英文语音输入及多轮对话等功能,适用于多种复杂场景下的数据理解和分析。
VGSE是一个用于零样本学习的工具,利用视觉基础的语义嵌入技术,能够在没有标记示例的情况下进行图像分类和视觉数据的语义理解。
Lunit Inc. 是一家利用人工智能开发癌症筛查和治疗先进技术的公司。其AI解决方案能够实现癌症的早期检测和治疗反应预测,最终拯救生命。
C2FViT是一个用于医学图像配准的项目,采用粗到细的注册方法,利用变换器架构提高图像对齐的精度,适用于医疗应用中的图像处理。