ViLMedic是一个模块化框架,专门用于医学领域的视觉和语言多模态研究。它提供了预训练模型,并实现了多种医学图像和文本任务的解决方案,包括医学问答、放射学报告生成和总结,以及自监督学习等。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型