Skywork-R1V 是一个先进的AI模型,通过38B参数实现文本与视觉推理能力的融合。它采用轻量级视觉适配器和三阶段训练方法,支持复杂数学问题解决和医学影像分析等场景。该模型在多个基准测试中表现出色,如MATH-500和MathVista,性能可能与闭源大型模型相当。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型