AI交流(进群备注:MiniMind-V)

MiniMind-V是MiniMind纯语言模型的视觉能力拓展,包含VLM大模型的极简结构、数据集清洗、预训练(Pretrain)、监督微调(SFT)等全过程代码。它是开源VLM模型的最小实现,也是入门视觉语言模型的简明教程。
MiniMind-V的特点:
- 1. 从0开始,仅用1.3块钱成本 + 1小时即可训练出26M参数的超小多模态视觉语言模型
- 2. 包含VLM大模型的极简结构
- 3. 包含数据集清洗、预训练(Pretrain)、监督微调(SFT)等全过程代码
- 4. 开源VLM模型的最小实现
- 5. 入门视觉语言模型的简明教程
MiniMind-V的功能:
- 1. 用于训练超小多模态视觉语言模型
- 2. 用于学习和理解VLM大模型的极简结构
- 3. 用于数据集清洗、预训练和监督微调的全过程实践
- 4. 作为开源VLM模型的最小实现进行研究和开发
- 5. 作为入门视觉语言模型的学习教程
相关导航
暂无评论...