所有AI工具AI学习网站AI开发框架AI开源项目

MiniMind-V开源项目 – 极简视觉语言模型实现

MiniMind-V是MiniMind纯语言模型的视觉能力拓展,包含VLM大模型的极简结构、数据集清洗、预训练(Pretrain)、监督微调(SFT)等全过程代码。它是开源VLM模型的最小实现,也是入门视觉...

标签:

AI交流(进群备注:MiniMind-V)

MiniMind-V是MiniMind纯语言模型的视觉能力拓展,包含VLM大模型的极简结构、数据集清洗、预训练(Pretrain)、监督微调(SFT)等全过程代码。它是开源VLM模型的最小实现,也是入门视觉语言模型的简明教程。

MiniMind-V的特点:

  • 1. 从0开始,仅用1.3块钱成本 + 1小时即可训练出26M参数的超小多模态视觉语言模型
  • 2. 包含VLM大模型的极简结构
  • 3. 包含数据集清洗、预训练(Pretrain)、监督微调(SFT)等全过程代码
  • 4. 开源VLM模型的最小实现
  • 5. 入门视觉语言模型的简明教程

MiniMind-V的功能:

  • 1. 用于训练超小多模态视觉语言模型
  • 2. 用于学习和理解VLM大模型的极简结构
  • 3. 用于数据集清洗、预训练和监督微调的全过程实践
  • 4. 作为开源VLM模型的最小实现进行研究和开发
  • 5. 作为入门视觉语言模型的学习教程

相关导航

暂无评论

暂无评论...