标签:多模态模型

Step R-mini:阶跃星辰在大模型领域的创新与突破

阶跃星辰最新推出的Step R-mini模型,作为其多模态技术矩阵的重要一环,展现了在推理和生成能力上的卓越表现。本文将深入探讨Step R-mini的技术特点、应用场...

Migician:清华团队推出的多模态模型,引领多图定位新潮流

清华团队推出的Migician多模态模型在MIG-Bench测试中表现优异,平均性能提升24.94%。该模型擅长结合文本指令与图像理解,支持多张图片中的物体定位,并实现更...

Step-Video-T2V:AI技术赋能影视内容生产的新篇章

欢瑞世纪与阶跃星辰合作共建“麟跃”AI联合实验室,接入Step-Video-T2V等多模态模型,推动AI技术在影视内容生产中的应用。本文探讨这一合作的意义及其对影视行...

2025年AI大模型竞争格局:MobileVLM与多模态模型的未来展望

本文深入分析2025年AI大模型的三种发展路径,包括多模态模型、大语言模型和独立基座模型,重点探讨MobileVLM的技术优势与未来潜力,并结合DeepSeek-R1等最新...

探索 SmolVLM-256M:世界上最小的视觉语言模型

Hugging Face 发布的 SmolVLM-256M 是世界上最小的视觉语言模型,基于 SigLIP 图片编码器和 SmolLM2 文本编码器,能在移动平台上轻松运行,仅需不到 1GB 的 G...

ICML 2023最佳论文奖揭晓:SD3引领图像生成新浪潮

ICML 2023公布了今年最佳论文奖,图像生成模型SD3凭借其创新性技术脱颖而出。本文将深入探讨SD3的核心技术,包括多模态统一表示空间、Dream Engine框架及其在...

检索增强生成(RAG):推动生成式AI的下一波浪潮

随着生成式人工智能的快速发展,检索增强生成(RAG)技术成为推动AI应用的关键。本文将探讨RAG技术在多模态模型、AI代理部署中的作用,以及其如何重塑数据中...

Flow Matching在视频生成模型中的革命性应用

2024年AI领域在生成模型方面取得了重大进展,特别是在视频生成领域。Alibaba的Wan 2.1模型通过Flow Matching技术,实现了高效、稳定的视频生成,展现出在复杂...

数据归因与选择性遗忘:多模态模型中的新挑战与机遇

在ICML 2024上,专家们深入探讨了数据归因问题及其在模型健壮性和选择性遗忘中的应用。本文结合多模态模型的最新研究,分析了数据归因的挑战与机遇,并展望了...

开源周重磅发布:DeepSeek将揭晓五大开源项目,推动AGI探索

DeepSeek官方宣布下周为“开源周”,将发布五个开源项目,涵盖混合专家系统核心框架、多模态模型Janus-Pro更新版本、模型蒸馏与推理加速套件、生产级API服务框...
1 3 4 5 6