Mixture-of-Mamba 是一种基于状态空间模型(SSMs)的新型架构,专门设计用于通过引入模态感知稀疏性来改进多模态模型。它能够高效处理文本、图像和语音等不同类型的数据,通过为每种数据类型定制参数,显著提高效率和性能。该项目在减少计算成本的同时,保持了或提升了模型的表现,特别适用于多模态预训练研究。