小型语言模型综述资源集:旨在全面调研小型语言模型的技术、应用、效率以及与大型语言模型的协作和可信度
这是一个精心策划的妆容迁移资源列表,包含了多种妆容和发型迁移的工具、研究和应用场景,适合开发者和研究人员使用。
该项目是对多模态大语言模型的全面调查,涵盖最新进展、模型比较和评估以及多种应用场景,信息更新频繁,确保时效性。
该项目是一份多模态大语言模型相关论文和资源的阅读清单,旨在汇集、分类和整理最新的研究成果,帮助研究人员和开发者了解多模态LLM的进展和最佳实践。
该项目是一个多模态大语言模型在数学、STEM及编程领域的论文集合,旨在整合和分享最新的研究成果,推动相关领域的创新与发展。
MM-LLM是一个增强现有大型语言模型的框架,支持多模态输入和输出,同时保持其推理和决策能力。该项目提供全面的模型架构和训练管道设计,并回顾了在主流基准上的表现,旨在推动多模态任务的发展。
Awesome_Multimodal是一个精心策划的GitHub项目,提供关于多模态大语言模型(MLLM)的全面资源集合。
该项目提供系统化的深度学习学习资料,专注于大语言模型的对齐,涵盖多种深度学习技术和方法,适合不同水平的学习者。
以爱丽丝漫游“可微分”仙境为比喻,向读者介绍神经网络领域的入门书,涵盖自动微分优化函数、序列、图、文本和音频处理的设计技术。
大型语言模型研究资源库,专注于OpenAI o1和推理技术,持续更新以追踪LLM推理的最新进展
该项目收集了关于具身多模态大型语言模型(VLA模型)的研究论文,旨在为研究人员和开发者提供最新的研究进展和相关文献资源,帮助大家获取前沿信息,推动该领域的发展。
一个专注于挖掘多模态视觉语言模型潜力的开源项目,支持从2B到34B不同规模的密集和MoE大型语言模型,具备图像理解、推理和生成的能力。
为视觉-语言模型(例如CLIP)提供精心策划的Prompt/Adapter学习方法列表,包含最新的研究进展和代码实现,促进模型的高效学习和应用
这是一个专门收集与多模态大语言模型(MLLM)幻觉相关资源的项目,包含研究论文、工具、教程和社区讨论。
该项目收录了关于大语言模型持续学习的关键论文,提供最新的研究成果和方法,适合研究人员和开发者参考,包含对比不同方法的分析。
NExT-GPT 是一个支持多种输入和输出形式的多模态大语言模型,具有灵活的处理能力,可广泛应用于文本、语音、图像和视频等多种场景。
初步探索复现o1类多模态大型语言模型,旨在通过结合视觉和文本数据,提升模型的推理和理解能力,推动人工智能在复杂任务中的应用
这是一个关于大规模语言模型的精彩集合,汇聚了最新的研究成果和资源,包括论文、技术进展以及各种语言模型的比较和评估,支持社区的贡献和反馈。