MyVLM使得大规模视觉语言模型(VLM)能够学习和推理用户个性化的信息,定制模型以反映用户的个人经历和关系。
LLaVA是一个轻量级的多模态大模型推理框架,结合了视觉和语言理解能力,基于LLaMA架构和视觉Transformer,支持图像+文本的高效处理。它能够理解和分析图像内容,适用于视觉问答、图片理解、AI助理等多种任务。
稳定扩散 - DreamStudio是一款创新的开源AI工具,允许用户基于文本描述生成个性化图像,适合艺术家和设计师使用。
Macaw-LLM是一项探索性的努力,它通过无缝地结合图像、视频、音频和文本数据,开创了多模态语言建模。
BMTools是面壁智能开发的一个大模型工具学习平台,专注于问答系统的构建和训练,填补了国产大模型在该领域的空白,支持多种中文应用。
AI Funko Pop Generator是一个基于人工智能的免费图像生成器,能够根据用户指定的描述快速创建个性化的Funko Pop图片,生成时间不到一秒。
Lamanote是一款创新应用,结合了社交媒体风格的滚动和AI驱动的学习,用户可以通过提问获得AI生成的答案,满足自己的好奇心。
一个用于强化学习与人工反馈(RLHF)的框架,旨在简化不同 RLHF 技术的集成,提供模块化和组合式的实验能力,适用于研究人员和实践者。该框架通过模块化设计,支持多种实验能力,灵活配置选项,方便用户根据不同需求进行调整和优化。