FilmAgent是由哈尔滨工业大学(深圳)提出的多Agent框架,利用大型语言模型(LLM)和多Agent协作,实现在虚拟3D空间中自动化电影制作。该框架模拟导演、编剧、演员和摄影师等角色,涵盖从创意开发到摄影的多个电影制作阶段,通过协作工作流提高效率。研究表明,FilmAgent在创意开发、剧本编写和摄影等阶段的自动化功能表现优异,即使使用性能较弱的模型,也可能超越单Agent系统。
KIM(知识引导模型)是一个创新的机器学习项目,旨在通过结合大型语言模型(LLM)和通用领域知识来增强行为克隆的性能。行为克隆是一种通过观察专家行为来学习决策策略的技术,而KIM通过引入结构化知识,显著提高了样本效率和鲁棒性,使其能够在少量演示数据下表现良好。KIM利用LLM生成策略结构,并通过少量演示数据进行微调,特别适用于需要专家演示的顺序决策任务,如月球着陆器和赛车任务。
AdditiveLLM是一个研究项目,专注于使用大型语言模型(LLM)预测3D打印过程中的缺陷,如Keyholing、Lack of Fusion和Balling。该项目在结构化输入下实现了93%的预测准确率,并通过自然语言输入简化了参数选择,为智能制造提供了新的思路。研究利用了一个过程参数缺陷数据集,对一系列模型进行微调,以提升预测能力。
云蝠机器人是云蝠智能推出的一款专注于房地产行业的AI产品,旨在通过AI呼叫和2D智能数字人服务提供数字化销售解决方案。其核心技术包括集群式软交换、话术画布逻辑配置、自然语言处理(NLP)、大型语言模型(LLM)和克隆音合成等,服务于万科、贝壳找房等知名房地产企业,提升销售效率和客户互动体验。
GraphAgent是一个前沿框架,利用大语言模型(LLMs)模拟人类行为并生成动态的、带文本属性的社交图。该框架适用于在线社交媒体、电子商务和论文创作等模拟场景,帮助深入理解网络中的交互行为,是社会科学、网络科学和计算社会模拟研究的重要工具。
Awesome-TimeSeries-LLM-FM 是一个面向时间序列任务的大型语言模型(LLM)应用的资源列表,旨在促进时间序列分析的统一模型发展。该项目汇集了多种时间序列分析相关的模型、工具和资源,支持跨领域的时间序列数据分析和处理,并提供丰富的学术和实践资源,为研究、开发和教学提供全面的支持。
Vlogger是一个通用的人工智能系统,专门用于生成用户描述的一分钟级视频博客(vlog)。该系统利用大型语言模型(LLM)作为导演,将vlog的长视频生成任务分解为四个关键阶段,从而突破现有视频生成方法的瓶颈,提升生成效率和质量。
OpenCopilot是一款开源AI辅助工具,专为各种SaaS产品设计,旨在为其提供定制化的AI助手。该工具能够无缝集成到产品的API中,通过使用LLM(大型语言模型)来判断用户的请求是否需要调用API端点,并决定调用哪个端点以及传递适当的载荷,从而自动执行API调用。
Arch是一个智能Layer 7网关,旨在保护、监控和个性化各种LLM应用(如Agent、助手、copilot)与API之间的交互。该项目提供了快速构建AI代理的能力,同时增强了安全性,并支持多种LLM应用,通过监控API交互和提供个性化功能,为开发者和企业提供了强大的支持。
由LLM驱动的自主Agent集合,涵盖任务解决、多智能体协作、社会模拟等项目,提供框架、基准评估和相关资源,推动AI代理技术的发展
一个纯Python实现的库,专注于流式生成LLM的JSON片段,便于前端展示,且不依赖任何第三方库。它支持高效的JSON流解析,用户友好的接口,实时数据处理,灵活的配置选项,并兼容大规模数据流。
REFLECT项目旨在通过总结机器人在执行任务中的经验,帮助进行故障的解释和纠正。它能够自动检测和分析失败的执行情况,利用大型语言模型进行故障的深度解释,并将多感官数据转化为分层的摘要。此外,REFLECT可以生成可执行的纠正计划,以应对各种故障,并创建RoboFail数据集用于系统的评估和改进。
Infinity是一个AI原生数据库,专为LLM应用设计,具备极快的向量和全文搜索能力,具有高性能、灵活性和易用性,能够满足下一代AI应用的各种挑战。
HyperDB是一个针对大规模语言模型(LLM)应用的超快本地向量数据库,具有高度优化的C++后端向量存储。它通过MKL BLAS实现硬件加速操作,并支持id和元数据等高级功能,旨在提升向量检索和管理的效率和性能。
Arcade AI是一个Python SDK和CLI工具包,专注于提升LLM应用和智能代理的能力。它提供多种预构建工具包,支持GitHub、Gmail、Slack等服务的集成,简化了开发者在构建AI应用时连接用户数据和服务的复杂性。此外,Arcade AI支持OpenAI、Anthropic等多种语言模型,并具备OAuth认证和自定义工具开发功能。
Remembrall是一个API平台,旨在为基于LLM的应用提供长期记忆能力。开发者只需两行代码即可将上下文信息插入到LLM调用中,使得LLM能够利用用户的聊天记录和相关文档进行更智能的回应。
AutoGen 是一个由微软开发的开源多智能体对话框架,旨在实现下一代大型语言模型(LLM)应用。它支持多智能体协作、可教性和个性化,适用于复杂工作流的编排、自动化和优化。AutoGen 提供多种对话模式和应用系统,涵盖多个领域和复杂度,并支持增强的 LLM 推理 API,以提高推理性能并降低成本。此外,它还提供人类代理智能体,方便集成人类反馈和参与。
Superpowered AI 是一款端到端的知识检索解决方案,旨在简化构建生产就绪的 LLM 应用程序,同时提供对外部知识的访问。该平台提供知识库即服务,赋予用户强大的人工智能能力。
Linq是一个AI驱动的企业搜索引擎,能够快速构建向量搜索引擎,支持文本、图像和表格的检索增强生成(RAG)。用户可以在一天内创建自己的知识库,并通过友好的管理页面高效管理数据。