Banana-lyzer是一个开源的AI代理评估框架,专为Web任务而设计,支持多种场景和任务,提供性能评估指标,并允许与现有AI代理的轻松集成,便于不同代理之间的比较分析。
一个可用来快速构建完善 AI Agent(智能体)服务的工具包,包含 LangGraph Agent、FastAPI 服务、Streamlit 应用等工具,并提供模板,助力构建和运行专属的 Agent。
一个创新的基准测试框架,专门评估大语言模型(LLM)和视觉语言模型(VLM)在游戏环境中的智能Agent能力。支持本地部署和主流AI API集成,提供完整的评估工具集,可用于测试模型在长期交互任务中的推理表现。
Gentopia是一个轻量可扩展的LLM驱动智能Agent和ALM研究框架,提供了构建、测试和评估智能Agent所需的基本组件,旨在简化智能Agent的开发与管理流程。
Chidori 是一种用于构建人工智能代理的反应式运行时,为构建具有反应性、可观察性和鲁棒性的人工智能代理提供了一个框架。
Tucky是一个多智能体框架,旨在为开发者提供简便的工具,以构建和管理多种人工智能代理。该项目支持多种AI模型,可以轻松集成和协作,适用于不同的应用场景,如智能客服、数据分析和用户交互等。Tucky通过模块化设计,使得用户可以根据需求自定义和扩展功能,提升开发效率。
AIlice是一个轻量级的AI代理,旨在为开发者提供一个简单的开发框架,快速构建和测试各种AI智能体的想法,同时支持多模态交互和语音交互,为用户提供灵活的参与方式。
ODRL是一个针对非动态强化学习的基准测试平台,旨在评估强化学习算法在不同环境下的表现。通过建立标准测试环境,研究人员可以有效地比较和分析不同的强化学习算法的性能。