ReComA旨在通过Agent通信实现推理问题的简化开发,提供了一个灵活的框架,支持多Agent间的通信,易于集成到现有系统中。
提出 RetNet 作为 LLM 的基础架构,同时实现训练并行性、低成本推理和良好性能。
一个简单的ReAct Agent模板,用于构建基于LangGraph的agent,通过迭代推理和执行动作来解决复杂问题。该项目旨在提供一个易于使用和扩展的框架,帮助开发者快速实现复杂任务的解决方案。
一个创新的基准测试框架,专门评估大语言模型(LLM)和视觉语言模型(VLM)在游戏环境中的智能Agent能力。支持本地部署和主流AI API集成,提供完整的评估工具集,可用于测试模型在长期交互任务中的推理表现。
Future AGI通过使用批评代理来替代人工质量保证,消除了人机协作的方法。用户可以设置自定义指标,以满足独特需求并更快检测错误,从而将人力资源保留用于关键任务,并在推理增长时有效扩展。
Llama Stack 是一个开源项目,旨在将 LLM 应用构建生成周期的所有组件打包,包括训练、微调、产品评估、观测、Agent & Memory、合成数据生成等,并支持 9+ 提供商。
这篇论文研究了让大模型代理玩“Donor Game”捐赠博弈的情况,探讨了在面临背叛的激励时,LLM代理的“社会”是否能够学习互惠互利的社会规范。