MultiagentBench/MARBLE 是一个开源的框架,专门用于评估由大型语言模型(LLM)驱动的多Agent系统在协作与竞争中的表现。该框架支持多种LLM接口,如OpenAI,并提供共享内存机制,以优化Agent间的信息交换。其模块化设计使得用户可以轻松扩展或替换组件,从而满足不同的评估需求。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型