Benchy 是一个用于实时比较不同AI模型性能、价格和速度的工具,支持主流模型如Deepseek R1、Gemini 2.0、OpenAI o1等。它提供多种微应用,满足不同测试场景的需求,帮助用户快速评估和选择最优模型。尽管目前无法找到明确命名为“Benchy”的工具,但它可能与Arthur Bench类似,功能上包括模型性能的定量比较和定制化基准测试。