标签：SWE-Bench

DeepSeek-R1：在SWE-bench基准测试中展现卓越的代码推理能力

DeepSeek-R1 是一款由中国杭州深度求索公司开发的高性能AI推理模型，专注于数学、代码和自然语言推理任务。在SWE-bench基准测试中，DeepSeek-R1 以49.2%的得...

AI快讯

3个月前

OpenAI最新推出的Deep Research模型在AI代理领域展现了强大的能力，尤其在编程和复杂任务处理上表现优异。本文将深入探讨Deep Research的技术特点、应用场景...

AI快讯

3个月前