SWE-Gym是首个用于训练现实世界软件工程智能Agent的环境,提供真实任务、代码库上下文、可执行环境和测试验证,旨在提升软件开发效率。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型