APIGen 是由 Salesforce 人工智能研究团队设计的一个工作流,用于自动生成高质量数据集,专门用于研究函数调用智能体模型。该项目集合了 21 个类别的 3673 个可执行 API,并通过三层验证(格式检查、实际函数执行和语义验证)确保生成的数据集的可靠性和正确性。使用 APIGen 生成的数据集训练的模型在伯克利函数调用基准测试中表现优越,并且公开了含有 6 万个高质量条目的数据集。