OpenEvals是一个为大型语言模型(LLM)应用提供强大评估工具的项目。它支持多种预建评估器,如正确性、简洁性和幻觉检测,能够帮助开发者全面评估LLM应用的性能。OpenEvals兼容Python和TypeScript,适配多种开发环境,并且集成了LangSmith,方便实验跟踪和结果记录。