Triton Performance Analyzer 是一个命令行工具,旨在通过测量优化实验期间的性能变化,优化在 Triton Inference Server 上运行的模型的推理性能。它支持多种模型类型和不同的推理负载模式,帮助用户准确评估模型性能,并优化推理速度。