TensorRT-Alpha是一个专注于深度学习计算机视觉领域模型加速部署的项目。它通过CUDA C++实现多batch图像预处理、推理、decode和NMS,支持多种YOLO系列模型,如YOLOv8、YOLOv7、YOLOv6、YOLOv5、YOLOv4、YOLOv3、YOLOX和YOLOR。该项目旨在高效加速深度学习模型的部署,特别适用于大规模图像处理任务和高性能计算场景。
字节跳动提供 DeepSeek R1、OpenAI o1、GPT-4o、Claude 3.5 和 Gemini 1.5等领先大模型