Track-On是一个先进的在线点跟踪模型,基于Transformer技术,专为实时视频点跟踪设计。它支持逐帧处理,确保内存使用效率,特别适合需要实时处理的流媒体应用场景。该模型通过双重内存模块(空间内存和上下文内存)捕获时间信息,并利用补丁分类与优化技术提高跟踪精度。在多个数据集上表现优异,运行速度超过15 FPS,GPU内存使用少于1 GB。