图像和视频神经tokenizer