该项目专注于近似最近邻搜索(ANN)中的向量ID无损压缩,采用非对称数字系统(ANS)和小波树方法,旨在不影响搜索性能的前提下,显著减少索引的存储空间。研究表明,在某些情况下,可将向量ID压缩7倍,在十亿级数据集上,索引大小可减少30%。该方法特别适用于大规模数据检索,特别是在倒排文件和基于图的索引中,解决了辅助数据存储成本高的问题。