multi-probe retrieval

分类: 基础理论

Multi-Probe Retrieval

定义

在聚类/分区索引中同时探测多个候选分区(而非仅最近的一个)以提高检索召回率的策略

核心要点

单探针检索(single-probe)在查询点靠近分区边界时容易遗漏正确结果

Multi-probe 通过探测多个分区显著提高召回率,代价是计算量线性增长

FlashHead 将 probe 数量从传统的几个扩展到数百/数千个,利用 GPU 并行性实现高效计算

探测数 pp 是精度-效率的核心调节参数

代表工作

FlashHead: 核心检索策略,p=512 时在精度和效率间取得最佳平衡

相关概念

Multi-Probe LSH

信息检索

Spherical K-Means