无放回采样

分类: 基础理论

无放回采样

定义

从集合中依次抽取元素,已抽取的元素不放回,确保每个元素最多被选一次

核心要点

与有放回采样相比,无放回采样保证样本多样性,避免重复

在 FlashHead 中,概率采样模式通过无放回采样选取聚类中心,确保候选 token 覆盖不同语义区域

计算效率:Gumbel-top-k 或 reservoir sampling 可实现高效无放回采样

代表工作

FlashHead: 基于 softmax 缩放的 centroid logits 进行无放回采样选取聚类探针

相关概念

Monte Carlo 估计

Temperature Sampling