Rényi 熵
分类: 基础理论
Rényi 熵
定义
Rényi 熵是 Shannon 熵 的一族推广,由 Alfréd Rényi 于 1961 年提出,通过阶参数 n 控制对概率分布不同特征的敏感度。
数学形式
Hn(X)=1−n1log(i=1∑Npin)
n≥0,n=1: 阶参数
pi: 离散概率分布
n→1 时退化为 Shannon 熵 H=−∑pilogpi
n=2: 碰撞熵(collision entropy)
n→∞: 最小熵(min-entropy)H∞=−logmaxipi
核心要点
阶参数 n 越大,对高概率事件越敏感,越能反映分布的”峰值”特征
所有阶的 Rényi 熵对均匀分布达到最大值 logN
Rényi 熵可以与 ℓn-范数建立等价关系:Hn=1−nnlog∥p∥n
在信息论、密码学、量子信息等领域有广泛应用
代表工作
Rényi (1961): 原始定义论文
Col-Ln: 利用 Rényi 熵推导 token 重要性度量,用于 ViT token pruning
相关概念
信息熵
Token Pruning