Effective Rank
分类: 基础理论
Effective Rank(有效秩)
定义
通过特征矩阵的奇异值分布的 Shannon 熵来衡量矩阵的”有效维度”,反映特征空间被利用的程度。eRank 越高说明各奇异方向分布越均匀,特征空间利用越充分(容量越饱和)。
数学形式
对特征矩阵 Z∈Rn×d 进行 SVD,得奇异值 σ1,…,σk,归一化为概率分布:
pi=∑jσjσi
Effective Rank 定义为该分布的指数熵:
eRank(Z)=exp(−i=1∑kpilnpi)
归一化版本(映射到 [0,1]):
eRank=min(n,d)eRank
核心要点
eRank 实质是奇异值分布的熵值再取指数,范围为 [1,min(n,d)]
归一化后的 eRank∈[0,1]:趋近 1 表示容量饱和(奇异值分布均匀),趋近 0 表示特征坍缩(少数奇异值主导)
原始定义来自 Roy & Vetterli (2007),GRACE 将其用于模型容量的自动评估
代表工作
GRACE: 用 eRank 评估 backbone 的特征空间饱和度,驱动 Grow-Assess-Compress 循环
相关概念
知识蒸馏
类增量学习
特征蒸馏