depth pruning

分类: 剪枝与稀疏化

Depth Pruning

定义

Depth pruning(深度剪枝/层剪枝)是一种结构化剪枝策略,通过直接移除网络中的整层(或 Transformer block)来减少模型深度,从而降低计算量和参数量。

核心要点

粒度最粗的结构化剪枝:直接删除整层,不改变层内结构

重要性评估方法:Block Influence (BI)、层间 cosine 相似度、Taylor 展开等

通常中间层冗余度高于首尾层

width pruning 互补,可组合使用(如 Minitron 的混合剪枝)

删层后通常需要微调或蒸馏来恢复性能

代表工作

ShortGPT:基于 Block Influence 的层剪枝

Minitron:混合 depth + width 剪枝

相关概念

width pruning

结构化剪枝

ShortGPT

Minitron