结构化剪枝的一般框架
分类: 预训练与微调 · 难度: 中级 · 关联讲座: L09
结构化剪枝是模型压缩的核心技术之一,通过学习二元掩码移除冗余参数,在保持模型性能的同时降低计算和存储开销。本文介绍剪枝的一般优化框架,包括幅度剪枝和 松弛两种主流方法,以及结构化与非结构化剪枝的本质区别。
📐 结构化剪枝的一般框架
给定原始模型权重 ,学习二元掩码 :
实践中 约束不可微,常用两种松弛:
- 幅度剪枝(Magnitude Pruning):按权重绝对值排序,直接清零最小的
- 松弛(Hard Concrete):用连续的概率变量 近似 ,梯度可传
结构化 vs 非结构化:
- 非结构化:任意位置置零,稀疏度高但硬件加速困难(稀疏矩阵乘法)
- 结构化:整行/列/头部置零,保持稠密计算,实际加速比更好