PuDDing
分类: 剪枝与稀疏化
PuDDing
定义
Prompt-conditioned Depth Pruning,一种基于 prompt 的动态深度剪枝方法,通过训练轻量路由器为每个输入动态选择跳过哪些 Transformer 块
核心要点
为每个 Transformer 块训练一个二值路由器,根据输入 prompt 决定是否跳过该块
属于动态推理范畴,不同输入使用不同的子网络
需要额外训练路由器,非 training-free
代表工作
DieT: 作为 DieT 的对比基线,DieT 在免训练条件下超越 PuDDing