PuDDing

分类: 剪枝与稀疏化

PuDDing

定义

Prompt-conditioned Depth Pruning,一种基于 prompt 的动态深度剪枝方法,通过训练轻量路由器为每个输入动态选择跳过哪些 Transformer 块

核心要点

为每个 Transformer 块训练一个二值路由器,根据输入 prompt 决定是否跳过该块

属于动态推理范畴,不同输入使用不同的子网络

需要额外训练路由器,非 training-free

代表工作

DieT: 作为 DieT 的对比基线,DieT 在免训练条件下超越 PuDDing

相关概念

depth pruning

结构化剪枝

early exit

adaptive computation