dynamic depth

分类: 高效推理与部署

Dynamic Depth

定义

Dynamic Depth 指在推理时根据输入的难度或复杂度动态调整网络使用的层数,简单输入提前退出、复杂输入走完全部层

核心要点

核心思想:不是所有输入都需要相同的计算量,通过条件判断决定是否提前退出

典型实现方式:在中间层设置 exit classifier/exit head,根据置信度决定是否跳过后续层

与 early exit 高度相关,early exit 是 dynamic depth 最常见的实现形式

可以与 MoE 结合,实现深度和宽度的双重动态调整

训练时通常需要对所有 exit 点联合优化(multi-exit training)

代表工作

BranchyNet: 早期 early exit 工作

SkipNet: 基于 RL 学习跳过策略

CAFlow: 在 flow matching 中应用 adaptive depth

相关概念

early exit — dynamic depth 的主要实现机制

adaptive computation — 更广义的自适应计算框架