DeeBERT

分类: 高效推理与部署

DeeBERT

定义

Xin et al. (2020) 提出的 BERT early exit 方法,在每层添加分类器,当 confidence 超过阈值时提前退出,ACL 2020

核心要点

在 BERT 各层附加 off-ramp 分类器

使用 entropy-based confidence 度量退出时机

仅适用于 encoder 模型的判别任务(分类、NLI 等)

不处理自回归生成和 KV Cache

代表工作

DeeBERT: 原始论文 (ACL 2020)

TIDE: 将 early exit 拓展到 decoder-only LLM

相关概念

early exit

CALM

信息熵