EAGLE

分类: 高效推理与部署

EAGLE

定义

Li et al. (2024) 提出的 speculative sampling 框架,通过轻量级 draft head 重新思考特征不确定性来加速 LLM 推理

核心要点

利用特征层面的不确定性建模提升 draft 质量

比标准 speculative decoding 有更高的接受率

不需要独立的 draft 模型

代表工作

MTP-D: 与 EAGLE 互补,可结合使用

相关概念

Speculative Decoding

Medusa

Acceptance Rate