PACT

分类: 剪枝与稀疏化

PACT

定义

基于注意力上下文的 token 剪枝方法,利用 attention score 作为 token 重要性的代理指标来选择性地移除冗余 token

核心要点

在 Vision-Language Model 推理中减少视觉 token 数量

通过 attention score 衡量 token 对下游任务的贡献

属于 training-free token pruning 的代表方法之一

代表工作

PACT 原文:attention-based token pruning for VLM inference acceleration

相关概念

EViT

FastV

VisionZip

PruMerge