TCA

分类: 剪枝与稀疏化

TCA

定义

TCA (Token Compression with Attention) 是一种基于注意力的 ViT token 压缩方法,通过注意力图选择和压缩 token。

核心要点

属于 [CLS]-based token pruning 方法家族

EViT 同属一类,使用注意力分数做 token 选择

在 ViT 推理加速场景下使用

相关概念

EViT — 类似的 [CLS]-based 方法

Token Merging — 另一种 token 减少策略