PruMerge
分类: 剪枝与稀疏化
PruMerge
定义
PruMerge 是一种面向大型视觉语言模型(LVLM)的 token 压缩框架,结合 pruning 和 merging 两种策略减少视觉 token 数量,降低 LLM 推理开销。
核心要点
先 prune 掉不重要的视觉 token,再将相似 token merge
可与不同的重要性度量(如 [CLS]-based、Col-Ln)组合使用
在 LLaVA 等 LVLM 上验证有效
Training-free,即插即用
代表工作
Shang et al., “LLaVA-PruMerge: Adaptive Token Reduction for Efficient Large Multimodal Models” (2024)
相关概念
Token Merging — PruMerge 的 merging 部分
EViT — pruning 策略的灵感来源
FastV — 同属 LVLM token 压缩方法