EfficientVLA

分类: 剪枝与稀疏化

EfficientVLA

定义

针对 VLA 模型的动态推理加速方法,通过视觉 token 剪枝实现高加速比

核心要点

实现 1.54× 加速比

局限性:在追求高加速比时性能退化严重(LIBERO 从 97.1% 降至 88.9%)

依赖动作空间信号和注意力分数

代表工作

VLA-IAP: 在相同 1.54× 加速比下维持 97.1% 成功率,远超 EfficientVLA 的 88.9%

相关概念

Visual Token Pruning

VLA

VLA-Cache