MasKD
分类: 知识蒸馏
MasKD
定义
知识蒸馏方法,使用**可学习掩码(mask)**选择 teacher feature map 中最有价值的区域/通道进行蒸馏,抑制无信息区域的噪声。
核心要点
核心思想:teacher feature 中并非所有位置都有等量的知识价值,用掩码过滤低价值区域
掩码可以是空间维度(spatial mask)、通道维度(channel mask)或两者兼有
掩码可通过 attention 机制自动学习,或基于 teacher activation 强度生成
相比固定掩码(如 DeFeat 的前背景二值掩码),可学习掩码更灵活
代表工作
LIAF — 与 MasKD 对比,LIAF 进一步做到 instance-aware 动态权重
相关概念
知识蒸馏 — MasKD 的上位概念
FGFI — 同类空间加权 KD 方法
DeFeat — 同类前背景分区 KD 方法
FreeKD — 另一种无需手动设计掩码的 KD 方法