DUNE 分类: 网络架构DUNE 定义 多视觉编码器聚合方法,将不同视觉基础模型的特征融合为统一表示,用于下游多模态任务 核心要点 与 RADIO 类似,目标是将多个视觉专家的能力整合到统一表示中 在 EUPE 论文中作为对比基线之一 区别于 RADIO 的蒸馏方式,DUNE 更侧重特征空间的直接融合 代表工作 EUPE (Meta FAIR, 2026): 对比了 DUNE 的融合方案,提出更高效的三阶段蒸馏替代 相关概念 RADIO CLIP DINOv2