OpenEQA
分类: 数据集与评估
OpenEQA
定义
Meta 提出的 Embodied Question Answering 开放基准,评估模型对真实 3D 环境的理解能力
核心要点
涵盖真实室内/室外场景的开放式问答,不限于固定答案选项
评估维度包括空间理解、物体识别、功能推理等
支持多种输入模态:视频帧序列、3D 扫描、导航轨迹
强调”具身”理解——模型需具备对物理环境的常识推理能力
代表工作
Majumdar et al. (2024): OpenEQA — Embodied Question Answering in the Era of Foundation Models