OpenEQA

分类: 数据集与评估

OpenEQA

定义

Meta 提出的 Embodied Question Answering 开放基准,评估模型对真实 3D 环境的理解能力

核心要点

涵盖真实室内/室外场景的开放式问答,不限于固定答案选项

评估维度包括空间理解、物体识别、功能推理等

支持多种输入模态:视频帧序列、3D 扫描、导航轨迹

强调”具身”理解——模型需具备对物理环境的常识推理能力

代表工作

Majumdar et al. (2024): OpenEQA — Embodied Question Answering in the Era of Foundation Models

相关概念

ScanQA