LongVideoBench

分类: 数据集与评估

LongVideoBench

定义

长视频理解评估基准,测试模型在长时间跨度视频上的理解和推理能力

核心要点

视频时长从数分钟到数小时不等,需要跨时间跨度的信息整合

评估任务包括时序推理、因果关系理解、长程事件追踪等

对模型的长上下文处理能力和视频压缩/采样策略提出挑战

是衡量视频大模型实际应用能力的关键基准之一

代表工作

Wu et al. (2024): LongVideoBench — A Benchmark for Long-context Interleaved Video-Language Understanding

相关概念

VideoMME