LongVideoBench
分类: 数据集与评估
LongVideoBench
定义
长视频理解评估基准,测试模型在长时间跨度视频上的理解和推理能力
核心要点
视频时长从数分钟到数小时不等,需要跨时间跨度的信息整合
评估任务包括时序推理、因果关系理解、长程事件追踪等
对模型的长上下文处理能力和视频压缩/采样策略提出挑战
是衡量视频大模型实际应用能力的关键基准之一
代表工作
Wu et al. (2024): LongVideoBench — A Benchmark for Long-context Interleaved Video-Language Understanding