ImageNet

分类: 数据集与评估

ImageNet

定义

大规模视觉识别挑战赛(ILSVRC)使用的图像数据集,ImageNet-1K 包含 1000 类、约 128 万训练图像和 5 万验证图像,是深度学习图像分类的标准 benchmark。

核心要点

ImageNet-1K:1000 类分类,训练集 ~1.28M 图像,验证集 50K

ImageNet-21K:约 14M 图像,21841 类,常用于预训练

Top-1 准确率是评估分类模型的核心指标

零样本分类:用 CLIP 等模型直接在 IN-1K 上评估,无需微调

代表工作

Deng et al. (2009): ImageNet 原始数据集论文

AMP (2026): 使用 50,000 张 ImageNet-1K 训练图像作为剪枝评估和蒸馏数据集

相关概念

EVA-CLIP

DINOv2