Calibration

分类: 基础理论

Calibration

定义

模型预测概率与真实正确率之间的一致性程度,即当模型以 80% 置信度预测时,实际正确率应接近 80%

核心要点

度量方法:Expected Calibration Error (ECE),将预测按置信度分桶后计算置信度与准确率的加权偏差

LLM 校准问题:大模型常表现出过度自信(overconfidence),即使在错误答案上也给出高置信度

校准方法:温度缩放(Temperature Scaling)、Platt Scaling、直方图分箱(Histogram Binning)

代表工作

Guo et al. (2017): “On Calibration of Modern Neural Networks” (ICML),揭示深度网络普遍校准不良

Kadavath et al. (2022): “Language Models (Mostly) Know What They Know”,研究 LLM 的自我校准能力

相关概念

Hallucination

LLM Evaluation