余弦相似度

分类: 深度学习基础

余弦相似度

定义

衡量两个向量方向相似程度的度量,取值范围 [1,1][-1, 1],不受向量模长影响,常用于特征空间中的相似性计算。

数学形式

cos(u,v)=uvuv\cos(u, v) = \frac{u \cdot v}{||u|| \cdot ||v||}

核心要点

值为 1 表示方向完全相同,0 表示正交,-1 表示方向相反

在对比学习、检索任务中广泛使用,是计算特征相似度矩阵的标准方法

归一化后的内积等价于余弦相似度

代表工作

AMP (2026): 用 cls token 的余弦相似度矩阵构建批次预测概率,计算信息熵

相关概念

信息熵

Softmax