低秩分解

分类: 量化与低秩

低秩分解

定义

  • 将高维权重矩阵分解为两个或多个低秩矩阵的乘积,从而减少参数量和计算量,是模型压缩和参数高效微调的基础技术

数学形式

  • WUVT,WRm×n,URm×r,VRn×r,rmin(m,n)W \approx UV^T, \quad W \in \mathbb{R}^{m \times n}, U \in \mathbb{R}^{m \times r}, V \in \mathbb{R}^{n \times r}, r \ll \min(m,n)

核心要点

  • SVD 是最经典的低秩分解方法
  • LoRA 将低秩分解应用于大模型微调
  • 压缩率取决于秩 r 的选择
  • 与量化、剪枝互补,可组合使用

代表工作

  • (待补充)

相关概念