向量量化
分类: 量化与低秩
type:: concept
aliases:: Vector Quantization, VQ
q(w)=argc∈Cmin∥w−c∥22
其中 C={c1,…,cK} 为码本。
-
核心要点
-
维度越高,量化效率越接近 Shannon 率失真极限
-
码本可以显式存储(如 K-means)或隐式表示(如格量化)
-
LLM 量化中常见的维度:1D(标量)、8D(E8 格)、24D(Leech 格)
-
格量化(Lattice VQ)利用格的数学结构避免暴力搜索和显式码本存储
-
代表工作
-
LLVQ: 24 维 Leech 格向量量化
-
Quip#: 8 维 E8 格向量量化
-
QTIP: Trellis 码向量量化
-
相关概念
-
PTQ
-
Leech lattice
-
Shape-Gain 量化
-
SQNR