QTIP

分类: 量化与低秩

QTIP

定义

  • 基于不规则格 (trellis) 的 LLM 量化方法,通过 trellis 编码实现高效的向量量化,在低比特率下优于标准标量量化

核心要点

  • 使用 trellis 结构作为量化码本
  • LLVQ (Leech Lattice VQ) 的核心对比对象
  • 在 2-3 bpw 区间有竞争力的性能

代表工作

  • (待补充)

相关概念