Quip#

分类: 量化与低秩

type:: concept aliases:: QuIP#, E8P, Quip-Sharp

  • Quip#

  • 定义

  • 基于 8 维 E8 格的 LLM 权重向量量化方法,结合 Hadamard 旋转和向量量化实现 2-bit 权重压缩

  • 数学形式

  • 使用 E8 格的 coset 构造(E8P)实现 8 维向量量化

  • 需要输入 + 输出双向 Hadamard 变换 预处理

  • 核心要点

  • 8 维 E8 格在 2 bits/dim 下达到 86.1% Shannon 信息保留率

  • 需要双向 Hadamard 旋转才能获得好的性能

  • LLVQ(24 维 Leech 格)全面超越:即使不用旋转,LLVQ 也优于 Quip# + 双向旋转

  • 是 LLVQ 论文中的主要对比基线

  • 代表工作

  • Tseng et al. (2024): Quip#/E8P 原始论文

  • 相关概念

  • 向量量化

  • GPTQ

  • Hadamard 变换

  • LLVQ

  • QTIP