RotorQuant

分类: 量化与低秩

RotorQuant

定义

RotorQuant 使用 3D Clifford rotor 对 KV cache 做 blockwise 旋转后量化,通过旋转使权重分布更均匀以改善量化精度。

核心要点

使用 SO(3) 旋转(Clifford algebra)做 blockwise 预处理

3D 分区与硬件 SIMD 不对齐是其主要缺陷

IsoQuant 提出用 SO(4) 替代以解决对齐问题

相关概念

Hadamard rotation — 同属旋转域量化

Quarot — 另一种旋转量化方法

KIVI — KV cache 量化方案