MXINT
分类: 量化与低秩
MXINT
定义
OCP (Open Compute Project) 标准定义的微缩放整数数值格式,每个块(block)共享一个 scale factor,块内元素使用低位整数表示
数学形式
其中 scale 为 block-wise 共享的缩放因子, 为 4/8-bit 整数
核心要点
OCP MX 标准的一部分(与 MXFP 互补)
Block-wise 量化:每 32 个元素共享一个 8-bit scale
常见格式:MXINT8(8-bit 整数 + shared scale)、MXINT4
硬件支持逐步增加,NVIDIA Blackwell 架构已支持
与 MXFP 可通过 Slice-and-Scale 无损转换
代表工作
OCP Microscaling Formats Specification (2023)
MF-QAT: 多格式 QAT 同时训练 MXINT 和 MXFP