DeepSpeed

分类: 训练优化

DeepSpeed

定义

DeepSpeed 是微软开源的深度学习训练优化库,提供 ZeRO(Zero Redundancy Optimizer)系列内存优化、混合精度训练、Pipeline 并行等功能,支持高效训练超大规模模型。

核心要点

ZeRO Stage 1/2/3:分别对优化器状态、梯度、参数进行分片,逐步减少内存冗余

ZeRO-Offload / ZeRO-Infinity:将状态卸载到 CPU/NVMe,突破 GPU 内存限制

混合精度训练:FP16/BF16 + FP32 主权重,减少内存和加速计算

Pipeline Parallelism:流水线并行训练,配合数据并行和张量并行

与 HuggingFace Transformers、PyTorch 深度集成

代表工作

Rajbhandari et al., 2020: “ZeRO: Memory Optimizations Toward Training Trillion Parameter Models”

LlamaFactory:集成 DeepSpeed 进行高效微调

相关概念

GaLore

LoRA

混合精度