A800

分类: 待分类

A800

定义

NVIDIA A800 是 A100 的中国特供版 GPU,基于 Ampere 架构,NVLink 带宽降至 400 GB/s(A100 为 600 GB/s),FP16 算力 312 TFLOPS

核心要点

80GB HBM2e 显存,显存带宽 2.0 TB/s

专为中国市场合规设计(芯片出口管制)

常见配置:2×A800(160GB aggregate VRAM)/ 8×A800(640GB)

代表工作

MSA: 在 2×A800 上实现 100M token 端到端推理

相关概念

KV Cache

FlashAttention