A800
分类: 待分类
A800
定义
NVIDIA A800 是 A100 的中国特供版 GPU,基于 Ampere 架构,NVLink 带宽降至 400 GB/s(A100 为 600 GB/s),FP16 算力 312 TFLOPS
核心要点
80GB HBM2e 显存,显存带宽 2.0 TB/s
专为中国市场合规设计(芯片出口管制)
常见配置:2×A800(160GB aggregate VRAM)/ 8×A800(640GB)
代表工作
MSA: 在 2×A800 上实现 100M token 端到端推理