Gemma

分类: 网络架构

Gemma

定义

Google DeepMind 发布的开源 LLM 系列,包含 2B 和 9B 参数规模,基于 Gemini 技术构建

核心要点

Gemma-2 是第二代,包含 2B、9B、27B 三种规模

采用标准 Transformer decoder 架构,支持 grouped-query attention

在同规模开源模型中性能领先

常被用作 LLM 压缩/剪枝研究的实验平台

代表工作

DieT: 在 Gemma-2 2B 和 9B 上验证维度级全局剪枝效果

相关概念

LLaMA

Qwen2.5