Mean Pooling
分类: 深度学习基础
Mean Pooling
定义
对一组向量取逐元素均值的池化操作,常用于将变长序列压缩为固定长度表示
数学形式
核心要点
与 max pooling 相比,保留更多全局信息但可能平滑掉显著特征
在 NLP 中常用于将 token 级表示聚合为句子/文档级表示
可用于降低序列长度(chunk-wise mean pooling)
代表工作
MSA: 使用 64-token kernel 的 chunk-wise mean pooling 将路由 Key 压缩为 chunk 级表示