Greedy Decoding

分类: 深度学习基础

Greedy Decoding

定义

每步选择概率最高的 token 作为下一个输出的确定性解码策略

数学形式

t=argmax(z)t = \arg\max(\mathbf{z})

核心要点

最简单、最快的解码方式,无随机性

可能陷入重复循环,生成多样性差

适用于精确度要求高的任务(如数学推理、代码生成)

FlashHead 的 greedy 模式选择 centroid logits 最大的 pp 个聚类

代表工作

FlashHead: greedy 模式下 Top-1 命中率在英文数据集上达到 100%

相关概念

Temperature Sampling

Softmax

classification head