Greedy Decoding
分类: 深度学习基础
Greedy Decoding
定义
每步选择概率最高的 token 作为下一个输出的确定性解码策略
数学形式
核心要点
最简单、最快的解码方式,无随机性
可能陷入重复循环,生成多样性差
适用于精确度要求高的任务(如数学推理、代码生成)
FlashHead 的 greedy 模式选择 centroid logits 最大的 个聚类
代表工作
FlashHead: greedy 模式下 Top-1 命中率在英文数据集上达到 100%
分类: 深度学习基础
每步选择概率最高的 token 作为下一个输出的确定性解码策略
最简单、最快的解码方式,无随机性
可能陷入重复循环,生成多样性差
适用于精确度要求高的任务(如数学推理、代码生成)
FlashHead 的 greedy 模式选择 centroid logits 最大的 个聚类
FlashHead: greedy 模式下 Top-1 命中率在英文数据集上达到 100%