Tree-of-Thought
分类: 基础理论
Tree-of-Thought
定义
Tree-of-Thought(ToT)是 Yao et al. (2023) 提出的一种结构化推理框架,将 LLM 的推理过程从 Chain-of-Thought 的线性链扩展为树状搜索结构,允许模型在多个推理路径间探索、评估和回溯,显著提升复杂推理任务的表现
核心要点
核心思想:将推理过程建模为树搜索——每个节点是一个”思维”(partial solution),边代表一步推理扩展
四个关键组件:
- (1) 思维分解(Thought Decomposition):将问题分解为中间步骤
- (2) 思维生成(Thought Generator):对每个节点生成多个候选扩展(采样或提示)
- (3) 状态评估(State Evaluator):LLM 自评估每个中间状态的前景(投票或打分)
- (4) 搜索算法:BFS(广度优先)或 DFS(深度优先)遍历思维树
与 CoT 的区别:CoT 是一条路径走到底(贪心),ToT 可以探索多条路径并回溯——本质上是把 LLM 推理从贪心搜索升级为系统搜索
典型任务:Game of 24(74% vs CoT 的 4%)、创意写作、迷你填字游戏等需要全局规划的任务
Self-Evaluation:ToT 的关键创新之一是用 LLM 自身评估推理中间状态的好坏,无需外部奖励模型
局限:计算开销显著增加(需要多次 LLM 调用),不适合简单任务
后续发展:Graph-of-Thought(GoT)进一步允许节点间的交叉连接
CS224N 讨论 LLM 推理能力提升时的重要范式
代表工作
Tree of Thoughts: Deliberate Problem Solving with Large Language Models (Yao et al., 2023)
Graph of Thoughts: Solving Elaborate Problems with Large Language Models (Besta et al., 2023)