Tree-of-Thought

分类: 基础理论

Tree-of-Thought

定义

Tree-of-Thought(ToT)是 Yao et al. (2023) 提出的一种结构化推理框架,将 LLM 的推理过程从 Chain-of-Thought 的线性链扩展为树状搜索结构,允许模型在多个推理路径间探索、评估和回溯,显著提升复杂推理任务的表现

核心要点

核心思想:将推理过程建模为树搜索——每个节点是一个”思维”(partial solution),边代表一步推理扩展

四个关键组件

  • (1) 思维分解(Thought Decomposition):将问题分解为中间步骤
  • (2) 思维生成(Thought Generator):对每个节点生成多个候选扩展(采样或提示)
  • (3) 状态评估(State Evaluator):LLM 自评估每个中间状态的前景(投票或打分)
  • (4) 搜索算法:BFS(广度优先)或 DFS(深度优先)遍历思维树

与 CoT 的区别:CoT 是一条路径走到底(贪心),ToT 可以探索多条路径并回溯——本质上是把 LLM 推理从贪心搜索升级为系统搜索

典型任务:Game of 24(74% vs CoT 的 4%)、创意写作、迷你填字游戏等需要全局规划的任务

Self-Evaluation:ToT 的关键创新之一是用 LLM 自身评估推理中间状态的好坏,无需外部奖励模型

局限:计算开销显著增加(需要多次 LLM 调用),不适合简单任务

后续发展:Graph-of-Thought(GoT)进一步允许节点间的交叉连接

CS224N 讨论 LLM 推理能力提升时的重要范式

代表工作

Tree of Thoughts: Deliberate Problem Solving with Large Language Models (Yao et al., 2023)

Graph of Thoughts: Solving Elaborate Problems with Large Language Models (Besta et al., 2023)

相关概念

Emergence

ReAct

Tool Use