理解 Agent（一）：为什么需要 loop

理解 Agent，首先要回答一个问题：为什么很多任务不能通过一次 LLM call 完成？

什么是 LLM call

LLM call 指的是：向模型发起一次请求，并接收一次结果。

从 API 角度看，它对应一次 request 和一次 response。例如：

const res = await client.responses.create({
  model: "gpt-5",
  input: "总结这段日志",
});

这个来回过程就是一次 LLM call。

一次 call 通常包含：

模型返回的结果通常是：

两者可以类比为后端开发中的“函数定义”和“函数调用”：

关键点在于：tool call 通常不是开发者随请求直接传给模型的，而是模型在 response 中生成的。

看一个例子：

修复一个陌生 Node.js repo 里的 failing test，直到 CI 通过

这个任务不是一次性的 input -> output，而是一个循环过程：

关键在于：新的 observation 是执行动作之后才产生的。

例如，模型先输出“请运行测试”，测试结果只有在测试执行完成后才会出现。它不可能被同一次 LLM call 看到，因为那次 call 在模型返回时已经结束。

因此，问题不只是“复杂”，而是：

这也是为什么“总结一段日志”常常一次 call 就够，而“运行测试 -> 读报错 -> 改代码 -> 重跑直到通过”通常不够。

Agent 存在，不是因为 LLM 不够聪明，而是因为很多真实任务本质上是一个闭环。

这个闭环可以写成：

decision -> action -> observation -> next decision

llm-call-loop

一旦任务需要这个闭环，single LLM call 就不够了，因为它无法在拿到新 observation 后继续推理。