下面是一套 Lecture 12 Exit Ticket,对应 36.md 的当前内容。建议把它当成一份“边翻边聊”的小练习,10 分钟足够。重点不是背论文名,而是看看你有没有抓住这条前沿线背后的共同问题:Agent 为什么不只是会调用工具,而是开始变成能自我改进的系统。

Exit Ticket(10 题,开卷)

1) 用一句话解释:为什么 agent 前沿已经从“让模型能做事”走向“让模型持续变强”?

2) test-time compute scaling 最核心的直觉是什么?为什么它会越来越重要?

3) verifier 在 agent 里到底扮演哪三种角色?

4) 为什么说 ReAct 的关键不是“会说话”,而是“边想边做”?

5) planning 里最容易被误解的一点是什么?它为什么不只是列 To-do list?

6) 你会怎么区分 test-time search 和 train-time scaling / RL 的分工?

7) 为什么 open-ended evolution 让 agent 研究变得更像“系统自举”?

8) 为什么 search / deep research agent 特别需要 evaluation 和证据链管理?

9) 为什么 software engineering 是最适合做 agent 的落地方向之一?

10) 如果只能带走一个关键词,你会选 test-time compute、verification、memory 还是 evaluation?为什么?