下面是一套 Lecture 12 Exit Ticket,对应 36.md 的当前内容。建议把它当成一份“边翻边聊”的小练习,10 分钟足够。重点不是背论文名,而是看看你有没有抓住这条前沿线背后的共同问题:Agent 为什么不只是会调用工具,而是开始变成能自我改进的系统。
Exit Ticket(10 题,开卷)
1) 用一句话解释:为什么 agent 前沿已经从“让模型能做事”走向“让模型持续变强”?
2) test-time compute scaling 最核心的直觉是什么?为什么它会越来越重要?
3) verifier 在 agent 里到底扮演哪三种角色?
4) 为什么说 ReAct 的关键不是“会说话”,而是“边想边做”?
5) planning 里最容易被误解的一点是什么?它为什么不只是列 To-do list?
6) 你会怎么区分 test-time search 和 train-time scaling / RL 的分工?
7) 为什么 open-ended evolution 让 agent 研究变得更像“系统自举”?
8) 为什么 search / deep research agent 特别需要 evaluation 和证据链管理?
9) 为什么 software engineering 是最适合做 agent 的落地方向之一?
10) 如果只能带走一个关键词,你会选 test-time compute、verification、memory 还是 evaluation?为什么?