下面是一套 Lecture 1 Exit Ticket,对应 lec1.md 的当前内容。建议把它当成一份“边翻边聊”的小练习,10 分钟足够。重点不是背概念,而是确认你有没有抓住这门课的底色:为什么要从零开始看语言模型、为什么 tokenization 放在第一讲、以及为什么这门课不是只讲模型,而是讲整个栈。
Exit Ticket(10 题,开卷)
1) 如果你要用一句话解释这门课的 from scratch
请回答:
- 它是“从零写代码”还是“从零理解系统”
- 为什么只会用 API 还不算真正懂语言模型
2) 这门课为什么要先画一张“语言模型地图”
请用 2 句话回答:
- 这张地图里最重要的几个阶段是什么
- 它们分别解决了什么新问题
3) 课程为什么把 tokenization 放在最前面
请用你自己的话解释:
- tokenization 在模型前面到底卡住了什么
- 如果这一步选得不对,后面的训练会怎么被拖累
4) mechanics、mindset、intuitions 各是什么味道
请分别用一句短语说清楚:
- mechanics 像什么
- mindset 像什么
- intuitions 像什么
5) executable lecture 到底在卖什么
请回答:
- 为什么“讲义本身就是程序”这件事不是噱头
- 它和普通静态 PPT 最大的区别是什么
6) encode / decode 是怎么把文本变成整数的
请分别用一句短语解释:
- encode 在做什么
- decode 在做什么
- 为什么模型最后只需要处理整数序列
7) 字符、字节、词、BPE 为什么要一起比较
请用 2 到 3 句话回答:
- 它们各自最明显的优点和缺点是什么
- 为什么 BPE 会成为今天最常用的折中方案
8) 这门课的五个单元为什么像一条流水线
请用 1 到 2 句话把 Basics、Systems、Scaling laws、Data、Alignment 串起来。
9) 这一讲里最容易被忽略、但最值得记住的一点是什么
请任选一个回答:
- 为什么“理解通过构建”比“先会用再说”更重要
- 为什么这门课一开始就谈 AI policy 和 compute support
10) 如果要把这一讲讲给一个新同学听,你会先说哪三件事
请用 3 个要点回答,尽量说得像聊天,不要像背定义。