下面是一套 Lecture 5 Exit Ticket,对应 lec5.md 的当前内容。把它当成一张“GPU 直觉卡”会更顺手。重点不是背硬件名词,而是看你有没有把算力、带宽、访存和并行执行方式串成一幅图。

Exit Ticket(10 题,开卷)

1) CPU 和 GPU 的分工为什么不一样

请用 2 句话回答:

2) 为什么内存层次对 GPU 这么重要

请回答:

3) roofline 这张图为什么经常被拿出来讲

请用 2 句话回答:

4) coalescing 和 branch divergence 听起来像黑话,其实在说什么

请分别用一句短语解释:

5) shared memory 和 tiling 为什么总是一起出现

请用 2 到 3 句话回答:

6) operator fusion、低精度、FlashAttention 分别在省什么

请回答:

7) 为什么 attention 特别适合拿来讲 GPU

请用 1 到 2 句话回答:

8) 矩阵乘法为什么总被当成性能标杆

请回答:

9) 如果你要优化一个算子,你会先看什么

请用 1 到 2 句话回答:

10) 用一句话把这讲的工程直觉说出来

请尽量自然一点: