大模型原理与应用

Principles and Applications of Foundation Models

2026 年春季

陈一帅

yschen@bjtu.edu.cn

北京交通大学电信学院

课程讲稿：https://yishuai.github.io/talk/ai-model/model.html

简介

这门课围绕大模型的原理、训练、系统与应用展开，目标是帮助学生建立一套完整、可迁移的知识框架。课程既讨论 Transformer、tokenization、预训练、微调和对齐等模型层面的核心问题，也覆盖计算资源、并行训练、推理部署、数据处理与评测等工程层面的关键环节。

课程内容覆盖从 AI 基础回顾、Transformer 机制、预训练与提示方法，到 Agent 系统、多 Agent 协作、微调、对齐后训练、多模态、时间序列 Foundation Model，以及 CS336 公开课中的模型架构、MoE、GPU、并行、scaling laws、数据治理和 RLVR 等主题；同时还结合 AI 项目开发实践，把提示词、规划、设计、实现与交付串成一条完整链路。

课程希望学生在完成学习后，不仅能够调用和评估大模型，还能够理解其关键结构、掌握基本训练、调试与系统优化方法，并进一步将这些方法迁移到通信、图像、时序、智能体和项目开发等具体场景中，形成面向实际问题的建模、实现与判断能力。

内容

🎓 课程导论｜课程地图与学习方法（PDF）
🧭 AI 基础回顾｜从机器学习到大模型（PDF）

准备
- 电脑实验环境准备：先把 VS Code、Anaconda、PyTorch 和 Jupyter 这些工具装顺。
练习
- TensorFlow Playground 上机手册：用几个经典小任务把特征工程、泛化和正则化摸出直觉。
- PyTorch 编程练习手册：跟着 tutorial 认识 tensor、autograd 和训练循环。
- PyTorch 跟练 Notebook：课堂跟练用的 notebook 版本。
作业
- 作业手册：把作业的目标、难点和提交节奏说明白。
- 作业 Notebook：把作业需要的代码入口先放好。
检查
- Exit Ticket：课后 10 分钟小测，看看主线有没有真的进脑子。

🧠 Transformer 核心机制｜注意力、结构与训练（PDF）

练习
- 编程与作业说明：先把两份 notebook 的节奏和目标捋顺。
- A2S1 Attention Notebook，讲解，讲解 Python 程序：用“选择、复制、平均、聚合”把 attention 的直觉做出来。
- A2S2 Mini Transformer Notebook，讲解，讲解 Python 程序：从零拼出 attention、mask 和 multi-head attention。
- N-gram.zip：A2S2 用的数据包。
- mingpt-cse447.zip：A2S2 用的本地代码包。
作业
- 作业提交说明：把两部分作业各自要看什么、怎么做讲清楚。
- 作业原题 PDF：想看完整要求时翻它。
检查
- Exit Ticket：课后 10 分钟小测，看看 attention 这条线有没有真的串起来。

🧠 预训练｜大模型能力的起点（PDF）

准备
- Ollama 手册：先把本地模型跑起来，熟悉命令行和 API。
学习
- Prompt 方法（PDF）：从 zero-shot 一路聊到工具、检索和反思。
练习
- Prompt 练习：拿 10 类任务练一练，看看提示词怎么越写越顺。
编程
- 课堂演示 Notebook：`qwen3.5:0.8b` 的最小对话体验。
- 代码说明：按 cell 一段段看它怎么跑。
检查
- Exit Ticket：课后 10 分钟小测，确认你有没有把预训练这条线抓住。

🤖 Agent 系统｜工具、记忆、工作流与评测（PDF）

练习

本地 `Ollama + qwen + PydanticAI` 工具调用 Agent

说明：先告诉你这套 demo 在干什么、怎么最快跑起来。
代码说明：一块块看本地 Ollama、PydanticAI 和工具调用怎么接上。

OpenAI Provider 简洁写法：看看怎么把模型接入这层写得更省事。

作业
- 作业手册：拿课程 demo 改成一个和自己专业有关的小型 agent。
检查
- Exit Ticket：课后小测，看看 agent 回路有没有真正走顺。
扩展
- 多 Agent 的完整内容已经单独提到后面一节了，方便和单 Agent 对照着看。

👥 多 Agent 系统｜CrewAI、分工协作与工作流（PDF）

练习
- 串行协作 Notebook：把 `Agent + Task + Crew + Tool` 串起来看一遍。
- 代码说明：看看每一步任务是怎么交接的。
进阶练习
- Manager + Specialists Notebook：看一个负责人带多个角色怎么协作。
- 代码说明：一块块看 manager、specialist 和 memory 怎么接上。
- 输出示例：看看这套多角色协作最后会产出什么。
- Project Memory：看看这份“团队记忆”是怎么写的。
作业
- 作业手册：把多 Agent 这套分工思路，自己改成一个能讲清楚的项目。
检查
- Exit Ticket：看看你是不是已经能分清 agent、task、crew、flow 和 process 了。

🧩 微调｜让基础模型真正可用（PDF）

准备
- AutoDL 手册：先把实例、镜像、JupyterLab 和存储流程跑顺。
练习
- LoRA 最小实验手册：按“检查、训练、保存、推理”跑通第一条闭环。
- tiny-gpt2 材料导航：最小 LoRA 闭环的材料入口。
- Qwen 版本修改说明：看看怎么把最小实验往更真实的 chat 模型上挪。
讲义
- Chapter 0 讲义（PDF） | 实验 Notebook：拿一条最小微调链路把量化、LoRA 和保存串起来。
作业
- 作业手册：围绕 Hugging Face 微调文章做一次“复现 + 解释”。
检查
- Exit Ticket：课后小测，看看你有没有把微调闭环看明白。

🎯 对齐与 RL 后训练｜偏好学习、奖励设计与推理优化（PDF）

练习
- RL 入口导航：先看这张总导航，再决定从哪条路进去。
- GRPO Notebook 导航：基础版和多奖励版的入口都在这儿。
- 基础版讲义（PDF） | 实验 Notebook
- 多奖励版讲义（PDF） | 实验 Notebook
作业
- 作业手册：基于两份 GRPO notebook，自己设计一个小型奖励实验。
检查
- Exit Ticket：课后小测，看看你有没有把对齐这条线串起来。
小结
- 工程补充讲稿（PDF）：把微调、对齐和部署这条工程线再串一遍。

🖼️ 多模态大模型｜视觉、语言与跨模态理解（PDF）

练习
- 视觉演示目录：多模态 demo 的总入口。
- 课堂演示 Notebook：课堂展示版 notebook。
- 代码说明：看图像怎么被编码、怎么发请求。
- 讲解提纲：告诉你怎么问、怎么讲、怎么带节奏。
作业
- 作业手册：围绕同一组图片做几轮提问，看看模型会不会跑偏。
检查
- Exit Ticket：课后小测，看看你有没有把图文模型的主线串起来。

📡 行业应用实践｜时间序列 Foundation 模型（PDF）

练习
- Chronos 演示目录：ETTh1 预测 demo 的总入口。
- 课堂演示 Notebook：本地 `chronos-t5-tiny` 跑 ETTh1 的课堂演示版 notebook。
- 代码说明：看数据、窗口和结果图怎么连起来。
- 讲解提纲：告诉你怎么讲、先讲哪、还能追问什么。
作业
- 作业手册：把 Chronos 挪到你自己的时间序列上试试看。
- Chronos 微调 demo 目录：最小微调闭环的总入口。
- 最小微调说明：窗口切分、训练和前后对比一条线跑完。
- 代码说明：一块块看数据、tokenizer 和训练循环怎么连上。
检查
- Exit Ticket：课后小测，看看你有没有把时序 foundation model 的直觉抓住。

📚 专题拓展 I：学术前沿

最新论文、前沿方法和研究问题
JHU CSCI 601.771（PPT）（Exit Ticket）（PDF）：自监督模型、长上下文、推理与记忆。
Stanford CS329A（PPT）（Exit Ticket）：AI 智能体的自改进、搜索与评测。
CMU 10-605/10-805（PPT）（Exit Ticket）：大规模机器学习、可扩展训练、大数据机器学习。

🧪 专题拓展 II：技术前沿

斯坦福 CS336 高级课程：语言模型从零开始（B 站视频）
Lecture 1（自学演示）（Exit Ticket）（练习介绍）：先把语言模型这张地图铺开，再从 tokenization 进入真正的第一公里。
最新模型

Lecture 2（自学演示）（Exit Ticket）：先把算力、显存和 dtype 的账算明白，后面才知道模型为什么贵。
Lecture 3（PDF）（Exit Ticket）：Transformer 的骨架怎么长成现代 LLM，几个关键小修补又在忙什么。
Lecture 4（PDF）（Exit Ticket）：MoE 怎么把“模型更大”和“每步不更贵”这件事尽量同时做到。
A1（基础）｜构建一个 Transformer LM（PDF | Zip）：自己搭一条最小闭环，从 tokenizer 到训练、保存、评测都跑一遍。

分布式并行

Lecture 5（PDF）（Exit Ticket）：GPU 为什么快、为什么贵、为什么老要和带宽较劲。
Lecture 6（自学演示）（Exit Ticket）：先测、再找、再改，把 kernel 慢在哪儿摸清楚。
Lecture 7（PDF）（Exit Ticket）：多卡训练怎么拆，通信、同步和显存又怎么一起算。
Lecture 8（自学演示）（Exit Ticket）：collective、NCCL 和拓扑这些“底层黑话”到底在说什么。
A2（系统与并行）（PDF | Zip）：把 profiling、mixed precision、FlashAttention、DDP 和 sharding 串成一条提速路线。

规模扩展

Lecture 9（PDF）（Exit Ticket）：训练前先估预算，用 scaling law 看看模型到底该长多大。
Lecture 10（自学演示）（Exit Ticket）：推理为什么难、KV cache 为什么关键、线上服务为什么更像系统题。
Lecture 11（PDF）（Exit Ticket）：把 scaling 规律落到具体超参和训练配方里。
Lecture 12（自学演示）（Exit Ticket）：benchmark、validity、污染和真实可用性，到底该怎么一起看。
A3（缩放法则）（PDF | Zip）：用有限预算做一次 scaling 外推，看看你的模型该往哪儿长。

数据资产

Lecture 13（自学演示）（Exit Ticket）：训练数据怎么从网页一路变成可用语料。
Lecture 14（自学演示）（Exit Ticket）：过滤、识别、去重，把“像文本”变成“像训练集”。
A4（数据）｜过滤语言模型数据（PDF | Zip）：从 WARC/WET 到抽取、过滤、去重和 tokenize，自己做一条数据清洗链路。

后训练对齐

Lecture 15（PDF）（Exit Ticket）：模型为什么会开始“更像助手”，RLHF 在这里干了什么。
Lecture 16（PDF）（Exit Ticket）：当答案能验证时，推理训练会变得更直接。
Lecture 17（自学演示）（Exit Ticket）：policy gradient、baseline 和 GRPO 到底在一起忙什么。
A5（对齐与推理RL）（PDF | Zip）：围绕 MATH 上的 zero-shot、SFT、Expert Iteration 和 GRPO，走一遍推理训练链路。
A5 补充｜指令调优&RLHF/DPO（PDF）：从 zero-shot baseline、SFT、偏好对齐到 DPO 和 alignment tax，把对话助手的行为链路补完整。

🚀 专题拓展 III：应用前沿

AI 企业级项目开发实践（PDF）：提示词驱动选题、规划、实现与交付
企业开发流程
- 流程导航总览：先把选题、规划、实现和交付这条线摸顺。
- Using Agent Skills：按任务阶段挑合适的 skill，让整个流程少绕路。
- 打磨想法
- 把方向变成规格和计划
- 开始实现，但不靠猜
- 把质量、性能和安全拉齐
- 收尾、迁移和交付
- 检查清单
- 特别专家
产品开发流程
- 产品开发提示词总览（PDF）：先把从想法到交付的整条路摸清楚。
- 想法
- 计划
- 设计
- 开发
练习
- 练习手册：把想法一路推进到计划和设计，看看它能不能真的落地。
检查
- Exit Ticket：看看你是不是已经把这套 AI 协作流程串成一条顺手的线。
参考与致谢
1. agent-skills：谢谢 Addy Osmani，这个项目给了我们不少把工作流“技能化”的灵感。
2. gstack：谢谢 Garry Tan，gstack 让 AI / agent 工具链的组织方式更直观。
3. superpowers：谢谢 Obra，superpowers 这套提示词和流程很值得借鉴。

这门课能带你做什么

建立一套从模型原理到系统实现的整体知识框架，理解 Transformer、MoE、scale law、RLHF、RLVR 和数据治理等关键主题之间的关系。
具备从 tokenization、训练、评测、推理到部署的基本动手能力，能够把课堂方法迁移到真实的实验与项目中。
理解大模型在算力、显存、并行、通信和数据成本上的主要瓶颈，知道为什么一个模型“做得出来”不等于“做得划算”。
掌握 Agent、多 Agent 和 AI 项目开发中的基本设计思路，能够把提示词、规划、设计、实现和交付串成一条完整流程。
在学习技术的同时建立科研视野、工程判断与责任意识，理解国产生态、模型安全、评测边界与数据治理的重要性。

适合谁来听

通信工程、人工智能、新一代电子信息技术、计算机及相关专业的研究生与高年级本科生。
已经具备机器学习、深度学习与 Python 基础，希望系统补上“大模型这一层”的学习者。
对模型训练、推理优化、数据处理、Agent 系统或多模态应用感兴趣，希望把原理和工程实践连起来的人。
希望将大模型用于通信、图像、时序、运维、信息处理或 AI 项目开发场景的学生与研究人员。

开课前最好会这些

数学基础：线性代数、概率论与数理统计
编程基础：Python
框架基础：PyTorch 或 TensorFlow
课程基础：机器学习、深度学习

怎么算成绩

课堂参与与讨论：10%
文献阅读与综述：20%
上机实验与报告：30%
课程项目设计：40%

顺手资料

课程资源
- Stanford CS224N：斯坦福经典 NLP 课程，适合补语言建模、Transformer 和 LLM 评测的基础框架。
- JHU CS 601.471/671：面向本科高年级和低年级研究生的自监督模型入门课，覆盖预训练、tokenization 和训练实践。
教程与课程笔记
- Hugging Face LLM Course：Hugging Face 官方 LLM 课程，适合系统上手 Transformers、Datasets 和 fine-tuning。
书籍
- A Hands-On Guide to Fine-Tuning Large Language Models with PyTorch and Hugging Face：一本偏实战的微调指南，适合把量化、LoRA、数据格式和训练流程串起来。
- 📙 Scaling Book：关于大模型规模扩展与训练配方的参考读物。

课程内容会跟着授课进度继续补充，边上课边长出来。