大模型原理与应用

Principles and Applications of Foundation Models

2026 年春季

陈一帅

yschen@bjtu.edu.cn

北京交通大学电信学院

课程讲稿:https://yishuai.github.io/talk/ai-model/model.html

简介

这门课围绕大模型的原理、训练、系统与应用展开,目标是帮助学生建立一套完整、可迁移的知识框架。课程既讨论 Transformer、tokenization、预训练、微调和对齐等模型层面的核心问题,也覆盖计算资源、并行训练、推理部署、数据处理与评测等工程层面的关键环节。

课程内容覆盖从 AI 基础回顾、Transformer 机制、预训练与提示方法,到 Agent 系统、多 Agent 协作、微调、对齐后训练、多模态、时间序列 Foundation Model,以及 CS336 公开课中的模型架构、MoE、GPU、并行、scaling laws、数据治理和 RLVR 等主题;同时还结合 AI 项目开发实践,把提示词、规划、设计、实现与交付串成一条完整链路。

课程希望学生在完成学习后,不仅能够调用和评估大模型,还能够理解其关键结构、掌握基本训练、调试与系统优化方法,并进一步将这些方法迁移到通信、图像、时序、智能体和项目开发等具体场景中,形成面向实际问题的建模、实现与判断能力。

内容

  1. 🎓 课程导论|课程地图与学习方法PDF
  2. 🧭 AI 基础回顾|从机器学习到大模型PDF
  3. 🧠 Transformer 核心机制|注意力、结构与训练PDF
  4. 🧠 预训练|大模型能力的起点PDF
  5. 🤖 Agent 系统|工具、记忆、工作流与评测PDF
  6. 👥 多 Agent 系统|CrewAI、分工协作与工作流PDF
  7. 🧩 微调|让基础模型真正可用PDF
  8. 🎯 对齐与 RL 后训练|偏好学习、奖励设计与推理优化PDF
  9. 🖼️ 多模态大模型|视觉、语言与跨模态理解PDF
  10. 📡 行业应用实践|时间序列 Foundation 模型PDF
  11. 📚 专题拓展 I:学术前沿
  12. 🧪 专题拓展 II:技术前沿
  13. 🚀 专题拓展 III:应用前沿

这门课能带你做什么

适合谁来听

开课前最好会这些

怎么算成绩

顺手资料

课程内容会跟着授课进度继续补充,边上课边长出来。