语言模型

因为大语言模型是一种“语言模型”,所以,我们首先理解语言模型。

语言模型是“预测语言中下一个 Token”的模型。这个 Token 可以是一个字母、一些字母的组合、一个字、一个词、或者一段代码。大语言模型也是一个语言模型:它在一个非常大的文本上训练。训练之后,给它输入一些文字,它就会接着往下写,比如写诗、列提纲。

因此,语言模型只是一个“预测”模型;它不断预测后面会出现什么文字。所以,它的“预测”并不一定是“事实”。

课程材料

语言模型是一个经典的 NLP 问题,几乎每个 NLP 的课程都会重点介绍它,所以,它的课程材料非常丰富,比如:

代码

练习

课本

论文

Demo

论文


Index Previous Next