`0-qwen3-chat-demo.ipynb` 代码说明

这份 notebook 在做什么

这份 notebook 是一个最小文本对话 demo。
它的目标不是训练模型，而是让学生先看到：

本地 Ollama 可以直接运行一个预训练文本模型
我们只需要一个 prompt，就能拿到回答
调用方式本质上就是一次本地 HTTP 请求

如果你把它和 5/2-prog/0-qwen3-vl-demo.ipynb 对照着看，会发现：

文本版：只有 content
视觉版：在 content 之外多了 images

所以这份 notebook 可以看成视觉 notebook 的更简单基础版。

整体结构

这份 notebook 的流程非常短：

导入依赖
写一个 prompt
构造请求体
请求本地 Ollama
读取模型回答
改一个新问题，再请求一次

Cell 0：标题页

这一格说明：

模型是 qwen3.5:0.8b
目标是本地最小对话演示

它帮助学生先建立一个边界：

这不是复杂项目
只是先把“本地模型会对话”这件事跑通

Cell 1：准备依赖

这一格是提示说明，不执行代码。
它的作用是让学生知道：

下一格开始就是真正的 Python 依赖

Cell 2：导入依赖

代码是：

import json
import os
import urllib.request
import urllib.error

逐个解释：

import json 作用：把 Python 字典转成 JSON 字符串。
import os 作用：后面清理代理环境变量。
import urllib.request 作用：发 HTTP 请求。
import urllib.error 作用：捕获请求错误。

和前面的视觉版本相比，这里没有：

base64
mimetypes
Path

因为文本对话不需要读图片，也不需要处理文件。

Cell 3：写一个 prompt

这一格告诉学生：

模型的输入最核心的就是 prompt

Cell 4：定义 prompt

prompt = '请用三句话解释什么是预训练，以及它为什么改变了 NLP。'
prompt

逐行解释：

prompt = '...' 把一个中文问题存进变量里。
prompt 直接显示变量内容，方便确认自己写的是什么。

为什么要先用变量，而不是直接把文本写死在下面的请求里？

因为这样更方便：

改问题
重复实验
和后面的 payload 分开理解

Cell 5：说明要构造请求体

这一格的意义是让学生知道：

文字 prompt 本身还不是请求
还要把它包装成 API 能理解的结构

Cell 6：构造 payload

代码是：

payload = {
    'model': 'qwen3.5:0.8b',
    'stream': False,
    'messages': [
        {
            'role': 'user',
            'content': prompt,
        }
    ],
}

payload

逐项解释：

'model': 'qwen3.5:0.8b' 指定本次调用哪个本地模型。
'stream': False 表示不要流式返回。对课堂展示更简单。
'messages': [...] 表示这是一个对话输入。
'role': 'user' 表示消息来自用户。
'content': prompt 把刚才定义的 prompt 作为用户问题塞进去。

为什么 messages 是列表？

因为对话可能有多轮：

用户一问
模型一答
用户再问

这里只做最简单的一轮，所以列表里只有一条用户消息。

Cell 7：说明要请求本地 Ollama

这一步帮助学生切换思路：

前面是在本地组织数据
现在是把数据发给本地服务

Cell 8：请求本地 Ollama

代码是：

request = urllib.request.Request(
    'http://localhost:11434/api/chat',
    data=json.dumps(payload).encode('utf-8'),
    headers={'Content-Type': 'application/json'},
    method='POST',
)

逐行解释：

'http://localhost:11434/api/chat' 是本地 Ollama 的聊天接口。
json.dumps(payload) 把 Python 字典转成 JSON 字符串。
.encode('utf-8') 再把字符串转成字节，方便发送。
headers={'Content-Type': 'application/json'} 告诉服务端：这次发的是 JSON。
method='POST' 说明这是一次提交数据的请求。

接下来：

for key in [
    'http_proxy',
    'https_proxy',
    'HTTP_PROXY',
    'HTTPS_PROXY',
    'all_proxy',
    'ALL_PROXY',
]:
    os.environ.pop(key, None)
opener = urllib.request.build_opener(urllib.request.ProxyHandler({}))

这一段的作用是：

清理代理
强制本地直连

为什么要这么做？

因为很多同学电脑里会有：

科学上网代理
终端代理
系统级代理配置

这些配置有时会把本地 localhost 请求也一起带偏。

os.environ.pop(key, None) 的意思是：

如果这个环境变量存在，就删掉
如果不存在，也不报错

然后：

urllib.request.ProxyHandler({})

表示：

这次请求不要走任何代理

最后：

with opener.open(request) as response:
    result = json.loads(response.read().decode('utf-8'))

这一段表示：

发请求
拿到返回
把返回内容从 JSON 解析回 Python 对象

Cell 9：说明下一步要看输出

这一格是过渡说明。
它的意义是告诉学生：

请求已经完成
下一步只看模型真正回答了什么

Cell 10：读取回答

result['message']['content']

这里是最简单、但最值得学生记住的一格。

它说明：

返回结果通常是一个更大的 JSON
模型真正回答的文本在 message -> content

Cell 11：说明要换一个问题

这一格告诉学生：

现在不换模型
也不改接口
只改 prompt

看输出会怎样变化

Cell 12：换一个更贴近课堂的问题

代码是：

payload['messages'][0]['content'] = '请比较 GPT、BERT、T5 三条路线的主要差别。'

这一句的作用是：

不重建整个 payload
只把原来的用户问题换掉

这是一种很适合教学的写法，因为它能让学生看到：

模型接口没变
只是输入内容变了

后面这段请求代码和前面几乎一样：

再构造一次 request
再清理代理
再用 opener.open(...)
再读结果

最后：

result['message']['content']

直接显示新的回答。

这份 notebook 最值得学生带走什么

文本模型的调用接口其实非常简单。
本地模型调用的本质就是一次本地 HTTP 请求。
payload 里最核心的三个字段是：model、stream、messages。
改 prompt，比改代码更能直接影响模型行为。
很多“跑不起来”的问题，其实来自代理、服务没开、模型名写错，而不是 Python 本身。

最常见的 3 个问题

1. 本地服务没开

现象：

请求时报 URLError

说明：

Ollama 没启动

2. 模型名不对

现象：

返回 model not found

说明：

本地没有拉这个模型
或者名字写错了

3. 代理干扰

现象：

明明请求的是 localhost
却报奇怪的代理错误

说明：

环境变量中的代理设置影响了本地请求

这也是为什么这里专门清理代理配置。

0-qwen3-chat-demo.ipynb 代码说明

这份 notebook 在做什么

整体结构

Cell 0：标题页

Cell 1：准备依赖

Cell 2：导入依赖

Cell 3：写一个 prompt

Cell 4：定义 prompt

Cell 5：说明要构造请求体

Cell 6：构造 payload

Cell 7：说明要请求本地 Ollama

Cell 8：请求本地 Ollama

Cell 9：说明下一步要看输出

Cell 10：读取回答

Cell 11：说明要换一个问题

Cell 12：换一个更贴近课堂的问题

这份 notebook 最值得学生带走什么

最常见的 3 个问题

1. 本地服务没开

2. 模型名不对

3. 代理干扰

`0-qwen3-chat-demo.ipynb` 代码说明