# 《AI 新范式》第9节:智能对话客服集成
作者:小傅哥
博客:https://bugstack.cn (opens new window)
视频:https://t.zsxq.com/Jh8WK (opens new window)
沉淀、分享、成长,让自己和他人都能有所收获!😄
Ollama + qwen2.5:0.5b · 对话客服接口 · 前端聊天窗口,让表单服务拥有 AI 对话能力。
# 一、本章诉求
集成 qwen2.5:0.5b 轻量模型到表单服务,开发 SSE 流式对话接口,实现 AI 智能客服功能,让应用拥有 AI 对话能力。
# 二、客服后端接口开发
# 1. 轻量模型
qwen2.5:0.5b 体积小、响应快,2C4G 服务器即可流畅运行。
# 2. Ollama API
调用本地 Ollama 接口,兼容 OpenAI 协议,零改造成本。
# 3. SSE 流式输出
Server-Sent Events 逐字返回,对话体验丝滑不等待。
# 三、配置与提示词
# application.yml
ollama:
base-url: http://127.0.0.1:11434
model: qwen2.5:0.5b
# 系统提示词
system-prompt:
你是表单服务的智能客服,
帮助用户解答表单创建、
填写、数据查看等问题。
回答简洁,不超过100字。
1
2
3
4
5
6
7
8
9
10
11
2
3
4
5
6
7
8
9
10
11
# 四、核心接口代码
@RestController
public class ChatController {
@GetMapping("/api/chat")
public SseEmitter chat(
@RequestParam String message
) {
SseEmitter emitter = new SseEmitter();
// 调用 Ollama 流式接口
ollamaService.stream(message, emitter);
return emitter;
}
}
1
2
3
4
5
6
7
8
9
10
11
12
13
2
3
4
5
6
7
8
9
10
11
12
13
# 五、前端聊天窗口与验证
整体交互链路如下:
💬 用户输入(聊天窗口)
↓ SSE 请求
🚀 SpringBoot(/api/chat)
↓ 调用 Ollama
🤖 qwen2.5:0.5b(流式回复)
1
2
3
4
5
2
3
4
5
# 1. 前端聊天组件
// JS 调用 SSE 接口
const source = new EventSource(
`/api/chat?message=${input}`
);
source.onmessage = (e) => {
// 逐字追加到对话气泡
appendBubble(e.data);
};
source.onerror = () => {
source.close();
};
1
2
3
4
5
6
7
8
9
10
11
12
13
2
3
4
5
6
7
8
9
10
11
12
13
# 2. 验证清单
- Ollama 服务正常运行
- qwen2.5:0.5b 模型已加载
- API 接口返回正常
- SSE 流式输出逐字显示
- 客服回答符合提示词约束
- 并发多用户同时对话正常
💡 qwen2.5:0.5b 模型仅 390MB,2C4G 云服务器即可流畅运行,适合轻量级客服场景
# 六、课程总结
通过 9 节课程的学习,我们完整体验了 AI 新范式——从开发到部署的全流程闭环:
- ✅ AI Shell 自然语言连接管理服务器
- ✅ Docker + MySQL + Redis + Ollama 环境搭建
- ✅ SpringBoot 应用开发、上线、压测调优
- ✅ qwen2.5:0.5b 智能客服集成,AI 对话上线
# 七、读者作业
- 简单作业:完成智能客服接口开发和前端聊天窗口对接,截图展示对话效果。
- 复杂作业:思考 qwen2.5:0.5b 和 7b 模型在客服场景下体验有什么差异?如何通过提示词优化客服回答质量?

