# 《AI 新范式》第9节:智能对话客服集成

作者:小傅哥
博客:https://bugstack.cn (opens new window)
视频:https://t.zsxq.com/Jh8WK (opens new window)

沉淀、分享、成长,让自己和他人都能有所收获!😄

Ollama + qwen2.5:0.5b · 对话客服接口 · 前端聊天窗口,让表单服务拥有 AI 对话能力。

# 一、本章诉求

集成 qwen2.5:0.5b 轻量模型到表单服务,开发 SSE 流式对话接口,实现 AI 智能客服功能,让应用拥有 AI 对话能力。

# 二、客服后端接口开发

# 1. 轻量模型

qwen2.5:0.5b 体积小、响应快,2C4G 服务器即可流畅运行。

# 2. Ollama API

调用本地 Ollama 接口,兼容 OpenAI 协议,零改造成本。

# 3. SSE 流式输出

Server-Sent Events 逐字返回,对话体验丝滑不等待。

# 三、配置与提示词

# application.yml
ollama:
  base-url: http://127.0.0.1:11434
  model: qwen2.5:0.5b

# 系统提示词
system-prompt:
  你是表单服务的智能客服,
  帮助用户解答表单创建、
  填写、数据查看等问题。
  回答简洁,不超过100字。
1
2
3
4
5
6
7
8
9
10
11

# 四、核心接口代码

@RestController
public class ChatController {

  @GetMapping("/api/chat")
  public SseEmitter chat(
    @RequestParam String message
  ) {
    SseEmitter emitter = new SseEmitter();
    // 调用 Ollama 流式接口
    ollamaService.stream(message, emitter);
    return emitter;
  }
}
1
2
3
4
5
6
7
8
9
10
11
12
13

# 五、前端聊天窗口与验证

整体交互链路如下:

💬 用户输入(聊天窗口)
        ↓ SSE 请求
🚀 SpringBoot(/api/chat)
        ↓ 调用 Ollama
🤖 qwen2.5:0.5b(流式回复)
1
2
3
4
5

# 1. 前端聊天组件

// JS 调用 SSE 接口
const source = new EventSource(
  `/api/chat?message=${input}`
);

source.onmessage = (e) => {
  // 逐字追加到对话气泡
  appendBubble(e.data);
};

source.onerror = () => {
  source.close();
};
1
2
3
4
5
6
7
8
9
10
11
12
13

# 2. 验证清单

  • Ollama 服务正常运行
  • qwen2.5:0.5b 模型已加载
  • API 接口返回正常
  • SSE 流式输出逐字显示
  • 客服回答符合提示词约束
  • 并发多用户同时对话正常

💡 qwen2.5:0.5b 模型仅 390MB,2C4G 云服务器即可流畅运行,适合轻量级客服场景

# 六、课程总结

通过 9 节课程的学习,我们完整体验了 AI 新范式——从开发到部署的全流程闭环:

  • ✅ AI Shell 自然语言连接管理服务器
  • ✅ Docker + MySQL + Redis + Ollama 环境搭建
  • ✅ SpringBoot 应用开发、上线、压测调优
  • ✅ qwen2.5:0.5b 智能客服集成,AI 对话上线

# 七、读者作业

  • 简单作业:完成智能客服接口开发和前端聊天窗口对接,截图展示对话效果。
  • 复杂作业:思考 qwen2.5:0.5b 和 7b 模型在客服场景下体验有什么差异?如何通过提示词优化客服回答质量?