基于微服务架构的AI智能客服系统:从传统客服到智能问答的完整解决方案
2026/6/25 20:23:53 网站建设 项目流程

项目简介

AI智能客服系统是一个基于微服务架构的企业级智能客服平台,集成了大语言模型(LLM)、知识库检索(RAG)、工单管理等核心功能,为企业提供从传统人工客服到AI智能问答的完整解决方案。项目采用前后端分离架构,后端基于Spring Boot 3.x + Spring Cloud Gateway,前端使用Vue 3 + Element Plus,支持多租户、多会话隔离,具备高可扩展性和高可用性。

核心特性

🤖 AI智能对话

  • 基于大语言模型的智能问答,支持上下文会话管理
  • 意图识别与智能路由,自动判断用户需求
  • Function Call工具调用,支持扩展AI能力
  • 多轮对话记忆管理,Redis持久化存储

📚 知识库检索(RAG)

  • 传统FAQ管理:支持FAQ的增删改查、分类管理
  • RAG检索增强生成
    • 多格式文档支持:PDF、TXT、DOCX、MD
    • 智能文本切片:可配置chunkSize和overlap参数
    • 向量化存储:支持Chroma(本地开发)和Milvus(生产环境)
    • 两阶段检索:向量召回 + Rerank重排,提升检索精度
    • 多用户会话隔离:基于Redis的对话记忆管理
    • 防幻觉机制:自定义Prompt模板,确保回答准确性

🎫 工单系统

  • 智能工单创建与流转管理
  • 工单状态跟踪:待处理、处理中、已完成、已关闭
  • 工单分配与优先级管理
  • 工单统计与报表

💬 实时通信

  • 基于WebSocket的即时消息推送
  • 支持在线客服聊天
  • 消息广播与群发功能
  • 连接状态管理

👥 客户管理

  • 完整的客户信息管理系统
  • 客户标签与分组
  • 客户画像与行为分析
  • 坐席账号管理

技术架构

系统架构图

┌─────────────────────────────────────────────────────────────┐ │ 前端层 (Vue3) │ │ ai-cs-frontend │ └──────────────────────┬──────────────────────────────────────┘ │ HTTP/WebSocket ┌──────────────────────▼──────────────────────────────────────┐ │ 网关层 (Gateway) │ │ ai-cs-gateway :8080 │ │ 路由转发 | 负载均衡 | 鉴权 | 限流 │ └──┬──────────┬──────────┬──────────┬──────────┬─────────────┘ │ │ │ │ │ ▼ ▼ ▼ ▼ ▼ ┌────────┐ ┌────────┐ ┌────────┐ ┌────────┐ ┌────────┐ │基础服务│ │AI代理 │ │知识库 │ │工单服务│ │WebSocket│ │:9001 │ │:9002 │ │:9003 │ │:9004 │ │:9005 │ └────────┘ └────────┘ └────────┘ └────────┘ └────────┘ │ │ │ │ │ └──────────┴──────────┼──────────┴──────────┘ │ ┌──────────▼──────────┐ │ 公共模块 (Common) │ │ Feign API (API) │ └─────────────────────┘ │ ┌────────────────┼────────────────┐ ▼ ▼ ▼ ┌─────────┐ ┌──────────┐ ┌──────────┐ │ MySQL │ │ Redis │ │ Milvus │ │ 主数据库 │ │ 缓存 │ │向量数据库│ └─────────┘ └──────────┘ └──────────┘

技术栈

后端技术

  • Java 17 + Spring Boot 3.2.0
  • Spring Cloud Gateway(微服务网关)
  • MyBatis Plus 3.5.5(ORM框架)
  • MySQL 8.0+(关系型数据库)
  • Redis 6.0+(缓存数据库)
  • Milvus 2.x / Chroma(向量数据库)
  • LangChain4j 0.32.0(Java版LLM应用框架)
  • Ollama(本地大模型服务)
  • WebSocket(实时通信)

前端技术

  • Vue 3.x(前端框架)
  • Vite 4.x(构建工具)
  • Element Plus(UI组件库)
  • Axios(HTTP客户端)
  • Vue Router 4.x(路由管理)

AI/ML技术

  • LLM集成(通义千问、ChatGLM等)
  • RAG检索增强生成
  • Embedding向量化(nomic-embed-text)
  • 重排模型(BGE-Reranker)

模块介绍

核心服务模块

模块端口职责
ai-cs-gateway8080API网关、路由转发、鉴权、限流
ai-cs-base-service9001客户管理、坐席管理、会话管理
ai-cs-ai-agent9002AI对话、意图识别、LLM调用
ai-cs-knowledge9003知识库管理、RAG检索、向量存储
ai-cs-workorder9004工单管理、工单流转
ai-cs-websocket9005实时通信、消息推送
ai-cs-job-定时任务、数据统计

公共模块

  • ai-cs-common:通用工具类、常量、DTO、异常处理、统一返回结果封装
  • ai-cs-api:Feign客户端接口定义、服务间通信DTO

前端应用

  • ai-cs-frontend:Vue3 + Element Plus用户界面,包含聊天、客户管理、知识库、工单管理等页面

RAG系统详解

RAG工作流程

用户提问 ↓ 文本向量化(Embedding) ↓ 向量相似度检索(Chroma/Milvus) ↓ Rerank重排优化(BGE-Reranker) ↓ 检索相关文档片段 ↓ 构建Prompt(包含检索到的上下文) ↓ LLM生成答案 ↓ 返回用户

RAG核心配置

rag:ollama:base-url:http://localhost:11434llm-model:qwen:7b# 对话模型embedding-model:nomic-embed-text# 向量模型rerank-model:bge-reranker:latest# 重排模型temperature:0.1chroma:base-url:http://localhost:8000collection-name:private_knowledge_basesplit:chunk-size:500# 文本切片大小chunk-overlap:80# 切片重叠字符数retrieve:top-k:5# 初次检索返回数量rerank-top-k:3# 重排后保留数量chat-memory:ttl:604800# 对话记忆过期时间(7天)

RAG API接口

  • POST /api/rag/upload/pdf- 上传PDF文档入库
  • POST /api/rag/upload/file- 上传普通文件入库
  • POST /api/rag/chat- 智能问答(支持多轮对话)
  • POST /api/rag/memory/clear/user- 清空单用户记忆
  • POST /api/rag/memory/clear/all- 清空全部记忆

文档版本管理(新增功能)

系统新增了文档版本管理功能,支持文档的版本跟踪、回退和对比:

核心功能

  • 版本创建:每次上传文档自动创建新版本记录
  • 版本查询:查看文档的所有历史版本
  • 版本回退:一键回退到任意历史版本
  • 版本对比:基于MD5和文件大小对比版本差异
  • 内容去重:通过MD5检测重复文档

版本管理API

  • GET /api/document/version/list- 获取所有文档列表
  • GET /api/document/version/versions/{documentId}- 获取文档的所有版本
  • POST /api/document/version/rollback- 回退到指定版本
  • DELETE /api/document/version/delete/{id}- 删除指定版本
  • GET /api/document/version/compare- 比较两个版本

快速开始

环境要求

  • JDK 17+
  • Maven 3.6+
  • MySQL 8.0+
  • Redis 6.0+
  • Node.js 16+(前端开发)
  • Ollama(RAG功能)
  • Chroma/Milvus(向量数据库)

启动步骤

  1. 克隆项目
gitclone https://gitee.com/huangrenhui/ai-cs-parent.gitcdai-cs-parent
  1. 初始化数据库
CREATEDATABASEai_cs_dbCHARACTERSETutf8mb4COLLATEutf8mb4_unicode_ci;mysql-u root-p ai_cs_db<docs/database/init.sql
  1. 启动RAG前置服务
# 拉取Ollama模型ollama pull qwen:7b ollama pull nomic-embed-text ollama pull bge-reranker:latest# 启动Chromachroma run--path./chroma-db
  1. 编译项目
mvn cleaninstall-DskipTests
  1. 启动后端服务
# 按顺序启动各微服务cdai-cs-gateway&&mvn spring-boot:runcdai-cs-base-service&&mvn spring-boot:runcdai-cs-ai-agent&&mvn spring-boot:runcdai-cs-knowledge&&mvn spring-boot:runcdai-cs-workorder&&mvn spring-boot:runcdai-cs-websocket&&mvn spring-boot:run
  1. 启动前端服务
cdai-cs-frontendnpminstallnpmrun dev

应用场景

1. 企业客服中心

  • 7x24小时智能问答,减少人工客服压力
  • 知识库自动更新,保持信息同步
  • 工单智能分配,提高处理效率

2. 技术支持系统

  • 技术文档智能检索
  • 问题自动诊断与解决方案推荐
  • 多轮对话引导问题解决

3. 内部知识管理

  • 企业文档集中管理
  • 智能搜索与问答
  • 版本控制与历史追溯

4. 在线教育平台

  • 课程资料智能检索
  • 学习问题智能解答
  • 个性化学习路径推荐

项目亮点

1. 微服务架构

  • 服务独立部署,易于扩展
  • 故障隔离,提高系统可用性
  • 技术栈灵活,便于技术升级

2. RAG技术落地

  • 结合向量检索与大语言模型
  • 两阶段检索优化,提升准确率
  • 支持多种文档格式,适用性广

3. 文档版本管理

  • 完整的版本追溯机制
  • 一键回退,降低运维成本
  • MD5去重,避免重复存储

4. 多用户会话隔离

  • 基于Redis的对话记忆管理
  • 支持多用户并发访问
  • 会话过期自动清理

5. 高可扩展性

  • 支持水平扩展
  • 无状态服务设计
  • 可集成消息队列解耦

部署架构

开发环境

本地运行各微服务,使用localhost访问

生产环境(推荐)

┌─────────────┐ │ Nginx LB │ └──────┬──────┘ │ ┌────────────┼────────────┐ │ │ │ ┌─────▼─────┐ ┌───▼────┐ ┌────▼─────┐ │ Gateway 1 │ │ GW 2 │ │ GW 3 │ └─────┬─────┘ └───┬────┘ └────┬─────┘ │ │ │ └────────────┼────────────┘ │ ┌────────────┼────────────┐ │ │ │ │ 各微服务集群 Redis集群 MySQL主从 Milvus/Chroma集群

安全设计

  1. 网关鉴权:所有请求经过网关进行身份验证
  2. 密码加密:坐席密码使用BCrypt加密存储
  3. HTTPS:生产环境使用HTTPS协议
  4. SQL注入防护:使用MyBatis Plus参数化查询
  5. XSS防护:前端输入过滤和转义
  6. CSRF防护:Token验证机制

性能优化

  1. Redis缓存:热点数据缓存,减少数据库查询
  2. 数据库索引:合理设计索引,优化查询性能
  3. 连接池:使用HikariCP数据库连接池
  4. 异步处理:耗时操作异步执行
  5. 分页查询:大数据量使用分页
  6. 向量检索优化:Milvus索引加速相似度搜索

监控与日志

  1. Spring Boot Actuator:健康检查和指标监控
  2. 日志收集:统一日志格式,支持ELK分析
  3. 链路追踪:集成Sleuth/Zipkin(可选)
  4. 告警机制:关键指标异常告警

项目地址

  • gitee: https://gitee.com/huangrenhui/ai-cs-parent.git
  • 维护者: huangrenhui
  • 许可证: MIT License

总结

AI智能客服系统是一个功能完善、架构合理的企业级智能客服解决方案。通过集成RAG技术、文档版本管理等先进功能,为企业提供了从传统客服到智能问答的完整升级路径。项目采用微服务架构,具备高可扩展性和高可用性,适合各种规模的客服场景。

无论是企业客服中心、技术支持系统,还是内部知识管理平台,该系统都能提供强大的智能问答能力和完善的管理功能,帮助企业提升客服效率,降低运营成本。


欢迎Star、Fork和贡献代码!

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询