# 基于RAG的智能客服Agent系统

**Repository Path**: ai-project_9/rag_agent

## Basic Information

- **Project Name**: 基于RAG的智能客服Agent系统
- **Description**: 面向电商/金融场景，构建可解释、高准确率的智能客服系统，需解决传统LLM幻觉问题，支持实时知识库更新（如商品规则/政策变更），并能在4060硬件上流畅运行。
- **Primary Language**: Python
- **License**: MulanPSL-2.0
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 1
- **Created**: 2026-01-09
- **Last Updated**: 2026-01-09

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# 基于RAG的智能客服Agent系统

#### 介绍
面向电商/金融场景，构建可解释、高准确率的智能客服系统，需解决传统LLM幻觉问题，支持实时知识库更新（如商品规则/政策变更），并能在4060硬件上流畅运行。

#### 1.软件架构
1.​​RAG模块​​：Chroma向量数据库（轻量级、支持GPU加速）+ 自定义检索策略（混合语义+关键词检索）

​​2.Agent框架​​：LangGraph（状态机驱动多轮对话）+ 自定义工具调用（如查询订单系统API）

​​3.模型层​​：轻量级LLM（如Llama-3-8B-Instruct-4bit量化版，4060显存友好）+ Prompt工程（少样本示例+思维链引导）

#### 2.优化点​​

1.检索结果相关性重排序（基于交叉编码器）

2.对话历史压缩（减少上下文长度）

#### 3.关键实施步骤
​​1.知识库构建​​：爬取/整理业务文档→文本分割（SentencePiece）→嵌入模型（BGE-M3）向量化→Chroma入库（支持增量更新）

2.​​检索模块优化​​：实现HybridRetriever（语义检索+BM25关键词检索融合），通过relevance_score动态调整权重

​​3.Agent流程设计​​：用LangGraph定义State（含chat_history/retrieved_docs/current_step），节点包括：用户输入解析→检索增强→LLM生成→工具调用（如计算运费）→响应验证（正则校验手机号/订单号）

#### ​​4.部署优化

模型4-bit量化（GPTQ）+ vLLM推理服务（支持动态批处理），4060实测QPS≥15（单轮对话）
#### 5.结构
## 软件架构

```
rag_agent_system/
│
├── knowledge_base/              # 知识库数据与处理
│   ├── documents/               # 原始文档
│   ├── vector_db/               # Chroma向量数据库
│   └── knowledge_builder.py     # 知识库构建模块
│
├── retrieval/                   # 检索相关模块
│   ├── hybrid_retriever.py      # 混合检索器
│   └── reranker.py              # 结果重排序
│
├── agent/                       # Agent核心逻辑
│   ├── agent_state.py           # 状态定义与管理
│   ├── langgraph_workflow.py    # 对话工作流
│   ├── tools.py                 # 工具函数
│   └── history.py               # 对话历史压缩
│
├── prompt/                      # 提示词相关
│   ├── onstraints.txt          # 约束设置
│   └── thought_instructions.txt # 思考过程设计
│
├── models/                      # 模型相关
│   └── setup_models.py          # 模型初始化
│
├── api/                         # API服务
│   └── main.py                  # FastAPI服务器
│
├── utils/                       # 实用工具
│   └── document_loader.py       # 文档加载器
│
└── requirements.txt             # 依赖列表
```