# 基于RAG的智能客服Agent系统 **Repository Path**: ai-project_9/rag_agent ## Basic Information - **Project Name**: 基于RAG的智能客服Agent系统 - **Description**: 面向电商/金融场景,构建可解释、高准确率的智能客服系统,需解决传统LLM幻觉问题,支持实时知识库更新(如商品规则/政策变更),并能在4060硬件上流畅运行。 - **Primary Language**: Python - **License**: MulanPSL-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 1 - **Created**: 2026-01-09 - **Last Updated**: 2026-01-09 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 基于RAG的智能客服Agent系统 #### 介绍 面向电商/金融场景,构建可解释、高准确率的智能客服系统,需解决传统LLM幻觉问题,支持实时知识库更新(如商品规则/政策变更),并能在4060硬件上流畅运行。 #### 1.软件架构 1.​​RAG模块​​:Chroma向量数据库(轻量级、支持GPU加速)+ 自定义检索策略(混合语义+关键词检索) ​​2.Agent框架​​:LangGraph(状态机驱动多轮对话)+ 自定义工具调用(如查询订单系统API) ​​3.模型层​​:轻量级LLM(如Llama-3-8B-Instruct-4bit量化版,4060显存友好)+ Prompt工程(少样本示例+思维链引导) #### 2.优化点​​ 1.检索结果相关性重排序(基于交叉编码器) 2.对话历史压缩(减少上下文长度) #### 3.关键实施步骤 ​​1.知识库构建​​:爬取/整理业务文档→文本分割(SentencePiece)→嵌入模型(BGE-M3)向量化→Chroma入库(支持增量更新) 2.​​检索模块优化​​:实现HybridRetriever(语义检索+BM25关键词检索融合),通过relevance_score动态调整权重 ​​3.Agent流程设计​​:用LangGraph定义State(含chat_history/retrieved_docs/current_step),节点包括:用户输入解析→检索增强→LLM生成→工具调用(如计算运费)→响应验证(正则校验手机号/订单号) #### ​​4.部署优化 模型4-bit量化(GPTQ)+ vLLM推理服务(支持动态批处理),4060实测QPS≥15(单轮对话) #### 5.结构 ## 软件架构 ``` rag_agent_system/ │ ├── knowledge_base/ # 知识库数据与处理 │ ├── documents/ # 原始文档 │ ├── vector_db/ # Chroma向量数据库 │ └── knowledge_builder.py # 知识库构建模块 │ ├── retrieval/ # 检索相关模块 │ ├── hybrid_retriever.py # 混合检索器 │ └── reranker.py # 结果重排序 │ ├── agent/ # Agent核心逻辑 │ ├── agent_state.py # 状态定义与管理 │ ├── langgraph_workflow.py # 对话工作流 │ ├── tools.py # 工具函数 │ └── history.py # 对话历史压缩 │ ├── prompt/ # 提示词相关 │ ├── onstraints.txt # 约束设置 │ └── thought_instructions.txt # 思考过程设计 │ ├── models/ # 模型相关 │ └── setup_models.py # 模型初始化 │ ├── api/ # API服务 │ └── main.py # FastAPI服务器 │ ├── utils/ # 实用工具 │ └── document_loader.py # 文档加载器 │ └── requirements.txt # 依赖列表 ```