# AI-QA-ystem **Repository Path**: dsdhctuo/ai-qa-ystem ## Basic Information - **Project Name**: AI-QA-ystem - **Description**: 这是一个基于 LangChain 和 DeepSeek 的公司知识库问答系统。系统可以自动处理公司文档,并回答相关问题。- `document_loader.py`: 文档加载和处理模块 - `create_vectorstore.py`: 向量数据库创建模块 - `qa_system.py`: 问答系统主模块 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-12-03 - **Last Updated**: 2025-12-04 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 公司知识库问答系统 这是一个基于 LangChain 和 DeepSeek 的公司知识库问答系统。系统可以自动处理公司文档,并回答相关问题。 ## 安装依赖 ```bash pip install langchain deepseek-ai faiss-cpu pypdf python-dotenv unstructured ``` ## 使用说明 ### 🚀 快速启动(推荐) 1. 配置 DeepSeek API 密钥: ```bash # 复制环境变量文件 cp .env.example .env # 编辑 .env 文件,填入你的 DeepSeek API 密钥 # DEEPSEEK_API_KEY=your_api_key_here ``` 2. 一键启动: ```bash python start.py ``` 3. 打开浏览器:http://localhost:5001 ### 🔧 手动启动 1. 首先配置 DeepSeek API 密钥(如上) 2. 运行问答系统: ```bash python api.py ``` ### 📝 环境要求 - Python 3.8+ - DeepSeek API 密钥 - 支持的文件格式:.docx(最大 16MB) ## 新功能特性 ### 🔥 增量更新知识库 - **上传文件时自动添加**:上传新的 .docx 文件会自动添加到知识库 - **删除文件时自动移除**:删除文件会自动从知识库中移除相关内容 - **无需手动重建**:不需要重新运行脚本创建向量数据库 ### 📁 支持的文件格式 - **Word文档**:.docx (推荐) - **文件限制**:最大 16MB - **中文支持**:完整保留中文文件名 ### 🌐 Web界面功能 - **文件管理**:查看、上传、删除知识库文件 - **流式对话**:实时打字效果的问答体验 - **来源显示**:显示答案相关的文档来源 ## 传统方式(可选) 如果需要手动处理批量文档: 1. 将文档放在 `data` 文件夹中 2. 运行:`python create_vectorstore.py` ## 系统架构 - `document_loader.py`: 文档加载和处理模块 - `create_vectorstore.py`: 向量数据库创建模块 - `qa_system.py`: 问答系统主模块 ## 注意事项 - 确保已安装所有必要的依赖 - 文档处理可能需要一些时间,具体取决于文档数量和大小 - 首次运行时需要下载相关模型,可能需要一些时间