# file-ocr **Repository Path**: gendial/file-ocr ## Basic Information - **Project Name**: file-ocr - **Description**: 使用百度OCR将包含图片的文件识别成文字后导入知识库 - **Primary Language**: Unknown - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-01-26 - **Last Updated**: 2025-01-26 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # file-ocr #### 介绍 使用百度OCR将包含图片的文件识别成文字后导入知识库 #### 煎蛋智能体流程 ![alt text](image.png) #### 使用说明 **注意**:本智能体使用到了百度OCR服务API (https://cloud.baidu.com/product/ocr/converter), 请前往百度智能云获取对应的OcrClientId 和 OcrClientSecret,并填入开始节点对应的环境变量里。 1. 创建一个知识库或者选择已有的知识库,在知识库设置里记录API密钥,稍后会用于环境变量:LibAuth 2. 在浏览器地址栏里获取知识库的ID,即当前知识库URL的最后一个UUID,稍后会用于环境变量:LibId 3. 创建任意煎蛋智能体,点击进入智能体编辑界面 4. 点击源代码 -> 导入 5. 选择文件agent.gen,完整煎蛋流程即可导入。 6. 点击设置,多模态选项里勾上 "文件", 保存设置 7. 点击编辑流程,点击开始节点,填入你的百度api OcrClientId 和 OcrClientSecret, 以及第一第二步记录的LibAuth 和 LibId的值 8. 点击调试按钮,上传需要识别的包含图片的文件,即可自动识别并向量化到对应的知识库里。 #### 注册煎蛋账号 1. 访问https://gendial.cn 2. 与右下角的煎蛋对话获取测试账号