# file-ocr

**Repository Path**: gendial/file-ocr

## Basic Information

- **Project Name**: file-ocr
- **Description**: 使用百度OCR将包含图片的文件识别成文字后导入知识库
- **Primary Language**: Unknown
- **License**: Apache-2.0
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2025-01-26
- **Last Updated**: 2025-01-26

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# file-ocr

#### 介绍
使用百度OCR将包含图片的文件识别成文字后导入知识库

#### 煎蛋智能体流程
![alt text](image.png)

#### 使用说明
**注意**：本智能体使用到了百度OCR服务API （https://cloud.baidu.com/product/ocr/converter), 请前往百度智能云获取对应的OcrClientId 和 OcrClientSecret，并填入开始节点对应的环境变量里。


1. 创建一个知识库或者选择已有的知识库，在知识库设置里记录API密钥，稍后会用于环境变量：LibAuth
2. 在浏览器地址栏里获取知识库的ID，即当前知识库URL的最后一个UUID，稍后会用于环境变量：LibId
3. 创建任意煎蛋智能体，点击进入智能体编辑界面
4. 点击源代码 -> 导入
5. 选择文件agent.gen，完整煎蛋流程即可导入。
6. 点击设置，多模态选项里勾上 "文件"， 保存设置
7. 点击编辑流程，点击开始节点，填入你的百度api OcrClientId 和 OcrClientSecret， 以及第一第二步记录的LibAuth 和 LibId的值
8. 点击调试按钮，上传需要识别的包含图片的文件，即可自动识别并向量化到对应的知识库里。

#### 注册煎蛋账号

1.  访问https://gendial.cn
2.  与右下角的煎蛋对话获取测试账号