# chinese-ocr **Repository Path**: coderdream/chinese-ocr ## Basic Information - **Project Name**: chinese-ocr - **Description**: 运用tensorflow实现自然场景文字检测,keras/pytorch实现crnn+ctc实现不定长中文OCR识别 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2019-04-16 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 本文基于tensorflow、keras/pytorch实现对自然场景的文字检测及端到端的OCR中文文字识别 # 实现功能 - [x] 文字方向检测 0、90、180、270度检测 - [x] 文字检测 后期将切换到keras版本文本检测 实现keras端到端的文本检测及识别 - [x] 不定长OCR识别 ## 环境部署 ``` Bash ##GPU环境 sh setup.sh ##CPU环境 sh setup-cpu.sh ``` # 模型训练 ## 训练keras版本的crnn ``` Bash cd train & sh train-keras.sh ``` ## 训练pytorch版本的crnn ``` Bash cd train & sh train-pytorch.sh ``` # 文字方向检测 基于图像分类,在VGG16模型的基础上,迁移训练0、90、180、270度的文字方向分类模型,详细代码参考angle/predict.py文件,训练图片100000张,准确率95.10%。 模型地址[百度云](https://pan.baidu.com/s/1nwEyxDZ)下载 # 文字检测 支持CPU、GPU环境,一键部署, [文本检测训练参考](https://github.com/eragonruan/text-detection-ctpn)(https://github.com/eragonruan/text-detection-ctpn) # OCR 端到端识别:GRU+CTC ## ocr识别采用GRU+CTC端到到识别技术,实现不分隔识别不定长文字 提供keras 与pytorch版本的训练代码,在理解keras的基础上,可以切换到pytorch版本,此版本更稳定 # 识别结果展示 ## 文字检测及OCR识别结果