# CPS-OCR-Engine **Repository Path**: lgx_com_cn/CPS-OCR-Engine ## Basic Information - **Project Name**: CPS-OCR-Engine - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2020-09-27 - **Last Updated**: 2021-01-04 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # CPS-OCR-Engine An awesome OCR engine developed by SYSU DeepDriving Lab 一个基于深度学习的文字识别系统,支持3755个(一级字库)的印刷体汉字识别。 因为近期在帮学校财务处审计处设计智能票据识别系统(已经支持数十类票据啦),需要用到OCR去识别一些汉字,做智能信息录入。对于汉字的识别,我尝试过Tessercact,实在太烂, 也试过百度的ocr接口,但是感觉不太适合(第一是要钱的,第二毕竟是别人的API,想优化也优化不了),那就自己搞一搞基于深度学习的OCR引擎吧,算是锻炼一下自己。  这个OCR模型专注于电子文档、证件、票据的汉字识别。 *** top 1 accuracy 0.99826 top 5 accuracy 0.99989 *** ### 数据合成 ``` python gen_printed_char.py --out_dir ./dataset --font_dir ./chinese_fonts --width 30 --height 30 --margin 4 --rotate 30 --rotate_step 1 ``` 合成效果