代码拉取完成,页面将自动刷新
同步操作将从 myhub/OCR 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
一句话:如果我们把图像中的物体看成是一个个字符,那么图像识别任务不就是文字识别任务吗?
模型工程师往往需要处理各种各样的任务,通常不同的任务需要用到不同的模型,对企业而言模型越多意味着越高的研发成本。因此当我发现CRNN+Transformer能够很好地识别多行文本时,我就在想同样的模型能否处理更多的任务?我首先想到的是目标检测,不过我很快发现CTCLoss不太适合回归类任务,于是我就将目标瞄准了图像识别任务。
运行环境: Ubuntu18+ 安装依赖: pip install ort==1.2.1 下载 https://github.com/myhub/tr/releases/download/2.8.1/crnn_for_image_recognition_v1_0.zip 文件后解压 执行 python test.py 即可
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。