12 Star 32 Fork 0

kendryte/k230_sdk

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
.github
board
configs
src
big
common
little
reference
ai_poc
anomaly_det
bytetrack
cmake
crosswalk_detect
dec_ai_enc
demo_mix
distraction_reminder
dms_system
dynamic_gesture
eye_gaze
face_alignment
face_detection
face_emotion
face_gender
face_glasses
face_landmark
face_mask
face_mesh
face_parse
face_pose
face_verification
falldown_detect
finger_guessing
fitness
head_detection
helmet_detect
kws
licence_det
licence_det_rec
llamac
nanotracker
object_detect_yolov8n
ocr
CMakeLists.txt
README.md
ai_base.cc
ai_base.h
clipper.cpp
clipper.hpp
main.cc
ocr_box.cc
ocr_box.h
ocr_reco.cc
ocr_reco.h
scoped_timing.hpp
utils.cc
utils.h
person_attr
person_detect
person_distance
pose_det_rtsp_plug
pose_detect
pphumanseg
puzzle_game
segment_yolov8n
self_learning
shell
smoke_detect
space_resize
sq_hand_det
sq_handkp_class
sq_handkp_det
sq_handkp_flower
sq_handkp_ocr
sq_handreco
traffic_light_detect
translate_en_ch
tts_zh
vehicle_attr
vi_vo
virtual_keyboard
yolop_lane_seg
.gitkeep
CMakeLists.txt
build_app.sh
build_app_sub.sh
version
business_poc
fancy_poc
.keep
tools
.gitignore
.gitlab-ci.yml
Kconfig
Kconfig.board
Kconfig.memory
Kconfig.storage
Kconfig.toolchain
Kconfig.wifi
LICENSE
Makefile
README.md
parse.mak
repo.mak
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README

1.简介

OCR识别任务采用了CRNN网络结构,OCR检测任务采用了DBnet的网络结构。使用该应用,可检测到图像或视频中的文本位置以及相应的文字内容。

2.应用使用说明

2.1 使用帮助

Usage: ./ocr_rec.elf <kmodel_det> <threshold> <box_thresh> <input_mode> <kmodel_reco> <debug_mode>
Options:
  kmodel_det      ocr检测kmodel路径
  threshold       置信度阈值:影响检测框的大小,置信度阈值越小,检测框越大,也更容易检测到文字。
  box_thresh      Box阈值:影响检测框的多少,最后输出的检测框分数小于Box阈值的会被剔除,大于Box阈值的会保留,过大的Box阈值导致漏检,过小的Box阈值导致误检。
  input_mode      本地图片(图片路径)/ 摄像头(None)
  kmodel_reco     ocr识别kmodel路径
  debug_mode      是否需要调试,0、1、2分别表示不调试、简单调试、详细调试
 
 #单图推理示例:(ocr_img.sh)
./ocr_reco.elf ocr_det_int16.kmodel 0.25 0.4 333.jpg ocr_rec_int16.kmodel 0

 #视频流推理:(ocr_isp.sh)
./ocr_reco.elf ocr_det_int16.kmodel 0.25 0.4 None ocr_rec_int16.kmodel 0

2.2 效果展示

文字识别效果图
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
C
1
https://gitee.com/kendryte/k230_sdk.git
git@gitee.com:kendryte/k230_sdk.git
kendryte
k230_sdk
k230_sdk
main

搜索帮助

371d5123 14472233 46e8bd33 14472233