本项目旨在实现甲骨文的自动化识别,采用ResNet-34卷积神经网络作为基础架构。模型训练采用分阶段的迁移学习策略:首先加载ImageNet预训练权重,冻结全部卷积层,仅训练输出分类层以适配甲骨文类别;随后解冻所有网络层,使用较小学习率进行全局参数更新,以优化特征提取与分类的协同效果。
这是一个基于OpenCV的信用卡数字自动识别系统。它先提取0-9数字的模板形状,然后通过图像处理找到信用卡上的数字区域,再将每个数字与模板进行匹配,找出最相似的数字,最后按顺序输出完整卡号并识别发卡机构类型。
这是一个文档扫描与OCR识别系统,能将拍摄倾斜的纸质文档自动矫正为正面视图,并提取其中的文字内容。项目通过边缘检测找到文档边界,利用透视变换拉直图像,最后用OCR引擎识别文字,实现从"拍照"到"可编辑文本"的一键转换。
本项目结合传统图像处理与深度学习技术,实现停车场车位的自动检测与状态识别。通过 Canny 边缘检测、霍夫直线检测提取车位区域,并利用微调的 VGG16 卷积神经网络对每个车位进行空闲/占用分类,提供从图像预处理、车位标注、模型训练到单张图片预测及视频实时检测的完整流程。
这是一个基于 OpenCV 的答题卡自动识别与阅卷系统。用户只需拍摄一张答题卡照片,程序便会自动通过边缘检测定位答题卡区域,利用透视变换将倾斜变形的图像矫正为规整视图,然后通过轮廓分析筛选出所有圆形选项,并利用掩膜技术统计每个选项的填涂像素数量,从而判断学生的作答结果,最后与标准答案比对并自动计算得分,同时在答题卡上标注出对错情况。整个流程无需人工干预,可快速、准确地完成答题卡的批阅工作。
本项目是基于 PyTorch 框架,利用 ResNet18 模型对 MedMNIST 医学影像数据集进行分类任务的实战训练和评估。项目提供了完整的数据加载、模型训练、验证、测试和结果分析流程,并输出 AUC、ACC 等指标。
最近一年贡献:40 次
最长连续贡献:3 日
最近连续贡献:1 日
贡献度的统计数据包括代码提交、创建任务 / Pull Request、合并 Pull Request,其中代码提交的次数需本地配置的 git 邮箱是 Gitee 帐号已确认绑定的才会被统计。