# PCB_Detection **Repository Path**: cenkai233/PCB_Detection ## Basic Information - **Project Name**: PCB_Detection - **Description**: 检测板子微型元器件和配对 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-05-14 - **Last Updated**: 2025-05-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ## PCB_Dection ## 项目背景解决PCB板小型元器件定位和组合问题，数据来源于矢量图，需要针对大尺寸图像提炼小目标进行检测分析。 ## 项目难点 1. 如果要走目标识别的路线，需要进行矢量图格式转换，除了开源库进行快速转换外，该方案有一个缺陷就是精度不够高，针对某一部分可能会出现精度丢失。 2. 小目标如电容、电感等元器件是类似两个小矩形组合排列得到的，如果是使用标注的标准，包括图像要提取这么小一个特征难度很大。 3. 小目标里面不仅有形如矩形的目标还有圆形的目标，其承担的角色不同，如何区分。 4. 为了保证转换后的图片不失真，转换后图片若要保持近似的清晰度图片的像素值过高，一般YOLO输入的图片需要转换为640*640进行识别，而原始图像可能会有6000+ * 6000+像素的可能，大小差距过大，很难提炼目标。 5. 尝试进行图像分割后对其进行识别，图像分割的过程需要参考**YOLT（You Only Look Twice）**的思路进行图像分割，这部分第一版代码过于老旧，参考意义比较小，需要自己进行调试和思想迁移。 ## 解决方案 - 本项目设计的过程中将使用svg图像解析融合视觉识别定位完成元器件的识别： - svg图像解析主要处理的问题包括电容电阻等及其微小的元器件的识别和匹配 - 视觉识别定位主要采用YOLO或者Tensorflow模型识别大型的元器件 ## svg图像解析定位主要的尝试思路如下所示： 1. 使用官方开源库对svg图片直接转换为png图片做处理 **===>（×)** 转换过程中像素信息丢失、模糊、会有重影 2. 可以注意到甲方发送的svg矢量图片中规格的大小以pt为单位（1pt=1/64英寸），我直接渲染出来图像的像素过高，目标识别一般输入的图像尺寸最好不要超过1920*1080，尺寸是它的好几倍，因此需要做分割？但是考虑分割后小目标识别丢失，转换使用算法解决配对和识别问题。 **===>（×）** 3. 最终思路直接使用svg文本格式的信息对图像进行提取：文本信息可以帮助提取以下内容（样例） ```xml

此时写一分标签分割的文件也对标签做相应的分割，这样后续训练的时候也要用分割大小的窗口进行检测。 - 大目标模型训练，得到新模型（可能需要做图像分割）这里使用的是YOLT模型，使用YOLTv8开源框架改进版本对其进行处理，配置好相关文件，将我们的模型进行训练。我这里使用的是YOLO11对我的标注数据进行训练。最终配好相关YOLTv8环境进行预测，预测结果如下所示： ![image-20250516164956878](./markdown_images/image-20250516164956878.png) 然后把该文件夹所有的识别结果进行导出处理： ![image-20250519135612686](./markdown_images/image-20250519135612686.png) 导出结果之后发现结果为归一化的结果，结果的格式为：类别--中心点x--中心点y--长--宽--置信度因此我将其关键的信息进行提取：首先获取原图像尺寸，当时转换的过程中为：原svg图像长、宽获取，设置相关dpi=10（经过测试会比较清晰）得到新的png图像。假设原svg图像为400pt*600pt，那么新图png的像素值为4000 * 6000像素，因此在转换回去的过程中获取原图像的像素，然后根据dpi的比例进行除法操作就可以得到我要的svg图中的准确结果。导出的结果如下图所示： ![image-20250519135951596](./markdown_images/image-20250519135951596.png) 上图中包含了所有检测的信息，并且是按照svg数值大小进行规范格式。此时关于检测图形类别识别和定位完成。