# ccv10 **Repository Path**: anjiang2020_admin/ccv10 ## Basic Information - **Project Name**: ccv10 - **Description**: 资料同步 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 5 - **Forks**: 6 - **Created**: 2021-10-18 - **Last Updated**: 2022-12-05 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # CCV10's CVFundamentals - computer vision fundamentals - 以下文件都可以在https://gitee.com/anjiang2020_admin/ccv10 找到,若找不到联系,可以明明老师协助。微信13271929138 - week7 ``` CV核心基础WEEK7 : 基本图像处理 https://gitee.com/anjiang2020_admin/ccv10 Pipeline: 0.职业规划 1.Computer Vision 的由来 2.计算机如何看到图像 3.计算机处理图像的方式,方法 作业: 1 用滤波操作给图片去除噪声, 选做:将自己的logo水印打到经过滤波后的照片上。 目的:感受滤波操作的作用,用数字上的滤波操作模拟老照片真实镜头的滤波功能。 参考步骤: 1 拿到老师给定的图片:week7_211017/week7_homework.png。 2 对图片进行滤波操作。参考week7_211017/week7_class_code_after_class.py 3 修改滤波核的数值和滤波核的大小,调整出最好的效果。 4 制作自己的logo水印的照片 5 将水印添加到图片上。参考week7_211017/week7_class_code_after_class.py 6 图像围绕任意点进行刚体旋转的公式推导:https://zhuanlan.zhihu.com/p/399377684 ``` - week8 ``` CV核心基础WEEK8 :认识计算机视觉[https://gitee.com/anjiang2020_admin/ccv10] Pipeline: 1. 图像处理与计算机视觉 2. 计算机视觉的输入与输出 3. 如何解决计算机视觉的几个问题 4. 计算机视觉第一步:图像描述子 作业: 编写计算机视觉的第0版程序。 步骤 1 生成10张图片,对应0,1,2,3,4,5,6,7,8,9. 2 对这10张图片提取特征x。 3 用一个判别器f(x)来决策输出结果y。 这个判别器达到作用: 当x是 “0”图片对应的特征时,y=f(x)=0 当x是 “1”图片对应的特征时,y=f(x)=1 当x是 “2”图片对应的特征时,y=f(x)=2 当x是 “3”图片对应的特征时,y=f(x)=3 当x是 “4”图片对应的特征时,y=f(x)=4 当x是 “5”图片对应的特征时,y=f(x)=5 当x是 “6”图片对应的特征时,y=f(x)=6 当x是 “7”图片对应的特征时,y=f(x)=7 当x是 “8”图片对应的特征时,y=f(x)=8 当x是 “9”图片对应的特征时,y=f(x)=9 4 参考代码:week2/recognize_computer_vision.py 课堂参考资料: 1. 灰度变换,gamma变换的例子:gamma.py 2. 课后作业参考:recognize_computer_vision.py 3. 第一周课后作业参考:week7_homework.ipynb 4. 第一周课后作业参考:week7_homework.py 5. week2课堂代码:week8_class_code.ipynb 6. week2课堂代码: week8_class_code.py 7. 课堂用图:tangsan.jpg 8. 课堂用图:dog.png 9. 关键点算法:https://zhuanlan.zhihu.com/p/147390611 ``` - week9 ``` CV核心基础WEEK9 :依赖硬件算力提升模型性能:cuda编程 https://gitee.com/anjiang2020_admin/ccv10 Pipeline: 1 week8作业 2 计算机视觉的常用模型 3 CNN统一了提特征与决策 4 GPU Schema 5 认识pycuda,并用pycuda完成矩阵乘法 作业:使用pycuda完成LeNet模型的以下模块: 1. [必做]conv 2. pooling 3. relu 4. linear 5. backward 要求: 1 要求用pycuda库利用gpu的多线程技术,完成卷积层的计算。 2 可以用自己定义的kernel函数,也可以用pycuda提供的核函数 3 自己定义核函数的时候,可以参考week9_pycuda_example_6.py来实现 其它参考材料: 1. week8参考作业:week9_20210313/week8作业答案课堂讲解.ipynb 2. 卷积层用nn.conv2d来实现,相关参考代码:week6/conv.py 3. 卷积的声明,更改默认weight,默认bias,对图片进行卷积,示例子代码在:week9_20210313/conv.py 的14行,27行,29行,55行 4. 图像滤波器:filter.py 5. pycuda-master: pycuda源码 6. week9_pe_5.py : 自定义核函数,打印出“hello world" 7. week9_pe_4.py : 自定义核函数,掌握threadIdx,blockIdx等内置变量的意义。 8. week9_pycuda_example_2.py : 自定义加法核函数 9. week9_pycuda_example_3.py : 自定义乘法核函数 10. week9_pycuda_example_6.py : 自定义矩阵乘法核函数 11. week9_pycude_example_1.py : 利用gpuarray来调用gpu进行计算。 12. week9_cvf.py : pycuda 自带api使用,gpuarray,以及自带核函数的使用 ``` - week10 [图像分类的决策层设计总结与实战] ``` https://gitee.com/anjiang2020_admin/ccv10 CV核心基础WEEK10:图像分类决策层的设计总结与实践 Pipeline: 1 CNN提特征层的设计:搭积木 2 看看经典模型是如何搭积木的 3 决策功能的实现:output层的设计 4 生成output需要的groundtruth 5 经典模型Resnet/mobilenet 作业:自己完成一个分类项目:数据采集,标注,设计网络(可从头开始,也可fineturn). 1. [可选]每人提交10张矿泉水瓶\可乐瓶的图片到邮箱:471106585qq.com ![输入图片说明](https://images.gitee.com/uploads/images/2020/0715/135022_28d7b639_7401441.png "屏幕截图.png") ![输入图片说明](https://images.gitee.com/uploads/images/2020/0715/135042_997cd525_7401441.png "屏幕截图.png") 2. 这次分类的图片由老师标注。统一传到modelarts标注平台标注。[检测类的项目时,老师会将图片统一传到modelarts标注平台,交给大家标注] 3. 自行完成分类网络的决策层。体特征层可从零设计,也可使用其他网络。建议resnet18,在week10_210902/resnet.py中有其实现,可参考 4. 此次数据集明名为week10_dataset,永远开放的学习型数据集,数据的data_loader也在最近几天提供在week10_dataset的gitee里:https://gitee.com/anjiang2020_admin/week10-dataset 要求: 1 提交作业时,需要提交代码,训练的train acc 2 [可选] 提交训练超参数(学习率策略,优化方法,优化epoch数,train acc,test acc) 其它参考材料: 1. mobilenets论文:mobilenets_paper.pdf 2. week9作业参考答案:pycuda_conv_week9_homework.py 3. resnet网络搭建代码参考:resnet.py 4. pytorch实现alexnet,代码在文件夹week10_210902/alexnet下,实现细节可参考:http://www.imlarger.com:8081/dist/index.html#/Paper/267 如果此网址打开困难,可以看week10_210902/alexnet/训练一个alexnet.pdf 5. week10_dataset::https://gitee.com/anjiang2020_admin/week10-dataset ``` - week11 [图像检测决策层设计总结与实战(一)] ``` [ https://gitee.com/anjiang2020_admin/ccv10 ] CV核心基础WEEK11:一阶段的图像检测模型的决策层设计总结与实战 Pipeline: 1 只用计算一次就能到得到检测框:YOLO 2 多尺度提取特征:YOLOV2 作业:1 下载提供的week10-datasets-detect 数据集:https://gitee.com/anjiang2020_admin/week10-dataset 2 在分类模型的基础上,加上检测层,对week10-datasets进行回归检测 说明: 1. 自行完成检测层的设计。自行决定:检测头的检测区域个数,每个检测区域内输出框数,类别数。 2. 网络得backbone可以是你week10使用得网络,也可以与加载一些经典网络,也可以自行设计。 3. NMS得实现可参考ppt.代码可自己写,也可以从网站找,网上代码一般含有IoU. 要求: 1 提交作业时,需要提交代码,训练超参数(学习率策略,优化方法,优化epoch数,给出10张图片以及其对应检测结果。) 其它参考材料: 1. week11_210327/矿泉水瓶分类/bcnn_iccv15.pdf 2. 矿泉水瓶分类.ipynb 3. YOLO_V1论文:YOLO_V1.pdf 4. YOLO_V2论文:YOLO_V2.pdf 5. YOLO_V3论文:YOLO_V3.pdf 6. [推荐]YOLO至YOLOv5通俗易懂文字教程:https://zhuanlan.zhihu.com/p/183261974 7. 2016CVPR会议上,作者的PPT:YOLO_CVPR_2016_ppt.pdf 8. [重要,建议背诵]微调模型示例:Finetuning_convnet.py Finetuning_convnet.ipynb ``` week12 [YOLO之前:图像检测决策层设计总结与实战(二)] ``` [ https://gitee.com/anjiang2020_admin/ccv10 ] CV核心基础WEEK12:YOLO之前:图像检测决策层设计总结与实战(二) Pipeline: 1 如何评价检测器性能? 2 深度学习初次用于检测:RCNN 3 比CRNN快213倍:Fast RCNN 4 真正得端到端:Faster RCNN 作业: 1. 计算week11所设计检测器的mAP,先把每个子类别得AP算出来,然后计算mAP。如果把所有水瓶算做一类,就算一个AP出来即可。 2. [faster rcnn学完之后选做]用region based得方法【rpn】,可能会更好 要求: 1. 提交作业时,需要与自己检测器相适配得mAP代码,以及总得mAP值,分类别得AP值。 其它参考材料: 1. mAP 代码可参考https://github.com/Cartucho/mAP 2. week11作业参考中的pennfudan数据下载地址:https://www.cis.upenn.edu/~jshi/ped_html/ 3. RCNN模型后续系列的发展,可以参考:https://zhuanlan.zhihu.com/p/368483790,比如这里有个:双头RCNN ``` week13 [分割网络的设计] ``` [ https://gitee.com/anjiang2020_admin/ccv10 ] CV核心基础WEEK13:分割网络的设计 Pipeline: 1 分割器的设计思路 2 经典分割模型的涨点方法 作业:对老师提供的FCN代码填空,对图像进行分割 FCN 参考步骤: 1. 编写网络结构文件week13_211205/homework/fcn.py 18行,补齐FCN32s网络各层得定义: [可选] 52行,补齐FCN8s各层得定义 [可选] 71行,实现跳级结构 2. 待准备pennfudan数据集https://www.cis.upenn.edu/~jshi/ped_html/ 所以,在一开始我们掌握模型原理阶段,需要一个小数据集 pennfudan是一个只有52M的小型数据集,我们就用它的验证网络的有效性。尽快掌握FCN pennfudan数据下载地址:https://www.cis.upenn.edu/~jshi/ped_html/ ![输入图片说明](https://images.gitee.com/uploads/images/2020/0706/195021_9b419532_7401441.png "屏幕截图.png") ![输入图片说明](https://images.gitee.com/uploads/images/2020/0706/200412_b841b066_7401441.png "屏幕截图.png") 3. 预先训练好得模型:week13_211205/homework/models/文件夹下 选做作业: 参考FCN,deeplab等,设计一种检测器,对week10_dataset中的瓶子进行分割。 建议步骤: 1. week10_dataset标注,标注文件在https://gitee.com/anjiang2020_admin/week10-dataset 2. dataloader的编写 3. 按照Deeplab的思路,重新设计一个网络 ``` week14- [跟踪算法的设计] ``` CV核心基础WEEK14 : 计算机视觉之跟踪算法的设计 [ https://gitee.com/anjiang2020_admin/ccv10 ] Pipeline: 0.week13homework 1.跟踪任务与检测任务的区别 2.用分类做跟踪 3. MeanShift做跟踪 4. 相关滤波方法做跟踪 5. 深度学习做跟踪 作业: 1 写一个tracker,跟踪水瓶(老师提供视频数据【已标注】:https://gitee.com/anjiang2020_admin/week10-dataset/blob/master/README.md#week14跟踪数据集) 选做:MOSSE方法或者learning to track 100FPS using DNN。 目的:掌握基于分类做跟踪的思路;掌握跟踪算法中,在线更新模型的的操作办法。 其它文件: week13作业答案:week14/week13_homework_answer/answer/ yolo的另一种实现:week14/CV_homework_week12 week14/将相关滤波器跟踪算法的速度做到极致.pdf 待跟踪视频:https://www.bilibili.com/video/BV1Y54y1273C/ ```