# MSC2 **Repository Path**: anjiang2020_admin/MSC2 ## Basic Information - **Project Name**: MSC2 - **Description**: 微软班课程资料与代码建议 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 4 - **Created**: 2020-07-16 - **Last Updated**: 2022-03-15 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # MSC2 #### 介绍 微软班课程资料与代码建议 #### week7[yolov4:精度与速度的最优秀结合] address:https://gitee.com/anjiang2020_admin/MSC2/blob/master/README.md pipeline: - 1. 只用计算一次就能够测到检测框 - 2. 多尺度提取特征,预测偏移量 - 3. 更深的网络,更多尺度的检测头 - 4. 将检测器一分为二:neck and head - 5. Bag of freebies:不增加推理计算量,带来较大提升的训练技巧 - 6. Bag of Specials:增加少量推理计算,带来较大提升的训练技巧 ``` week7作业 1. 手算或者代码算yolov4的计算量。 建议步骤: 1. 先搞清楚yolov4模型得前向计算:这里面CSPDarknet53如何与spp,PANet进行结合要搞清楚,确定好。这部分可以参考yolov4官方开源得代码去确定。 2. 分别计算CSPDarkent53,sspblock,PANet block,还有检测头head得计算量。 其它参考材料: 1. week7/YOLO CVPR 2016PPT.pdf,yolov1得ppt,作者关于loss得几个图做得很好。 2. week7/YoloV4-最全面ppt.pdf,yolov4得分享ppt,100多页,很用心。 3. week7/darknet_yolov4_github_src.pdf,darknet_yolov4_github_src,代码较为复杂,耐心边看边做笔记。 4. week7/yolov1.pdf,yolov1论文 5. week7/yolov2_9000_1612.08242.pdf,yolov2论文 6. week7/yolov3.pdf,yolov3论文 7. week7/yolov4.pdf,yolov4论文 ``` #### week8[场景文字检测模型:EAST] address:https://gitee.com/anjiang2020_admin/MSC2/blob/master/README.md pipeline: - 0. yolov1 例子代码:https://gitee.com/anjiang2020_admin/yolo_series - 1. EAST得输入输出以及中间过程 - 2. Output map详解 - 3. Groundtruth生成与loss - 4. 场景文字使用得数据集库介绍 ### week8作业要求 ![输入图片说明](https://images.gitee.com/uploads/images/2020/0706/163031_5ef4c8ca_7401441.png "屏幕截图.png") ``` 作业建议步骤以及建议代码: 1. 数据准备(图片读取,对应的GT生成)[数据这个没有讲,所以代码直接提供,不用填空,代码位置:week8/dataset.py] 2. EAST 模型建立[填空代码week8/model.py] 3. loss 函数建立[填空代码week8/loss.py] 4. 优化函数,超参数选择[填空代码week8/train.py] > 开始作业前,建议先下载 VGG 模型预训练权重 pths.zip 和数据集 ICDAR_2015.zip。 > > [ICDAR_2015.zip](:https://pan.baidu.com/s/1w20qOiQzgqm3bL4l08sDcg) 密码:j3sw > > > [pths.zip](链接:https://pan.baidu.com/s/1rVwGyb7-He-kMJKpdbEjCw) 密码:1jwf > > 下载后解压,将 `ICDAR_2015` 和 `pths` 文件夹放入 `week8` 目录中。 ``` #### week9[场景文字识别模型:CRNN] address:https://gitee.com/anjiang2020_admin/MSC2/blob/master/README.md pipeline: - 1. CRNN代码 - 2. CRNN前向计算过程 - 3. CRNN的LOSS FUNCTION:CTC [待整理] - 4. greedy search 与 beam search [待讲] ### week9作业要求 - 用自己截图的10张汉字图片对CRNN模型进行微调微调训练,模型只要能识别对自己提供的10张图片即可。 ``` 作业建议步骤以及建议代码: 1. 数据准备:自己随机截取10张图片。 2. 拿到老师提供的CRNN-python代码之后,先把【 python demo.py 】 运行成功。 3. train.py 的61行和73行是数据加载代码,自己修改成读取自己的代码。 ``` ### week10作业要求 - 改进模型,完成指定数字的生成。输入:随机数,one_hot(1),输出:数字1的图片 ``` 作业建议步骤以及建议代码: 1. 在week10文件夹下的代码基础上修改。 2. 可参考:https://blog.csdn.net/weixin_41278720/article/details/80861284 其它参考资料: 1. CTC loss中的beam search 示例代码:week10/ctc_decode.py 2. 详细说明:https://distill.pub/2017/ctc/#inference 3. 代码路径:https://gist.github.com/awni/56369a90d03953e370f3964c826ed4b0 Author: Awni Hannun This is an example CTC decoder written in Python. The code is intended to be a simple example and is not designed to be especially efficient. The algorithm is a prefix beam search for a model trained with the CTC loss function. For more details checkout either of these references: https://distill.pub/2017/ctc/#inference https://arxiv.org/abs/1408.2873 ``` ### week11垃圾分类检测项目 - week11项目代码讲解 ``` https://gitee.com/anjiang2020_admin/MSC2/blob/master/README.md 华为垃圾分类检测代码以及数据下载路径 华为云:【有效期从20200903 00:00 开始 18个小时】https://open-class-0319.obs.cn-north-4.myhuaweicloud.com:443/yolo/huawei%E5%9E%83%E5%9C%BE%E5%88%86%E7%B1%BB.zip?AWSAccessKeyId=5RFRW6KVA9JXD6IYARJT&Expires=1599127198&response-content-disposition=inline&x-amz-security-token=gQpjbi1ub3J0aC00iuNR7Bu-vyQwZc_h27WTF3FO3JObvKFygVaAMtBN_gyD3et7dF1DRb25ptMLLDbo9YevqIuLGDFOCil_BkMYhixJtY0Q4k1VxbkqnBjWdSeN8lfps3nwchosQ_OiSTrF84Ij_65Hp5vA0sEoewCnIECOB9RaW-Vq358AQKGv8x5bcDbPYA9sxW17YSCn9MM38Gicp8jQuh5yOLvPoPw3PSfFlQjJnY2ksNvra7WGr9QljZTb4kHzR5KGspJo7jCkV3dNT_zNRct3qJOdRYqjOlClZyBDyKFF2WVSEsPr5AjKH9ApfC8CBNz3GqSmA6xaiMt2cN3w0TuqljpiGOZRDmz4rCF0KCoN5HWFdAKMOP70bmaWCqZBCaOZHPWwcNzE2jan5dvlgfAd1tnly4o_WRjPWtGy7igKWd0ZuITpB_mAVq0nLy_1deUmTp8sB3SRvqGwA5ea4YsSyaD9mUhuGXpvu8uG0KbFHfLzK_ZXLvpyMPrQ3WI5WHGWHyDgOniLyypS2SI1OnRDFvJZlqu52TWDWg09SJJHUCrwhUoSsnLX1-CS8-XdHVUsuUmFUdxQnTzsYGO76suSW7zfiIoQeR12FizuJkU491ceXnbflrw_jgLyYWlR7Vvt5j86QdKT5JWP_fxPVJalwxP0zSZjN7wc2n22p11Thg1sxYNzdRUybfOLw-hNT1RUKi0KOJ92PaxLsNAxa6xGCbxC0CU-GevLoiJw1hhYR7_V8xS0L95RdTGBR_i8ChXxuG3bjaUVabApIUOJINodnGyLfE9g6rEZgIQahuQCHNDeWyzyiVTp&Signature=vtzv6iUYfDJ5sbnbN6IVZae9CvA%3D 百度网盘:链接:https://pan.baidu.com/s/1BwnHF91ncR0CquoEDAHrvg 密码:i58m ``` ### week12车道线检测项目 - week12车道线检测项目 ``` deeplabv3p: 链接:https://pan.baidu.com/s/1E7464Aap8G-Vh66zuPzVUQ 密码:2sy0 FCN: 链接:https://pan.baidu.com/s/1qbZUJ7NIiqqmHlP62BXZ8g 密码:q1n7 ``` ### week13 车牌识别项目 - week13 车牌识别项目 ``` 车牌检测+矫正+识别项目: https://github.com/shiheyingzhe/plate_detect_corner_warp_recognize 课上讲解后的CRNN_Chinese_Characters_Rec(来自天池比赛)代码: 链接:https://pan.baidu.com/s/16nBLh79OnvGUVGjxp4Bezg 密码:zqn9 ``` #### 参与贡献 1. Fork 本仓库 2. 新建 Feat_xxx 分支 3. 提交代码 4. 新建 Pull Request #### 码云特技 1. 使用 Readme\_XXX.md 来支持不同的语言,例如 Readme\_en.md, Readme\_zh.md 2. 码云官方博客 [blog.gitee.com](https://blog.gitee.com) 3. 你可以 [https://gitee.com/explore](https://gitee.com/explore) 这个地址来了解码云上的优秀开源项目 4. [GVP](https://gitee.com/gvp) 全称是码云最有价值开源项目,是码云综合评定出的优秀开源项目 5. 码云官方提供的使用手册 [https://gitee.com/help](https://gitee.com/help) 6. 码云封面人物是一档用来展示码云会员风采的栏目 [https://gitee.com/gitee-stars/](https://gitee.com/gitee-stars/)