name | about | labels |
---|---|---|
Bug Report | Use this template for reporting a bug | kind/bug |
Ascend
/GPU
/CPU
):/device ascend
v1.2.0
v3.7.5
ModelArts
default_config.yaml
文件中的num_classes
、data_url
、train_url
等属性train.py
脚本训练现象:
经分析,原因是因为在train.py
脚本的61行未显式指定n_class=config.num_classes
参数,导致模型的分类数永远等于默认值1000;除此之外,eval.py
和export.py
也有同样的问题。
修改脚本代码之后,Loss即能完成收敛。
Please add labels (comp or sig), also you can visit "https://gitee.com/mindspore/community/blob/master/sigs/dx/docs/labels.md" to find more.
为了让问题更快得到响应,请您为该issue打上**组件(comp)或兴趣组(sig)**标签,打上标签的问题可以直接推送给责任人进行处理。更多的标签可以查看 https://gitee.com/mindspore/community/blob/master/sigs/dx/docs/labels.md"
以组件问题为例,如果你发现问题是data组件造成的,你可以这样评论:
//comp/data
当然你也可以向data SIG组求助,可以这样写:
//comp/data
//sig/data
如果是一个简单的问题,你可以留给刚进入社区的小伙伴来回答,这时候你可以这样写:
//good-first-issue
恭喜你,你已经学会了使用命令来打标签,接下来就在下面的评论里打上标签吧!
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。
hello, @leonwanghui , we suggest you add some labels like:
你好, @leonwanghui , 建议您为这个issue打上标签:
//comp/modelzoo
//sig/modelzoo
简单分析为,train.py中,网络构造未增加n_class入参, 使得ShuffleNetV1类初始化时,n_class=1000不会随外部config文件的配置动态调整。
建议对上述问题进行修改,并对modelzoo网络中的num_class等问题进行一下初步排查也改下如关于num_class硬编码的脚本(考虑:之前没排查过)
- net = ShuffleNetV1(model_size=config.model_size)
+ net = ShuffleNetV1(model_size=config.model_size, n_class=config.num_classes)
定义shufflenetv1对象的时候,没有传递n_class参数。
在train.py,eval.py,export.py中的网络定义操作中增加n_class的参数传递。
同步排查了主要的分类网络如下,不存在类似问题。
@chenhaozhe 建议将目标检测的网络也筛选下,目前已经发现YOLOv3_resnet18存在同样问题:https://gitee.com/mindspore/mindspore/blob/master/model_zoo/official/cv/yolov3_resnet18/src/yolov3.py#L589
haozhe 目标检测类的网络 帮再看看,也顺带排查改一下吧 @chenhaozhe
yolov3_resnet18主要问题为现有结构不方便用户进行二次开发,与此问题不同类,由单独问题跟踪
#I4437P:[ModelZoo] YOLOv3_resnet18模型修改backbone网络num_classes参数后训练失败
登录 后才可以发表评论