一、问题现象(附报错日志上下文):
跑测试集时遇到错误:terminate called after throwing an instance of 'std::system_error'
what(): Invalid argument。程序会卡在这里,所以手动终止了训练作业。
二、软件版本:
-- CANN 版本: ascend-share/5.0.3.alpha002_tensorflow-ascend910-cp37-euleros2.8-aarch64-training:1.15.0-21.0.2_0916
--Tensorflow/Pytorch/MindSpore 版本:Tensorflow 1.15.0
提取码:
123000
*有效期至: 2022/10/21 10:44:21 GMT+08:00
你好,请把你运行环境配置发出来,看看image path(optional) 这里,是不是填写的最新的ModelArts镜像地址。 最新镜像地址应该是:
ascend-share/5.0.3.alpha005_tensorflow-ascend910-cp37-euleros2.8-aarch64-training:1.15.0-21.0.2_1019
另外,你的模型名称是啥?麻烦放在标题里面
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。
你好,请用obs 分享一下吧。 百度网络盘我们内网不好下载。分享个文件夹呢
https://support.huaweicloud.com/intl/zh-cn/ugobs-obs/obs_41_0024.html#section2
开启debug后,应该生成很多日志和dump图,要这个文件夹共享。
你好,从你的日志里面,发现错误
FileNotFoundError: [Errno 2] No such file or directory: 'tmp_result_0.pkl'
这里请用绝对路径访问数据或者文件,因为modelArts暂时不支持相对路径,因为modelArts启动的工作目录并非上传脚本的路径。
登录 后才可以发表评论