name | about | labels |
---|---|---|
Bug Report | Use this template for reporting a bug | kind/bug |
wide&deep ps网络在GPU上8p训练报错:Cuda create Event failed
模型仓地址:https://gitee.com/mindspore/models/blob/master/official/recommend/Wide_and_Deep/script/
Ascend
/GPU
/CPU
) / 硬件环境:Please delete the backend not involved / 请删除不涉及的后端:
/device GPU
Software Environment / 软件环境 (Mandatory / 必填):
-- MindSpore version (e.g., 1.7.0.Bxxx) :
-- Python version (e.g., Python 3.7.5) :
-- OS platform and distribution (e.g., Linux Ubuntu 16.04):
-- GCC/Compiler version (if compiled from source):
mindspore包版本:2.2.1.20231031
Excute Mode / 执行模式 (Mandatory / 必填)(PyNative
/Graph
):
Please delete the mode not involved / 请删除不涉及的模式:
/mode graph
用例仓地址:solution_test/cases/02network/06recommend/wide_deep/train
用例:
test_ms_wide_deep_criteo_ps_train_infer_gpu_8p_daily_0001.py
1.get code from models
2.cd models/official/recommend/Wide_and_Deep
3.bash run_parameter_server_train_distribute.sh RANK_SIZE EPOCHS DEVICE_TARGET DATASET
SERVER_NUM SCHED_HOST SCHED_PORT RANK_TABLE_FILE VOCAB_CACHE_SIZE SPARSE
4.验证训练是否成功,性能是否达标
训练成功,性能达标
走给兰秉良
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。
感谢您的反馈,您可以评论//mindspore-assistant更快获取帮助,更多标签可以查看标签列表:
请跟具体的开发沟通好再提单给对应的开发人员
登录 后才可以发表评论