diff --git a/examples/activation/simplesoftmax/kernel_launch_method_by_framework/README.md b/examples/activation/simplesoftmax/kernel_launch_method_by_framework/README.md index e11480235ed7d77f208fddf64ddc38aace4e47ea..5d92834c70ff112e29ad0047066d9a23050fd3c0 100644 --- a/examples/activation/simplesoftmax/kernel_launch_method_by_framework/README.md +++ b/examples/activation/simplesoftmax/kernel_launch_method_by_framework/README.md @@ -75,5 +75,28 @@ cd build_out ``` ./simplesoftmax_custom_npu ``` + +### 6.sim仿真模式运行(可选) +若要执行sim仿真,在build_out目录下执行如下命令: +``` +export LD_LIBRARY_PATH=$ASCEND_HOME_DIR/tools/simulator/${SOC_VERSION}/lib:$LD_LIBRARY_PATH +msprof op simulator --application=./simplesoftmax_custom_npu +``` +其中SOC_VERSION参数说明如下: +- SOC_VERSION :昇腾AI处理器型号,如果无法确定具体的[SOC_VERSION],则在安装昇腾AI处理器的服务器执行npu-smi info命令进行查询,在查询到的“Name”前增加Ascend信息,例如“Name”对应取值为xxxyy,实际配置的[SOC_VERSION]值为Ascendxxxyy。支持以下参数取值(xxx请替换为具体取值): + - Atlas 推理系列产品(Ascend 310P处理器)参数值:Ascend310P1、Ascend310P3 + - Atlas A2训练系列产品参数值:AscendxxxB1、AscendxxxB2、AscendxxxB3、AscendxxxB4 + +### 7.不同环境上的编译与运行(可选) +若执行样例环境与编译样例环境不一致,请在执行环境中进行如下操作,确保该环境上能够正确执行样例。 + - 参考步骤1,配置环境变量。 + - 参考步骤2,生成输入和真值数据,或者将编译环境下生成的input和output目录复制到执行环境。 + - 将编译环境下编译生成的自定义算子包,复制到执行环境。 + - 参考步骤4,在执行环境,安装部署自定义算子包。 + - 设置如下环境变量:export LD_LIBRARY_PATH=$ASCEND_HOME_DIR/opp/vendors/customize/op_api/lib:$LD_LIBRARY_PATH + - 进入临时目录,参考步骤5,执行可执行程序,即可运行样例。 +注意,以上方法仅支持编译环境与运行环境是相同的物理硬件架构,比如编译环境和执行环境均为x86硬件架构;若硬件架构不一致,必须重新编译算子工程,再安装部署和运行样例。 + + ### 注意事项 本样例工程会自动识别执行的硬件平台,无需单独设置SOC_VERSION \ No newline at end of file diff --git a/examples/activation/simplesoftmax/kernel_launch_method_by_framework/testcases/npu/simplesoftmax_custom_main.cpp b/examples/activation/simplesoftmax/kernel_launch_method_by_framework/testcases/npu/simplesoftmax_custom_main.cpp index 15408874415e7467ff20a5f55d111e296b8267ca..a7e2734d3b98cb3e067f71d5c042870415a5fabc 100644 --- a/examples/activation/simplesoftmax/kernel_launch_method_by_framework/testcases/npu/simplesoftmax_custom_main.cpp +++ b/examples/activation/simplesoftmax/kernel_launch_method_by_framework/testcases/npu/simplesoftmax_custom_main.cpp @@ -176,9 +176,7 @@ int32_t main(void) } ret = aclnnSimplesoftmaxCustom(workspace, workspaceSize, handle, stream); printf("aclnnSimplesoftmaxCustom ret %u\n", ret); - if (aclrtSynchronizeStreamWithTimeout(stream, 5000) != ACL_SUCCESS) { - printf("Synchronize stream failed\n"); - } + CHECK_ACL(aclrtSynchronizeStream(stream)); uint8_t *zHost, *maxHost, *sumHost; int64_t zHostSize = GetDataSize(&(tensorDesc[3]));