登录
注册
开源
企业版
高校版
搜索
帮助中心
使用条款
关于我们
开源
企业版
高校版
私有云
模力方舟
AI 队友
登录
注册
11月29日 Gitee Talk | 模力方舟 AI 沙龙深圳站:看懂算力到应用的下一个主战场!点击立即报名~
代码拉取完成,页面将自动刷新
仓库状态说明
捐赠
捐赠前请先登录
取消
前往登录
扫描微信二维码支付
取消
支付完成
支付提示
将跳转至支付宝完成支付
确定
取消
Watch
不关注
关注所有动态
仅关注版本发行动态
关注但不提醒动态
68
Star
258
Fork
189
Ascend
/
modelzoo
暂停
代码
Issues
157
Pull Requests
9
Wiki
统计
流水线
服务
JavaDoc
PHPDoc
质量分析
Jenkins for Gitee
腾讯云托管
腾讯云 Serverless
悬镜安全
阿里云 SAE
Codeblitz
SBOM
我知道了,不再自动展开
更新失败,请稍后重试!
移除标识
内容风险标识
本任务被
标识为内容中包含有代码安全 Bug 、隐私泄露等敏感信息,仓库外成员不可访问
[哈工大] tf.image.resize_bilinear/resize_image算子在AiCore上执行速度慢
DONE
#I2AXL4
Duplication
鸿铭要开心
创建于
2020-12-26 16:01
## Environment -- ascend 910 -- Apulis -- Python 3.7.5 -- GCC 7.5.0 -- Tensorflow 1.15 ## Related Discussion https://gitee.com/ascend/modelzoo/issues/I29LVC ## Description 我们迁移Siammask模型到npu时发现训练速度极慢,经分析定位到是由resize_bilinear算子引发的瓶颈。 我们对resize_bilinear算子进行了 单算子的性能测试,分别跑在AiCore和CPU上,发现其速度相差巨大 | Key | Value | |---------------|--------------------| | Input_shape | [10000, 63, 63, 1] | | Input_dtype | float16 | | newlist | [127,127] | | AiCore用时 | 35s | | CPU用时 | 2s | ## Code 主要执行代码如下,统计的时间就是执行该函数所需的时间。 ``` def tvm_run(params,newlist,align_corners, session_config): input = tf.placeholder(params.dtype, shape=params.shape) s = tf.image.resize_bilinear(input, newlist,align_corners) with tf.Session(config=session_config) as sess: result = sess.run(s, feed_dict={input: params}) return result ``` 完整代码:[该链接有效期一周](https://dbnet.obs.cn-north-4.myhuaweicloud.com:443/logs/resize_image_obs.zip?AccessKeyId=NMZTI8AEEE9WMDLZ4ABS&Expires=1609576030&Signature=/WczaInctZEAHyKLNs9KarovI4g%3D) ## Host Log 下载地址:[该链接有效期一周](https://dbnet.obs.cn-north-4.myhuaweicloud.com:443/logs/run_1226.log?AccessKeyId=NMZTI8AEEE9WMDLZ4ABS&Expires=1609574289&Signature=AjJaW63JGv5BQCVrnQbRJkMXy5A%3D) - 通过第2398行判断,代码应该是跑在了AiCore上 - 通过第2633行-2969行能看到两边执行所需的时间 ## Discussion 我们在代码中使用的是tf.image.resize_image算子,各位老师推荐我们使用tf.image.resize_bilinear;但根据源代码,二者底层调用的都是 gen_image_ops.resize_bilinear,且从运行速度上看,而这并未有太多的差异 | | [tf.image.resize_image](https://github.com/tensorflow/tensorflow/blob/v2.4.0/tensorflow/python/ops/image_ops_impl.py#L1446-L1448) | [tf.image.resize_bilinear](https://github.com/tensorflow/tensorflow/blob/v2.4.0/tensorflow/python/ops/image_ops_impl.py#L4437-L4447https://github.com/tensorflow/tensorflow/blob/v2.4.0/tensorflow/python/ops/image_ops_impl.py#L4437-L4447) | |--------|-----------------------------------------------------------------------------------------------------------------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | AiCore | 33.90s | 34.06s | | CPU | 2.122s | 2.149s |
## Environment -- ascend 910 -- Apulis -- Python 3.7.5 -- GCC 7.5.0 -- Tensorflow 1.15 ## Related Discussion https://gitee.com/ascend/modelzoo/issues/I29LVC ## Description 我们迁移Siammask模型到npu时发现训练速度极慢,经分析定位到是由resize_bilinear算子引发的瓶颈。 我们对resize_bilinear算子进行了 单算子的性能测试,分别跑在AiCore和CPU上,发现其速度相差巨大 | Key | Value | |---------------|--------------------| | Input_shape | [10000, 63, 63, 1] | | Input_dtype | float16 | | newlist | [127,127] | | AiCore用时 | 35s | | CPU用时 | 2s | ## Code 主要执行代码如下,统计的时间就是执行该函数所需的时间。 ``` def tvm_run(params,newlist,align_corners, session_config): input = tf.placeholder(params.dtype, shape=params.shape) s = tf.image.resize_bilinear(input, newlist,align_corners) with tf.Session(config=session_config) as sess: result = sess.run(s, feed_dict={input: params}) return result ``` 完整代码:[该链接有效期一周](https://dbnet.obs.cn-north-4.myhuaweicloud.com:443/logs/resize_image_obs.zip?AccessKeyId=NMZTI8AEEE9WMDLZ4ABS&Expires=1609576030&Signature=/WczaInctZEAHyKLNs9KarovI4g%3D) ## Host Log 下载地址:[该链接有效期一周](https://dbnet.obs.cn-north-4.myhuaweicloud.com:443/logs/run_1226.log?AccessKeyId=NMZTI8AEEE9WMDLZ4ABS&Expires=1609574289&Signature=AjJaW63JGv5BQCVrnQbRJkMXy5A%3D) - 通过第2398行判断,代码应该是跑在了AiCore上 - 通过第2633行-2969行能看到两边执行所需的时间 ## Discussion 我们在代码中使用的是tf.image.resize_image算子,各位老师推荐我们使用tf.image.resize_bilinear;但根据源代码,二者底层调用的都是 gen_image_ops.resize_bilinear,且从运行速度上看,而这并未有太多的差异 | | [tf.image.resize_image](https://github.com/tensorflow/tensorflow/blob/v2.4.0/tensorflow/python/ops/image_ops_impl.py#L1446-L1448) | [tf.image.resize_bilinear](https://github.com/tensorflow/tensorflow/blob/v2.4.0/tensorflow/python/ops/image_ops_impl.py#L4437-L4447https://github.com/tensorflow/tensorflow/blob/v2.4.0/tensorflow/python/ops/image_ops_impl.py#L4437-L4447) | |--------|-----------------------------------------------------------------------------------------------------------------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | AiCore | 33.90s | 34.06s | | CPU | 2.122s | 2.149s |
评论 (
15
)
登录
后才可以发表评论
状态
DONE
TODO
Analysing
ACCEPTED
WIP
Feedback
DONE
REJECTED
负责人
未设置
王振动
wangzhendong07
负责人
协作者
+负责人
+协作者
标签
未设置
项目
未立项任务
未立项任务
里程碑
未关联里程碑
未关联里程碑
Pull Requests
未关联
未关联
关联的 Pull Requests 被合并后可能会关闭此 issue
分支
未关联
未关联
master
开始日期   -   截止日期
-
置顶选项
不置顶
置顶等级:高
置顶等级:中
置顶等级:低
优先级
不指定
严重
主要
次要
不重要
预计工期
(小时)
参与者(1)
1
https://gitee.com/ascend/modelzoo.git
git@gitee.com:ascend/modelzoo.git
ascend
modelzoo
modelzoo
点此查找更多帮助
搜索帮助
Git 命令在线学习
如何在 Gitee 导入 GitHub 仓库
Git 仓库基础操作
企业版和社区版功能对比
SSH 公钥设置
如何处理代码冲突
仓库体积过大,如何减小?
如何找回被删除的仓库数据
Gitee 产品配额说明
GitHub仓库快速导入Gitee及同步更新
什么是 Release(发行版)
将 PHP 项目自动发布到 packagist.org
评论
仓库举报
回到顶部
登录提示
该操作需登录 Gitee 帐号,请先登录后再操作。
立即登录
没有帐号,去注册