代码拉取完成,页面将自动刷新
2750
optimize elementwise_min_grad using new reduce interface
已合并
PR types
Performance optimization
PR changes
OPs
Describe
功能
该PR使用Reduce接口优化了elementwise_min的反向计算
效果
以下是op-benchmark效果,其中「paddle优化1」 表示使用Reduce初步优化效果;「paddle优化2」表示进一步优化,即三元计算替换二元计算后的优化效果:
整体上,效果与elementwise_max_grad几乎相同:优化3(适配多输出代码优化后)较优化1(reduce接口优化)、优化2(三元functor优化)均有显著提升;但当前前两个配置差于dev 10%左右;