PR types

Performance optimization

PR changes

OPs

Describe

功能

该PR使用Reduce接口优化了elementwise_min的反向计算

效果

以下是op-benchmark效果,其中「paddle优化1」 表示使用Reduce初步优化效果;「paddle优化2」表示进一步优化,即三元计算替换二元计算后的优化效果:

截屏2022-01-10 13 35 27

整体上,效果与elementwise_max_grad几乎相同:优化3(适配多输出代码优化后)较优化1(reduce接口优化)、优化2(三元functor优化)均有显著提升;但当前前两个配置差于dev 10%左右;