【特性描述】
openeuler 2203 LTS和CentOS 8.0比较UnixBench多核整形得分,有明显劣势,intel Sapphire Rapids CPU。
初步定位怀疑oe高版本gcc和CentOS8.0的gcc相比有变更,导致性能劣势。希望针对Sapphire Rapids进行调优。
开启超线程,执行./Run dhry2reg -i 1 -c N(cpu数量);或者直接执行UnixBench的二进制,以2U为例,taskset -c 0 ./dhry2reg 10& taskset -c 1(对应的超线程CPU id) ./dhry2reg 10,循环执行10次取平均值。结果显示openeuler2203劣于CentOS8.0 7.5%左右。
【特性竞争力】
性能竞争力
【硬件架构】
X86
【特性约束】
NA
【涉及仓库】
gcc
【交付个人/团队】
gcc
Hi zhaoclark, welcome to the openEuler Community.
I'm the Bot here serving you. You can find the instructions on how to interact with me at Here.
If you have any questions, please contact the SIG: Compiler, and any of the maintainers: @Noah , @eastb233 , @kuen , @编译小伙 , @huangxiaoquan , @cf-zhao , @周磊 , @stubCode , @Haijian.Zhang , @熊洲
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。
你好,有做实验确定是GCC的问题吗?CentOS的GCC可以直接在openEuler使用,可以在openEuler上对比两个编译器的结果。
通过对比二进制可以发现明显不同。将oe的汇编部分替换成CentOS8的汇编,可以明显提升性能。主要是在全局变量布局、vmovdqu指令上。
登录 后才可以发表评论