21 Star 26 Fork 89

src-openEuler / gcc

 / 详情

openeuler 2203 LTS和CentOS 8.0比较UnixBench多核整形得分有明显劣势,gcc需要调优

待办的
用户需求
创建于  
2024-03-19 20:10

【特性描述】
openeuler 2203 LTS和CentOS 8.0比较UnixBench多核整形得分,有明显劣势,intel Sapphire Rapids CPU。
初步定位怀疑oe高版本gcc和CentOS8.0的gcc相比有变更,导致性能劣势。希望针对Sapphire Rapids进行调优。

开启超线程,执行./Run dhry2reg -i 1 -c N(cpu数量);或者直接执行UnixBench的二进制,以2U为例,taskset -c 0 ./dhry2reg 10& taskset -c 1(对应的超线程CPU id) ./dhry2reg 10,循环执行10次取平均值。结果显示openeuler2203劣于CentOS8.0 7.5%左右。

【特性竞争力】
性能竞争力
【硬件架构】
X86
【特性约束】
NA
【涉及仓库】
gcc
【交付个人/团队】
gcc

评论 (3)

Zhao.Clark 创建了用户需求

Hi zhaoclark, welcome to the openEuler Community.
I'm the Bot here serving you. You can find the instructions on how to interact with me at Here.
If you have any questions, please contact the SIG: Compiler, and any of the maintainers: @Noah , @eastb233 , @kuen , @编译小伙 , @huangxiaoquan , @cf-zhao , @周磊 , @stubCode , @Haijian.Zhang , @熊洲

openeuler-ci-bot 添加了
 
sig/Compiler
标签
Zhao.Clark 修改了描述

你好,有做实验确定是GCC的问题吗?CentOS的GCC可以直接在openEuler使用,可以在openEuler上对比两个编译器的结果。

通过对比二进制可以发现明显不同。将oe的汇编部分替换成CentOS8的汇编,可以明显提升性能。主要是在全局变量布局、vmovdqu指令上。

登录 后才可以发表评论

状态
负责人
项目
里程碑
Pull Requests
关联的 Pull Requests 被合并后可能会关闭此 issue
分支
开始日期   -   截止日期
-
置顶选项
优先级
预计工期 (小时)
参与者(3)
5329419 openeuler ci bot 1632792936 11454036 xiongzhou4 1689147764
1
https://gitee.com/src-openeuler/gcc.git
git@gitee.com:src-openeuler/gcc.git
src-openeuler
gcc
gcc

搜索帮助