登录
注册
开源
企业版
高校版
搜索
帮助中心
使用条款
关于我们
开源
企业版
高校版
私有云
模力方舟
登录
注册
医疗 AI 怎么落地?本周四晚 19:30,「智医灵枢」开发者直播开讲,来听听一线医院的实战分享!
代码拉取完成,页面将自动刷新
捐赠
捐赠前请先登录
取消
前往登录
扫描微信二维码支付
取消
支付完成
支付提示
将跳转至支付宝完成支付
确定
取消
Watch
不关注
关注所有动态
仅关注版本发行动态
关注但不提醒动态
19
Star
1
Fork
4
src-openEuler
/
sysTrace
代码
Issues
0
Pull Requests
0
Wiki
统计
流水线
服务
JavaDoc
PHPDoc
质量分析
Jenkins for Gitee
腾讯云托管
腾讯云 Serverless
悬镜安全
阿里云 SAE
Codeblitz
SBOM
我知道了,不再自动展开
更新失败,请稍后重试!
移除标识
内容风险标识
本任务被
标识为内容中包含有代码安全 Bug 、隐私泄露等敏感信息,仓库外成员不可访问
systrace智能化改造,支持openEuler Intelligence智能调用
已完成
#ICUGMJ
需求
huangbin
成员
创建于
2025-08-25 10:00
##【特性描述】 面向运维、开发人员,支持自然语言对接,实现启发式调优,实现3个工具接口,分别为性能劣化感知工具,慢卡定界工具,报告输出工具。 其中: 性能劣化感知工具:通过解析sysTrace采集的L0数据,即AI框架关键阶段 dataloader、forward、backward的类step时延数据,检测是否存在性能劣化现象; 慢卡定界工具:性能劣化后,开启慢卡定界,输入通信算子数据(5分钟左右),输出故障节点,时间,覆盖计算慢、通信慢、算子下发慢、IO慢问题; 报告输出工具:在上述工具的输出基础上,整理结果,形成报告输出; 上述三个工具在EulerCopilot框架的调度下实现用户对机器训练过程性能劣化排查的任务。 【特性竞争力】 充分利用sysTrace采集的数据,对ai训练过程进行慢卡检测,提高发现问题的能力和效率 【硬件架构】 NoArch 【特性约束】 NA 【涉及仓库】 https://gitee.com/src-openeuler/sysTrace 【交付个人/团队】 A-ops团队
##【特性描述】 面向运维、开发人员,支持自然语言对接,实现启发式调优,实现3个工具接口,分别为性能劣化感知工具,慢卡定界工具,报告输出工具。 其中: 性能劣化感知工具:通过解析sysTrace采集的L0数据,即AI框架关键阶段 dataloader、forward、backward的类step时延数据,检测是否存在性能劣化现象; 慢卡定界工具:性能劣化后,开启慢卡定界,输入通信算子数据(5分钟左右),输出故障节点,时间,覆盖计算慢、通信慢、算子下发慢、IO慢问题; 报告输出工具:在上述工具的输出基础上,整理结果,形成报告输出; 上述三个工具在EulerCopilot框架的调度下实现用户对机器训练过程性能劣化排查的任务。 【特性竞争力】 充分利用sysTrace采集的数据,对ai训练过程进行慢卡检测,提高发现问题的能力和效率 【硬件架构】 NoArch 【特性约束】 NA 【涉及仓库】 https://gitee.com/src-openeuler/sysTrace 【交付个人/团队】 A-ops团队
评论 (
1
)
登录
后才可以发表评论
状态
已完成
新建
已接纳
已挂起
设计中
开发中
已完成
已验收
已拒绝
负责人
未设置
标签
sig/sig-ops
未设置
项目
未立项任务
未立项任务
里程碑
未关联里程碑
未关联里程碑
Pull Requests
未关联
未关联
关联的 Pull Requests 被合并后可能会关闭此 issue
分支
未关联
未关联
master
openEuler-25.09
openEuler-24.03-LTS-SP2
openEuler-22.03-LTS-SP4
openEuler-22.03-LTS-Next
openEuler-24.03-LTS-Next
openEuler-22.03-LTS-NEXT
开始日期   -   截止日期
-
置顶选项
不置顶
置顶等级:高
置顶等级:中
置顶等级:低
优先级
不指定
严重
主要
次要
不重要
预计工期
(小时)
参与者(1)
1
https://gitee.com/src-openeuler/sysTrace.git
git@gitee.com:src-openeuler/sysTrace.git
src-openeuler
sysTrace
sysTrace
点此查找更多帮助
搜索帮助
Git 命令在线学习
如何在 Gitee 导入 GitHub 仓库
Git 仓库基础操作
企业版和社区版功能对比
SSH 公钥设置
如何处理代码冲突
仓库体积过大,如何减小?
如何找回被删除的仓库数据
Gitee 产品配额说明
GitHub仓库快速导入Gitee及同步更新
什么是 Release(发行版)
将 PHP 项目自动发布到 packagist.org
仓库举报
回到顶部
登录提示
该操作需登录 Gitee 帐号,请先登录后再操作。
立即登录
没有帐号,去注册