标题 :将AMD ROCm开源软件栈逐步引入openEuler实现GPU加速计算
难度 :高
描述 :
针对高性能计算和人工智能,GPU加速计算在数据中心的作用日益显著。英伟达CUDA是一套闭源的软件栈,需要厂商提供直接的支持,而AMD ROCm是一套完全开源的软件栈,社区可以针对不同的Linux发行版和硬件架构进行适配,从而实现基于AMD GPU的加速计算。ROCm整体架构可查看参考资料【1】,本项目希望能够将基本的ROCm Runtime支持引入到openEuler社区中,并使用一些测试程序进行相关的功能验证。在此基础上,后续可基于openEuler,对ROCm软件栈中的编程模型、上层库和框架进行使能,并验证TensorFlow和PyTorch的ROCm加速(TensorFlow和PyTorch上游已默认支持ROCm)。本项目暂时只需要考虑单GPU的情况。
基本的软件模块包括:
验证测试程序包括:
目标:
导师:周杰
联系方式:jammy.zhou@gmail.com
产出标准:
技术要求:
相关项目链接(仓库列表等):
【1】https://github.com/RadeonOpenCompute/ROCT-Thunk-Interface
【2】https://github.com/RadeonOpenCompute/ROCR-Runtime
【3】https://github.com/RadeonOpenCompute/rocminfo
【4】https://github.com/RadeonOpenCompute/rocm_smi_lib/tree/master/python_smi_tools
【5】https://github.com/RadeonOpenCompute/rocm_bandwidth_test
【6】https://github.com/ROCm-Developer-Tools/ROCmValidationSuite
相关资料(可选):
【1】https://rocmdocs.amd.com/en/latest/
【2】https://github.com/RadeonOpenCompute/ROCm
【3】https://developer.amd.com/resources/rocm-resources/rocm-learning-center/
【4】https://github.com/ROCm/ROCm.github.io/blob/master/hardware.md
【5】https://rocmdocs.amd.com/en/latest/Installation_Guide/Installation-Guide.html#getting-the-rocm-source-code