10 Star 18 Fork 57

openEuler/opensource-intern

基于 CUDA 的分布式并行计算程序 - 0.1.0

已完成
开源实习 成员
创建于  
2023-07-17 18:45

基于 CUDA 的分布式并行计算程序 - 0.1.0

【任务分值】 45 分

【背景描述】CUDA 是 NVIDIA 开发的并行计算平台,能够利用 GPU 的并行处理能力进行高效的计算。然而,当前的 CUDA 程序大多只能在单个节点上运行,无法充分利用分布式环境中的并行处理能力。本项目的目标是在已有的 CUDA 程序基础上,实现适用于分布式环境的程序,以便在多个节点上并行运行。

【需求描述】

  • 制定分布式环境的架构和通信协议
  • 修改已有的 CUDA 程序,使其能够在分布式环境中并行执行
  • 实现节点状态监测和故障恢复机制
  • 进行性能测试和优化

【环境要求】

  • CUDA 11.0 或以上版本
  • MPI (Message Passing Interface) 或其他通信协议
  • 支持 CUDA 的 GPU

【产出标准】

  • 完成分布式环境的架构和通信协议设计文档
  • 完成 CUDA 程序的分布式并行版本的代码
  • 完成性能测试和优化报告

【PR提交地址】本仓库的 distributed-cuda 目录

【期望完成时间】2023-11-31

【开发指导】

【导师及邮箱】
Email: pengpeng@bytetrade.io

【备注】
确定选择此题目需要和导师沟通,对相关项目进行调研,确定本次任务的工作范围,编写项目方案后再进行开发。
需要有一定的开发基础,懂 CUDA 开发语言,理解并行计算和分布式系统的基本原理。

评论 (5)

genedna 创建了开源实习 2年前
openeuler-ci-bot 添加了
 
sig/sig-OSCourse
标签
2年前
openeuler-ci-bot 移除了
 
sig/sig-OSCourse
标签
2年前
openeuler-ci-bot 添加了
 
sig/sig-OSCourse
标签
2年前
openeuler-ci-bot 添加了
 
intern
标签
2年前
openeuler-ci-bot 添加了
 
intern-OSCourse
标签
2年前

/intern-assign

/intern-assign

/close

openeuler-ci-bot 任务状态待办的 修改为已完成 1年前

登录 后才可以发表评论

状态
负责人
项目
里程碑
Pull Requests
关联的 Pull Requests 被合并后可能会关闭此 issue
分支
开始日期   -   截止日期
-
置顶选项
优先级
预计工期 (小时)
参与者(4)
5329419 openeuler ci bot 1632792936 瞳殇-linzs148 laiyijun2023-laiyijun2023 23249 genedna 1586065964
1
https://gitee.com/openeuler/opensource-intern.git
git@gitee.com:openeuler/opensource-intern.git
openeuler
opensource-intern
opensource-intern

搜索帮助