# iceHpcExperience **Repository Path**: xiwen32/ice-hpc-experience ## Basic Information - **Project Name**: iceHpcExperience - **Description**: 云南省内燃机重点实验室的机架服务器的操作指南 - **Primary Language**: Unknown - **License**: MPL-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 0 - **Created**: 2023-12-27 - **Last Updated**: 2025-09-10 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # iceHpcExperience ## 公告 **由于资源有限,请特别注意:** ```plaintext 1. 调试的case不要在HPC上提交; 2. 一般任务:单个任务最多使用一个节点,核心数为4的整数倍(4、16、64)。 3. 请及时下载与清除自己计算的结果文件,避免磁盘出现问题。 4. 学生毕业3个月后将统一删除账号,请及时下载数据。 ``` ## 软件列表 ```plaintext 1. abaqus 2021 2. cfx 2022R1 3. fluent 2022R1 4. converge 2.4.21 5. converge 3.0 # 2025.9.10 更新 5. openFOAM-v2206 6. comsol6.2 # 2024.8.27 更新 ``` ## HPC使用指南 ### 第1章 登录和登出超算系统 在登录超算系统前需要找相关负责人**注册超算账号**并使用WIFI或者网线**连接校园网**,校外网络将无法访问。确保连接校园网后可以正常访问学校官网:https://www.kmust.edu.cn/ #### 1.1 打开命令提示符 以Windows操作系统为例,同时按下键盘的`win`和`r`键,在弹出的窗口中输入`cmd`并回车。 ![img_4.png](/pic/img_4.png) **图1.1 打开命令提示符** 参考来源及其他操作方法: https://blog.csdn.net/m0_56223593/article/details/128866616 https://jingyan.baidu.com/article/3f16e003f1dd416491c103a6.html #### 1.2 连接超算系统 在窗口中输入`ssh -p 22 NewName@218.194.100.9`并回车: `NewName`是用户名,需要修改为自己的用户名,后续输出的`NewName`均会显示为自己的用户名,以下截图以IP地址`218.194.100.139`和用户名`user1`示范操作流程,实际连接时需要将IP地址改为`218.194.100.9`和使用**自己的用户名**。 回车后会出现以下提示: ```plaintext NewName@218.194.100.139's password: ``` ![img_5.png](/pic/img_5.png) **图1.2 连接超算系统** 如果连接超算系统出现以下提示: ```plaintext The authenticity of host '218.194.100.139 (218.194.100.139)' can't be established.ECDSA key fingerprint is SHA256:stRsASF0kQO5pfluqN/eT+Vggb3vkGFAGZAR6UbTANc.Are you sure you want to continue connecting (yes/no/[fingerprint])? ``` 此时输入`yes`并回车,会出现以下提示后再出现1.3节的输入密码的提示。 ```plaintext Warning: Permanently added '218.194.100.139' (ECDSA) to the list of known hosts. ``` #### 1.3 登录超算系统 输入账号密码后回车登录超算系统,输入密码时屏幕显示没有变化是正常现象,需要自己判断密码是否输入完毕。 登录超算系统后会出现以下提示,此时可进行其他的操作。 ```plaintext Last login: Wed Aug 23 17:48:18 2023 from 218.194.100.196 [NewName@master ~]$ ``` ![img_6.png](/pic/img_6.png) **图1.3 登录超算系统** #### 1.4 登出超算系统 输入`exit`并回车,登出后即可继续关闭命令提示符的界面。 登出后会出现以下提示: ```plaintext logout Connection to 218.194.100.139 closed. ``` ![img_7.png](/pic/img_7.png) **图1.4 登出超算系统** ### 第2章 计算文件管理 本地计算机与超算之间文件的互相传输通过软件FileZilla实现,按照图2.1的步骤下载软件。 FileZilla下载地址:https://filezilla-project.org/download.php?type=client#close [img_8.png](/pic/img_8.png) **图2.1 FileZilla下载** #### 2.1 新建管理站点 建立与超算连接的站点后便于下一次连接超算,新账户只用设置一次。点击图2.2所示的图标进入站点管理器,再按照图2.3的操作流程选择新建新站点,然后给新站点重命名,方便区分不同的站点,再将协议设置为【 SFTP - SSH File Transfer Protocol 】,在主机处输入【 218.194.100.9 】,在用户处输入自己的用户名,在密码处输入账号密码,最后点击确定保存站点设置。 ![img_10.png](/pic/img_10.png) **图2.2 打开站点管理器** ![img_9.png](/pic/img_9.png) **图2.3 新建站点管理** #### 2.2 连接超算的文件系统 点击图2.4所示站点管理器的下三角,选择账户连接超算的文件夹,当出现图2.5所示弹出窗口时,勾选信任主机后点击确定即可。成功连接后文件的显示如图2.6所示,左侧的文件可以右键选择上传到超算,右侧的文件可以右键选择下载到本地计算机,也可右键创建新的文件夹,但超算系统的文件夹及文件名称不能有中文。右侧有【 . 】的文件名是超算系统的配置文件,可以按照图2.7的步骤隐藏配置文件显示,新的账户首次登录后请新建文件夹保存计算的文件,不要将文件保存到系统默认的文件夹,避免导致账户崩溃。 ![img_11.png](/pic/img_11.png) **图2.4 连接超算文件夹** ![img_12.png](/pic/img_12.png) **图2.5 连接提示窗口** ![img_13.png](/pic/img_13.png) **图2.6 成功连接后文件显示** ![img_14.png](/pic/img_14.png) **图2.7 隐藏配置文件显示** ### 第3章 SLURM作业调度系统的使用 #### 3.1 提交计算 例如提交一个fluent的计算,操作流程如下。 ##### 3.1.1 上传计算文件 首先将计算所需要的文件和slurm脚本文件上传到同一个文件夹,确保文件夹内无与计算无关的文件,计算报错后需要删除已生成的会对计算造成影响的文件。 ![img_15.png](/pic/img_15.png) **图3.1 计算文件的上传** ##### 3.1.2 登录超算系统 详见第1章。 ##### 3.1.3 获取文件存储路径 进入超算存储需要计算的文件的文件夹,再复制存储路径。 ![img_16.png](/pic/img_16.png) **图3.2 获取计算文件存储路径** ##### 3.1.4 在命令提示符中定位到存放计算文件的目录 输入`cd 空格 3.1.3节复制的文件存储路径`并回车。 ```bath cd /share/home/user1/clusterTest/fluent_steady ``` 其中: `cd` 是切换文件夹路径的命令; `/share/home/user1/clusterTest/fluent_steady` 是存放计算文件的路径。 ![img_17.png](/pic/img_17.png) **图3.3 命令提示符中定位到存放计算文件的目录** ##### 3.1.5 查看路径下的文件 非必要操作,主要是为了检查用于提交计算的文件是否完整。 输入`ls`并回车。`ls`是查看当前路径下文件的命令,回车后会显示各个文件的名称。 ![img_18.png](/pic/img_18.png) **图3.4 查看路径下的文件** ##### 3.1.6 正式提交计算 输入`sbatch 空格 slurm文件的名称`并回车,出现`Submitted batch job XXX`提示即为提交成功。 ```bath sbatch ansys2022R1_fluent_f202.slurm ``` 其中: sbatch是提交计算的命令; ansys2022R1_fluent_f202.slurm是用于控制计算的脚本文件,提交计算时输入存放计算文件的文件夹下后缀是.slurm的文件即可。 ![img_19.png](/pic/img_19.png) **图3.5 提交计算** **小提示:**输入slurm文件的名称时可以只输入文件名的前几个字母,再按键盘的`tab`键实现自动补全,例如:输入`an`后按`tab`键,如果没有自动补全,则需要手动再输入一部分后按【 tab 】键。 #### 3.2 查看正在进行的计算及计算资源 ##### 3.2.1 查看正在进行的计算 输入`squeue`并回车。 回车后会显示正在计算的作业信息。 ```plaintext 其中: JOBID是正在计算作业的编号; NAME是提交计算时设置的作业名称,只能显示8位; ST是作业状态,R表示正常运行,PD表示在排队,CG表示计算完成正在退出计算,S 是管理员暂时挂起,CD表示已完成,F表示计算失败,与计算报错不一样,计算的报错信息请查看计算文件夹下生成的XXX_out.log和XXX _err.log文件或者软件计算生成的日志文件; TIME是计算耗时; NODES是作业使用的节点数; NODELIST(REASON)对于正在运行的作业(R状态)显示使用的节点列表。 ``` ![img_20.png](/pic/img_20.png) **图3.6 查看正在进行的计算** ##### 3.2.2 查看超算计算资源 输入`sinfo`并回车。 回车后会显示资源使用状态,STATE NODELIST列出现`idle`表示还有剩余资源可以用于计算,如果没有`idle`即提交计算后需要排队计算。 ![img_21.png](/pic/img_21.png) **图3.7 查看超算计算资源** #### 3.3 终止(取消)计算 ##### 3.3.1 终止(取消)单个作业计算 输入`scancel 空格 作业编号`并回车。 ```bath scancel 99 ``` 其中:`scancel`是取消计算的命令; 数字`99`是计算作业的编号,通过`squeue`命令查看正在计算的作业后修改为需要取消的作业编号。 ##### 3.3.2 终止(取消)用户所有作业 输入`scancel 空格 -u 用户名`并回车。 ```bath scancel -u NewUser ``` 其中:`NewUser`是需要取消计算的账户。 ## Linux的操作简易教程 ### 文件与目录操作 1. 新建文件夹:`mkdir folder` 2. 删除文件夹:`rm -r folder`,其中-r是参数 3. 复制文件夹:`cp -r oldfolder newfloder` 4. 移动文件夹:`mv -r oldfolder newfloder` 5. 切换文件夹目录:`cd /root/runoob/`使用绝对路径切换到 runoob 目录,`cd ~`回到家目录,`cd ..`回到上一级目录 ###