# ubuntu_nvidia_driver_install **Repository Path**: jaykieq/ubuntu_nvidia_driver_install ## Basic Information - **Project Name**: ubuntu_nvidia_driver_install - **Description**: No description available - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 0 - **Created**: 2021-03-31 - **Last Updated**: 2021-11-03 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README #### 前提 1. 系统:ubuntu16.04 ubuntu18.04 ubuntu20.04 2. nvidia版本:见group_vars/all文件 3. 需要知道机器的ssh账户和密码 4. ubuntu安装sshd (apt install openssh-server;systemctl start sshd;systemctl enable ssh;) 5. 运行环境:Centos7 ``` 1. ubuntu16_nvidia430.64 内网安装 2. ubuntu多版本,多nvidia 网络安装 3. ubuntu安装docker ``` ## ubuntu16_nvidia430.64 内网安装 #### 使用 1. 修改hosts文件为自己的新系统的sudo账户和密码 2. 卸载清理(可忽略,!慎用,这里是用于初始化的系统,清理所有的nvidia,通过apt-get autoremove清理掉与自己相关而没有被其他手动安装包所依赖的包,最后会重启使卸载生效) ``` ansible-playbook -f 3 --ssh-common-args="$ANSIBLE_SSH_COMMON_ARGS" -i hosts clean.yml ``` 3. 执行安装(最后会重启使安装生效) ``` ansible-playbook -f 3 --ssh-common-args="$ANSIBLE_SSH_COMMON_ARGS" -i hosts offline.yml ``` ## ## ## ubuntu多版本,多nvidia 网络安装 #### 支持 详细见group_vars/all ``` #ubuntu16.04 nvidia-430 测试通过 #ubuntu18.04 nvidia-driver-460 测试通过 #ubuntu20.04 nvidia-driver-460 测试通过 ``` #### 使用 请确保目标机器联网 修改hosts文件为自己的新系统的sudo账户和密码 在group_vars/all文件修改为自己想要安装的nvidia版本,默认为nvidia的430版本(ubuntu16.04 ubuntu18.04 ubuntu20.04均支持), ``` ubuntu16.04改成nvidia_version: nvidia-430(默认,不改是给ubuntu16安装430版本) ubuntu18.04改成nvidia_version: nvidia-driver-430 ubuntu20.04改成nvidia_version: nvidia-driver-430 ``` 清理环境(!慎用,这里是用于初始化的系统,清理所有的nvidia,通过apt-get autoremove清理掉与自己相关而没有被其他手动安装包所依赖的包,最后会重启使卸载生效) ``` ansible-playbook -f 3 --ssh-common-args="$ANSIBLE_SSH_COMMON_ARGS" -i hosts clean.yml ``` 安装(最后会重启使驱动连接成功) ``` ansible-playbook -f 3 --ssh-common-args="$ANSIBLE_SSH_COMMON_ARGS" -i hosts online.yml ``` ## ## ## ubuntu安装docker 请确保目标机器联网 ``` ansible-playbook -f 3 --ssh-common-args="$ANSIBLE_SSH_COMMON_ARGS" -i hosts docker_online.yml ``` # 成功截图 ![Image description](https://images.gitee.com/uploads/images/2021/0331/163644_8bce27a3_5239449.png "屏幕截图.png") # 注意: ####如下为正常情况,重启自然连接不了ssh ``` ## ubuntu TASK [clean : reboot] ****************************************************************************************************************************** fatal: [ubuntu16(10.196.50.30)]: UNREACHABLE! => {"changed": false, "msg": "Failed to connect to the host via ssh: Shared connection to 10.196.50.30 closed.", "unreachable": true} ```