ubuntu服务器安装cuda11.0、cuDNN入门教程

在 Ubuntu 服务器上安装 CUDA 11.0 和 cuDNN 的详细教程如下。本教程涵盖了从环境准备到安装和验证的完整流程,适用于初学者。

一、环境准备

1. 系统要求

  • 操作系统:Ubuntu 18.04 或 20.04
  • GPU:NVIDIA GPU,支持 CUDA 11.0(如 Tesla、GeForce RTX 系列等)
  • 权限:需要 sudo 权限
  • 驱动程序:NVIDIA 驱动需支持 CUDA 11.0

2. 卸载旧版本(如有)

清理可能存在的旧版本 CUDA 和 NVIDIA 驱动:

sudo apt-get --purge remove "*nvidia*"
sudo apt-get autoremove
sudo apt-get autoclean

二、安装 NVIDIA 驱动

1. 检查 GPU 支持情况

使用 lspcinvidia-smi 确认是否已安装支持的 GPU:

lspci | grep -i nvidia

如果 nvidia-smi 已输出驱动信息,则 NVIDIA 驱动已安装,可以跳过驱动安装部分。

2. 安装 NVIDIA 驱动

安装合适的 NVIDIA 驱动:

sudo apt update
sudo apt install -y nvidia-driver-450

说明nvidia-driver-450 是支持 CUDA 11.0 的推荐驱动版本。

重启服务器以使驱动生效:

sudo reboot

验证驱动是否正常:

nvidia-smi

三、安装 CUDA 11.0

1. 下载 CUDA Toolkit 11.0

访问 NVIDIA CUDA Toolkit Archive,选择 CUDA Toolkit 11.0,并下载对应的 Debian 文件

直接下载命令:

wget https://developer.download.nvidia.com/compute/cuda/11.0.3/local_installers/cuda-repo-ubuntu2004-11-0-local_11.0.3-450.51.06-1_amd64.deb

2. 安装 CUDA

  1. 添加 CUDA 本地仓库:
sudo dpkg -i cuda-repo-ubuntu2004-11-0-local_11.0.3-450.51.06-1_amd64.deb
sudo apt-key add /var/cuda-repo-ubuntu2004-11-0-local/7fa2af80.pub

2. 更新并安装 CUDA:

sudo apt update
sudo apt install -y cuda

3. 配置环境变量

将 CUDA 的路径添加到系统变量:

echo 'export PATH=/usr/local/cuda-11.0/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-11.0/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc

4. 验证 CUDA 安装

运行以下命令查看 CUDA 版本:

nvcc --version

输出示例:

Cuda compilation tools, release 11.0, V11.0.221

四、安装 cuDNN

1. 下载 cuDNN

访问 NVIDIA cuDNN 下载页面,选择与 CUDA 11.0 兼容的版本(如 cuDNN 8.x)。

需要登录 NVIDIA 开发者账户后下载。

直接下载(假设文件名为 cudnn-11.0-linux-x64-v8.0.4.30.tgz):

wget https://developer.download.nvidia.com/compute/machine-learning/cudnn/secure/8.0.4/11.0_20200826/cudnn-11.0-linux-x64-v8.0.4.30.tgz

2. 解压并安装 cuDNN

  1. 解压文件:
tar -xzvf cudnn-11.0-linux-x64-v8.0.4.30.tgz

2. 将库文件复制到 CUDA 的目录:

sudo cp cuda/include/cudnn*.h /usr/local/cuda-11.0/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-11.0/lib64/
sudo chmod a+r /usr/local/cuda-11.0/include/cudnn*.h /usr/local/cuda-11.0/lib64/libcudnn*

3. 验证 cuDNN 安装

运行以下命令验证 cuDNN 版本:

cat /usr/local/cuda-11.0/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

输出示例:

#define CUDNN_MAJOR 8
#define CUDNN_MINOR 0
#define CUDNN_PATCHLEVEL 4

五、测试 CUDA 和 cuDNN

1. CUDA 示例测试

  1. 进入 CUDA 示例程序目录:
cd /usr/local/cuda-11.0/samples/1_Utilities/deviceQuery

2. 编译示例程序:

sudo make
3. 运行测试:
./deviceQuery

输出示例:

Result = PASS

2. cuDNN 示例测试

下载 cuDNN 示例程序或编写简单代码调用 cuDNN API,测试其功能。

六、常见问题排查

  1. nvccdeviceQuery 无法找到:
    • 确认 CUDA 路径已正确配置。
    • 检查 /usr/local/cuda-11.0/bin 是否存在。
  2. nvidia-smi 无法识别 GPU:
    • 确保 NVIDIA 驱动已正确安装并匹配 GPU 型号。
    • 尝试重装驱动。
  3. cuDNN 版本不兼容:
    • 确认下载的 cuDNN 版本与 CUDA 11.0 兼容。

七、总结

通过上述步骤,你已经成功在 Ubuntu 服务器上安装了 CUDA 11.0 和 cuDNN,并验证了其功能。接下来,你可以使用这些工具进行深度学习模型的训练和开发。若有其他问题,可以随时提问!

发布者:myrgd,转载请注明出处:https://www.object-c.cn/4423

Like (0)
Previous 2024年11月22日 下午7:33
Next 2024年11月23日 下午1:49

相关推荐

  • 使用 Redis 和 Spring Cache 实现基于注解的缓存功能

    Spring Cache 提供了一种简单的方法来通过注解对方法的返回结果进行缓存。结合 Redis,可以构建一个高效的分布式缓存解决方案。以下是详细实现步骤: 1. 引入必要的依赖在 pom.xml 文件中添加以下依赖(适用于 Spring Boot 项目): 2. 配置 Redis在 application.yml 或 application.proper…

    2024年12月1日
    00
  • 在国内访问 GitHub 可能会遇到加载缓慢或无法打开的问题

    在国内访问 GitHub 可能会遇到加载缓慢或无法打开的问题,这通常与网络连接、DNS 设置或网络限制有关。以下是几种解决方法: 1. 更改 DNSDNS 配置错误可能导致 GitHub 无法正常访问。可以尝试修改 DNS 为公共 DNS 服务:推荐使用:阿里云 DNS:223.5.5.5 和 223.6.6.6Google DNS:8.8.8.8 和 8.…

    2024年11月27日
    00
  • 若依集成 X-File-Storage 框架(实现图片上传阿里云 OSS 服务器)

    若依(Ruoyi)是一款基于 Spring Boot 的企业级开发框架,在此框架中集成 X-File-Storage 框架来实现图片上传到阿里云 OSS(对象存储服务)是一个常见的需求。通过这个集成,你可以便捷地将图片或文件上传到阿里云 OSS,并在系统中管理和访问这些文件。以下是详细的步骤说明: 1. 安装 X-File-Storage 框架 X-File…

    2024年11月25日
    00
  • 在工业场景中使用 Apache Flink 处理 Kafka 数据是一种常见的实时流处理方案

    在工业场景中使用 Apache Flink 处理 Kafka 数据是一种常见的实时流处理方案,特别是针对 ChangeRecord 数据类型时,能够帮助实现高效的实时 ETL(提取、转换、加载)或事件驱动的应用。以下是关于如何用 Flink 处理 Kafka 数据,并重点解析 ChangeRecord2 的详细步骤和注意事项。 1. ChangeRecord…

    2024年12月5日
    00
  • 高性能 TongRDS 是一种分布式内存数据缓存中间件

    TongRDS 是一种分布式内存数据缓存中间件,旨在为高性能、高并发的应用场景提供快速的数据访问解决方案。类似于 Redis 或 Memcached,TongRDS 的核心功能围绕内存数据存储和分布式特性展开,同时可能具备特定的优化或扩展能力。 以下是 TongRDS 的可能特性和应用场景总结: 1. 核心特性 分布式缓存架构 高性能存储 灵活的数据模型 扩…

    2024年12月3日
    00
  • 本地部署VMware ESXi服务并实现实现无公网IP远程访问服务器

    要在本地部署 VMware ESXi 服务,并实现无公网 IP 的情况下远程访问和管理 ESXi 服务器,您可以通过以下几种方法来完成。这些方法包括使用 VPN、反向代理、NAT(端口转发)等方式。下面是具体步骤和建议。 1. 使用 VPN(虚拟私人网络)访问 通过 VPN 将远程客户端与本地网络连接,从而可以通过局域网(LAN)访问 VMware ESXi…

    2024年11月24日
    00
  • 在 Ubuntu 20.04 上安装 CUDA (Compute Unified Device Architecture) 支持 NVIDIA GPU 的加速计算

    在 Ubuntu 20.04 上安装 CUDA (Compute Unified Device Architecture) 是为了支持 NVIDIA GPU 的加速计算。下面是详细的步骤,包括安装 CUDA、相关驱动以及 cuDNN(用于深度学习的库)。 步骤 1:检查系统要求 步骤 2:安装 NVIDIA 驱动 2. 添加 NVIDIA PPA: 你可以使…

    2024年11月24日
    00
  • 在 Apache Spark 中,任务的切分(Task Division)机制

    在 Apache Spark 中,任务的切分(Task Division)是 Spark 将应用程序逻辑划分为多个并行任务的核心机制。任务切分的主要原则是基于数据分区和操作算子。以下是任务切分的核心原则和关键影响因素: 1. Spark 任务切分的基本概念 2. 任务切分的原则 2.1 基于分区(Partition)的切分 2.2 基于依赖关系(Depend…

    2024年11月25日
    00
  • 使用 Webpack 5 优化构建减少生成文件的体积提升前端性能

    在使用 Webpack 5 时,优化构建以减少生成文件的体积是提升前端性能的重要一步。以下是一些常见的优化方法和策略: 1. 开启生产模式 确保构建时使用生产模式,Webpack 会自动应用多种优化(如代码压缩、Tree Shaking 等): 或在配置文件中明确设置: 2. 启用 Tree Shaking Tree Shaking 是 Webpack 内置…

    2024年12月3日
    00
  • 修复 Elementor 网站上出现的 HTTPS 400 错误请求(服务器错误)

    在修复 Elementor 网站上出现的 HTTPS 400 错误请求(服务器错误)时,您需要采取以下步骤来排查和解决问题。这类错误通常与服务器配置、插件冲突或 HTTPS 配置相关。 1. 检查 HTTPS 配置 2. 排查插件冲突 3. 检查主题兼容性 4. 调整服务器配置 URL 重写规则: 5. 清理缓存 6. 检查网络请求 7. 联系主机服务商 如…

    2024年12月9日
    00
  • 安装 Laravel 11 + Filament 详细教程

    安装Laravel 11之前选确保安装了Composer 管理器,接下来的步骤是通过Composer 包管理器安装完成的。 一、前提条件 二、使用 Composer 创建新的 Laravel 11 项目 三、在现有项目中添加 Laravel 11(如果是集成到现有项目) 请注意,在实际安装过程中,可能会遇到各种问题,如权限问题(在 Linux 下,如果没有足…

    2025年1月18日
    00
  • 通过 PHP 读取微软邮箱(Outlook/Office 365 邮箱)

    通过 PHP 读取微软邮箱(Outlook/Office 365 邮箱)邮件,通常需要使用 Microsoft Graph API,因为微软逐步淘汰了基于用户名和密码的 IMAP/SMTP 方式。Microsoft Graph API 支持 OAuth2.0 认证,可以安全地访问和管理用户邮件。 以下是实现读取微软邮箱邮件的完整示例。 实现步骤 1. 准备工…

    2024年11月25日
    00
  • Redis中如何使用lua脚本redis与lua的相互调用方法

    在 Redis 中,Lua 脚本 提供了一种强大的方式来执行原子操作,可以在 Redis 服务器上直接执行 Lua 代码,从而避免了多次网络往返和保证操作的原子性。Redis 内置了对 Lua 脚本的支持,通过 EVAL 命令来执行脚本,EVALSHA 则用于执行已经加载到 Redis 服务器的脚本。1. Redis 与 Lua 脚本的基本交互1.1 基本的…

    2024年11月28日
    00
  • 在 MySQL 中 utf8mb4 和 utf8mb3 两种 UTF-8 编码的字符集主要区别

    在 MySQL 中,utf8mb4 和 utf8mb3 是两种 UTF-8 编码的字符集,它们的主要区别如下:1. 支持的字符范围不同utf8mb3:原来的 UTF-8 编码实现,支持最多 3 个字节的字符。无法存储超出基本多语言平面 (BMP) 的 Unicode 字符(U+10000 至 U+10FFFF),例如某些表情符号和特殊的语言字符。主要用于存储…

    2024年12月3日
    00
  • 部署 Harbor 时,如果运行 install 脚本报错可能导致问题的

    在部署 Harbor 时,如果运行 install 脚本报错,可能是网络问题导致的。以下是排查网络问题的方法: 1. 检查网络连通性 测试目标网络的连通性: 检查 DNS 配置: 如果解析失败,检查 /etc/resolv.conf 中的 DNS 配置,或者尝试手动指定公共 DNS,如 Google 的 8.8.8.8 或阿里云的 223.5.5.5。 2.…

    2024年12月9日
    00

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

在线咨询: QQ交谈

邮件:723923060@qq.com

关注微信