从零开始深度学习第15讲：ubuntu16.04 下深度学习开发环境搭建与配置

2019 年 4 月 9 日 数萃大数据

深度学习大多用来处理图片、语言、视频和文本等大量非结构化数据，因而计算资源是进行深度学习开发的必要条件，想依靠windows单机玩深度学习恐怕不现实，基于linux和 gpu服务器的深度学习开发环境配置就显得尤为重要了。本节笔记就先学习下如何在 ubuntu16.04 系统下配置深度学习开发环境。

使用 xshell linux虚拟机工具

使用 xshell 工具创建与linux服务器的连接，设置好主机地址和端口号，输入登录名和密码连上服务器。

下载和更新显卡驱动

先查看本机当前显卡信息：

ubuntu-drivers devices

依次执行下述命令：

sudo apt-get purge nvidia*
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update 
sudo apt-get install nvidia-384 nvidia-settings

之后重启服务器使更新生效

sudo shutdown -r now

重新连接服务器后查看当前的生效的显卡驱动

nvidia-smi

安装CUDA8

以CUDA8为例进行安装，CUDA是NVIDIA推出的用于自家GPU的并行计算框架，也就是说CUDA只能在NVIDIA的GPU上运行，而且只有当要解决的计算问题是可以大量并行计算的时候才能发挥CUDA的作用。安装CUDA的话首先必须去 Nvidia 官网下载对应的CUDA安装包：
https://developer.nvidia.com/cuda-80-ga2-download-archive

选择 cuda-repo-ubuntu1604-8-0-local-ga2_8.0.61-1_amd64.deb 进行下载：

然后运行下列命令进行安装：

sudo dpkg -i cuda-repo-ubuntu1604-8-0-local-cublas-performance-update_8.0.61-1_amd64.deb
sudo apt-get update
sudo apt-get upgrade cuda

安装完成之后在 ~/.bashrc 中设置CUDA的环境变量：

export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda

完了之后运行 source ~/.bashrc 生效。再次运行 nvidia-smi 查看驱动信息如若报驱动不匹配的错误：

Failed to initialize NVML: Driver/library version mismatch

这个问题出现的原因是kernel mod 的 Nvidia driver 的版本没有更新，一般情况下，重启机器就能够解决，如果因为某些原因不能够重启的话，也有办法reload kernel mod。依次执行下述命令即可解决：

lsmod | grep nvidia

sudo rmmod nvidia_drm
sudo rmmod nvidia_modeset
sudo rmmod nvidia_uvm
sudo rmmod nvidia
sudo lsof /dev/nvidia*
lsmod | grep nvidia

最后再次输入 nvidia-smi即可查看到当前的驱动信息。

安装cuDNN6.0

cuDNN（CUDA Deep Neural Network library）是NVIDIA打造的针对深度神经网络的加速库，是一个用于深层神经网络的GPU加速库。如果你要用GPU训练模型，cuDNN不是必须的，但是一般会采用这个加速库。CUDA8.0的最佳匹配的cuDNN版本为6.0，所以我们到nvidia官网下载cuDNN6.0即可。但目前下载cuDNN需要注册nvidia账号才可下载，可能需要多费些周折。

下载完成后按照下列命令进行解压缩和安装：

tar -zxvf cudnn-8.0-linux-x64-v6.0.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ -d

安装 anaconda 并创建虚拟环境

下载anaconda 的 linux版本：

wget https://repo.anaconda.com/archive/Anaconda3-5.2.0-Linux-x86_64.sh

执行bash命令进行安装：

bash Anaconda3-5.1.0-Linux-x86_64.sh

安装完成后创建 anaconda 虚拟环境：

conda install -n 虚拟环境名称

启动虚拟环境：

source activate 虚拟环境名称

退出虚拟环境：

source deactivate 虚拟环境名称

安装深度学习主要计算框架

安装 tensorflow：
pip install tensorflow-gpu==版本号
安装keras:
pip install keras==版本号
安装pytorch:
conda install pytorch==版本号

再安装一些其他的常用库即可搭建好深度学习开发环境。

注：本深度学习笔记系作者学习 Andrew NG 的 deeplearningai 五门课程所记笔记，其中代码为每门课的课后assignments作业整理而成。

参考资料：

http://www.52nlp.cn/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E4%B8%BB%E6%9C%BA%E7%8E%AF%E5%A2%83%E9%85%8D%E7%BD%AE-ubuntu-16-04-nvidia-gtx-1080-cuda-8

从零开始深度学习第13讲：Tensorflow实战之mnist手写数字识别

从零开始深度学习第12讲：卷积神经网络的Tensorflow实现

从零开始深度学习第11讲：利用numpy搭建一个卷积神经网络

从零开始深度学习第10讲：三维卷积、池化与全连接

从零开始深度学习第9讲：卷积神经网络（CNN）入门

从零开始深度学习第8讲：利用Tensorflow搭建神经网络

登录查看更多

相关内容

CUDA

关注 20

【2020新书】实战R语言4，323页pdf

专知会员服务

102+阅读 · 2020年7月1日

【实用书】Python爬虫Web抓取数据，第二版，306页pdf

专知会员服务

122+阅读 · 2020年5月10日

【百度】-大规模深度学习广告系统的分布式分层GPU参数服务器，Distributed Hierarchical GPU PS

专知会员服务

24+阅读 · 2020年3月15日

【Python最佳实践、技巧与提示30则】《30 Python Best Practices, Tips, And Tricks》by Erik-Jan van Baaren

专知会员服务

35+阅读 · 2020年1月6日

《动手学深度学习》(Dive into Deep Learning)PyTorch实现

专知会员服务

120+阅读 · 2019年12月31日

【新书】傻瓜式入门深度学习，371页pdf

专知会员服务

192+阅读 · 2019年12月28日

花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

专知会员服务

62+阅读 · 2019年12月25日

【干货】大数据入门指南：Hadoop、Hive、Spark、 Storm等

专知会员服务

97+阅读 · 2019年12月4日

【电子书】C++ Primer Plus 第6版，附PDF

专知会员服务

88+阅读 · 2019年11月25日

【O'Reilly AI Conference 2019】部署大规模分布式数据（How to deploy large-scale distributed data analytics and machine learning on containers (sponsored by HPE))，HPE BlueData，Thomas Phelan

专知会员服务

19+阅读 · 2019年11月5日

教程 | 从零开始搭建『深度学习』GPU开发环境

机器学习算法与Python学习

8+阅读 · 2019年10月28日

通过Docker安装谷歌足球游戏环境

CreateAMind

12+阅读 · 2019年7月7日

免费！Google Colab现已支持英伟达T4 GPU

新智元

5+阅读 · 2019年4月25日

GitHub 新项目 Deepo：一键安装 11 项深度学习框架与环境

云头条

9+阅读 · 2017年12月18日

手把手教你搭建AI开发环境 !（附代码、下载地址）

数据派THU

6+阅读 · 2017年12月15日

6个实验教你用Torch玩转深度学习

七月在线实验室

7+阅读 · 2017年11月21日

10个深度学习软件的安装指南（附代码）

数据派THU

17+阅读 · 2017年11月18日

【专知-Deeplearning4j深度学习教程01】分布式Java开源深度学习框架DL4j安装使用: 图文+代码

专知

60+阅读 · 2017年10月12日

手把手教你安装深度学习软件环境（附代码）

数据派THU

4+阅读 · 2017年10月4日

从零开始：深度学习软件环境安装指南

机器之心

6+阅读 · 2017年10月2日

Meta-Learning with Implicit Gradients

Arxiv

13+阅读 · 2019年9月10日

Knowledge Flow: Improve Upon Your Teachers

Arxiv

5+阅读 · 2019年4月11日

Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context

Arxiv

4+阅读 · 2019年1月9日

Multi-task learning to improve natural language understanding

Arxiv

4+阅读 · 2018年12月17日

Learning with Interpretable Structure from RNN

Arxiv

19+阅读 · 2018年10月25日

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

Arxiv

15+阅读 · 2018年10月11日

Bidirectional Attention for SQL Generation

Arxiv

4+阅读 · 2018年6月21日

Multi-turn Dialogue Response Generation in an Adversarial Learning Framework

Arxiv

4+阅读 · 2018年6月11日

Low-Shot Learning from Imaginary Data

Arxiv

15+阅读 · 2018年4月3日

CuLDA_CGS: Solving Large-scale LDA Problems on GPUs

Arxiv

3+阅读 · 2018年3月13日

VIP会员