手把手教你在谷歌云渠道建立根据GPU的深度学习
大数据文摘授权转载自 数据派THU作者:Saurabh Bodhe编译:陈振东、车前子我知道,依据GPU的高端的深度学习体系构建起来十分贵重,而且不容易取得,除非你……https://hackernoon.com/deep-learning-with-google-cloud-platform-66ada9d7d029假定你有一台带有GPU的裸机,当然假如有些装备是预先设置好的,能够越过下面部分教程。此外,我还假定你有一个NVIDIA的显卡,咱们在本教程中只评论怎么装备TensorFlow,也便是现在最受欢迎的深度学习结构(向谷歌问候!)装置CUDA驱动程序CUDA是NVIDIA开发的一个并行核算渠道,是建立TensorFlow的基本前提。可是咱们后面会说到,实际上最好运用逆向作业的办法,所以咱们稍后再回到这部分。装置TensorFlow发动终端(假如是长途拜访的话,就运用SSH)。总归,找到特定应用程序(假如有的话)所需的TensorFlow版别,或许假如没有这样的约束,能够运用我现在运用的TensorFlow 1.8.0。pip install tensorflow-gpu==1.8.0在TensorFlow装置的时分,咱们运转下Python shell,python在Python shell中输入下面的代码:import tensorflow as tf但这时咱们还没有装置CUDA,你会看到相似下面的报错:ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory9.0版别、文件名或许是其他的报错,这取决于您挑选的TensorFlow版别。可是这样做的意图是知道咱们需求哪个版别的CUDA,在这个比如中是9.0。官方文档中TF版别和CUDA版别的对应联系不是很清楚,所以我一向觉得这种逆向工程办法更好。然后,咱们再回到CUDA的装置。运用exit()退出Python shell。装置CUDA驱动(信任我,这次是真的装置)依据之前的操作,挑选你需求的版别:Linux-x86_64-Ubuntu-16.04 (or 17.04)-deb (network)下载相应的.deb文件,并依照NVIDIA的官方阐明装置CUDA。完结之后,让咱们查看下是否一切正常。再次翻开Python shell并运转下面的代码,import tensorflow as tf当然,咱们还没有完结,这次你会看到略微不同的报错(假如在此之前就呈现了相似的报错,参阅下面的“Troubleshooting”中的修正办法)ImportError: libcudnn.so.7: cannot open shared object file: No such file or directory咱们还需求NVIDIA供给的一个叫做cuDNN的库,它能够运用GPU加快深度神经网络的核算。留意,本教程中的cuDNN版别是7.0。翻开并注册一个帐户(免费的):https://developer.nvidia.com/cudnn注册好帐号后,登录:https://developer.nvidia.com/rdp/cudnn-archive。挑选你需求的cuDNN版别,并保证你挑选该版别所对应的CUDA版别。在本教程中,咱们需求下载以下版别,Download cuDNN v7.0.5 (Dec 5, 2017), for CUDA 9.0在下拉选项中挑选,cuDNN v7.0.5 Library for Linux这样,.tgz文件就开端下载了,将文件存储到你的机器上,并运用以下指令进行提取,tar -xzvf CUDNN_TAR_FILENAME终究提取出一个名为“CUDA”的文件夹,切换到该目录,并履行下面两条指令,sudo cp lib64/* /usr/local/cuda/lib64/sudo cp include/cudnn.h /usr/local/cuda/include/这样就完结了(但愿如此)。再次发动Python shell,这次你知道该做什么。假如这次运转没有报错,那就没问题了。为保证TensorFlow能够检测到GPU,在Python shell中运用以下代码,tf.test.gpu_device_name()它将会把一切可用的GPU显示出来。假如这个指令在旧版别的TF或许运转不了,能够试试下面的指令。nvidia-smi问题修正假如一切装备都正确,nvidia-smi也能够履行,但TensorFlow依然报出相同的过错,那么很有或许环境变量出了问题。履行下面的指令进行修正:export LD_LIBRARY_PATH=/usr/local/cuda/lib64:${LD_LIBRARY_PATH}export PATH=/usr/local/cuda/lib64:${PATH}假如nvidia-smi指令都无法履行,CUDA没有正确装置,那就重新装置装备一遍,看看有没有什么遗失的当地。欢迎我们发问,主张或许批判。祝好。