GPU 드라이버 설치한 후 tensorflow 개발 환경을 구축해보려고 합니다. 설치환경은 다음과 같아요
운영 체제(OS): Ubuntu 18.04
그래픽 카드(GPU): GeForce RTX 2060 super
CUDA 10.0
cuDNN 7.4
Python 3.7
tensorflow-gpu-1.14
1. NVIDIA 그래픽 드라이버 확인
nvidia-smi -q | grep Product 명령어로 GPU 드라이버 설치된 것을 확인해볼 수 있습니다.
$ nvidia-smi -q | grep Product
Product Name : GeForce RTX 2060 SUPER
Product Brand : GeForce
2. CUDA 설치
CUDA, cuDNN을 설치해줘야 합니다. tensorflow, tensorflow-gpu 버전 별로 어떤 버전을 설치해야 하는지는 아래 링크에서 확인할 수 있습니다.
저는 tensorflfow-gpu-1.14.0에 맞춰 CUDA 10.0, cuDNN 7.4를 설치하려고 합니다.
[tensorflow 버전별 CUDA, cuDNN 버전 확인 링크]
버전을 확인했으니 설치를 진행해야겠죠? 아래의 nvidia 링크에서 OS, Architecture, Distribution, Version, Installer Type 순서대로 선택하면 설치 가이드와 명령어가 뜹니다. 하라는대로 하면 되겠습니다. 저는 ubuntu 18.04에 맞게 선택했으며 deb[network]옵션을 사용했습니다.
package 파일이 있는 경로에서 다음 명령어들을 순서대로 실행시켜줍니다.
$ sudo sudo dpkg -i cuda-repo-ubuntu1804_10.0.130-1_amd64.deb
$ sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
$ sudo apt-get update
$ sudo apt-get install cuda
마지막 줄을 실행시켰다면 약 1.5GB 정도의 CUDA 파일이 받아진 후 설치가 됩니다. 다른거 이것저것 하고 왔는데도 시간이 꽤 오래걸리네요.
나중에 다시해보니 deb (local)을 선택해서 설치파일을 받으시기 바랍니다. 그게 더 빠르네요.
3. cuDNN 설치
[cuDNN 라이브러리 다운 링크]에서 7.4.2 버전을 선택한 후 cuDNN Library for Linux를 선택하면 가입 후 다운받으실 수 있습니다.
약 400MB이며 다운 후 압축해제를 시켜준 후 terminal을 켜고 압축해제된 폴더가 있는 디렉토리로 이동합니다. 그리고 다음 명령어를 통해 /usr/local/cuda 내 하위 폴더로 header 파일과 library 파일을 옮겨줍니다.
# cuDNN 압축 해제된 폴더가 존재하는 디렉토리에서 입력
$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
그리고 권한을 부여한 후 설치를 진행합니다.
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h
$ sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
$ sudo apt-get install libcupti-dev
최종적으로 path를 설정하는 일이 남았습니다. 다음 코드로 bashrc 파일을 열어주면 메모장 같은 파일이 하나 열립니다.
$ gedit ~/.bashrc
파일의 맨 밑에 아래 코드를 추가해주고 ctrl+s를 눌러 저장해줍니다. 다른 CUDA 버전이라면 10.0 대신 해당되는 버전을 입력해주면 됩니다.
export PATH=/usr/local/cuda-10.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
마지막으로 아래 코드를 실행시킵니다.
$ source ~/.bashrc
4. tensorflow-gpu 설치
아래 명령어로 virtualenv 환경에 tensorflow-gpu 1.14 버전을 설치했습니다.
>>pip install tensorflow-gpu==1.14.0
참고로 GPU가 제대로 설치되어있는지 확인하기 위해서는 이 페이지를 참고하면 됩니다.
'개발' 카테고리의 다른 글
Docker 관련 명령어 정리 (0) | 2020.06.05 |
---|---|
tensorflow GPU 확인 방법 (0) | 2020.06.05 |
Ubuntu에서 CUDA 완전 삭제 명령어 (2) | 2020.06.04 |
Ubuntu 18.04 GPU 개발환경 세팅 (3) - CUDA 삭제 및 재설치 (0) | 2020.06.03 |
Ubuntu 18.04 GPU 개발환경 세팅 (1) (0) | 2020.06.02 |