Deepleaning(5)
-
NUMA node read from SysFS had negative value -1
환경 OS : RHEL 8.5 GPU : Nvidia GeForce GTX 1060 6GB CUDA : 11.6 문제발생 Tensorflow를 실행 시킬 때 아래와 같은 로그가 뜨면서 GPU 동작을 하지 않고 CPU로만 동작합니다. Found 3670 files belonging to 5 classes. Using 2936 files for training. 2022-03-29 16:21:12.425272: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:936] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so r..
2023.04.22 -
Could not load dynamic library 'libcudnn.so.8'
환경 OS : RHEL 8.5 GPU : Nvidia GeForce GTX 1060 6GB CUDA : 11.6 문제발생 Tensorflow를 실행 시킬 때 아래와 같은 로그가 뜨면서 GPU 동작을 하지 않고 CPU로만 동작합니다. 2022-03-29 16:21:12.448227: W tensorflow/stream_executor/platform/default/dso_loader.cc:64] Could not load dynamic library 'libcudnn.so.8'; dlerror: libcudnn.so.8: cannot open shared object file: No such file or directory; LD_LIBRARY_PATH: :/usr/local/cuda-11.6/lib64 ..
2023.04.21 -
RHEL8.5 Python 및 Tensorflow 설치
이 글은 RHEL(Red Hat Enterprise Linux)에 Tensorflow를 설치하기 위한 글입니다. 먼저 이전에 작성한 블로그를 참고하여 CUDA를 설치하여야 합니다. Python 설치 RHEL에 python을 설치하기 위해서는 yum 또는 dnf를 통해 쉽게 설치가 가능합니다. $ sudo yum -y install python3 $ sudo dnf -y install python3 하지만 2022-03-28 기준 최신 버전인 3.10.4를 설치하도록 하겠습니다. Python Source 설치 전 패키지 설치 $ sudo dnf -y install gcc openssl-devel bzip2-devel libffi-devel 해당 패키지는 소스 파일의 Makefile을 컴파일하기 위해 필요한..
2023.04.19 -
RHEL8.5 CUDA 및 CuDNN설치
먼저 이전에 작성한 블로그를 참고하여 BIOS에서 보안부팅을 해제해야 합니다. RHEL8.5 설치를 참고하셔서 OS 설치하시고 보시면 됩니다. CUDA란? CUDA(Computed Unified Device Architecture)는 NVIDIA에서 개발한 GPU 개발 툴이다. 아래는 NVIDIA 블로그에서 나온 글입니다. CUDA는 범용 컴퓨팅을 위해 GPU를 간단하고 우아하게 사용하는 병렬 컴퓨팅 플랫폼 및 프로그래밍 모델입니다. 개발자는 여전히 친숙한 C, C ++, Fortran 또는 계속 확장되는 지원되는 언어 목록을 프로그래밍하고 몇 가지 기본 키워드의 형태로 이러한 언어의 확장을 통합합니다. 이 키워드를 통해 개발자는 대량의 병렬 처리를 표현하고 GPU를 매핑하는 응용 프로그램 부분으로 컴파..
2023.04.19 -
TorchServe 맛보기
TorchServe 맛보기 TorchServe를 간단히 시작하기 위한 정리입니다. pytorch/serve에서 제공해주는 학습 모델을 사용하여 RestApi로 추론하는 방법입니다. Torchserve는 Docker 이미지를 사용합니다. 참고 https://github.com/pytorch/serve/tree/master/examples/image_classifier/densenet_161 모델압축 모델을 학습하게 되면 로컬에 pth 파일이 생성이 됩니다. 이 모델 파일을 그대로 TorchServe에서는 사용 할 수 없기 때문에 먼저 Training이 끝난 모델을 압축해야 합니다. densenet161 학습 모델 다운로드 model.py TorchServe에서 제공해주는 모델을 다운로드 받습니다. 저는 D..
2023.04.19