엔비디아가 마이크로소프트의 클라우드 플랫폼 '애저'에 엔비디아 GPU 클라우드를 지원한다고 밝혔다. 애저에서 지원되는 엔비디아 GPU 클라우드의 즉시 실행가능한 컨테이너를 통해 개발자는 소프트웨어 통합 및 테스트의 복잡성을 제거할 수 있다. 필요에 따라 확장가능한 온디맨드 GPU 컴퓨팅에 액세스 할 수 있다.
GPU 가속 SW 구성 컨테이너 제공
딥 러닝 컨테이너, 매달 업데이트
애저 NCv2, NCv3 및 ND 지원
엔비디아가 8월 30일, 마이크로소프트의 클라우드 플랫폼 ‘애저(Azure)’에 엔비디아 GPU 클라우드(NVIDIA GPU Cloud, NGC)를 지원한다고 밝혔다.
애저에서 지원되는 NGC의 즉시 실행가능한 컨테이너를 통해 개발자는 소프트웨어 통합 및 테스트의 복잡성을 제거할 수 있다. 필요에 따라 확장가능한 온디맨드 GPU 컴퓨팅에 액세스 할 수 있다.
보다 빠른 AI, HPC 프로젝트 가능해져
텐서플로우(TensorFlow), 마이크로소프트 코그니티브 툴킷(Microsoft Cognitive Toolkit), 파이토치(PyTorch) 및 엔비디아 텐서RT(NVIDIA TensorRT)와 같이 널리 사용되는 딥 러닝 소프트웨어를 실행하기 위한 소프트웨어 스택을 구축하고 테스트하는 것은 까다롭고 많은 시간을 요한다.
또한, 운영체제(OS) 레벨과 드라이버, 라이브러리 및 런타임에 종속성을 가지며, 많은 패키지는 서로 다른 버전의 지원 구성요소를 권장한다. 거기에다 프레임워크와 애플리케이션은 자주 업데이트되므로 새 버전이 출시될 때마다 이 작업을 반복해야 한다.
이상적인 것은 새로운 버전을 테스트하여 이전 버전과 동일한 혹은 더 나은 성능을 제공하는지 확인하는 것이며, 이 과정은 프로젝트를 시작하기 전에 이루어져야 한다.
HPC의 경우, 어려운 작업은 시스템 클러스터에 최신 소프트웨어를 배포하는 것이다. 정확한 종속성을 찾고 설치하고 테스트하는 것은 물론, 이 작업을 멀티테넌트(multi-tenant) 환경에서 여러 시스템에 걸쳐 수행해야 한다.
NGC는 GPU 가속 소프트웨어로 사전 구성된 컨테이너를 제공함으로써 이러한 복잡성을 제거해준다. 엔비디아의 지속적인 R&D 투자의 결과, 딥러닝 컨테이너는 컨테이너가 최신 GPU 기능을 활용하도록 지원한다. 또한, 엔비디아는 최상의 성능을 보장하기 위해 매달 업데이트되는 딥러닝 컨테이너에서 전체 소프트웨어 스택을 테스트, 조정 및 최적화한다.
엔비디아는 커뮤니티 및 프레임워크 개발자들과 긴밀히 협력함으로써 오픈소스 프로젝트에 기여하고 있다. 엔비디아의 오픈소스 프로젝트 기여는 2017년, 800건에 달했다. 또한, NGC에서 제공하는 다른 컨테이너 개발자와 협업해 애플리케이션을 최적화하고 성능 및 호환성을 테스트하고 있다.
엔비디아 GPU로 애저 인스턴트 실행하기
사용자들은 딥러닝 소프트웨어, HPC 애플리케이션, HPC 시각화 툴 및 NGC 컨테이너 레지스트리의 다양한 파트너 애플리케이션에 대한 35개의 GPU 가속 컨테이너에 액세스하여, 엔비디아 GPU를 통해 다음과 같은 마이크로소프트 애저 인스턴트를 실행할 수 있다.
▲NCv3 (1, 2 혹은 4 NVIDIA Tesla V100 GPU), ▲NCv2 (1, 2 혹은 4 NVIDIA Tesla P100 GPU) ▲ND (1, 2 혹은 4 NVIDIA Tesla P40 GPU)
다른 종류 혹은 다른 수량의 GPU를 가진 경우라도 동일한 NGC 컨테이너는 애저 인스턴스에서 작동된다.
NGC 컨테이너 애저에서 사용하는 방법
마이크로소프트 애저 마켓 플레이스에서 딥러닝 및 HPC 용 엔비디아 GPU 클라우드 이미지를 클릭한 후, 애저에서 호환되는 엔비디아 GPU 인스턴스를 실행한다. 그 다음 원하는 컨테이너를 NGC 레지스트리에서 실행중인 인스턴스로 가져오면 된다. 이 과정을 진행하기에 앞서 무료 NGC 계정을 신청해야 한다. 자세한 내용은 ‘애저에서 NGC 컨테이너를 사용하는 방법’ 설명서에서 확인할 수 있다.
이러한 NGC 컨테이너를 실행하기 위해 애저 마켓플레이스에서 엔비디아 이미지를 클릭하는 것 외에도, 애저 NCv2, NCv3 및 ND와 같은 VM상의 NGC에서 애저 배치 AI(Azure Batch AI)를 다운로드하여 실행할 수 있다. 깃허브(GitHub) 지침에 따라 NGC 컨테이너로 애저 배치 AI를 시작할 수 있다.
한편, 엔비디아는 이번 발표와 관련된
웨비나를 한국시간 10월 2일 오전 1시에 진행한다.