엔비디아가 새로운 튜링(Turing) GPU 아키텍처를 선보였다. 튜링은 RT 코어로 가속화된 실시간 레이 트레이싱을 지원하며, 강력한 텐서 코어로 가속화된 AI 경험을 창출한다. 또한 한층 빨라진 시뮬레이션 및 래스터화를 지원한다.
실시간 레이 트레이싱 지원
텐서 코어로 AI 가속화
쿼드로 GPU, 4분기 출시
엔비디아가 튜링(Turing) GPU 아키텍처를 출시했다.
튜링의 주요 특징은 레이 트레이싱(ray-tracing)을 가속화하는 새로운 RT 코어와 세계 최초로 실시간 레이 트레이싱을 지원하는 인공지능 추론용 텐서 코어(Tensor Core)를 갖췄다는 점이다.
이 두 가지 엔진은 시뮬레이션과 향상된 래스터화(rasterization)를 위한 보다 강력한 컴퓨팅을 제공한다. 동시에 2,500억 달러 규모의 시각효과 시장을 겨냥한 차세대 하이브리드 렌더링의 새 지평을 열 것으로 기대된다. 하이브리드 렌더링은 복잡한 모델에서 신경망 및 유체 상호작용을 통해 영화와 같은 수준의 인터랙티브 경험과 새로운 효과를 구현해낸다.
엔비디아는 디자이너 및 아티스트들을 위한 자사 최초의 튜링 기반 제품인 쿼드로(Quadro) RTX 8000, 쿼드로 RTX 6000, 쿼드로 RTX 5000 GPU도 공개했다.
엔비디아 젠슨 황 CEO
엔비디아의 젠슨 황(Jensen Huang) CEO는 컴퓨터 그래픽 컨퍼런스인 시그라프 2018(SIGGRAPH 2018)에서 기조연설을 통해 “튜링은 지난 10여 년 간 컴퓨터 그래픽 분야에서 엔비디아가 이룬 가장 중대한 혁신”이며, “하이브리드 렌더링은 업계를 변화시켜 한층 아름다운 디자인과 풍부한 엔터테인먼트 및 인터랙티브 경험을 통해 우리의 삶을 고양시킬 수 있는 놀라운 가능성을 열어줄 것이다. 실시간 레이 트레이싱의 등장은 업계의 ‘성배’나 다름없다”고 말했다.
엔비디아의 8세대 GPU 아키텍처인 튜링은 기존 파스칼(Pascal) 세대 보다 6배 빠른 속도로 실제 세계를 시뮬레이션 할 수 있다. 엔비디아는 개발자들이 튜링의 이 같은 기능을 최대한 활용할 수 있도록 새로운 AI, 레이 트레이싱 및 시뮬레이션 SDK를 통해 RTX 개발 플랫폼을 개선시켰다. 또한, 수백만 디자이너, 아티스트 및 과학자들을 대상으로 하는 핵심 그래픽 애플리케이션도 RTX 개발 플랫폼을 통해 튜링 기능을 활용할 계획이다.
시장조사기관 JPR의 존 페디 (Jon Peddie) CEO는 “엔비디아의 이번 발표는 컴퓨터 그래픽 역사의 중요한 순간”이라며 “엔비디아는 우리 예상보다 5년이나 앞서 실시간 레이 트레이싱을 선보였다”고 말했다.
RT 코어로 가속화된 실시간 레이 트레이싱
튜링 아키텍처는 RT 코어라고 불리는 레이 트레이싱 전용 프로세서를 갖추고 있어 초당 최대 10 기가레이(GigaRays)에 달하는 3D 환경에서 빛과 소리가 이동하는 방식을 한층 빠르게 계산한다. 튜링은 실시간 레이 트레이싱을 기존 파스칼 세대보다 최대 25배까지 가속화하며, GPU 노드는 CPU 노드의 30배 이상 속도로 영화 효과를 위한 최종 프레임 렌더링에 사용할 수 있다.
시네사이트(Cinesite)의 미셸 숄레트(Michele Sciolette) 최고기술책임자(CTO)는 “시네사이트는 오토데스크 (Autodesk) 및 엔비디아와 제휴해 아놀드(Arnold)를 GPU에 도입할 수 있게 된 점을 자랑스럽게 생각한다. 그러나 결과가 이렇게 좋을 줄 몰랐다”며, “이는 곧 우리가 더 높은 품질 설정으로 더욱 빨리, 더욱 자주 반복할 수 있음을 의미한다. 이는 우리 아티스트들의 작업 방식을 완전히 바꿔 놓을 것”이라고 말했다.
텐서 코어로 가속화된 AI
튜링 아키텍처는 텐서 코어, 딥 러닝 훈련 및 추론을 가속화하는 프로세서 등을 갖추고 있으며, 초당 최대 500조 회의 텐서 연산을 지원한다.
이러한 수준의 성능은 새롭고 강력한 기능을 갖춘 애플리케이션을 제작하기 위한 AI 기반 기능을 제공한다. 여기에는 고화질 모션 이미지 생성의 핵심 요소인 딥 러닝 앤티 앨리어싱(DLAA), 디노이징, 해상도 스케일링 및 비디오 리타이밍 등이 포함된다.
이 같은 기능들은 엔비디아 NGX 소프트웨어 개발 키트의 일환이다. 이 키트는 개발자들이 가속화되고 향상된 그래픽과 사진 이미징, 비디오 프로세싱을 사전 훈련된 네트워크로 애플리케이션에 쉽게 통합할 수 있도록 지원하는 새로운 딥 러닝 기반 기술 스택이다.
한층 빠른 시뮬레이션 및 래스터화 지원
튜링 기반 GPU는 부동 소수점 데이터 경로, 병렬식 정수 실행 장치, 그리고 이전 세대의 두 배에 달하는 대역폭을 가진 새로운 통합 캐시 아키텍처를 갖춘 스트리밍 멀티 프로세서(SM) 아키텍처를 특징으로 한다.
가변 비율 음영과 같은 새로운 그래픽 기술과 결합된 튜링 SM은 최대 4,608개의 코어를 지원하며, 1초에 최대 16조 회의 병렬식 부동 소수점 연산과 정수 연산이 가능하다. 개발자들은 엔비디아 CUDA 10, FleX 및 PhysX SDK를 활용해 과학적 시각화, 가상 환경 및 특수 효과를 위한 입자 또는 유체 역학과 같은 복잡한 시뮬레이션을 생성할 수 있다.
튜링 기반 쿼드로 GPU는 오는 4분기부터 판매될 예정이다.