엔비디아(nvidia)가 가속컴퓨팅, AI, 수퍼컴퓨팅 센터 및 클라우드 컴퓨팅을 위한 다양한 기술을 새롭게 내놓으며 양자 물리학, 디지털 생물학, 기후 과학에 이르기까지 여러분야에서 기여가 기대되고 있다.
▲젠슨황 엔비디아 CEO가 기조연설을 하고 있다.
퀀텀2, 400Gbps 슈퍼컴퓨팅 서비스 제공
젯슨 AGX 오린 처리능력 최대 6배 향상
옴니버스 아바타 AI·시뮬레이션 기술 연결
엔비디아(nvidia)가 가속컴퓨팅, AI, 수퍼컴퓨팅 센터 및 클라우드 컴퓨팅을 위한 다양한 기술을 새롭게 내놓으며 양자 물리학, 디지털 생물학, 기후 과학에 이르기까지 여러분야에서 기여가 기대되고 있다.
젠슨황 엔비디아 CEO는 9일 GPU 테크놀로지 컨퍼런스(GTC)에서 기조연설을 갖고 AI, 가속 컴퓨팅, 컴퓨터 그래픽스, 로보틱스부터 메타버스에 이르는 다양한 기술 소개했다.
이번 기조연설에서 젠슨황 CEO는 엔비디아가 클라우드 컴퓨팅 제공업체와 슈퍼 컴퓨팅 센터에 필요한 최고의 성능, 광범위한 접근성, 강력한 보안을 제공하는 차세대 인피니밴드 네트워킹 플랫폼인 엔비디아 퀀텀2를 공개했다.
엔비디아 퀀텀2는 현재까지 구축된 가장 진보된 엔드-투-엔드 네트워킹 플랫폼으로 엔비디아 퀀텀2 스위치, 커넥트X-7 네트워크 어댑터, 블루필드-3 데이터 처리 장치(DPU) 및 새로운 아키텍처를 지원하는 모든 소프트웨어로 구성된 400Gbps 인피니밴드 네트워킹 플랫폼이다.
엔비디아 퀀텀2는 슈퍼컴퓨팅 센터가 조직 외부의 수많은 사용자에게 더 많이 개방되는 추세에 맞춰 공개됐다. 동시에 전세계 클라우드 서비스 제공업체들은 수백만 명의 고객에게 더 많은 슈퍼컴퓨팅 서비스 제공을 시작하고 있다.
이와 함께 엔비디아는 엣지 AI 및 오토노머스 머신을 구현하는 ‘잿슨 AGX 오린’을 공개했다. 세계에서 가장 작은 AI 슈퍼 컴퓨터인 엔비디아 젯슨 AGX 오린은 강력한 성능과 더불어 에너지 효율성을 극대화한다.
엔비디아 암페어(Ampere) 아키텍처를 기반으로 구축된 젯슨 AGX 오린은 최대 6배 향상된 처리능력과 함께 이전 세대 젯슨 AGX 자비에(Xavier)의 폼팩터 및 핀에 대한 호환성을 제공한다. 해당 모델은 GPU 지원 서버와 유사하지만 손바닥만큼 작은 크기로, 초당 약 200TOPS(초당 테라 연산)를 수행한다.
새로운 젯슨 AGX 오린은 엔비디아 AI 소프트웨어 풀 스택을 가속화해 개발자가 자연어 이해, 3D 인식, 멀티센서 퓨전 등과 관련된 엣지(edge) AI 및 로보틱스 문제를 해결하는 데 필수적인 가장 크고 복잡한 모델을 배치할 수 있도록 한다.
이와 함께 젠슨황은 전세계 기업이 대규모 언어모델(LLM)을 구축하고 개발하도록 지원한다고 밝혔다.
이를 위해 수조 개의 매개변수가 있는 언어모델 훈련을 위한 엔비디아 네모 메가트론(NeMo Megatron), 새로운 도메인 및 언어에 대해 교육할 수 있는 맞춤형 대규모 언어모델인 메가트론 530B과 다중 GPU, 다중 노드 분산 추론 기능을 갖춘 트리톤 추론서버(Triton Inference Server)를 공개했다.
해당 툴과 엔비디아 DGX 시스템을 함께 사용하면 생산 준비가 완료된 엔터프라이즈급 솔루션을 제공해 대규모 언어모델의 개발 및 배포를 단순화한다.
이번 기조연설에서는 심층 신경망을 훈련하기 위해 물리적으로 시뮬레이션된 합성 데이터를 생성하는 강력한 합성 데이터 생성 엔진인 엔비디아 옴니버스 리플리케이터(Omniverse Replicator)도 발표됐다.
엔비디아는 해당 엔진을 처음 구현하면서 두 가지 합성 데이터 생성 애플리케이션을 도입했다. 이는 자율주행 차량의 디지털 트윈을 호스팅하는 가상세계인 엔비디아 드라이브 심(DRIVE Sim)과 조작(manipulation) 로봇의 디지털 트윈을 위한 가상세계인 엔비디아 아이작 심(Issac Sim)이다.
두 가지 리플리케이터는 개발자가 AI 모델을 부트스트랩하고, 실제 데이터 격차를 보완하고, 인간이 할 수 없는 방식으로 실측 사실에 라벨링할 수 있게 한다. 이러한 가상세계에서 생성된 데이터는 실제 환경에서는 정기적으로 또는 안전하게 경험할 수 없는 희귀하거나 위험한 조건 등을 포함해 다양한 시나리오를 다룬다.
이와 함께 전세계 2만5,000명 이상의 고객들이 사용하는 AI 추론 플랫폼인 트리톤 추론 서버(NVIDIA Triton Inference Server)에 대한 최신 업데이트를 발표했다.
트리톤 추론 서버는 캐피탈 원(Capital One), 마이크로소프트(Microsoft), 지멘스 에너지(Siemens Energy) 및 스냅(Snap)을 비롯해 수많은 고객들이 사용 중이다. 이번 업데이트로 모든 AI 모델과 프레임워크에 대한 교차 플랫폼 추론을 제공하는 오픈소스 엔비디아 트리톤 추론 서버 소프트웨어 및 AI 모델을 최적화하고 엔비디아 GPU의 고성능 추론을 위한 런타임을 제공하는 텐서RT(Tensor RT)을 지원한다.
엔비디아는 또한 CPU보다 최대 20배 더 높은 추론 성능을 제공하는 AI 추론용 저전력 소형 가속기인 엔비디아 A2 텐서 코어 GPU를 선보였다.
AI 아바타 생성을 위한 플랫폼도 발표됐다.
엔비디아 옴니버스 아바타(Omniverse Avatar)는 엔비디아의 음성 AI, 컴퓨터 비전, 자연어 이해, 추천 엔진 및 시뮬레이션 기술을 연결한다. 옴니버스 플랫폼에 생성된 아바타는 다양한 주제를 보고, 말하고, 대화하고, 언어의 의도를 자연스레 이해할 수 있는 레이 트레이싱 3D 그래픽이 포함된 대화형 캐릭터다.
옴니버스 아바타는 대부분의 산업 분야에 쉽게 맞춤화 할 수 있는 AI 비서 제작을 가능케 한다. 이는 식당 주문, 은행 거래, 개인 약속 및 예약 등 매일 수십억 건의 고객 서비스 상호작용을 통해 비즈니스 기회를 확대하고 고객 만족도를 높일 수 있도록 지원한다.
엔비디아의 창립자 겸 CEO인 젠슨 황은 “지능형 가상 비서의 시대가 다가왔다. 옴니버스 아바타는 엔비디아의 기본 그래픽, 시뮬레이션 및 AI 기술을 결합하여 지금까지 만들어진 가장 복잡한 실시간 애플리케이션을 만든다. 협동 로봇과 가상 비서의 사용 사례는 놀랍고 광범위하다”고 말했다.
▲퀀텀-2 네트워킹 플랫폼
▲엔비디아 젯슨 AGX 오린 모듈과 개발자 키트