엔비디아가 자사의 AI 워크로드 인증 프로그램을 통과한 서버들을 공개했다. 엔비디아 인증 시스템은 엔비디아 멜라녹스 네트워크에서 구동하는 최신 엔비디아 GPU로 AI를 가속하고, 대규모 AI 워크로드를 처리하기 위해 도입됐다. 이를 통해, 조직들의 기존 시스템이 놓치고 있는 수많은 데이터로부터 통찰력을 도출하도록 돕는다.
엔비디아, 자사 인증 통과한 서버 제품 공개
델, 기가바이트, HPE, 인스퍼, 슈퍼마이크로 등
데이터 선별에 활용되는 AI 모델이 5년 사이 3만 배 늘면서 데이터센터와 네트워크 에지 모두에서 네트워크 트래픽이 급증하고 있다. GPU 유연성과 고성능 컴퓨팅 필요성이 커지고 있으며, 인프라의 효율적인 확장을 위한 안전하고 안정적인 고속 인프라도 요구되고 있다.
엔비디아는 27일, 자사의 AI 워크로드 인증 프로그램인 ‘엔비디아 인증 시스템(NVIDIA Certified System)’을 통과한 업계 최초의 서버 제품을 공개했다.
▲ 엔비디아 인증 시스템 통과 서버들 [사진=엔비디아]
엔비디아 인증 시스템은 엔비디아 멜라녹스(Mellanox) 네트워크에서 구동하는 최신 엔비디아 GPU로 AI를 가속하고, 대규모 AI 워크로드를 처리하기 위해 도입됐다. 이를 통해, 조직들의 기존 시스템이 놓치고 있는 수많은 데이터로부터 통찰력을 도출하도록 돕는다.
델 테크놀로지스(Dell Technologies), 기가바이트(GIGABYTE), 휴렛팩커드 엔터프라이즈(HPE), 인스퍼(Inspur), 슈퍼마이크로(Supermicro)는 엔비디아 A100 텐서 코어(Tensor Core) GPU를 탑재한 다음의 엔비디아 인증 시스템을 출하한다.
해당 시스템은 ▲델 EMC 파워엣지(PowerEdge) R7525, R740 랙 서버 ▲기가바이트 R281-G30, R282-Z96, G242-Z11, G482-Z54, G492-Z51 시스템 ▲HPE 아폴로(Apollo) 6500 Gen10, 프로라이언트(ProLiant) DL380 Gen10 서버 ▲인스퍼 NF5488A5 ▲슈퍼마이크로 A+ 서버 AS-4124GS-TNR, AS-2124GQ-NART 등이다.
◇ 다양한 테스트 통과로 AI 워크로드 적합성 입증
인증은 여러 컴퓨팅 노드가 필요한 작업부터 단일 GPU 성능의 일부만 필요한 작업에 이르는 다양한 워크로드에 대한 테스트를 통과해야 부여된다. 테스트는 △딥러닝 훈련 및 추론, △머신러닝 알고리즘, △지능형 동영상 분석, △네트워크 및 스토리지 오프로드 등을 검증한다.
엔비디아 인증 시스템은 GPU에 최적화된 애플리케이션을 위한 엔비디아의 허브인 NGC 카탈로그에서 AI 애플리케이션을 실행하도록 최적화돼 있다.
NGC는 헬스케어(클라라(Clara)), 로보틱스(아이작(Isaac))와 같은 수직 시장에 AI를 구현하는 소프트웨어 개발 키트 기반이다. 또한, 추천 시스템(멀린(Merlin)), 지능형 동영상 분석(메트로폴리스(Metropolis))와 같은 새로운 사용사례를 지원하는 프레임워크를 보유하고 있다.
모든 엔비디아 인증 시스템은 엔비디아 멜라녹스 8700 HDR 200G 인피니밴드 스위치 또는 멜라녹스 SN3700 이더넷 스위치를 사용해 인증됐으며, 오픈소스 코드 지원을 포함해 전체 소프트웨어 스택에서 엔터프라이즈 지원을 통해 제공된다.
11개의 시스템 제조업체의 약 70개 시스템이 인증 프로그램에 참여했으며, 현재까지 6개 업체의 14개 서버가 엔비디아 인증을 받았다.