슈퍼마이크로컴퓨터(Super Micro Computer, 이하 슈퍼마이크로)가 슈퍼클러스터 포트폴리오에 엔비디아 블랙웰 플랫폼을 탑재한 엔드투엔드 AI 데이터센터 솔루션을 추가했다고 22일 발표했다.
▲엔비디아 블랙웰용 직접액체냉각 슈퍼클러스터 공개 / (이미지:슈퍼마이크로)
AI 컴퓨팅 집적, 조 단위 매개변수 기반 생성형 AI 대응
HGX B200 8-GPU·GB200·NVL4·NVL72 시스템 탑재
슈퍼마이크로컴퓨터(Super Micro Computer, 이하 슈퍼마이크로)가 슈퍼클러스터 포트폴리오에 엔비디아 블랙웰 플랫폼을 탑재한 엔드투엔드 AI 데이터센터 솔루션을 추가했다고 22일 발표했다.
새로운 슈퍼클러스터는 수냉식 랙 안에 엔비디아 HGX B200 8-GPU 시스템 수를 크게 늘렸다. 이에 이전 수냉식 엔비디아 HGX H100 및 H200 기반 슈퍼마이크로 슈퍼클러스터 대비 GPU 컴퓨팅 집적도가 대폭 향상된 것으로 전해진다.
현재 슈퍼마이크로는 엔비디아 호퍼 시스템 포트폴리오를 강화해 급속도로 증가하고 있는 HPC 애플리케이션과 대중적인 엔터프라이즈 AI의 가속 컴퓨팅 도입에 대응하고 있다.
업그레이드된 슈퍼클러스터 확장 가능 장치는 혁신적인 수직 냉각 분배 매니폴드(CDM)를 갖춘 랙 스케일 설계를 기반으로, 단일 랙에 더 많은 컴퓨팅 노드를 탑재할 수 있다. 새롭게 개발된 고효율 냉각판과 고급 호스 설계로 수냉식 시스템의 효율성이 높인 것으로 전해진다.
대규모 배포를 위한 새로운 인-라인(in-row) 이중화 냉각 분배 장치(CDU) 옵션도 추가로 제공된다. 기존의 공냉식 데이터센터도 새로운 공냉식 냉각 시스템 섀시를 탑재한 엔비디아 HGX B200 8-GPU 시스템을 통해 성능과 효율을 극대화할 수 있다.
엔비디아 HGX B200 8-GPU 서버에서는 열관리 및 전력 공급이 강화됐으며, 듀얼 500W 인텔 제온6(8800MT/s의 DDR5 MRDIMM 포함) 또는 AMD EPYCTM 9005 시리즈 프로세서를 지원한다.
새롭게 설계된 공냉식 10U 폼 팩터는 열전도 헤드룸이 확장된 섀시를 탑재해 1000W TDP 블랙웰 GPU 8개를 수용할 수 있다. 이 서버는 GPU와 NIC(엔비디아 블루필드-3 슈퍼닉 또는 엔비디아 커넥트X-7)가 1대1 비율로 설계돼 고성능 컴퓨팅 환경에서 확장성을 제공한다. 또한, 서버당 2개의 엔비디아 블루필드-3 DPU가 포함돼 AI 스토리지와의 데이터 처리를 효율적으로 간소화한다.
슈퍼마이크로의 엔비디아 MGX 설계 라인업은 엔비디아 GB200 그레이스 블랙웰 NVL4 슈퍼칩을 지원할 예정이다. 해당 슈퍼칩은 NVLink-C2C 기술을 통해 2개의 엔비디아 그레이스 CPU와 통합된 4개의 블랙웰 GPU를 연결한다. 슈퍼마이크로의 수냉식 엔비디아 MGX 모듈형 서버와 호환되며, 과학적 컴퓨팅, 그래프 신경망(GNN) 학습, 추론 애플리케이션에서 이전 세대 대비 최대 2배의 성능을 제공하는 것으로 알려졌다.
찰스 리앙(Charles Liang) 슈퍼마이크로 사장 겸 CEO는 “슈퍼마이크로는 세계 최대 규모의 수냉식 AI 데이터센터 프로젝트에 기여할 수 있는 전문성, 배포 속도, 그리고 배송 역량을 지니고 있다”라며, “최근 슈퍼마이크로와 엔비디아가 GPU 10만개 규모의 AI 데이터센터를 성공적으로 구축했다”고 말했다.
그는 “슈퍼클러스터는 직접액체냉각을 통해 전력 수요량을 줄일 수 있으며, 데이터센터 전반의 성능은 향상시키고 전력 소비를 줄이며 운영 비용 절감 효과를 제공한다”고 설명했다.