엔비디아, 생성AI용 GH200 그레이스 호퍼 슈퍼칩 공개

기사입력2023.08.10 15:24

▲GH200 그레이스 호퍼 슈퍼칩(이미지:엔비디아)

HBM3e 탑재·다중 GPU 연결 기능 지원

주요 시스템 제조사, 2024년 2분기 적용

생성AI가 산업과 시장 판도를 뒤흔들고 있는 가운데 AI 서버 시장을 주도하는 엔비디아가 차세대 AI 지원 플랫폼을 선보였다.

AI 컴퓨팅 기술 분야의 선두주자인 엔비디아가 가속 컴퓨팅과 생성형 AI를 위한 차세대 엔비디아 GH200 그레이스 호퍼 플랫폼(NVIDIA GH200 Grace Hopper platform)을 10일 발표했다.

GH200 그레이스 호퍼 플랫폼은 세계 최초로 HBM3e 프로세서가 탑재된 새로운 그레이스 호퍼 슈퍼칩을 기반으로 한다. 대규모 언어 모델, 추천 시스템, 벡터 데이터베이스를 비롯해 전 세계적으로 가장 복합한 생성형 AI 워크로드를 처리할 수 있도록 개발됐으며, 다양한 구성으로 제공될 예정이다.

현 세대 제품보다 최대 3.5배 많은 메모리 용량과 3배 높은 대역폭을 제공하는 듀얼 구성은 144개의 Arm 네오버스 코어, 8페타플롭의 AI 성능, 282GB의 최신 HBM3e 메모리 기술을 갖춘 단일 서버로 구성된다.

엔비디아 창립자 겸 CEO인 젠슨 황(Jensen Huang)은 “급증하는 생성형 AI의 수요를 충족하기 위해 데이터센터에는 전문적인 요구 사항을 갖춘 가속화된 컴퓨팅 플랫폼이 필요하다”며 “새로운 GH200 그레이스 호퍼 슈퍼칩 플랫폼은 탁월한 메모리 기술과 대역폭을 통해 처리량을 개선하고, 성능의 저하 없이 GPU를 연결해 성능을 통합한다”고 말했다.

새로운 플랫폼에 사용된 그레이스 호퍼 슈퍼칩은 엔비디아 NV링크(NVLink)로 추가 슈퍼칩과 연결할 수 있으며, 이들이 함께 작동해 생성형 AI에 사용되는 거대한 모델을 배포할 수 있다. 이러한 고속 기술은 GPU가 CPU 메모리에 완전히 액세스할 수 있도록 지원해 듀얼 구성 시 총 1.2TB의 빠른 메모리를 제공한다.

HBM3e 메모리는 기존 HBM3보다 데이터 전송 속도가 50% 빠르며, 초당 총 10TB의 대역폭을 제공한다. 이를 통해 새로운 플랫폼에서 이전 버전보다 3.5배 용량이 큰 모델을 실행할 수 있으며, 3배 빠른 메모리 대역폭으로 성능을 개선할 수 있다.

선도적인 제조업체들은 이미 이전에 발표된 그레이스 호퍼 슈퍼칩을 기반으로 한 시스템을 선보이고 있다. HBM3e가 탑재된 차세대 그레이스 호퍼 슈퍼칩 플랫폼은 기술의 도입을 확대하기 위해 올해 초 컴퓨텍스에서 공개된 엔비디아 MGX서버 사양과 완벽하게 호환된다. 모든 시스템 제조업체는 MGX를 통해 100가지가 넘는 서버 변형에 그레이스 호퍼를 추가할 수 있다.

엔비디아측에 따르면 주요 시스템 제조업체는 2024년 2분기에 GH200 그레이스 호퍼 플랫폼을 기반으로 한 시스템이 제공될 것으로 예상했다.

#AI #AI반도체 #HBM #데이터센터 #생성AI #엔비디아 #SK하이닉스

권신혁 기자kwonsh@e4ds.com

기사 전체보기

관련뉴스

엔비디아, 생성형 AI 날개 달고 광폭 행보

인공지능(AI) 컴퓨팅 기술을 주도하는 엔비디아가 최근 컴퓨텍스 2023에서 AI 시장을 타겟으로 하는 △제품과 사양 △파트너사 협력 지원 △레퍼런스 등을 대거 공개했다. 생성형 AI가 만들어낸 AI 시장의 확대를 등에 업고 엔비디아가 광폭 행보를 보이고 있다. ■ DGX GH200 AI 슈퍼컴퓨터 발표 엔비디아가 대용량 메모리 AI 슈퍼컴퓨터 DGX GH200을 발표했다. DGX 슈퍼컴퓨터는 엔비디아 GH200 그레이스 호퍼 슈퍼칩과 엔비디아 NVLink 스위치 시스템을 탑재하고, 생성형 AI 언어 애플리케이션과 추천 시스템, 데이터 애널리틱스 워크로드에 사용될 차세대 거대 모델들의 개발을 지원한다. DGX GH200의 공유 메모리 공간은 NVLink 인터커넥트 테크놀로지와 NVLink 스위치 시스템으로 GH200 슈퍼칩 256개를 결합해 단일 GPU로 기능하게 한다. 이를 통해 1엑사플롭의 성능과 144테라바이트의 공유 메모리를 제공하는데, 이는 단일 엔비디아 DGX A100 시스템 메모리의 500배에 가까운 용량이다. 구글 클라우드와 메타, 마이크로소프트는 업계 최초로 DGX GH200을 도입해 생성형 AI 워크로드 역량을 탐구하고 있는 것으로 전해졌다. 엔비디아는 또한 클라우드 서비스 제공업체와 기타 하이퍼스케일러가 DGX GH200 설계를 청사진으로 삼아 자체 인프라로 커스터마이징 할 수 있도록 지원할 방침이다. ■ 그레이스 호퍼 슈퍼칩, 日 분산 AI 데이터센터에 공급 엔비디아는 생성형 AI와 5G/6G 애플리케이션용 플랫폼 구축에 소프트뱅크와의 협력을 발표했다. 소프트뱅크는 Arm 네오버스(Neoverse) 기반 엔비디아 GH200 그레이스 호퍼(Grace Hopper) 슈퍼칩을 해당 플랫폼에 적용해 일본 전 지역의 새로운 분산 AI 데이터센터에 배포할 계획...(더보기) #AI반도체 #챗GPT #AI서버 #AI컴퓨팅 #인공지능가속기 #반도체수요 #AI수요

2023-06-01 10:43:53by 권신혁 기자

AI 가속기 전쟁, "2024년 HBM3 급부상"

시장조사업체 트렌드포스는 1일 AI 가속기 칩 수요가 증가하고, 업체들이 자체 칩을 개발하는 추세에 따라 2024년 새로운 HBM3·HBM3e이 시장의 주류가 될 것이라 주장했다. 엔비디아의 거세진 입김을 피하기 위해 최근 업계는 자체 AI 칩 개발에 몰두하고 있다. AI 가속기 칩에 대한 수요가 진화함에 따라 HBM3 및 HBM3e의 성장이 예측된다.

2023-08-03 13:30:08by 김예지 기자

젠슨 황, “생성형 AI 시대 도래”

“아이폰의 순간(iPhone moment)이라고 칭할 수 있는 ‘생성형 AI의 시대’가 다가오고 있다” 엔비디아 창립자 겸 CEO인 젠슨 황(Jensen Huang)이 로스앤젤레스에서 열린 세계적인 컴퓨터 그래픽 콘퍼런스인 시그래프(SIGGRAPH)에서 한 말이다.

2023-08-10 14:25:18by 권신혁 기자