인공지능(AI) 컴퓨팅 기술을 주도하는 엔비디아가 최근 컴퓨텍스 2023에서 AI 시장을 타겟으로 하는 △제품과 사양 △파트너사 협력 지원 △레퍼런스 등을 대거 공개했다. 생성형 AI가 만들어낸 AI 시장의 확대를 등에 업고 엔비디아가 광폭 행보를 보이고 있다.
■ DGX GH200 AI 슈퍼컴퓨터 발표
엔비디아가 대용량 메모리 AI 슈퍼컴퓨터 DGX GH200을 발표했다. DGX 슈퍼컴퓨터는 엔비디아 GH200 그레이스 호퍼 슈퍼칩과 엔비디아 NVLink 스위치 시스템을 탑재하고, 생성형 AI 언어 애플리케이션과 추천 시스템, 데이터 애널리틱스 워크로드에 사용될 차세대 거대 모델들의 개발을 지원한다.
DGX GH200의 공유 메모리 공간은 NVLink 인터커넥트 테크놀로지와 NVLink 스위치 시스템으로 GH200 슈퍼칩 256개를 결합해 단일 GPU로 기능하게 한다. 이를 통해 1엑사플롭의 성능과 144테라바이트의 공유 메모리를 제공하는데, 이는 단일 엔비디아 DGX A100 시스템 메모리의 500배에 가까운 용량이다.
구글 클라우드와 메타, 마이크로소프트는 업계 최초로 DGX GH200을 도입해 생성형 AI 워크로드 역량을 탐구하고 있는 것으로 전해졌다. 엔비디아는 또한 클라우드 서비스 제공업체와 기타 하이퍼스케일러가 DGX GH200 설계를 청사진으로 삼아 자체 인프라로 커스터마이징 할 수 있도록 지원할 방침이다.
■ 그레이스 호퍼 슈퍼칩, 日 분산 AI 데이터센터에 공급
엔비디아는 생성형 AI와 5G/6G 애플리케이션용 플랫폼 구축에 소프트뱅크와의 협력을 발표했다. 소프트뱅크는 Arm 네오버스(Neoverse) 기반 엔비디아 GH200 그레이스 호퍼(Grace Hopper) 슈퍼칩을 해당 플랫폼에 적용해 일본 전 지역의 새로운 분산 AI 데이터센터에 배포할 계획...(더보기)
#AI반도체 #챗GPT #AI서버 #AI컴퓨팅 #인공지능가속기 #반도체수요 #AI수요
e4ds+ 멤버십에 가입하시고 프리미엄 유료 기사를 경험하세요
유료 웨비나, 컨퍼런스, 컨퍼런스 리뷰 콘텐츠 등을 멤버십 특별 할인가격에 이용할 수 있습니다.
E4ds+ 가입하기