AI 가속기 솔루션 수요가 급속히 증가하고 있는 가운데 AI 시장에서 엔비디아의 아성에 도전하는 AMD가 주요 파트너사들과 함께 미래 AI 솔루션 성장을 모색하는 자리를 가졌다.
▲라이젠 8040(Ryzen 8040) 시리즈 프로세서(사진:AMD)
MS·델·HPE·레노버·메타·슈퍼마이크로
AMD 데이터 센터용 AI 가속기 탑재
AI 가속기 솔루션 수요가 급속히 증가하고 있는 가운데 AI 시장에서 엔비디아의 아성에 도전하는 AMD가 주요 파트너사들과 함께 미래 AI 솔루션 성장을 모색하는 자리를 가졌다.
AMD가 7일 ‘Advancing AI’ 행사에서 주요 파트너사와 함께 클라우드, 기업 및 PC 등 다양한 부문에 고급 AI 솔루션을 제공하기 위한 다양한 협업 사례를 발표했다.
이번 행사에 △마이크로소프트 △메타 △오라클 △델 테크놀로지스 △HPE △레노버 △슈퍼마이크로 △아리스타 △브로드컴 △시스코(Cisco) 등이 참여했다.
AMD는 인스팅트(Instinct) MI300 시리즈 데이터 센터 AI 가속기, 대규모 최적화 및 대규모 언어 모델(LLM)을 지원하는 새로운 기능을 갖춘 ROCm 6 개방형 소프트웨어 스택과 라이젠 AI(Ryzen AI)가 탑재된 라이젠 8040(Ryzen 8040) 시리즈 프로세서 등 다양한 신제품도 출시했다.
▲AMD 라이젠 AI(사진:AMD)
AI 컴퓨팅 기능을 제공하는 최신 AMD 라이젠 8040 시리즈 프로세서 출시와 함께 사전 훈련된 모델로 윈도우 애플리케이션에 손쉽게 AI 기능을 추가하고 배포할 수 있도록 하는 소프트웨어 스택 ‘라이젠 AI 1.0’을 함께 선보인 것이다.
리사 수 AMD CEO는 “AI는 컴퓨팅의 미래이며 AMD는 대규모 클라우드부터 엔터프라이즈 클러스터, AI 지원 지능형 임베디드 기기 및 PC에 이르기까지 AI 시대를 정의할 엔드투엔드 인프라를 강화할 수 있는 독보적인 위치에 있다”고 강조했다.
또한 그는 “우리는 생성형 AI를 위한 세계 최고 성능의 가속기인 인스팅트 MI300 GPU에 대한 수요가 매우 높다고 보고 있다”며 “현재 최대 규모의 클라우드 기업, 업계 최고의 서버 제공업체, 가장 혁신적인 AI 스타트업과 함께 데이터 센터 AI 솔루션 분야에서 상당한 모멘텀을 구축하고 있다”고 말하며 AI 생태계 전반의 혁신 속도가 빨라지고 있다는 말을 덧붙였다.
■ 확장되는 AI 생태계
AMD는 이번 행사 기간 동안 여러 파트너와 함께 AMD 인스팅트 데이터 센터 AI 가속기 채택 사례를 발표하고 성장 모멘텀에 대해 강조했다.
다수의 대형 데이터 센터 인프라 제공업체가 자사 제품 포트폴리오 전반에 걸쳐 AMD 인스팅트 MI300 가속기를 탑재할 계획이라고 발표했다.
▲AMD 인스팅트 MI300X 가속기(사진:AMD)
마이크로소프트는 AI 워크로드에 최적화된 새로운 애저 ND MI300x v5 가상머신 시리즈 구동을 위해 AMD 인스팅트 MI300X 가속기를 활용하는 방안에 대해 자세히 설명했다.
메타는 AI 추론 워크로드를 강화하기 위해 ROCm 6과 함께 데이터 센터에 AMD 인스팅트 MI300X 가속기를 추가하고 있으며, AMD가 라마 2 모델 제품군에 대한 ROCm 6 최적화를 수행한 것에 대해서도 인지하고 있다고 밝혔다.
오라클은 AMD 인스팅트 MI300X 가속기를 갖춘 OCI 베어 메탈 컴퓨팅 솔루션 공급 및 향후 자사 생성형 AI 서비스에 대한 AMD 인스팅트 MI300X 가속기 포함 계획을 발표했다.
이외에도 델은 AMD 제품을 탑재한 서버 솔루션을 통합해 생성형 AI 워크로드에 대한 획기적인 성능을 제공하는 확장 가능한 모듈식 제품을 공급하며, HPE는 AMD 인스팅트 MI300 가속기를 도입한다는 계획을 발표했다.
레노버는 AMD 인스팅트 MI300X 가속기를 레노버 씽크시스템 플랫폼에 도입하며, 슈퍼마이크로는 자사의 AI 솔루션 포트폴리오 전반에 걸쳐 AMD 인스팅트 MI300 GPU를 제공할 예정이다.
■ 검증된 개방형 AI 소프트웨어 플랫폼 출시
AMD는 자사의 AMD 인스팅트 데이터 센터 가속기를 지원하는 소프트웨어 생태계 확장에 대해서도 강조했다.
AMD는 생성형 AI, 특히 대규모 언어 모델에 최적화된 AMD 인스팅트 GPU용 오픈 소스 소프트웨어 스택인 ROCm 6의 최신 버전을 공개했다.
ROCm 6는 새로운 데이터 유형, 고급 그래프 및 커널 최적화, 최적화된 라이브러리 및 강력한 어텐션 알고리즘을 지원한다.
라마 2 기준 텍스트 생성 전체 대기 시간을 비교하면, ROCm6를 MI300X에서 구동 시 MI250에서 실행되는 ROCm 5 대비 최대 8배 향상된 성능을 제공한다.
최신 모델과 AI 솔루션을 개발하는 스타트업인 △데이터브릭스 △에센셜 AI △ 라미니 등은 AMD 인스팅트 MI300X 가속기와 개방형 ROCm 6 소프트웨어 스택을 활용해 고객에게 차별화된 AI 솔루션을 제공하는 방법에 논의했다.
오픈AI는 트리톤 3.0에 AMD 인스팅트 가속기에 대한 지원을 추가해 개발자가 AMD 하드웨어에서 더 높은 수준의 추상화 작업을 수행할 수 있도록 지원한다.