엔비디아, AI 데이터센터 생산성·ROI 획기적 향상

기사입력2025.10.14 09:04

인퍼런스MAX 벤치마크서 블랙웰 성능 입증

AI 컴퓨팅 기술의 선두주자 엔비디아(NVIDIA)가 AI 데이터센터의 성능을 수익으로의 전환할 수 있음을 입증하며, AI 추론 시장의 판도를 바꿨다.

엔비디아는 차세대 AI 플랫폼 ‘블랙웰(Blackwell)’을 통해 새롭게 발표된 인퍼런스MAX v1 벤치마크에서 최고 성능과 효율성을 보였다고 13일 밝혔다.

이번 결과는 하드웨어와 소프트웨어의 풀스택 공동 설계를 기반으로, AI 데이터센터의 생산성과 투자수익률(ROI)을 획기적으로 향상시킨 사례로 평가받고 있다.

엔비디아 GB200 NVL72 시스템에 500만달러를 투자하면 7,500만달러의 토큰 수익을 창출할 수 있어, 15배의 ROI를 기록했다.

이는 AI 추론이 단순한 기술을 넘어 실질적인 비즈니스 가치를 창출하는 핵심 인프라로 자리잡고 있음을 보여준다.

인퍼런스MAX v1은 세미애널리시스(SemiAnalysis)가 발표한 독립형 벤치마크로, 실제 시나리오 기반의 총 컴퓨팅 비용을 측정해 블랙웰의 성능 리더십을 입증했다.

특히 GPT-OSS 120B, 라마 3 70B, 딥시크 R1 등 오픈소스 기반 모델들과의 협업을 통해, 대규모 추론 환경에서 최적의 성능을 구현하고 있다.

TensorRT LLM v1.0은 블랙웰 B200 시스템과 NVLink 스위치의 1,800GB/s 대역폭을 활용해 GPT-OSS 모델의 처리량을 획기적으로 향상시켰다.

특히 추측 디코딩(speculative decoding) 기술을 도입한 gpt-oss-120b-Eagle3-v2 모델은 사용자당 100TPS를 달성하며, GPU당 최대 30,000TPS까지 처리 속도를 끌어올렸다.

블랙웰은 GPU당 10,000TPS 이상을 제공하며, H200 대비 4배 높은 처리량을 기록했다.

전력 제한 환경에서도 메가와트당 10배 높은 처리량을 실현하며, 백만 토큰당 비용을 15배 절감해 AI 배포의 경제성을 극대화했다.

인퍼런스MAX는 데이터센터의 처리량, 반응성, 비용, 에너지 효율성을 균형 있게 매핑하는 파레토 프론티어 접근법을 적용해, 실제 워크로드에서 최고의 ROI를 보장한다.

이는 단일 시나리오에 최적화된 시스템과 차별화되는 블랙웰의 풀스택 설계의 강점을 보여준다.

블랙웰은 NVFP4 저정밀도 포맷, 5세대 NVLink, 고병렬 처리 알고리즘 등으로 구성된 아키텍처를 기반으로, TensorRT-LLM, Dynamo, SGLang, vLLM 등 오픈소스 프레임워크와의 협업을 통해 지속적인 성능 향상을 실현하고 있다.

#AI #데이터센터 #엔비디아

배종인 기자jongin@e4ds.com

기사 전체보기

관련뉴스

슈나이더, 엔비디아와 차세대 AI 팩토리 구축 박차

글로벌 에너지 관리 및 자동화 전문기업 슈나이더 일렉트릭이 AI 기술의 선두주자 엔비디아(NVIDIA)와 전략적 협력에 나서며 차세대 대규모 AI 공장 구축을 위한 인프라 개발에 속도를 내고 있다.

2025-07-08 05:49:35by 배종인 기자

델, RTX 프로 블랙웰 GPU 탑재 ‘델 프로 맥스’ 모바일 워크스테이션 6종 출시

델 테크놀로지스(Dell Technologies)가 새로운 프리미엄 워크스테이션 브랜드 ‘델 프로 맥스(Dell Pro Max)’를 공개하고, AI 및 고성능 작업에 최적화된 모바일 워크스테이션 6종을 선보였다. 이번 제품군은 엔비디아 RTX 프로 블랙웰 GPU를 탑재해 강력한 성능을 자랑하며, 휴대성·디자인·보안·지속가능성을 모두 갖춘 델의 차세대 전략 제품으로 평가받는다.

2025-07-24 16:30:05by 배종인 기자

SKT, 1천장 이상 B200 탑재 ‘해인’ GPU 클러스터 가동

SK텔레콤(대표 유영상)이 최신 엔비디아 B200 GPU 기반의 국내 최대 규모 단일 클러스터 ‘해인(Haein)’을 가동하며, 고성능 AI 인프라 서비스인 GPUaaS(GPU-as-a-Service)를 본격 출시했다. 이번 클러스터는 1천장 이상의 B200 GPU를 탑재해 국내 AI 산업의 인프라 확충과 글로벌 경쟁력 강화에 기여할 전망이다.

2025-08-06 16:27:46by 배종인 기자

PTC, NVIDIA와 손잡고 AI 인프라 혁신 가속

글로벌 산업 소프트웨어 기업 PTC의 CAD 소프트웨어 ‘크레오(Creo®)’와 PLM 솔루션 ‘윈칠(Windchill®)’에 엔비디아의 실시간 시뮬레이션 플랫폼 ‘옴니버스(NVIDIA Omniverse)’를 통합하며, 차세대 제품 설계 및 시뮬레이션 혁신에 박차를 가한다.

2025-08-12 10:37:25by 배종인 기자

인피니언·엔비디아, 휴머노이드 로봇 혁신 가속화…정밀 제어와 실시간 AI 구현

인피니언 테크놀로지스(Infineon Technologies)가 인피니언의 마이크로컨트롤러·센서·스마트 액추에이터 기술과 엔비디아 젯슨 토르(NVIDIA Jetson Thor) 시리즈 모듈을 결합해 OEM 및 ODM이 확장 가능하고 정밀한 로봇 시스템을 빠르게 구현할 수 있도록 지원한다. 이번 협력에서 인피니언은 엔비디아 홀로스캔 센서 브리지와 완벽하게 통합되는 PSOC Control C3 마이크로컨트롤러를 공급한다. 해당 제품은 젯슨 토르 모듈과 결합되어 실시간 추론 성능과 확장성을 제공하며, FOC(field-oriented-control) 알고리즘을 통해 소음 감소와 안정적인 토크 출력을 실현해 휴머노이드 시스템의 진동을 최소화한다.

2025-08-27 10:37:19by 배종인 기자

엔비디아, 인텔에 50억불 투자

글로벌 AI 컴퓨팅 기술을 선도하는 엔비디아(NVIDIA)와 인텔(Intel)이 NV링크 기반 아키텍처 통합으로 최첨단 솔루션 제공에 본격 나선다. 엔비디아와 인텔은 전략적 협력을 공식 발표하고, 하이퍼스케일부터 엔터프라이즈, 소비자 시장까지 다양한 애플리케이션과 워크로드를 가속화하기 위한 맞춤형 데이터센터 및 개인용 컴퓨팅 제품을 공동 개발하며, 차세대 컴퓨팅 시대의 기반을 마련한다고 밝혔다.

2025-09-22 15:55:22by 배종인 기자

엔비디아, 오픈소스 모델·시뮬레이션 기술로 로보틱스 연구 가속화

AI 컴퓨팅 기술 선도 기업 엔비디아(NVIDIA)가 오픈소스 뉴턴 물리 엔진(Newton Physics Engine)이 엔비디아 아이작™ 랩(NVIDIA Isaac™ Lab)에서 이용 가능하며, 로봇 기술을 위한 엔비디아 아이작 GR00T N1.6 추론 비전 언어 행동(vision language action, VLA) 모델과 새로운 AI 인프라를 함께 제공한다.

2025-09-30 15:06:44by 배종인 기자