엔비디아, ‘지포스 RTX 40 슈퍼’ GPU 출시…PC에서 생성 AI 가속

엔비디아, ‘지포스 RTX 40 슈퍼’ GPU 출시…“PC에서 생성 AI 가속”

기사입력2024.01.09 16:24

▲엔비디아 지포스 수석 부사장 제프 피셔

지포스 RTX 40 슈퍼 시리즈 3종 출시
1월 말 맞춤형 AI 챗봇 ‘챗 RTX’ 공개
AI 개발자를 위한 통합 툴킷 ‘AI 워크벤치’ 제공

엔비디아가 텐서 코어 GPU, LLM, RTX PC 및 워크스테이션용 도구를 통해 생성형 AI를 지원한다.

엔비디아(NVIDIA)는 라스베거스에서 9일 개최된 CES 2024에서 생성형 AI 성능을 갖춘 새로운 ‘지포스 RTX 40 슈퍼 GPU(GeForce RTX 40 SUPER GPU)’ 시리즈를 발표했다. 더불어 주요 제조업체의 신규 AI 노트북, 엔비디아 RTX™ 가속 AI 소프트웨어 및 도구를 발표했다.

이와 함께 CES 2024에서 엔비디아는 PC용 새로운 생성형 AI 기반 어플리케이션과 서비스 출시를 알렸다. 여기에는 △텍스트-이미지 워크플로우를 지원하는 인기 모델 스테이블 디퓨전 XL(Stable Diffusion XL)의 엔비디아 텐서RT(TensorRT) 가속 △생성형 AI 텍스처 툴이 포함된 엔비디아 RTX 리믹스(RTX Remix) △DLSS 3 프레임 제너레이션(Frame Generation)을 사용하는 게임 △엔비디아 ACE 마이크로서비스가 포함된다.

엔비디아 CEO 젠슨 황(Jensen Huang)은 “생성형 AI는 컴퓨팅 역사상 가장 중요한 플랫폼 전환이며 게임을 포함한 모든 산업을 변화시킬 것”이라고 말했다. 엔비디아 지포스 수석 부사장인 제프 피셔(Jeff Fisher)는 “1억 개 이상 출하된 엔비디아의 RTX GPU는 이미 챗GPT 및 스테이블 디퓨전(Stable Diffusion)과 같은 생성 AI 분야에서 중추적인 역할을 하고 있다”고 말했다.

한편 지난 10월 엔비디아는 윈도우용 텐서RT-LLM 라이브러리를 출시해 RTX PC에서 ‘라마 2’ 등 대규모 언어 모델(LLM)을 최대 5배까지 가속화한 바 있다. 또한 이번 달 말 ‘챗 RTX(Chat with RTX)’ 플레이그라운드를 통해 RTX 가속 LLM을 디바이스에서부터 유투브 비디오까지 지원할 예정 중에 있다.

‘챗 RTX’로 사용자는 문서, 메모, 동영상, 기타 데이터 등 자신의 콘텐츠에 연결된 LLM을 개인화할 수 있을 것으로 기대된다. 검색 증강 생성(RAG), 텐서RT-LLM 및 RTX 가속을 활용해 맞춤형 챗봇으로 상황에 맞는 답변을 빠르게 얻을 수 있다는 설명이다. 또한 오픈 소스 참조 프로젝트를 제공받아 자신의 애플리케이션에서 동일한 기능을 쉽게 구현할 수 있다.

■ 지포스 RTX 40 슈퍼 시리즈 3종 공개

CES 2024에서 발표된 ‘지포스 RTX 40 슈퍼(GeForce RTX 40 SUPER) 시리즈’에는 ‘지포스 RTX 4080 슈퍼’, ‘4070 Ti 슈퍼 및 4070 슈퍼’ 3종이 포함된다.

이번에 출시된 제품 3종에서, ‘지포스 RTX 4080 슈퍼’는 4K와 같은 그래픽 집약적인 게임에서 프레임 생성이 없는 RTX 3080 Ti보다 1.4배 빠르다. RTX 4080 슈퍼는 더 많은 코어와 더 빠른 메모리를 갖추고 있다. 1월 31일 출시되며 가격은 999달러로 책정됐다.

‘RTX 4070 Ti 슈퍼’는 더 많은 코어가 추가됐고, 프레임 버퍼를 16GB로, 메모리 버스를 256비트로 늘렸다. 해당 제품은 3070 Ti보다 1.6배 빠르며, DLSS 3에서는 2.5배 빠르다. RTX 4070 Ti 슈퍼는 1월 24일부터 799달러에 출시된다.

‘RTX 4070 슈퍼’는 20% 더 많은 코어를 추가해 RTX 3090보다 더 빠르고 전력 효율성이 뛰어나다. DLSS 3를 사용하면 가장 까다로운 게임에서도 1.5배 더 빠르다. 해당 제품은 1월 17일부터 599달러에 출시된다.

에이서(Acer), 아수스(ASUS), 델(Dell), HP, 레노버(Lenovo), MSI, 레이저(Razer) 및 삼성전자 등 제조업체는 RTX AI 노트북을 출시해 즉시 사용자에게 전체 생성 AI 기능 세트를 제공할 수 있다. 엔비디아는 “NPU(신경 처리 장치)보다 20배~60배 범위의 성능 향상을 제공하는 새로운 시스템은 이번 달에 출시된다”고 말했다.

RTX GPU가 탑재된 모바일 워크스테이션은 텐서RT, 래피즈(RAPIDS™) 등 AI 소프트웨어를 통해 간소화되고 안전한 생성 AI 개발을 수행할 수 있도록 이번 출시된 제품에는 3년 라이선스가 포함된다.

■ AI 모델 구축을 위한 PC 개발자 도구 제공

엔비디아는 AI 모델 구축을 위한 새로운 PC 개발자 도구를 제공한다. ‘AI 워크벤치(Workbench)’는 AI 개발자를 위한 통합 툴킷으로, 개발자가 PC급 성능과 메모리 공간을 사용해 LLM을 신속하게 생성하고 테스트 및 사용자 정의할 수 있도록 한다. 이번 달 말에 베타 버전으로 제공될 예정이다.

AI 워크벤치에는 허깅 페이스(Hugging Face), 깃허브(GitHub) 및 NGC ™와 같은 리포지토리에 대한 효율적인 액세스를 제공한다. 개발자가 프로젝트를 쉽게 재현, 협업 및 마이그레이션할 수 있는 단순화됐다. 데이터 센터, 퍼블릭 클라우드, NVIDIA DGX™ 클라우드 등으로 프로젝트를 확장한 다음 추론 작업을 위해 PC 또는 워크스테이션의 로컬 RTX 시스템으로 다시 가져올 수 있다.

엔비디아는 HP와의 협력해 AI 모델 개발을 간소화한다. 엔비디아 AI 기반 모델 및 엔드포인트를 HP AI 스튜디오에 통합한다. 이를 통해 사용자는 PC와 클라우드 전반에서 최적화된 모델을 쉽게 검색하고 가져오고 배포할 수 있다. 개발자는 PC용 사례에 맞게 AI 모델을 구축한 후, 엔비디아 텐서RT로 최적화해 RTX GPU의 텐서 코어의 이점을 최대한 활용할 수도 있다.

#AI #GPU #생성AI #엔비디아

김예지 기자lucy@e4ds.com

기사 전체보기

관련뉴스

엔비디아, 한국 LLM 개발자 데이 온라인 개최

엔비디아가 12월4일 월요일 오후 2시부터 5시까지 온라인으로 국내 LLM 개발자들을 위한 ‘한국 LLM 개발자 데이(Korea LLM Developer Day)’를 개최한다.

2023-11-27 13:31:49by 배종인 기자

2026년 HBM4 출시…“GPU 위에 HBM 올린다”

처리 속도를 혁신적으로 끌어올리기 위해 등장한 ‘HBM(High Bandwidth Memory)’은 여러 개의 D램을 TSV(실리콘 관통 전극) 기법으로 수직 연결한 고대역폭 메모리다. HBM 시장은 삼성전자와 SK하이닉스가 양대 산맥을 차지하고 있으며, 마이크론이 이를 뒤쫓고 있다. 트렌드포스에 따르면 지난해 글로벌 HBM 시장 점유율은 SK하이닉스가 50%, 삼성전자(40%), 마이크론(10%)으로 나타났다. 2026년 엔비디아 및 아마존, 구글, MS 등과 같은 클라우드 서비스 제공사(Cloud Service Provider, CSP)의 수요에 맞춰 출시될 HBM4는 지금의 반도체와는 다른 방식이 도입된다.

2023-11-30 16:53:35by 김예지 기자