
▲브라이언 카탄자로 엔비디아 응용 딥러닝 연구 부문 부사장이 기조연설을 하고 있다.
네모트론, 개발자·기업 AI 특화 동시 데이터·기술 주권 유지
하드웨어 설계 직접적 영향, 에너지 효율·성능 동시 끌어올려
엔비디아가 인공지능(AI) 시대의 핵심 가치로 ‘효율’을 전면에 내세우며 개방형 대규모언어모델(LLM) 전략을 강화하고 있다.
브라이언 카탄자로(Bryan Catanzaro) 엔비디아 응용연구 부문 부사장은 21일 서울 마포구 디캠프에서 열린 ‘엔비디아 네모트론 디벨로퍼 데이즈 서울 2026’ 기조연설에서 “효율은 곧 지능이며, 한정된 컴퓨팅 자원으로 더 높은 수준의 인공지능을 구현하는 것이 관건”이라고 강조했다.
Catanzaro 부사장은 AI 발전 단계를 대화형 모델, 추론 모델, 그리고 에이전트로 이어지는 진화 과정으로 설명했다.
에이전트는 단일 모델을 넘어 기억, 멀티모달 입력, 파일·메시징 도구 접근, 컴퓨터 사용 능력 등을 결합한 시스템으로, 개인의 생산성과 문제 해결 능력을 비약적으로 확장한다는 설명이다.
그는 “각 개인이 자신의 연구소를 운영하는 CEO가 되는 시대”라고 표현했다.
이 같은 변화의 중심에 엔비디아의 개방형 LLM 패밀리인 ‘네모트론(Nemotron)’이 있다.
Catanzaro 부사장은 AI가 더 이상 단일 모델로 작동하지 않으며, 복수의 모델과 시스템이 결합되는 구조로 발전하고 있다고 진단했다.
이에 따라 사전학습, 사후학습, 추론 단계, 그리고 에이전트 운용까지 네 가지 ‘스케일링 법칙’이 동시에 작용하며 컴퓨팅 수요를 폭발적으로 끌어올리고 있다고 설명했다.
그는 “컴퓨트가 곧 지능이며, 효율이 높아질수록 더 많은 지능을 얻을 수 있다”고 말했다.
네모트론은 이러한 철학에 따라 모델 자체뿐 아니라 학습 데이터셋, 학습 기법, 하이퍼파라미터, 소프트웨어까지 폭넓게 공개하는 개방 전략을 택했다.
이는 개발자와 기업들이 각자의 요구에 맞춰 AI를 특화하고, 동시에 데이터와 기술 주권을 유지할 수 있도록 하기 위한 선택이라는 설명이다.
네모트론은 엔비디아의 하드웨어 설계에도 직접적인 영향을 미친다.
대규모 전문가 혼합(MoE) 모델을 효율적으로 처리하기 위해 초저지연·고대역폭 인터커넥트를 설계했고, 최신 GPU 세대에서는 4비트 수치 표현(NVFP4)을 도입해 에너지 효율과 성능을 동시에 끌어올렸다.
실제로 네모트론-3 계열 모델은 4비트 연산만으로 사전학습이 이뤄졌다는 점이 소개됐다.
이날 행사에서는 네모트론 3 세대의 진척 상황도 공개됐다.
300억 파라미터 규모의 네모트론 나노, 1,200억 파라미터의 네모트론 슈퍼에 이어 초대형 모델 ‘울트라’가 사후학습 단계에 있으며, 이미지·음성·영상·텍스트를 아우르는 멀티모달 추론 모델도 곧 공개될 예정이다.
Catanzaro 부사장은 “네모트론 슈퍼는 긴 맥락 추론과 속도 면에서 경쟁 모델 대비 강점을 입증했다”고 말했다.
한국을 겨냥한 데이터셋 공개도 눈길을 끌었다.
엔비디아는 한국의 인구통계, 언어, 문화 통계를 반영한 700만 개의 합성 페르소나 데이터셋을 공개했다.
실제 분포를 반영하되 개인정보는 포함하지 않은 ‘프라이버시 설계’ 데이터로, 국내 개발자들이 한국 환경에 특화된 AI를 개발할 수 있도록 지원하기 위한 목적이다.
Catanzaro 부사장은 “엔비디아의 목표는 AI를 통제하는 것이 아니라 생태계를 가속하는 것”이라며, 국내 기업과 연구기관과의 협력 의지도 강조했다.
그는 “한국의 AI 모멘텀은 매우 인상적이며, 함께 개방적이고 가속화된 AI의 미래를 만들어가길 기대한다”고 말했다.

▲‘네모트론 디벨로퍼 데이즈 서울 2026’에서는 직접 AI 에이전트를 빌드해 볼 수 있는 데모 현장이 마련됐다.
한편 엔비디아가 개최한 ‘네모트론 디벨로퍼 데이즈 서울 2026’에서는 △OpenClaw & NemoClaw로 나만의 AI 에이전트 직접 빌드 △NVIDIA 전문가와 라이브 데모 △DGX Spark 구매 상담 및 현장 구매 등의 행사를 진행했다.
엔비디아 네모트론 기술팀은 모델 개발, 데이터 구축, AI 에이전트 설계 등 실무 중심의 기술 세션을 통해 참가자들과 소통했다.