대규모 언어 모델과 AI음성 기술을 통해 AI서비스가 구현되고 있다. 엔비디아가 관련 분야 서비스를 출시한 가운데 생태계 조성에 박차를 가하고 있다.
▲LLM과 음성 AI 주제로 온라인 개발자 밋업 개최(이미지:엔비디아)
엔비디아 LLM 서비스 네모·다국어 음성 AI 리바
대규모 언어 모델과 AI음성 기술을 통해 AI서비스가 구현되고 있다. 엔비디아가 관련 분야 서비스를 출시한 가운데 생태계 조성에 박차를 가하고 있다.
AI 컴퓨팅 기술 기업 엔비디아가 대규모 언어 모델(LLM)과 음성 AI(Speech AI)를 주제로 엔비디아(NVIDIA) AI 개발자 밋업을 17일 온라인으로 개최한다고 11일 밝혔다.
이번 밋업에서는 대규모 언어 모델과 음성 AI로 글로벌 기술 트렌드, 솔루션 업데이트, 핸즈온 데모와 모범 사례를 알아본다.
개발자 밋업은 기술에 관심이 있다면 누구나 무료로 참여 가능하며, 사전 등록자에게는 △발표 자료 및 영상 △샘플 코드 △라이브 데모가 공유된다.
■대규모 언어 모델(LLM)
대규모 언어 모델은 모든 애플리케이션뿐만 아니라 헬스케어, 로보틱스 등 다양한 분야에서 빠르게 성장하고 있다. 지난 2021년 엔비디아는 메가트론(Megatron) 530B 대규모 언어 모델을 발표했다. 이는 새로운 도메인 및 언어에 대해 교육할 수 있는 맞춤형 대규모 언어모델이다.
여기에 지난해 9월, GTC에서 엔비디아는 네모(Nemo) 대규모 언어 모델 서비스를 소개했다. 엔비디아가 관리하는 클라우드 서비스로, 대규모 언어 모델의 크기 및 복잡성 증가함에 따라 최대 30%의 훈련 속도 향상을 제공한다.
이외에도 엔비디아는 대규모 언어 모델 개발 및 추론을 위한 다양한 프레임워크를 지원한다. 따라서 이번 개발자 밋업을 통해 전 세계 기업들의 다양한 활용 사례를 알아보고, 엔비디아 대규모 언어 모델을 구현 및 추론하는 방법을 배울 수 있을 것으로 기대된다.
■다국어 음성 AI를 위한 리바(Riva)
엔비디아 리바는 음성 AI 애플리케이션을 구축하고 배포하기 위한 GPU 가속 소프트웨어 개발 키트이다. 지난해 9월, GTC에서 엔비디아는 엔비디아 리바에 새로운 추가 기능을 발표했다. 리바는 한국어를 포함해 다양한 언어로 제공되며, 단어 수준 신뢰도 점수와 오디오 스트림에서 화자를 식별하는 화자 분할(diarization)과 같은 기능이 추가됐다.
리바는 음성 AI 파이프라인의 모든 단계에서 완전히 사용자 지정할 수 있도록 구축돼 고유한 문제를 효율적으로 해결할 수 있도록 돕는다. 개발자는 온프레미스, 엣지, 임베디드 디바이스 등 원하는 데이터 위치에 배포할 수 있고, 기업은 서비스, 효율성, 경쟁력을 강화하는 데 사용한다. 또한 엔비디아 리바로 기업은 큰 규모의 딥 러닝 모델을 탐색하고, 보다 세밀한 음성 시스템을 개발할 수 있다.
이번 개발자 밋업을 통해 참여자들은 복잡한 음성 AI 파이프라인과 한국어 음성 AI 애플리케이션 구축을 위한 엔비디아 가속화 솔루션을 만나볼 수 있다.
한편, 이번 AI 개발자 밋업은 17일 오후 2시부터 5시까지 온라인으로 진행된다.
등록 페이지에서 등록 가능하다.