온디바이스 AI 반도체 개발에 집중하는 딥엑스가 지난 CES 2024에서 세계적 주목을 받은 데 이어 초거대 AI를 온디바이스 AI 칩에서 구현하기 위한 도전을 선언하며 미래 비전을 제시했다.
▲딥엑스는 생성형 AI를 상용화하는 데 결정적인 기술로 ‘거대 AI의 연합 구동(Federated Operation of LLM)’이라 정의하고 핵심기술로 개발할 계획이다.(이미지:딥엑스)
딥엑스, 70여 글로벌 기업과 기술 협업 중
‘거대 AI의 연합 구동’ 핵심기술 개발 계획
5W 이하서 초거대 AI 구동 가능한 칩 구상
온디바이스 AI 반도체 개발에 집중하는 딥엑스가 지난 CES 2024에서 세계적 주목을 받은 데 이어 초거대 AI를 온디바이스 AI 칩에서 구현하기 위한 도전을 선언하며 미래 비전을 제시했다.
AI 반도체 팹리스 기업 딥엑스는 생성형 AI의 상용화를 가능케할 기술로 ‘거대 AI의 연합 구동(Federated Operation of LLM)’개념을 제시하며 기술 개발에 나서는 한편, 2월 말에 열리는 MWC 2024 참가해 글로벌 협력사와의 제휴를 확장할 계획이라고 6일 밝혔다.
현재 국내 및 유럽 이동통신사, 글로벌 데이터센터 기업들과 제휴를 맺고 네트워크 및 클라우드 시스템과의 호환성 및 최적화를 추진 중에 있다고 전했다.
딥엑스는 지난 CES 2024에서 1세대 온디바이스 AI 반도체 기술을 선보이며 3개 부문의 CES 혁신상 수상, 5,000명 이상의 관람객이 부스를 방문한 것으로 전해진다. 아울러 고객사 기술 협력 프로그램인 EECP의 고객 수가 두 배로 늘며 글로벌 협력 기업 70여개를 달성했다.
향후 딥엑스는 서버의 초거대 AI와 온디바이스의 거대 AI를 연합구동하는 기술을 개발해, 개인화 기기에서 지능은 초거대 AI의 수준으로, 전력은 수 와트로 구동할 수 있는 온디바이스 AI 반도체를 내년 하반기에 선보일 예정이라고 밝혔다.
이러한 배경에는 작은 크기의 AI 모델뿐만 아니라 거대언어모델(LLM) 및 생성형 AI와 같은 초거대 AI를 널리 보편화할 수 있는 근본적인 솔루션은 온디바이스 AI이라는 점이 대두되고 있기 때문이다.
최근 챗GPT, 제미나이 등 LLM 서비스를 위해 엔비디아의 GPGPU 기반 솔루션이 가장 가성비 높은 솔루션으로 주목받고 있지만 거대 AI 모델의 상용화가 확대됨에 따라 전세계에서 소모되는 GPU의 전력 에너지가 한 나라의 전력 에너지를 넘어서는 수준에 이르렀다.
이에 마이크로소프트, 아마존, 메타, 구글, 오픈AI 등은 GPU를 대체하고 자사의 AI 알고리즘 수행에 최적화된 자체 칩을 제작하는상황이다.
딥엑스는 자사의 AI 반도체 원천기술이 온디바이스에서 AI 구동 시 고성능, 저전력, 경제성을 최적화하는 데 강점이 있다고 강조한다. 이와 같은 강점으로 딥엑스는 생성형 AI를 상용화하는 데 결정적인 기술로 ‘거대 AI의 연합 구동(Federated Operation of LLM)’이라 정의하고 핵심기술로 개발할 계획이다.
이 기술을 통해 서버의 초거대 AI와 온디바이스의 거대 AI 모델간 협력을 완성한다면 데이터센터에만 의존하는 것보다 에너지 소모, 탄소 배출 및 비용을 작게는 10배에서 1000배까지도저감할 수 있을 것으로 딥엑스는 기대했다.
김녹원 대표는 “올해 하반기부터 양산되는 4개의 AI 반도체로 구성된 1세대 제품을 통해 글로벌 시장 공략을 본격화하면서 AI Everywhere 시대를 열어가겠다”며 “후속으로 5W 이하에서 초거대 AI 수준의 인공지능 서비스가 가능한 신기술을 개발해, 챗GPT로 촉발된 거대 인공지능 기술에서 핵심기술을 제공하고 이를 통해 글로벌 시장을 선도하는 종합 AI 반도체 회사가 되겠다”고 밝혔다.