국내 연구진이 1초에 약 5,000조회의 연산이 가능한 인공지능(AI) 학습과 추론을 가속할 수 있는 시스템을 개발해 자율주행, 클라우드, 데이터센터 등 대규모 AI 서비스에 활용 될 것으로 기대된다.
▲ETRI가 개발한 NPU보드가 서버노드에 집약되어 있는 모습
고성능·저전력 AI 반도체 탑재, 성능 4배·효율 7배 ↑
자율차·클라우드·데이터센터 등 대규모 AI서비스 활용
국내 연구진이 1초에 약 5,000조회의 연산이 가능한 인공지능(AI) 학습과 추론을 가속할 수 있는 시스템을 개발해 자율주행, 클라우드, 데이터센터 등 대규모 AI 서비스에 활용 될 것으로 기대된다.
한국전자통신연구원(ETRI)은 고성능 AI 반도체 칩을 활용해 낮은 전력으로 초당 약 5,000조회 연산이 가능한 인공지능 시스템을 개발했다고 2일 밝혔다.
ETRI는 작년 NPU 기반 AI 반도체 칩, AB9(알데바란9)을 공개한 데 이어 올해 AB9 기반 보드와 인공지능 시스템을 개발하는 데 성공했다.
자율주행차, 클라우드, 데이터센터, 사람·사물·음성 인식 등 AI 응용 서비스를 제공하는 고성능 서버에 본격적으로 활용하기 위함이다.
연구진이 개발한 NPU 보드 ‘ABrain-S’는 AB9을 기반으로 독자적인 설계를 이뤄 부피가 작으면서도 전력 소모가 낮다.
인공지능 알고리즘 처리를 위해 입출력 데이터를 16GB까지 저장할 수 있는 메모리와 데이터 이동 속도를 빠르게 하기 위한 인터페이스도 적용했다.
고성능·고효율 서버를 구현하기 위해서는 NPU 보드를 최대치로 고집적화하는 것이 핵심이라고 연구진은 전했다.
AB9이 내장된 NPU 보드는 한 서버 노드에 최대 20개씩 장착 가능하다.
기존 시스템 대비 공간·전력효율을 개선하면서 가격도 낮췄다.
AB9이 동전 크기의 작은 면적에 초당 40조 회 연산 성능을 내면서도 전력 소모가 15W 수준으로 매우 낮기 때문이다.
이를 바탕으로 ETRI는 서버 노드 8개를 쌓아 랙 서버(Rack Server) 형태로 구성된 인공지능 시스템, 아트브레인(ArtBrain-K)을 만들었다.
개발된 시스템은 최대 5페타플롭스(PetaFLOPS) 성능을 발휘한다.
서버 1개당 1초에 약 5천 조 회 연산이 가능한 셈이다.
기존 GPU 기반 인공지능 서버 대비 약 4배의 연산 성능과 7배의 전력효율이다.
아트브레인이 데이터센터 등에 적용되면 처리 용량과 속도가 대폭 개선된다.
따라서 트랜스포머 계열 인공지능 알고리즘 등 초거대 인공신경망(Huge Neural Network)과 같이 데이터 처리와 학습에 엄청난 컴퓨팅 자원이 필요한 곳에 활용될 전망이다.
이 밖에도 ETRI는 AI 알고리즘을 쉽게 개발할 수 있도록 SW 개발환경도구 ‘AIwareRT’를 깃허브(Github)에 공개했다.
프로그래밍에 필요한 기본적인 구조와 알고리즘, 시뮬레이터, 최적화 도구 등을 라이브러리 형태로 제공해 프로그래밍 언어에 생소한 사람들도 쉽게 사용해볼 수 있게 구성했다.
ETRI 한진호 인공지능프로세서연구실장은 “AI 반도체 자체 개발로 비메모리 반도체 분야 원천기술을 보유하고 있다. AI 반도체를 탑재한 NPU 보드와 NPU 서버시스템 및 관련 SW까지 개발하여 우리가 개발한 기술의 경쟁력을 높이는 데 성공했다”고 말했다.
현재 본 기술은 반도체 기업 및 AI 하드웨어 기업 등에 기술을 이전해 공항 자동 출입국 시스템에 적용되어 얼굴인식 및 출입국 보안에 활용되고 있다.