딥 러닝에는 컴퓨팅 리소스가 많이 소모되며, 따라서 학습 시간을 줄이는 분산 학습 기술이 사용된다. 그러나 분산 학습 기술도 대용량 모델을 여러 컴퓨터에서 동시에 실행하면 통신 병목 현상이 발생하는 한계가 있었다. 이에 ETRI가 딥 러닝 분산 학습에 최적화된 고속 처리 기술을 개발했다고 밝혔다. ETRI가 개발한 메모리 박스 공유기억장치는 분산 학습 시 발생하는 통신 병목현상을 해소함으로써 학습 시간을 단축시켰다. 이 기술을 적용하면 학습하는데 일주일이 걸리던 AI 모델을 같은 환경에서 1~2일 만에 학습할 수 있다.
| 같은 환경 속 통신량 줄여 AI 학습 속도↑
| 초보 개발자도 쉽게 AI 모델 생성 가능
| 국내 개발자용 딥 러닝 대시보드 개발
딥 러닝은 컴퓨터가 사람처럼 생각하고 배울 수 있도록 하는 기술이다. 하지만 컴퓨터 역시 대규모 영상, 이미지, 음성 등의 데이터나 모델을 학습하는 데는 많은 시간이 걸린다.
대규모 데이터를 처리하려면 여러 대의 컴퓨터를 활용해 학습 시간을 줄이는 분산 학습 기술이 사용된다. 하지만 분산 학습 기술도 대용량 모델을 여러 컴퓨터에서 동시에 실행하면 통신 병목 현상이 발생하는 한계가 있었다.
이를 해결하는 방법 중 하나는 컴퓨터의 계산 및 처리 능력을 담당하는 CPU나 GPU의 성능을 높이는 것이다. 그러나 이 방법은 장비를 계속 업그레이드해야 하는 등, 비용 부담이 크다.
국내 연구진이 이에 AI 학습시간을 1/4로 줄이는 컴퓨팅 기술을 개발하는데 성공했다.
▲최용석 책임연구원이 서버에
메모리박스를 장착하고 있다 (사진=ETRI)
한국전자통신연구원(ETRI)이 10일, 딥 러닝 분산 학습에 최적화된 고속 처리 기술을 개발했다고 밝혔다. 이 기술을 적용하면 학습하는데 일주일이 걸리던 AI 모델을 같은 환경에서 1~2일 만에 학습할 수 있다.
ETRI는 '메모리 박스(Memory Box)' 라 불리는 공유기억장치를 개발해 분산 학습 시 발생하는 통신 병목현상을 해소함으로써 학습 시간을 단축시켰다. 메모리 박스는 컴퓨터들 중간에 위치해 각 컴퓨터들이 학습한 것을 서로 공유하도록 돕고 통신량을 줄여준다.
따라서 대대적인 장비 교체 없이 최소 투자로 동일한 환경에서 딥 러닝 학습 시간을 대폭 줄일 수 있다. 특히, 하드웨어와 소프트웨어 형태를 모두 제공할 수 있어 수요자 맞춤형 기술 이전이 가능하다.
메모리 박스를 이용해 1,000가지 종류의 이미지 128만 장을 분류하는 모델을 1만 번 반복 학습하는 실험을 진행한 결과, 기존 서버 방식이 16분 23초가 걸린 반면 이 기술을 이용한 방식은 7분 31초가 걸렸다.
전용 GUI 제공하는 딥 러닝 대시보드 개발
아마존, 구글, MS 등 글로벌 IT 기업들은 자사 소스코드를 공개하거나 대규모 컴퓨팅 자원을 클라우드 형태로 제공하며 개발자들을 유인하고 AI 컴퓨팅 인프라 시장의 점유율을 높여왔다.
이로 인해 AI을 연구하는 국내 기업이나 기관들은 외국 기업들의 서비스에 의존하거나 많은 비용을 들여 자체 서버를 구축해야 했다.
▲ETRI 연구진이 딥 러닝 대시보드에서 AI 모델
학습 후 속도를 측정하고 있다 (사진=ETRI)
이에 ETRI 연구진은 국내 개발자들이 손쉽게 딥 러닝 연구를 진행할 AI 컴퓨팅 환경을 제공하기 위해 '딥 러닝 대시보드'도 개발했다.
연구진이 개발한 대시보드는 GUI를 제공하므로 개발자들이 코드를 하나하나 입력할 필요가 없다. 덕분에 학습시간은 물론 모델 개발 시간을 단축시키는데도 도움을 준다. AI 개발에 주로 쓰이는 텐서플로(TensorFlow)나 카페(Caffe) 프레임워크도 지원하여 대시보드 상에서 개발한 그래픽 모델을 학습할 수 있다.
이 기술은 해상도가 높은 의료 영상 분석이나 방대한 이미지 분석 등 딥 러닝 및 AI이 필요한 다양한 산업 분야에서 활용이 가능하다. 특히, 컴퓨팅 환경이 열악한 중소기업, 학교, 스타트업에서 활용한다면 개발 시간과 비용을 절약할 수 있다.
현재 두 개의 중소기업이 메모리 박스 기술을 이전받아 연구소기업 설립을 추진 중이다. 연구진은 해당 기업을 통해 내년 상용화를 목표로 하고 있다.
사업책임자인 ETRI AI연구소 최완 책임연구원은 "글로벌 기업이 독식하고 있는 AI 컴퓨팅 인프라 시장을 우리 기술로 대체하고, 고난이도 딥 러닝 기술과 독자적인 AI 슈퍼컴퓨팅 시스템을 개발하는데 도움이 되기를 바란다"고 밝혔다.