KAIST 산업및시스템공학과 이재길 교수 연구팀이 향후 2주간의 코로나19 해외유입 확진자 수를 예측할 수 있는 기술을 개발했다. 이 기술은 해외 각국의 확진자 수, 사망자 수, 코로나19 관련 키워드 검색빈도, 한국으로의 일일 항공편 수, 한국으로의 로밍 고객 입국자 수 등 빅데이터에 AI 기술을 적용해 해외유입 확진자 수를 예측한다.
KAIST, AI 모델 Hi-COVIDNet으로
향후 2주간 해외 유입 확진자 수 예측
전 세계적으로 코로나19 확진자 수가 2,000만 명을 넘어선 가운데, 국내 연구진이 해외유입 확진자 수를 예측할 수 있는 관련 기술을 개발했다.
▲ 코로나19 해외유입 확진자 수 예측 방법 [그림=KAIST]
한국과학기술원(KAIST) 산업및시스템공학과 이재길 교수 연구팀은 19일, 향후 2주간의 코로나19 해외유입 확진자 수를 예측할 수 있는 빅데이터‧AI 기술을 개발했다고 밝혔다.
이번 연구는 데이터 마이닝 분야 국제 학술대회인 'ACM KDD 2020'의 'AI for COVID-19' 세션에서 'Hi-COVIDNet: Deep Learning Approach to Predict Inbound COVID-19 Patients and Case Study in South Korea'라는 제목으로 24일 발표됐다.
연구진은 해외 각국의 코로나19 위험도를 산출할 때, 기본적으로 보고된 확진자 수와 사망자 수를 활용했다. 그러나 이러한 수치는 진단검사 수에 좌우되기 때문에, 코로나19 관련 키워드 검색 빈도를 같이 입력 데이터로 활용해 해당 국가의 코로나19 위험도를 실시간 산출했다.
이와 함께 실시간 입국자 수는 기밀정보로서 외부에 공개되지 않기 때문에 매일 제공되는 한국에 도착하는 항공편 수와 로밍 고객 입국자 수를 통해 유추했다. 로밍 고객 입국자 수 데이터는 KT로부터 받았지만, KT 고객 입국자만을 포함한다는 한계를 일일 항공편 수를 함께 고려함으로써 해소했다.
이밖에 해외유입 확진자 수 예측을 위해서는 국가 간의 지리적 연관성도 고려해야 한다.
연구팀은 지리적 연관성을 학습하도록 국가-대륙으로 구성되는 지리적 계층구조에 따라 우선 각 대륙으로부터의 해외유입 확진자 수를 정확히 예측함으로써 궁극적으로 전체 해외유입 확진자 수를 정확히 예측하도록 하는 AI 모델 ‘Hi-COVIDNet’을 설계했다.
연구팀은 약 한 달 반에 걸친 단기간의 훈련 데이터만으로 생성된 Hi-COVIDNet을 통해 향후 2주 동안의 해외유입 확진자 수를 예측했다. 그 결과, 이 모델이 기존의 시계열 데이터 기반의 예측 기계학습이나 딥러닝 기반의 모델과 비교했을 때 최대 35% 더 높은 정확성을 지니고 있음을 확인했다.
이번 연구는 KAIST 글로벌전략연구소 코로나19 AI 태스크포스팀의 지원, KT와 과학기술정보통신부의 코로나19 확산예측 연구 얼라이언스를 통한 로밍 데이터 세트 지원을 받아 이뤄졌다.