1997년 IBM이 개발한 ‘딥 블루’가 인간과의 체스대결에서 이긴 후 그래도 바둑은 힘들 것이라는 전망이 있었다. 그 이유는 체스보다 경우의 수가 훨씬 많고 복잡하기 때문이다. 하지만 지난 1월 19일, ‘e4ds’에서 만난 소프트정책 연구소 김진형 소장(사진)의 말은 달랐다. “인공지능이 바둑도 머지 않아 이길 것이다. 만약에 마음을 먹고 집중적으로 돈을 투자한다면 이기게 될 것이다.”라고 말했다. 그의 “흥분하지도 말고 냉소적이지도 말라” 라는 말로 시작으로 우리나라 인공지능의 현실과 미래를 허심탄회하게 들을 수 있었다.
인터뷰/ 김진형 소프트웨어 정책 연구소 소장
지난 28일 드디어 인공지능이 바둑을 이겼다. 구글에서 개발한 A.I. 프로그램 ‘알파고(AlphGo)는 유럽 바둑 챔피언인 판후이 2단과의 5번 경기에서 모두 이겼다. 이 성과는 세계적인 학술지 네이처에 실리기도 했으며 이에 구글은 우리나라 이세돌 9단에게 도전장을 냈고 곧 3월에 대국을 펼칠 예정이다.
1997년 IBM이 개발한 ‘딥 블루’가 인간과의 체스대결에서 이긴 후 그래도 바둑은 힘들 것이라는 전망이 있었다. 그 이유는 체스보다 경우의 수가 훨씬 많고 복잡하기 때문이다. 하지만 지난 1월 19일, ‘e4ds’에서 만난 소프트정책 연구소
김진형 소장(사진)의 말은 달랐다. “인공지능이 바둑도 머지 않아 이길 것이다. 만약에 마음을 먹고 집중적으로 돈을 투자한다면 이기게 될 것이다.”라고 말했다. 그의 “흥분하지도 말고 냉소적이지도 말라” 라는 말로 시작으로 우리나라 인공지능의 현실과 미래를 허심탄회하게 들을 수 있었다.
- 요즘 2016 IT 화두는 단연 인공지능이다. 인공지능에 대한 기술은 일반 대중들에게도 줄곧 영화나 만화로 관심을 끄는 주제였는데 유독 부각되는 이유는 무엇인가.
인간이 컴퓨터를 만든 이유는 ‘자동화’하기 위함이고 인공지능은 ‘생각’을 ‘자동화’ 하겠다고 만든 것이 그 출발점이다. 인공지능이 세상이 나온 지는 70년이 넘었고 대부분 학술적인 분야에서 성과들이 나왔다. 그러나 현재 획기적인 결과들이 나오면서 일상생활에 적용할 수 있게 된 것이다.
하지만 인공지능의 붐은 이번이 처음이 아니다. 1985년 내가 처음 한국에 들어 올 때도 인공지능에 대한 기대감이 높았다. 현재 나는 이런 분위기를 흥분하지도 말고 냉소적으로도 보지 않았으면 좋겠다.
- 기술의 발전에 따라 이슈가 되어 왔던 것 인가.
그렇다. 1970년에 전문가 시스템이 개발되면서 붐이 일었다. 하지만 그 이후 괄목한 성과를 내지못해 연구와 투자들이 내리막길로 들어섰다. 본격적으로 인공지능의 날개가 돋친 건 90년대 이후다. 컴퓨터 파워가 급속도로 좋아졌기 때문이다. 1970년대 이후에도 지금과 같은 컴퓨터 파워가 있었다면 지금의 기술들을 구현할 수 있었을 것이다.
기술이 발전하지 않았다는 것은 아니지만 핵심적인 기술을 오래 전부터 알고 있었다. 컴퓨터의 성능이 그만큼 따라오지 못했다. 예전에는 하나를 인식하려면 며칠이 걸려서 가능했다.
그 다음은 데이터 파워이다. 데이터의 양이 엄청나게 늘어났다. 음성 인식을 개발 할 때 음성 데이터를 분석하여 일정의 형태를 알아내야 한다. 만약 ‘한국’이라는 발음을 할 때 무수한 발음의 데이터를 통해 이를 훈련시켜 발음이 서툴고 발음이 새도 인식할 수 있게 되었다. 이것을 ‘범용성’이라고 한다. 마지막으로는 ‘Cloud(클라우드)’라는 무한한 저장 공간이다. 컴퓨터가 없는 곳에서도 저장이 가능하기 때문에 막대한 데이터의 양을 저장하여 컴퓨팅 파워를 사용할 수 있게 되었다.
판교에 위치한 ‘소프트웨어정책연구소(SPRI)’ 사무실
컴퓨터 파워, 클라우드, 빅데이터의 삼박자 발전이
인공지능 붐을 다시 일으켜
- 인공지능은 크게 지식처리와 신호처리로 나누던데.
신호처리는 센서로부터 들어오는 데이터 즉 카메라, 음성, 냄새 등을 인식해서 상황을 인지하고 그것을 신호처리 해서 기호로 만든다. 그리고 윗단에서는 기호를 조합해서 지식처리를 하는 것이다. 이 두 단계가 부드럽게 이어지는 것이 인공지능의 궁극적인 목표이다.
하지만 어렵다. 이유는 목적이 다르기 때문이다.
신호처리는 음성인식을 ‘어떤 말을 했다.’로 인식하는 과정이다. 하지만 이후에 기호로 바꾸어 지식처리 단계가 되면 문장이 무슨 의미인지 해석하고 어떤 대답을 해야 하는데 이 과정은 별개의 문제이기 때문이다.
두 가지 방법이 인공지능이지만 접근 방식이 다르기 때문이 자연스럽게 연결 하는 것이 어렵다. 그러나 일반 사람들은 이 두 가지 방식을 한꺼번에 처리한다. 정보를 인식, 획득하고 행동을 결정짓는다. 현재 아이폰의 시리(Siri)가 신호처리 대부분과 지식처리 방식이 조금 가미된 것이다. 하지만 알다시피 수준이 낮다.
- 일상 생활에 쓰일 수 있을 정도로 기술이 발전했다고 하지 않았나.
번역 시스템은 아주 잘 발달되어 있다. 현재 91개의 언어가 가능하다. 현재 한국어를 하는 사람이 영어를 번역하여 말할 순 있지만 힌디어를 몽골어로 번역하는 사람은 흔하지 않을 것이다. 거의 없다고 보면 된다. 하지만 컴퓨터는 가능하다. 물론 완벽한 것은 아니지만 어느 정도 의미를 파악할 수 있는 수준까지 왔다. 평창 올림픽에는 이런 번역 서비스가 들어가려고 준비 중이다. 서비스의 단계는 간단하게 이루어질 것 같다.
또한 지식과 원칙, 원리의 발견도 가능하다. 이외에도 질의응답 시스템, 추천 시스템 등 일상적으로 쓰이는 인공지능 기술은 많다. 가장 극적인 사건은 2011년 IMB 챌린지에서 왓슨(Whatson)이 사람과의 대결에서 퀴즈대회를 우승한 것이다. 또한 일본 로봇의 ‘페퍼’가 감정을 읽고 대답하였다. 또한 지봇(G-BOT)은 음식을 만드는데 도움을 준다. 미래는 이미 와 있으며 일반인들도 사용하기 시작한 것이다.
일상생활까지 쓰이는 번역, 질의응답 시스템, 추천시스템은 지식처리
아이폰의 ‘시리(Siri)’는 신호처리+지식처리 혼합이나 아직은 역부족
- 현재의 인공지능의 기술은 어느 정도 인가. 또한 한계는 무엇인가.
예를 들어 음성인식 기술을 개발했다고 했을 때 특정한 사람의 말을 인식하는데 다른 사람들의 말을 인식하지 못하면 음성인식 기술이 100% 가능하다고 말할 수 없다. 일반인이 누구나 말을 알아듣고 이야기할 수 있듯이 인공지능은 ‘범용성’이 중요하다. 만약 길거리는 지나다니는 사람들의 말까지 인식할 수 있냐고 판단한다면 현재는 50%이하의 성공률일 것이다.
- 아직까지는 사람의 능력을 따라잡기는 힘들 것이라는 이야기인가?
사람은 칵테일 파티 효과라고 해서 자신이 필요한 소리만으 잘 들을 수 있는 능력이 있다. 이렇게 인간의 뛰어난 능력은 이성적인 지능과 또 별개이기 때문에 ‘인간과 비슷한 지능’을 구현하기란 쉽지 않을 것이다.
- 현재 인공지능이 강점을 보이는 분야는 지식처리에 관한 부분인 건가.
왓슨도 답을 구하고 대답하는 것까지 했다. 이처럼 지식 처리 같은 경우 한 없이 많은 지식을 판단하고 분석하는 일은 뛰어나다. 만약 나에게 큰 배에 들어가는 어떤 부품을 물어본다면 당연히 대답하지 못한다. 그런 지식들을 도메인 지식(domain knowledge)라고 하는데 주어진 문제 영역에 대한 특별한 지식을 말한다.
궁극적 목표는 ‘범용성’을 가지는 것, 그러나 미지수
‘인공지능’에 대한 경고는 그 분야 전문가들이 아닌 경우 많아
- 빌게이츠나 앨론 머스크는 인공지능의 기술발전을 경고하고 있는데.
우선 빌게이츠는 인공지능 학자가 아니다. 현재 인공지능의 기술은 약점이 많은 기술 중 하나다. 계속 강조했듯이 ‘범용성’을 구현하기 힘들기 때문이다.
퀴즈대회를 우승한 왓슨도 방송하는 시끄러운 환경에서 사회자 말을 인식하는 것이 힘들기 때문에 컴퓨터 파일로 넣어 바로 지식처리를 할 수 있도록 하였다.
엔지니어들은 범용성과 기술의 깊이가 최대의 관심사이다. 밖에 있는 사람들은 한 예만 보고 인공지능이 위협이지 않을까 상상을 한다. 하지만 사람을 흉내내기도 상당히 어렵거니와 사람을 위협하려면 ‘자의식’이 필요하다. 생존하기 위해서 스스로 새로운 목표와 방법론을 찾아야 하는데 기계가 그럴 이유가 있을까 하는 점이다. 자의식이 생명체 아니고도 존재할 하기란 어려울 것이다. 만약 가능하다면 공학 쪽 분야보다 생물학 분야에서 만드는 게 더 빠를 수도 있다.
- 어떤 보고서에 따르면 인공지능을 기반한 산업 자동화를 가장 빨리 도입할 것 같은 나라로 우리나라가 상위권에 랭킹 되어 있는데 선진국은 그에 비해 천천히 도입할 것이라고 예측한 보고서가 있다. 이에 어떻게 생각하시는 지 궁금하다.
아니다. 우리나라는 굉장히 느리다. 어느 대학생이 중고차 앱을 만들어 300억 이상의 수입을 벌어들였다. 하지만 기존 중고차 매매 업자들의 방해로 매장이 있어야 사업이 가능하다는 법을 통과 시켰다. 그 학생은 당장 사업장을 마련할 수 없어 결국 사업을 접어야 했다. 우리나라는 현재 기득권들을 위한 규제가 심하다. 밥그릇 싸움 때문에 기술과 시장 경쟁력을 키우지 못하고 있고 있다. 정말 웃기는 일이다.
이 외에도 정말 많은 경우가 있다. 작년에 폐지된 공인 인증서도 6~7년 동안이나 싸웠다. 그러다 작년 결국 대통령이 나서니 한번에 해결되었다.
우리나라는 아직도 기득권을 위한 ‘빨간 깃발’ 법이 만연해 있어
소프트웨어의 능력을 무력화시켜
마차가 현재 교통수단으로서 기능을 상실한 것처럼 현재 직업은 많이 사라질 것이다. 우리가 낸 연구소 결과 63%정도 없어진다. 사라질 직업 중 하나는 기자도 있다. 올해 3월 LA 지진 기사는 8분만에 쓰여졌다. 인공지능으로 작성한 것이다. 이처럼 스포츠 경기 결과 같은 단순 보도는 인공지능으로 기사 작성이 가능하다.
실은 굉장히 간단하다. 사람이 기사 양식을 만들어 놓고 사실에 기반한 데이터만 집어넣으면 된다. 훈련된 기자가 템플릿을 제작하고 시시각각 변하는 데이터들을 인공지능이 입력하는 것이다. 기업 실적 보고서 등도 마찬가지다. 이런 반복 작업들을 자동화시킬 수 있다. 바로 이런 사회를 소프트웨어 중심사회라고 말할 수 있다.
"영국에서 자동차가 처음 만들어졌을 때 우마차 업자들이 위기의식을 느껴 교통법을 제정했는데 그것은 바로 ‘빨간 깃발 법’이였다.
자동차가 다닐 경우 한 사람이 빨간 깃발을 들고 “자동차요, 자동차요” 하고 사람이 지나갈 수 있도록 해야 한다는 것이었다.
이 법 때문에 자동차는 빨간 깃발을 든 사람보다 먼저 갈 수 없었다. 그 법은 자동차의 능력을 완전히 무력화 시키는 것이다. 이처럼 우리나라에도 빨간 깃발 법이 만연해있다."
- 그렇다면 소프트웨어 정책 연구소가 ‘빨간 깃발 법’ 등을 제정하지 못하도록 하는 것인 것인가.
그렇다. 소프트웨어 관련 보고서들을 계속 발표하며 정부가 소프트웨어 산업 정책을 올바르게 할 수 있도록 고문과 같은 역할을 한다.
- 그 중에서도 민간참여에 대해서 강력하게 주장하시는 것을 다른 인터뷰에서 보았는데.
현재 정부가 소프트웨어를 만들어서 소유한다. 그렇기 때문에 잘 만들고 사용하는 것 그리고 유지, 보수하는 것도 정부 책임이다. 그러나 공무원들을 이 분야에 대해서 너무 모른다.
어떤 프로그램을 만들어라 할 때도 잘 알지 못하는 상태에서 이야기 한다. 그리고 만들면 이거 “이거 아닌데?” 하면서 엔지니어들에게 제대로 된 대우를 해주지 않는다. 그래서 우수한 인재들은 정부에서 일하지 않으려고 한다.
미국이 2020년까지 엔지니어 140만 명이 필요하다. 하지만 40만 명 밖에 공급하지 못한다. 100만 명을 인도, 중국 한국에서 다 충원시킨다. 그렇기 때문에 잘 모르는 정부가 소유하지 말고 민간 참여를 통해 정부가 합당하고 돈을 지불하여 사용하라는 것이다.
국토부가 ‘V월드’라고 지도 서비스를 만들었다. 상도 받고 좋은 평가도 받았다. 하지만 나는 ‘안 된다.’ 라고 말했다. 정부는 데이터만 제공 해야 한다. 일본 같은 경우 벚꽃이 ‘제일 예쁘게 피는 날’ 같은 데이터들을 민간인이 서비스를 제공하여 지식 산업들이 발달하게 되었다.
특허도 마찬가지다. 정부에 특허를 승인 받기 위해 자료들을 제출 한다. 보관만 하면 상관없는데 정부가 민간사업의 서비스를 세금을 들여서 한다.
- 그렇다면 우리나라의 인공지능의 상황은 어떠한가?
인공지능도 마찬가지다. 미국에서 만들었으니 ‘우리나라도 만들 수 있다.’라는 분위기다. 그래서 ETRI에서도 추진 중이다. 문제는 완성했다고 한들 사용자 그룹이 만들어져야 한다. 생태계 조성이 중요하기 때문이다. 그러나 ETRI는 사람을 모을 능력이 없다. 그것을 진작 안 IBM은 왓슨을 공개했다. 생태계 조성을 구축하기 위함인 것이다.
그렇다면 우리도 쓰면 된다. 인공지능이 할 수 있는 서비스를 개발하면 된다. 남의 뒤를 따라는 것은 경쟁력이 없다.
우리나라도 인공지능을 공부하는 사람들이 많아진 건 사실이다. 또한 알고리즘을 공개하기 때문에 들여다 보면 금방 알 수 있을 정도로 경쟁력 또한 있다. 문제는 연구를 통해 부딪히는 어려움들을 극복하기 위해선 집요하게 해야 할 필요가 있는데 투자를 잘 하지 않는다.
- 인재 육성을 일환으로 2017년 초등학생을 위한 코딩 교육도 의무화 하지 않았나?
그렇다. 대학교에서도 시행 중이다. 정부가 소프트 중심 대학을 선정해서 코딩 교육을 시키면 나라에서 비용을 지원해주고 있다. 현재는 성균관대학교 등 몇몇 곳에서 시행 중이다.
컴퓨터 기술 보편화가 이루어짐에 따라 인공지능을 통해 스타트업 기업들도 얼마든지 개발할 수 있게 되었다. 기존에는 거대 IT 기업들이 주도했지만 혁신적인 기술을 개발하는데 부족했다. 그 이유는 대기업들은 산업사회에 익숙하기 때문이다. 자본투자에 의해서 대량생산으로 막대한 수익을 챙겨야 한다.
하지만 이미 소프트웨어 산업은 기존의 경제학으로는 설명 못한다. 숙박공유사이트 AirBnB(에어비엔비)가 시가 총액 250억불이다. 전세계에 있는 부동산기반의 하얏트 (Haytt) 호텔은 83억불이다. 심지어 에어비엔비는 상장도 안되었다.
초등학교 코딩 의무화, 소프트 중심 대학 선정을 통한 지원
그러나 창업 육성 정책은 엉터리
- 현재 정부에서 스타트업 육성 정책들이 지원되고 있는 것으로 알고 있는데.
맞다. 하지만 지금의 스타트업 육성 정책은 변화해야 한다. 능력 부족의 젊은 사람들에게 창업하라고 꼬드기고 있기 때문이다. 그래서 요즘 졸업하지 않거나 능력도 되지 않은 학생들이 창업한다고 난리다.빌게이츠가 대학교 중퇴 후 회사를 차렸지만 그는 고등학교 때 이미 대학 수준의 지식과 능력을 갖춘 상태였다.
- 마지막으로 대한민국이 인공지능 경쟁력을 키우기 위해서 해야 할 일들은 무엇인가.
소프트웨어의 능력은 컴퓨터 하드웨어 파워, 클라우드, 데이터에 달려있다. 그렇기 때문에 연구하는 분들이나 중소기업에서도 인공지능을 개발할 수 있도록 컴퓨팅 파워를 맘껏 사용할 수 있는 환경을 제공하는 것이 첫 번째이다.
두 번째로는 막대한 양의 데이터를 모아주는 것이다. 인공지능은 데이터가 많을수록 성능은 좋아진다. 이는 국가 차원에서 같이 도와주어야 데이터파워 활용을 통한 개발이 쉽게 이루어 질 수 있다. 마지막으로 정확한 목표 설정이 필요하다.
데이터 수집을 하더라도 수집 목적이 불분명하다면 많은 데이터도 쓸모 없게 된다. 인공지능을 통해 ‘어떤 문제’를 해결한 것인가에 대한 심도 있는 접근이 필요하다. 이를 통해 데이터를 모으고 컴퓨팅 파워를 이용하여 알고리즘을 만들면 우리나라도 충분히 경쟁력이 생길 것이다.