[편집자주]인공지능(AI) 기술이 점차 고도화되며 상용화 추세가 뜨겁다. 자율주행이 그간 상당한 주목을 받았고 현재도 트렌드 중심에 있지만 △안면인식 △객체감지를 이용한 서비스 △AI챗봇 등 다양한 서비스가 고도화되면서 시장에서 존재감을 드러내고 있다. 이에 인공지능 전문가 AMC PLANET 김현석 대표를 만나 컴퓨터 비전을 활용한 화재감지솔루션에 묻고 관련 시장 전망과 인공지능 개발에 관한 이야기를 들어봤다.
“AI, Framework 형태로 진화”…노코드 AI 미래
AI 테크 콘서트서 화재감지 AI 기술 발표 예정
[편집자주]인공지능(AI) 기술이 점차 고도화되며 상용화 추세가 뜨겁다. 자율주행이 그간 상당한 주목을 받았고 현재도 트렌드 중심에 있지만 △안면인식 △객체감지를 이용한 서비스 △AI챗봇 등 다양한 서비스가 고도화되면서 시장에서 존재감을 드러내고 있다. 이에 인공지능 전문가 AMC PLANET 김현석 대표를 만나 컴퓨터 비전을 활용한 화재감지솔루션에 묻고 관련 시장 전망과 인공지능 개발에 관한 이야기를 들어봤다.
▲
김현석 AMC PLANET 대표
■ 현재 기술이 시장에서 어느 정도 수준에 위치해 있다고 평가하는가
2022년 9월 기준으로 지금까지 본 논문을 보면 우리나라에서 나온 것은 그때까지만 해도 인식률이 97∼98% 정도였다.
저희 같이 99% 이상의 인식률을 나타내는 것은 그때까지는 없었다. 4, 5개월 지났기에 지금은 모르겠다.
■ 1, 2%의 인식률 차이도 엄청난 건가
엄청나다. 이거는 화재 위험이지 않는가? 0.1%도 사실 위험한 것이다.
■ 화재감지솔루션, 안면인식 등 컴퓨터 비전에 핵심이 되는 것이 바로 객체탐지기술인가
일단 화재감지솔루션은 객체 탐지가 맞다. 객체 탐지는 정확하게 얘기하면 사진 전체를 보고 사전에 라벨링 과정을 거친다. 라벨 툴을 이용해 학습 가능한 형태로 가공해서 인공지능에 인식을 시키고, 이런 형태의 피처가 나오면 너는 이것을 우리가 지정한 오브젝트로 인정을 해달라, 그렇게 해서 계속 학습을 시키는 것이다. 여러 종류의 사진을 보지만 이것은 인공지능 특징을 계속 학습하는 것이다.
신경망에는 모바일넷(MobileNet)이라든가 레즈넷(ResNet)이 있는데 이것을 기준으로 설명드리자면, 모바일넷 같은 경우는 굉장히 적은 파라미터를 가지고 있다. 약 500만 개에서 1,000만 개 정도의 파라미터가 있고 레즈넷 같은 경우는 3,000만 개에서 8,000만 개 정도의 파라미터가 있다.
작게는 500만 개, 크게는 8,000만 개에 대한 파라미터들이 서로 조합을 한다. 이 사진 혹은 이 영상에서 이 부분은 우리가 지정한 오브젝트라고 8,000만 개가 다 훈련된 결과를 가지고 결과를 내보내는 게 그게 이제 오브젝트 디텍트(객체탐지)가 되는 것이다.
그 다음에 레코그니션(recognition, 인식)은 좀 다른 얘기이다.
일단 먼저 탐지를 해야 된다는 건 맞다. 탐지 먼저 해야 되는 것이고 그 다음에 화재 감지 같은 경우는 객체 탐지로 끝날 수 있는 범위이기 때문에 네트워크를 작게 만들 수 있다.
그러나 안면 인식 같은 경우는 객체를 일단 먼저 탐지해야 되고 그 다음에 거기서 얼굴 자체의 특징(피처)을 더 세분화해야 된다. 지정된 점을 더 세분화해서 별도의 네트워크를 통해서 인식을 하게끔 만들어야 된다.
피처를 종합해서 봤을 때 “아 이거는 A라는 사람이다”라는 인식이 확률적으로 접근이 돼야 인식을 할 수가 있는 것이다.
■ 객체탐지기술 구현에 있어서 주의해야 할 점은 무엇인가
피플 카운팅을 하게 될 경우에는 객체 탐지를 먼저 한다. 그러면 화면 속 사람들을 따라가야 한다. 이때 사각형이 쭉 따라간다.
이때 AI 개발을 처음 시작하거나 중급 정도 되는 AI엔지니어들이 하는 실수가 화면 하나하나만 인식을 한다는 점이다. 하나만 인식을 하면 객체는 계속 탐지가 된다. 그래서 이걸 연속적으로 쭉 보면 따라가는 것처럼 보인다. 보이는 것과는 다르게 실제로 그것은 따라가는 게 아니다.
이제 서베일런스(Surveillance, 감시), 다른 말로 해서 트래킹(Tracking, 추적), 서베일런스라고 보통 인공지능쪽에선 얘기하지만 이를 오브젝트 트래킹이라고 하는데 이 트래킹을 하는 게 아니라 화면 하나를 디텍트해서 사용자한테 보여주는 것일 뿐이다.
그걸 구분할 수 있는 방법이 뭐가 있냐면 각 오브젝트마다 아이디를 매겨서 실제 그 아이디대로 가는지 안 가는지를 보면 된다.
그런데 제가 아쉽게도 재작년 12월에 인공지능 대전을 한국에서 가봤을 때 대부분이 객체 탐지를 하는데 트래킹은 잘 안 되는 것 같았다. 왜냐하면 화면에 사각형이 깜빡깜빡거리거나 아이디가 없는 경우가 있는데 그거는 트래킹이 안 된다는 얘기이다.
트래킹이 되는 것과 안 되는 것과는 적용할 때 어떤 차이가 있냐면 카메라가 여러 대 있을 때 사람이 이쪽에서 저쪽으로 지나간다고 가정한다면 사람이 이렇게 이쪽 방향으로 가게 됐을 때 A라는 카메라 범위에서 B라는 카메라 범위로 넘어간다.
이때 이 사람이 A 카메라에서는 a라는 아이디를 가지고 있지만 넘어가는 순간 B 카메라에서는 b라는 사람이 될 수도 있다.
■ 더 자세한 이야기는 e4ds 특별웨비나 AI 테크 콘서트서 나누겠다. 마지막으로 E4ds 독자 여러분께 한 말씀 부탁드린다
처음에 인공지능을 접할 때 조금 배우기 어려웠다. 여러분들도 조금씩 공부해 보신 분들은 알겠지만 우리가 학교 졸업하고 나면 수학은 거의 하지 않는다.
컴퓨터 공학 쪽을 공부하게 되면 수학에서 특정 분야에 공부를 집중하게 된다. 그렇기 때문에 인공지능을 처음 접할 때 미분, 적분 그 다음에 확률, 통계가 나오게 되고 수학에서 가장 어려운 게 확률과 통계라고 생각한다.
이런 게 좀 부지기수로 나오니까 접근하기가 굉장히 어렵고 기호를 이해하는 것 자체도 어렵다. 진입장벽이 좀 크다고 느낄 수 있다.
그런데 저는 꼭 그렇지 않을 수도 있다고 생각한다. 소프트웨어가 발전을 할 때 OS가 나오고 Framework가 나오고 그 다음에 앱이 나오며 앱 개발자들이 등장하기 시작했다. 옛날에는 이 밑에 OS라든가 이런 시스템 개발하는 사람들이 앱도 같이 개발했었다.
그때는 소프트웨어, 애플리케이션 하나 나오는 게 많이 어려웠다. 그래서 당시 저희 같은 사람들이 굉장히 인기가 있었다. 몸값도 높았으나 지금은 아니다. 앱 개발하는 사람이 별도로 등장한 것이다.
그렇듯이 AI도 지금은 Framework 형태로 진화가 되고 있다. 그러면 인공지능을 위한 Framework가 완벽하다면, 지금같이 어떤 시스템 Framework같은 플랫폼이 완전히 갖춰진다면, AI에 대한 창조적인 생각만 있으면 누구든지 자기만의 인공지능을 만들 수 있게 된다.
너무 어렵게 생각하지 말긴 바란다. 어렵게 생각하는 것보다는 어떻게 하면은 우리 삶이 좀 더 풍요롭고 재밌어질까를 생각하면서 인공지능을 접근해 본다면 좀 더 재밌게 개발할 수 있을 것이라고 생각한다.
고맙습니다.