[편집자주] 인공지능의 발전을 이끌고 있는 2개의 축이 있다. 현재 시장에서 가장 스포트라이트를 받고 있는 것은 단연 생성형 AI일 것이다. 챗 GPT가 쏘아 올린 작은 공이 스노우볼이 돼 현재 빅테크를 중심으로 초거대언어모델의 개발과 리더십 경쟁이 치열하다. 그리고 남은 1개의 축은 엣지 AI 혹은 온-디바이스 AI이다. 엣지 AI는 앞선 생성형 AI에 비해 상대적으로 대중적의 시선을 받지는 못하고 있지만 산업과 기술단에서의 실제적 활용도가 급격히 확대되고 있는 상황이다.
“모든 서비스는 ‘인지(Perception)’에서부터 시작한다”
인-캐빈 모니터링 시스템, 센서 대통합 가능성↑
컴퓨터 비전, 더 나은 서비스·센싱 사각지대 대체
“자동차 내 연산, 엣지 케이스 실패도 용납 불가”
[편집자주] 인공지능의 발전을 이끌고 있는 2개의 축이 있다. 현재 시장에서 가장 스포트라이트를 받고 있는 것은 단연 생성형 AI일 것이다. 챗 GPT가 쏘아 올린 작은 공이 스노우볼이 돼 현재 빅테크를 중심으로 초거대언어모델의 개발과 리더십 경쟁이 치열하다. 그리고 남은 1개의 축은 엣지 AI 혹은 온-디바이스 AI이다. 엣지 AI는 앞선 생성형 AI에 비해 상대적으로 대중적 시선을 받지는 못하고 있지만 산업과 기술단에서의 실제적 활용도가 급격히 확대되고 있는 상황이다.
이에 엣지 AI의 영역 중 가장 핫하며 모든 인공지능 기반 서비스의 시작이 되는 인지 솔루션, 즉 컴퓨터 비전에 대해 탐구했다. 컴퓨터 비전과 엣지 AI에서의 전문 역량을 지닌 델타엑스의 김수훈 대표를 만나 이야기를 나눴다.
▲인터뷰 중인 김수훈 델타엑스 대표의 모습
■ 컴퓨터 비전 기술이 자동차 내 어디에 응용되고 있는가
그 중에서 한 가지는 인-캐빈 모니터링 시스템이라고 하는 건 차 안에 카메라를 장착하고 차량 내를 모니터링하고, 모니터링된 결과를 가지고 서비스 모델을 만들 수도 있다.
또 일부 기능들은 안전 영역에 필요한 기능들로 구현되고 있다. 원래 자동차 전면에 카메라가 하나가 설치돼 있어서 운전자가 졸고 있는지 혹은 주의태만이 없는지를 분석하는 솔루션을 통상 DMS, 드라이버 모니터링 시스템(Driver Monitoring System)이라고 불러왔고, 일부 고급 차량에는 장착이 되어 있다.
운전자의 눈이 떠져 있는지 감겨 있는지에 대해, 혹은 어디를 보고 있는지 주의태만을 넘어 그리고 전체 승객들이 어디 있는지 안전벨트를 매고 있는지 혹은 졸고 있지 않은지 행동, 그리고 무엇을 필요로 하는지, 또 그리고 운전자의 특정 손모양을 가지고 제스처를 통해 전체 차량 내 제어를 하는 게 가능하다.
■ 비전 기술이 활용될 때 스마트카 내 서비스의 미래는
생성모델, GPT 같은 대화가 가능하게 하는 솔루션들이 나오고 있다. 그런데 기자님, 혹은 피디님께서 차에 딱 탔는데 갑자기 내가 전혀 관심 없을 만한 영역으로 대화를 시작하거나 이건 여성
들이 관심 있어 할 만한 대화 혹은 아이들이 관심 있어 할 만한 대화라고 한다면 흥미를 잃을 수 있다.
결국, 제가 이렇게 만나서 맞는 대화를 하려면 내가 누구인지, 무엇을 관심 있어 할지를 아는 것, 이해하는 것에서부터 시작돼야 하기 때문에, 결국 모든 서비스 역시 ‘인지(Perception)’에서 시작한다.
더 나은 서비스를 만들 수 있다는 것도 있고, 또 한 관점에서 보면은 과거 센서로는 불가능한 것들이 만들어질 수 있다는 것도 가능하다.
카메라가 달려 있어서 한 예로, 자동차에 이런 광고가 나올 것 같다.
뒷좌석에 제 아이가 타고 있는데 아이가 어느새 잠들어 버린 것이다. 그런데 아빠는 음악을 크게 틀고 있다. 뒤에 카메라가 뒷좌석을 보니깐 아이인지를 알고 있고, 사람인지 인지한다. 눈이 감겨 있는 걸 보고 눈이 떠지지 않는 걸 보니깐 “아 자고 있구나”라는 걸 알게 되면서 무슨 판단을 하냐면 “(AI가) 음악을 줄여야 되겠구나”하는 판단을 할 수 있다.
아마 제 생각에는 스마트카에 대한 광고가 이런 식으로 나오지 않을까 생각한다.
■ 컴퓨터 비전 솔루션이 광범위한 센서 솔루션을 대체할 수 있는가
저희 인-캐빈 모니터에 설치된 카메라는 카메라를 통해 들어오는 영상으로 사람이 이해하는 것처럼 운전자와 전체 승객들을 이해한다.
그럼 이런 솔루션이 있으면 단순하게 생각하면 안전벨트 센서도 대체할 수 있을 것 같고, 이렇게 핸들을 잡고 있는 거를, 요새 레벨2나 3을 보면 스마트 크루즈 기능들이 있다. 그건 핸들에 손을 놓으면 조금 있으면 알람이 나오는데 손을 떼고 있는 것을 안다는 것은 뭔가 센서가 달려 있다는 것이다.
창문을 열고 내리면 문이 열렸다는 걸 알려주는 거고, 도어가 안 닫히면 도어가 열려 있다는 것을 센서가 알려주기도 하고, 즉 실내 모든 곳곳에는 엄청나게 많은 아날로그-디지털 센서들이 달려있다는 얘기고, 그를 통해 차의 상태나 이런 걸 알게 된다.
그 많은 센서들을 카메라 하나로 대체할 수 있다고 하는 것은 자동차 입장에서 엄청난 원가 절감을 할 수 있다는 가능성이 생기는 거니깐 신뢰도의 문제는 별개의 문제로 하고, 기능적으로 보면 그러한 많은 센서들을 한 개의 영상 센서로 다 통합할 수 있다라고 하는 엄청난 가능성이 생기는 것이다. 굉장히 매력적인 접근이다.
■ 델타엑스가 집중하고 있는 자동차 영역에서 비전 기술들을 개발할 때 고려점은?
자동차에 필요한 컴퓨터 비전은 사실 인공지능은 파이썬이라고 하는 코드 언어체계를 가지고 개발을 많이 하게 되는데 이런 코드체계들이 통상 컴퓨터에 있는 리눅스나 윈도우 같은 오퍼레이팅 시스템에서 돌아가게 되어 있다.
그런데 자동차 환경은 많이 다르다. 자동차 환경은 첫째 PC나 서버 같은 고성능의 연산 장치를 준비해서 탑재 구성할 수 있는 환경이 전혀 안된다.
왜냐하면 자동차가 코스트에 굉장히 민감한 인더스트리이기 때문에 작은 칩 하나에서 인공지능이 돌아가야 한다는 어려움이 첫 번째 있다.
두 번째는 자동차 애플리케이션 자체가 사람이 타고 움직이는 운송수단이다 보니깐 센서 에러 같은 것들이 발생하게 되면 그 결과가 아주 치명적일 수 있다. 통상적으론 잘되는데 아주 특수한 케이스에 문제가 나오는 것을 엣지 케이스 혹은 코너 케이스 이렇게 정의를 하는데, 이런 작은 엣지 케이스에 실패(Failure)들도 용납이 안 되는 게 자동차 시장인 것이다.
그래서 통상적인 인더스트리에서는 “잘되네, 이정도면 되네”라는 것들이 자동차로 넘어오게 되면 결국 그걸 넘지 못해서 적용에 실패하거나 제품 출시가 안 되는 사례가 굉장히 많이 나
온다. 더 완벽하게 만들어야 하고 어떠한 사례에서도 실패가 안 나오도록 하는 솔루션을 만들어야 한다는 게 자동차 비즈니스에서 굉장한 챌린지이다.
연산 환경이 아주 열악하다는 것은 저희 모듈, 모델 알고리즘들을 아주 작은 사이즈로 경량화해야 하고, 그건 사이즈 면에서도 그렇고 처리 면에서도 굉장히 헤비한 모델은 돌아갈 수 없으니깐 경량화 최적화를 잘해야 한다는 건데, 이런 게 또 개발하는 것 이상으로 어렵고, 많은 경험과 노하우가 필요한 영역이다. 이런 쪽에 기술적으로 많은 어려움이 있다.
이것을 어떻게 잘 이겨내느냐가 자체 알고리즘을 개발하는 것 보다 훨씬 더 저희에게 관심사이고 많은 인력들이 투입돼서 경험과 기술들을 쌓고 있는 영역이다.
컴퓨터 비전 회사가 정말 많다. 하지만 그 중에 자동차 하는 회사들을 추려보면 그 중에서도 일부 그런 자동차 환경 내에서 알고리즘을 잘 빨리 돌아갈 수 있도록 개발하고 최적화 경량화까지 할 수 있는 업체를 조금 추려보면 그 중엔 아주 소수가 있다.
현재 델타엑스는 그 소수 안에 들어가 있다고 자부하고 있다.
■ 임베디드 환경에서 인지 기술의 핵심 경쟁력은 알고리즘의 최적화·경량화인 것인가
저희가 이제 이런 질문을 많이 받는다. 인공지능을 하고 있는 업체들이 굉장히 다양하니깐 “델타엑스가 하는 솔루션은 뭐가 다른가요?”라는 질문을 사실 한다.
아마도 그 질문은 인지모델을 하고 있는 유사한 솔루션들을 봐 왔는데 그런 것 대비 어떤 성능이 차이가 있나에 대한 질문일 텐데 우리가 성능을 객관적으로 비교하려면 나머지 환경이 동일한 상태에서 A와 B의 차이를 비교해야 한다.
오토모티브 영역 내에서 보면 제조사가 요구하는 정말 열악한 연산 환경 내에서 성능을 돌려보면 명확하게 차이가 난다.
첫 번째 일단, “인공지능 알고리즘을 개발합니다”라고 하는데 자동차는 어떤 환경에서 돌아야 하는지를 잘 이해하는 업체도 그 중에서 소수이고, 그런 환경에서 거기에 돌아가게 하는 것은 코드 체계가 다르기 때문이다.
예를 들자면 파이썬으로 돌지 않고 C++이라는 새로운 코드 체계로 저희가 알고리즘을 새로 개발하기도 하는데 이런 체계가 완전히 다르다 보니까 용량도 기존에는 사이즈가 큰 용량의 모델들이었다면 임베디드 환경은 넣을 수 있는 메모리의 사이즈도 아주 작기 때문에 용량 자체도 작아야 하고 연산도 버전 굉장히 작아야 된다.
이런 걸 다 만족하는 솔루션을 개발하는 것은 저희가 알고 있는 일반적인 컴퓨터 비전을 혹은 데모를 보아 오셨던 일반적인 솔루션을 개발하는 것과는 완전히 다른 이야기이다.
■ 마지막으로 e4ds news 독자들에게 하는 한 마디
저는 여전히 개발자이고 엔지니어이고, 학교를 졸업한 이후 계속 개발 영역에 있었다. 지금도 개발을 꾸준히 하고 있는 개발자이자 엔지니어이자 이 회사의 대표이다.
델타엑스는 2025년에는 내부적으로 상장도 고민하고 있다. 그것도 저희의 타임라인 중 하나이고, 내년에는 연구개발, 지금하고 있는 PoC, 그리고 거기 관련된 다양한 투자, 이런 것들을 잘 마무리하는 것이 저에게 지금 중요한 아젠다 중 하나라고 생각하시면 될 것 같다.
감사합니다.