많은 조직이 AI 알고리즘 개발에 집중하고 있다. 하지만 조직이 살아남기 위해서는 AI 알고리즘과 모델이 아닌, AI 기반 제품과 서비스를 시장에 출시해야 한다. 그러기 위해선 전체 시스템 설계 워크플로우에 AI를 통합해야 한다.
AI, 산업용 애플리케이션에 빠르게 도입될 것
코로나19 극복 수단으로 AI 통한 DX 필요
AI 모델 개발, 첨단 시스템 구현 과정 중 하나
코로나19 확산을 막기 위해 정부로부터 ‘생활 속 거리두기’ 지침이 내려진 가운데, 매스웍스가 매년 진행하던 매트랩 엑스포 2020을 온라인으로 총 3일(7월 2·9·16일) 진행하기로 했다.
이에 앞서 매스웍스는 2일, 줌(Zoom)을 통해 미디어 브리핑을 열고 2020년 AI 5대 트렌드를 발표했다. 발표를 맡은 짐 텅(Jim Tung) 비즈니스 및 기술 전략 및 분석 책임자는 “AI가 산업용 애플리케이션 영역에 빠르게 도입될 것이다”라고 전망했다.
▲ 기업의 AI 프로젝트 건수가 크게 증가하고 있다 [제공=매스웍스]
가트너(Gartner)의 발표에 따르면, 기업들의 평균 AI 프로젝트 건수가 2019년 4건에서 2022년 35건으로 약 10배 성장할 것으로 예상되며, ‘시스템으로의 AI 통합’이 기업의 최우선 과제가 되고 있다. 한편, 성공적인 AI 도입의 장애물로 ‘낮은 AI 기술 숙련도(56%)’ 및 ‘데이터 품질 문제(34%)’가 지목되고 있어 이를 해결할 수 있는 솔루션이 주목받을 것으로 예상했다.
또한, 코로나19로 인한 글로벌 팬데믹 사태로 활동 규모를 축소한 기업들이 있지만, 일부 기업 및 조직은 위기 극복의 수단으로 디지털 트랜스포메이션을 택하고 있다. 정은옥 건국대학교 수학과 교수 연구팀은 매트랩을 통해 한국형 코로나19 확산 모델을 개발하고, 정부의 전염병 확산 대응 정책의 과학적 근거가 될 만한 연구 결과를 얻었다.
정 교수팀은 매트랩의 수학적 모델링 기술을 활용한 일련의 연구를 통해 확진자 수뿐만 아니라 국민 행동 변화, 사회적 거리두기 및 개학 연기 제도 시행 등 다양한 변수를 고려한 SEIR 모델을 개발했다. 이를 통해 정부의 코로나19 통제 및 예방 정책이 추가 확진자 발생 방지에 효과적이라는 점을 밝혀냈다.
텅 책임자는 코로나19까지 고려한 2020년 AI 5대 트렌드로 ▲AI 기술 장벽의 완화와 데이터 품질의 개선 ▲AI 기반 시스템의 설계 복잡성 증가 ▲쉬워진 저전력 저비용 임베디드 디바이스로의 AI 배포 ▲게임에서 실세계 산업용 애플리케이션으로 확대 적용되는 강화학습 ▲시뮬레이션으로 생성한 다량의 AI 모델 훈련 데이터를 기반으로 개발되는 AI 모델을 꼽았다.
◇ AI 기술 장벽의 완화와 데이터 품질의 개선
AI 확산과 함께 AI 프로젝트에 참여하는 엔지니어와 과학자들의 수가 늘어나고 있다. 오늘날 이들은 커뮤니티의 딥러닝 모델 및 연구 결과에 쉽게 접근할 수 있으며, AI 프로젝트 초기 단계부터 큰 도움을 받고 있다. 또한, 과거의 AI 모델은 이미지 데이터에 기반했으나, 이제 시계열 데이터, 텍스트 및 레이더 등의 다양한 센서 데이터를 처리할 수 있게 됐다.
▲ 매스웍스의 시맨틱 분할을 위한 (왼쪽부터)
이미지 라벨링 앱과 신호 라벨링 앱 [사진=매스웍스]
텅 책임자는 “매스웍스는 엔지니어와 과학자들이 AI 기반 제품 및 서비스 구축 시 프로그래밍 학습 필요 없이 도메인 전문지식을 적용할 수 있도록 지원한다”라며, “분류(classification) 및 예측(prediction)을 지원하는 알고리즘, 커뮤니티에서 사전 구축된 다양한 모델, 넓은 엔지니어링 애플리케이션 영역의 AI 모델 구축을 돕는 수백 가지의 예제(Examples)를 제공한다”라고 밝혔다.
◇ AI 기반 시스템의 설계 복잡성 증가
AI가 훈련을 통해 더 많은 유형의 센서 데이터를 처리할 수 있게 되면서 엔지니어들은 자율주행 차량, 항공기 엔진, 산업 플랜트, 풍력 발전용 터빈, 클라우드 기반 스트리밍 시스템과 같은 매우 다양한 시스템에 AI를 적용하고 있다.
복잡한 시스템에서 AI 모델은 전체 시스템 수준의 성능에 중대한 영향을 미친다. 따라서 오늘날 AI 모델 개발은 복잡한 시스템을 효과적으로 구동하기까지의 과정 중 한 단계로 봐야 한다.
설계자들은 복잡한 AI 기반 시스템 설계를 간소화하기 위해 △AI가 시스템의 다른 부분들과 상호 작용하는 방식을 이해할 수 있도록 지원하는 시뮬레이션, △설계자가 완전한 시스템 문맥 내에서 다양한 설계 개념들을 시도해 볼 수 있도록 지원하는 통합, △설계자가 AI 훈련 데이터 세트의 약점 또는 다른 구성요소들의 설계 결함을 빠르게 찾아낼 수 있도록 지원하는 연속적인 테스트를 지원하는 ‘모델 기반 설계’ 도구를 도입할 것을 고려해야 한다.
텅 책임자는 “매스웍스는 하드웨어로의 배포 이전 시뮬레이션을 통해 AI 모델의 효과성 검증을 돕는다”라며 특히, “시뮬링크(Simulink)는 시뮬레이션으로 테스트를 수행하고 그 결과를 반영해 반복적인 설계 과정을 빠르게 수행하도록 돕는다”라고 강조했다.
▲ [그림=매스웍스]
그 예시로 텅 책임자는 3개월 안에 레벨3 자율주행차량을 개발한 보이지(Voyage)의 사례를 들었다. 보이지는 통합 모델을 활용하여 아이디어 구상에서부터 로드 테스팅까지의 프로세스를 가속하고, 실험 결과 데이터를 바탕으로 컨트롤러를 조율해 목적을 이룰 수 있었다.
◇ 쉬워진 저전력 저비용 임베디드 디바이스로의 AI 배포
지금까지 AI는 GPU, 클러스터, 데이터 센터 등의 고성능 컴퓨팅(HPC) 시스템에서 사용되는 것과 같은 32bit 부동소수점 연산을 사용해 왔다. 고정소수점 연산을 사용하는 저전력 장치에서는 구현할 수 없었다. 현재는 소프트웨어 도구의 발전으로 다양한 수준의 고정소수점 연산을 지원하는 AI 추론 모델을 제공할 수 있게 됐다.
저렴한 저전력 장치에 AI를 배포할 수 있게 되면서 엔지니어는 AI를 다양한 설계에 적용할 수 있게 됐다. 텅 책임자는 “이제 차량 내 ECU(Electronic Control Unit) 및 여타 산업용 임베디드 애플리케이션에도 AI를 적용할 수 있게 됐다”라고 설명했다.
그러면서 “매스웍스는 코드 생성 프레임워크(code generation framework)를 통해 매트랩이나 시뮬링크로 개발한 AI 모델을 재작성 없이 △임베디드 디바이스 △엔터프라이즈 시스템 △에지 △클라우드 및 데스크톱 등 모든 환경으로 배포할 수 있도록 지원한다”라고 밝혔다. 또한, 모델 배포를 위한 자동 코드 생성 기능도 지원하여 코딩 에러를 제거할 수 있다고도 덧붙였다.
◇ 게임에서 실세계 산업용 애플리케이션으로 확대 적용되는 강화학습
올해 강화학습은 게임 분야를 넘어서서 자율주행, 자율적 시스템(autonomous system), 제어 설계 및 로보틱스와 같은 실세계 산업용 애플리케이션으로 확대 도입될 전망이다. 그리고 실세계에서 구현하기 어려운 조건들을 반영한 가상 모델로 훈련하여 대규모 시스템을 개선하는 데 이바지할 것으로 기대된다.
이를 가능케 하려면 △손쉬운 강화학습 정책 구축 및 훈련 △다량의 훈련용 시뮬레이션 데이터 생성 △시스템 시뮬레이션 도구와 강화학습 에이전트의 쉬운 통합 △임베디드 하드웨어로의 배포를 위한 코드 생성을 지원하는 기술이 필요하다.
텅 책임자는 자율주행 시스템의 운전 성능 향상을 예로 들며 “강화학습 에이전트는 속도를 높이고, 연료 소비 및 응답 시간을 최소화하여 성능을 개선 및 최적화하는 효과를 제공한다”라며, “강화학습 모델은 차량 동역학 모델, 환경 모델, 카메라 센서 모델 및 이미지 처리 알고리즘을 포함하는 완전 자율주행 시스템 모델에도 통합할 수 있다”라고 말했다.
매스웍스의 강화학습 툴박스(Reinforcement Learning Toolbox)는 내장된 맞춤형 강화학습 에이전트를 제공하며, 매트랩이나 시뮬링크에서 강화학습 환경을 모델링할 수 있도록 지원한다.
▲ 자율주행차량을 위한 강화 학습 예제 [사진=매스웍스]
그뿐만 아니라 △강화학습 정책 설계를 지원하는 딥러닝 툴박스(Deep Learning Toolbox) △GPU 및 클라우드에서의 훈련 가속화 기능 △시뮬레이션을 통한 훈련 정책 검증 기능 △임베디드 디바이스로의 배포 기능 △자율주행 차량을 위한 강화학습 등의 레퍼런스 예제를 지원한다.
텅 책임자는 “마이크로소프트(MS)와의 협력을 통해 매스웍스는 로보틱스, 에너지, 제조 및 프로세스 최적화 분야의 애플리케이션을 개발하는 고객들이 ‘MS 오토노머스 시스템(Microsoft Autonomous Systems)’ 플랫폼에서 워크플로우를 간소화시킬 수 있도록 지원한다”라며, “‘애저(Azure)’ 환경에서 매트랩 및 시뮬링크 모델에 대한 시뮬레이션을 확장해가며 수행할 수 있도록 지원한다”라고 덧붙였다.
◇ 시뮬레이션으로 생성한 다량의 AI 모델 훈련 데이터를 기반으로 개발되는 AI 모델
낮은 데이터 품질은 성공적인 AI 도입의 가장 큰 장애물이다. 매스웍스는 2020년에 시뮬레이션이 이러한 데이터 품질 문제를 쉽게 해결하도록 도울 것으로 전망했다.
훈련을 통해 AI 모델의 정확성을 높이려면 다량의 데이터가 필요하다. 그러나 정상적인 시스템 작동과 관련된 데이터와 달리, 정말로 필요한 이상 조건 또는 심각한 장애 조건 데이터는 쉽게 확보하기 어렵다.
텅 책임자는 “산업 현장에서 펌프의 잔여 수명을 정확하게 예측할 수 있는 건전성 예측관리 애플리케이션의 경우, 물리적인 장비에서 장애가 발생하는 경우가 드물어서 장애 데이터를 확보하기 어렵다”라고 예시를 들었다.
AI 모델 훈련을 위한 고품질 데이터를 다량 확보하는 최고의 방법은 기능 장애를 모사할 수 있는 시뮬레이션을 실행하여 데이터를 생성하고, 합성된 데이터를 통해 정확한 AI 모델을 개발할 수 있도록 훈련시키는 것이다.
▲ 시뮬레이션을 통해 펌프의 장애 발생 이벤트 데이터를
생성 및 합성하도록 지원하는 시뮬링크 [사진=매스웍스]
앞서 언급한 펌프의 모델에 대한 시뮬레이션을 통해 장애를 나타내는 신호를 생성하고, 이러한 신호 데이터를 바탕으로 AI 모델을 훈련, 산업 현장의 실제 시스템에 배포하여 미래의 장애 발생을 예측할 수 있다.
시뮬레이션은 매우 드물게 발생하는 산업 현장의 이벤트에 대응하는 AI 알고리즘을 구축하는 데 핵심적인 역할을 할 수 있다. 텅 책임자는 “매트랩과 시뮬링크는 엔지니어들이 시뮬레이션을 통해 드물게 발생하는 이벤트들에 대한 훈련용 데이터를 적절한 주기로 생성 및 통합하도록 돕는다”라고 말했다.
마지막으로 텅 책임자는 “현재 많은 조직이 AI 알고리즘 개발에 집중하고 있다”라며, “단순한 AI 알고리즘 또는 모델이 아니라 AI 기반 제품 또는 서비스를 시장에 성공적으로 출시하려면 전체 시스템 설계 워크플로우에 AI를 통합해야 한다”라고 조언했다.