디지털화가 가속하면서 많은 기업이 자사 사업에 AI 도입을 서두르고 있다. AI 도입의 성공은 조직의 AI 능력과 데이터의 품질, 그리고 전체 AI 시스템의 각기 다른 구성요소를 담당하는 여러 부서 간의 사일로 제거에 달렸다. 또한, AI 기반 시스템을 설계하기 위해 엔지니어는 데이터 준비, AI 모델링, 시뮬레이션과 테스트, 최종 배포 등의 단계를 고려해야 한다.
비즈니스에 AI 적용하려면 조직의 AI 능력 및
데이터 품질의 향상, 부서 간 사일로 제거 필요
매스웍스, AI 시스템 구축하는 통합 솔루션 제공
디지털화가 가속하면서 많은 기업이 자사 사업에 AI 도입을 서두르고 있다. 가트너에 따르면 기업들의 평균적인 AI 프로젝트 건수는 2019년 4건에서 2022년 35건으로 증가할 전망이다.
하지만 AI 시스템을 설계하고 구현해야 하는 도메인 전문가의 전문적인 AI 지식과 경험은 여전히 부족하다. AI 도입의 성공은 △조직의 AI 능력과 △데이터의 품질, 그리고 △전체 AI 시스템의 각기 다른 구성요소를 담당하는 여러 부서 간의 사일로 제거에 달렸다.
▲ 웨비나를 진행하는 송완빈 과장 [출처=매스웍스]
매스웍스에서 애플리케이션 엔지니어로 근무하는 송완빈 과장은 지난 18일, 유튜브 라이브 웨비나를 통해 기업들이 AI 시스템 개발 시 마주하는 과제를 짚어봤다. 그리고 이를 지원하는 매스웍스만의 솔루션을 소개하고, 다양한 산업 분야에서의 성공사례도 공유했다.
단계별 AI 시스템 설계 과정
송완빈 과장은 AI 기반 시스템을 설계하기 위해 엔지니어는 ▲데이터 준비(Data Preparation) ▲AI 모델링(AI Modeling) ▲시뮬레이션과 테스트(Simulation and Test) ▲최종 배포(Deployment) 등의 단계를 고려해야 한다고 강조했다.
데이터 준비 단계는 데이터 클렌징 및 전처리 작업을 수반한다. 또한, 데이터의 양이 부족할 때 수행하는 데이터 증강(Augmentation), 가짜 데이터 생성 작업도 포함한다. 매스웍스는 AI 지식과 경험이 부족한 도메인 전문가가 AI 프로젝트를 진행할 수 있도록 높은 수준의 함수와 도메인 특화 도구를 제공하여, 향상된 품질의 데이터 세트를 구축하도록 지원한다.
도메인 특화 도구에는 데이터에 정답을 달아주는 ‘라벨링’ 작업의 자동화를 위해 이미지, 비디오, 오디오, 신호 데이터 등 다양한 데이터 유형에 최적화된 상호작용 UI 기반 라벨링 도구를 제공한다.
AI 모델링 단계는 데이터 유형과 AI 도입목적에 따라 네트워크 구조 및 학습 알고리즘 유형을 결정하여 모델을 설계 및 조정하는 작업을 포함한다. 매스웍스는 파이썬(Python) 등 딥러닝 프레임워크와의 상호운용성을 지원하여 해당 프레임워크의 완료된 작업을 매트랩으로 임포트(Import)하여 사용할 수 있도록 한다.
시뮬레이션과 테스트 단계는 기존 시스템과 AI 모델의 통합, AI 시스템 시뮬레이션, 그리고 검증과 확인을 위한 테스트를 포함한다. 매스웍스는 AI 모델링 및 시뮬레이션을 위한 단일한 플랫폼을 제공하여 전체 시스템 수준의 통합 위험을 줄이며, 머신러닝 모델을 쉽게 학습하고 실험할 수 있도록 상호작용 도구를 지원한다.
최종 배포 단계는 AI 모델 또는 시스템을 임베디드 타깃, 엔터프라이즈 시스템, 또는 클라우드로 배포하는 것을 의미한다. 매스웍스는 배포 타깃에 최적화된 코드 생성과 에지 및 클라우드로의 배포를 위한 AI 모델 경량화를 모두 지원한다.
▲ AI 시스템 구축 단계 [제공=매스웍스]
송 과장은 “AI 시스템 구축 작업은 단 한 번으로 끝나는 것이 아니다”라며, “데이터 준비, 모델링, 시뮬레이션, 테스트, 배포 단계를 반복적으로 수행하여 AI 모델과 시스템을 향상해야 한다”라고 말했다. 그러면서 “이를 위해서는 각 단계 사이의 사일로를 제거해야 하며, 매스웍스는 위의 과정을 통합 환경에서 지원하여 사일로 문제를 해결했다”라고 밝혔다.
해외 유명 기업들의 ML 및 DL 도입 사례
송 과장은 타이어 제조사 ‘브릿지스톤(Bridgestone)’의 타이어 마모 탐지, 디지털 IT 제품 및 솔루션 제공회사 ‘코그니전트(Cognizant)’의 고객 이탈률 예측, 건물 에너지 관리 솔루션 제공회사 ‘빌딩IQ(BuildingIQ)’의 에너지 사용량 분석 및 최적화, 자동차 제조사 ‘BMW’의 오버스티어링(Oversteering) 탐지, 자동차 제조사 ‘혼다(Honda)’의 플릿(fleet) 데이터 분석 등에 매스웍스의 머신러닝 솔루션이 활용되었다고 언급했다.
또한, 정유회사 ‘쉘(Shell)’의 장비 식별, 생명공학 회사 ‘제넨테크(Genentech)’의 병리학 분석, 항공기 제조사 ‘에어버스(Airbus)’의 결함장비 탐지, 자동화 및 자동차 부품 제조사 ‘무사시(Musashi)’의 비정상 부품 탐지 자동화 등 영상, 신호, 음성뿐 아니라 3D 데이터에 대한 객체 탐지까지 많은 성공사례가 나오고 있다고 덧붙였다.
국내 기업 및 기관의 매스웍스 솔루션 활용 사례
국내에서도 전 세계적인 흐름에 발맞춰 많은 성공사례가 구축되고 있다. 송 과장은 현대제철, 한국건설기술연구원(KICT), 한국해양과학기술원(KIOST)과 그 산하의 선박해양플랜트연구소 사례를 소개했다.
◇ 철강원료 이미지 분석에 픽셀 기반 딥러닝 기술 적용한 현대제철
현대제철은 매스웍스 솔루션 도입 이전엔 분석 엔지니어가 광학 현미경을 통해 철강원료 이미지를 수동으로 분석했다. 이 과정은 매우 오랜 시간이 소요됐고, 분석 엔지니어마다 결과도 달랐다. 이에 철강원료 이미지 분석의 정량화와 자동화에 매스웍스 솔루션을 활용키로 했다. 현대제철은 딥러닝 기법 중 시맨틱 분할 기법을 적용하기로 했다.
▲ 매트랩으로 라벨링 자동화 기술 개발한 현대제철 [출처=매스웍스]
매트랩에서 비지도 머신러닝 학습으로 라벨링 자동화 알고리즘을 만들고, 라벨러(Labelor)로 임포팅(Importing)하여 라벨링, 검사, 학습, 학습 결과의 라벨러 반영 사이클을 반복하면서 딥러닝 모델 정확도를 85%까지 개선했다. 또한, 라벨링 자동화 알고리즘을 통해 시맨틱 분할 작업 시간의 많은 부분을 차지하는 라벨링 작업 시간을 대폭 단축했다.
◇ 하수관 폐수 배출 측정 지원하는 딥러닝 모델 개발한 KICT
과거 KICT는 하수관 안의 폐수량을 비전, 센서 기반 솔루션으로 측정했으나, 불순물, 부식, 탁도로 인한 불안정성으로 인해 정확한 측정을 할 수 없었다.
이에 매트랩으로 시맨틱 분할 기법을 적용하여 영상 픽셀을 기반으로 하수관 안의 폐수 높이를 정밀하게 측정하는 딥러닝 모델을 개발했다. 해당 딥러닝 모델로 수학적 계산을 통해 폐수 높이를 측정했으며, 수위 감지 비율을 기존의 53%에서 100%로 높였다.
◇ 적조 발생 조기 예측하는 LSTM 딥러닝 모델 개발한 KIOST
KIOST는 적조 발생을 조기에 예측하기 위해서 영상 이외의 시계열 데이터 예측에 많이 사용하는 LSTM(Long Short-Term Memory) 딥러닝 모델을 도입했다.
해수면 온도와 위성에서 얻은 광합성 유효 방사 시퀀스 데이터를 전처리하고, 해당 데이터로 LSTM 네트워크를 학습시켜서 정확도가 98%에서 100%에 달하는 애플리케이션을 개발할 수 있었다.
◇ 딥러닝 객체 검출 알고리즘으로 드론 기반 생존자 수색 기술 개발한 선박해양플랜트연구소
선박해양플랜트연구소는 딥러닝 객체 탐지 방식의 해양 조난자 검출 모델을 개발했다. 기존에는 해양에서 육안에 의존해 생존자를 수색하고 구조했는데, 효율적이고 정확한 검출을 위해 AI 기반 실시간 생존자 수색 솔루션을 개발한 것이다.
YOLO 객체 검출 알고리즘을 사용한 AI 기반 실시간 생존자 수색 솔루션은 딥러닝 모델과 UDP 통신을 통해서 전달받은 드론 영상 데이터를 기반으로 객체와 조난자 여부를 탐지한다. 해당 솔루션은 평균 정밀도 99%를 달성했으며, 현장 수색을 대체할 수 있을 정도다.
송 과장은 “매스웍스는 다양한 산업군의 AI 도입 가속을 위해 기업의 AI 프로젝트 기획, PoC 단계를 지원하는 100개 이상의 예제를 제공하고 있다”라며, “엔지니어는 예제를 출발점 삼아 데이터와 네트워크 아키텍처를 맞춤형으로 변형 및 적용하여 AI 모델을 구체화하고 개발 시간을 단축할 수 있다”라고 밝혔다.
또한, 매트랩 깃허브(MATLAB Github)에서 매스웍스 코리아의 엔지니어를 통해 도움을 받을 수도 있다고도 덧붙였다.