스마트팩토리에 클라우드를 접목하는 사례가 늘고 있다. 하지만 스마트팩토리에 설치된 각종 센서와 설비가 생산하는 데이터양은 초당 수백만 태그에 이르기 때문에 클라우드만으로는 한계가 있다. 따라서 방대한 데이터를 초고속으로 수집하고 저장할 수 있는 데이터 저장소와 압축 저장할 수 있는 솔루션이 필요하다.
클라우드만으론 스마트팩토리 운영 힘들어
마크베이스 DBMS, 초당 수백만 개의
실시간 센서 데이터 수집·저장·분석 가능해
클라우드를 비즈니스에 적용하는 사례가 늘어나는 가운데, 스마트팩토리에 클라우드를 채택한 사례도 늘고 있다.
하지만 스마트팩토리에 설치된 각종 센서와 설비가 생산하는 데이터양은 초당 수백만 태그(Tag)에 이르기 때문에 클라우드만으로는 한계가 있다.
따라서 이를 초고속으로 수집하고 저장할 수 있는 데이터 저장소와 압축 저장할 수 있는 솔루션이 필요하다.
지난 11월, 국산 데이터베이스 관리시스템인 마크베이스 DBMS가 TPCx-IoT 분야에서 국내 최초로 국제표준으로 등재되었고 국제 공인 인증을 획득했다.
TPC(Transaction Processing Performance Council)는 서버, 스토리지, 데이터베이스 관리 시스템(DataBase Management System; DBMS) 같은 기반 소프트웨어 및 컴퓨팅 장비의 성능을 시험하고 평가하는 국제 공인 기관이다. TPCx-IoT는 IoT 환경에서의 성능시험을 위한 벤치마크다.
이번 인증을 획득한 마크베이스 DBMS는 초당 수백만 개의 센서 데이터의 수집, 저장 및 실시간 분석이 가능한 시계열(Time-Series) DBMS로, IoT, 스마트시티, 스마트팩토리, 빅데이터 등 다양한 분야에 적용할 수 있다.
마크베이스 DBMS는 Couchbase, Hbase 등 해외 DBMS보다 성능이 약 140% 향상된 결과로 1위를 획득하였다. 기존 1위인 HBase로, 742,256.79 IoTps의 성능을 보여주었으며, 마크베이스는 1,043,276.60 IoTps의 성능을 확보했다. IoTps는 초당 IoT 데이터 수집/분석 속도를 측정하는 단위다.
▲마크베이스 김성진 대표 (사진=마크베이스)
국내 최초로 IoT 분야에서 국제 공인 인증을 획득한 마크베이스 DBMS를 만든 ㈜마크베이스의 김성진 대표를 만나 에지 컴퓨팅 시대에 필요한 데이터베이스의 필요성에 관해 물었다.
Q. 대표님과 마크베이스에 대한 간단한 소개 부탁드립니다.
A. 저는 알티베이스 인메모리 데이터베이스 사의 창업 멤버였으며, 15년간 전통적인 기술의 데이터베이스를 개발해 왔습니다. 해당 회사에서 CTO와 CEO를 다년간 수행했고, 2013년도에 마크베이스를 창업했습니다. 향후 사람이 만드는 데이터보다 기계나 센서가 만드는 데이터가 더 많아질 것으로 예상하고 새로운 개념의 데이터베이스가 필요해질 거란 생각에 창업을 하게 되었습니다.
Q. 정부가 2022년까지 스마트팩토리 3만개를 보급하겠다는 계획을 발표하는 등 스마트팩토리 구축 수요가 늘어나고 있습니다. 스마트팩토리에서 클라우드의 역할과 한계점은 무엇입니까?
A. 클라우드는 최근 많은 기업이 채택하고 있는 IT 인프라입니다. 여기에 스마트팩토리를 접목하려는 시도가 많이 일어나고 있는데, 몇 가지 문제가 있습니다.
첫 번째는 비용입니다. 스마트팩토리에서 생성되는 데이터양은 거의 무한인데 이 데이터를 모두 클라우드에 저장한다는 것은 비용적으로 감당하기 힘든 결과를 초래할 수 있습니다.
두 번째는 느린 응답성입니다. 모든 데이터를 클라우드에 보내어서 특정한 비즈니스 의사 결정을 한다는 것은 실시간성이 필수적인 스마트팩토리 분야에서는 취약한 특성을 나타낼 수 있습니다.
세 번째는 고가용성 및 보안에 관한 이슈입니다. 모든 고객은 자신들의 비즈니스가 중지되는 것을 허용하지 않습니다. 만일 클라우드 사업자의 인프라가 어떤 이유로 중지하거나, 네트워크 환경에 문제가 발생한다면 필연적으로 비즈니스에 큰 영향을 줄 수 있습니다. 또한, 사용자의 중요하고도 민감한 생산 데이터를 어디에 있을지도 모르는 클라우드에 보낸다는 것도 심리적으로 큰 저항이 큰 부분이기도 합니다.
Q. 최근 클라우드 컴퓨팅을 보완하는 에지 컴퓨팅이 이슈로 떠오르고 있습니다. 에지 컴퓨팅이란 무엇이며 클라우드 컴퓨팅의 무엇을 보완하는 것입니까?
A. 에지 컴퓨팅은 앞에서 언급한 클라우드 컴퓨팅의 한계를 극복하고, 더욱 나은 사용자 환경을 구축하려는 목적에서 출현한 개념입니다. 이것이 지향하는 큰 철학은 사용자 데이터의 분리입니다.
즉, 실시간성이 중요한 모든 데이터는 에지에 보관하고, 필요한 일부 데이터만을 클라우드로 전송하는 방법을 지향합니다. 이런 모델로 비즈니스를 구축하게 되면, 우선 클라우드 사용에 들어가는 데이터 관련 비용이 극적으로 줄 수 있을 뿐만 아니라, 에지에서 발생한 이벤트 및 데이터에 대한 실시간 접근이 가능합니다.
결국 클라우드가 가진 장점을 잘 활용하면서, 그 단점을 에지로 보완하는 훌륭한 모델이 탄생할 수 있는 것입니다.
Q. AWS, 오라클, MS애저 등 클라우드 솔루션을 제공하는 사업자 역시 에지 컴퓨팅 솔루션을 제공할 텐데 그 수준은 어느 정도라고 보십니까? 제조 환경에서 사용하기 적합한 수준입니까?
A. 기존 클라우드 사업자들이 가진 솔루션의 수준으로는 제조 환경에 바로 사용하기에는 부족하다고 할 수 있습니다.
단순히 제조 환경의 데이터를 클라우드로 모은다는 측면만 보면 큰 문제가 없을 수 있지만, 실제 고객의 요구 사항에 맞도록 데이터를 모두 수집하고, 이를 요구 사항별로 분리, 가공, 전송해야 하는 관점에서는 아직도 많은 부분이 보완되어야 합니다.
▲마크베이스 제품 개요 (이미지=마크베이스)
특히, 기존 클라우드 사업자들의 에지 컴퓨팅에서는 에지 장비에서의 데이터 저장과 처리에 있어서 해결책을 거의 내놓지 못하고 있습니다.
Q. 에지 컴퓨팅을 실제로 제조 환경에서 구현하려면 맞닥뜨릴 수 있는 여러 문제가 있을 것 같은데 어떤 것들이 있습니까?
A. 실제 에지 컴퓨팅 환경을 제대로 지원하기 위해서는 몇 가지 큰 난제를 해결해야 합니다.
첫째, 낮은 하드웨어 사양의 에지 장비에서 데이터를 고속으로 수집해야 합니다. 대부분의 에지 장비는 느린 CPU와 메모리 한계를 가지고 있지만, 실제 수집되는 데이터는 초당 수백에서 초당 수만 건까지 다양합니다. 이러한 데이터를 어떻게 저장해야 할지에 대한 기술적인 해결이 필요하지요.
둘째, 데이터 복제 혹은 전송에 대한 간결하고 간단한 해결책을 제공해야 합니다. 에지의 가장 큰 개념 중인 하나인 데이터의 분리 보관을 실현하려면 필연적으로 에지에서 발생하는 데이터 중 특정 센서에 대한 데이터를 다른 곳, 즉, 클라우드로 전송하거나 복제해야 하는 상황이 발생합니다.
그러나, 실제 에지 컴퓨팅 환경은 네트워크도 불안할 뿐만 아니라, 여러 불연속적인 비즈니스 환경에 처해 있는데, 이러한 것들에도 불구하고 안정적인 데이터 전송 관리가 필요합니다. 이러한 것을 고객이 직접 구현하기는 너무나 큰 비용을 초래하게 됩니다.
셋째, 대량의 에지 장비에 대한 손쉬운 관리입니다. 한 제조 환경에서는 적게는 수십 많게는 수백 개 이상의 에지 장비가 동작합니다. 이것들에 대한 소프트웨어 설치 관리 업데이트 등이 큰 문제가 됩니다.
넷째로는 실시간 데이터 모니터링과 시각화입니다. 클라우드 환경에서는 손쉽게 데이터를 시각화하고, 이것이 익숙합니다. 그러나, 하드웨어 한계가 있는 에지 장비에 입력되는 데이터에 대한 실시간 모니터링과 특정 데이터에 대한 차트를 그리는 등의 시각화도 큰 어려움이 있습니다.
Q. 공장 내 센서 성능 향상과 숫자 증가로 IIoT 데이터가 증가하고 있는데, 이런 데이터를 효율적으로 활용할 수 있는 데이터베이스에 대한 요구 사항은 무엇입니까?
A. IIoT 데이터는 시계열 데이터로서 수많은 센서로부터 초당 수천에서 수백만까지 발생하는 대규모 데이터입니다. 이를 처리하기 위해서는 다음과 같은 요구 사항이 해결되어야 합니다.
첫째는 고속 입력입니다. 그 DB는 최소한 초당 수만 건 이상의 센서 데이터를 받아들일 수 있어야 합니다.
둘째로는 고속 추출입니다. 기본적으로 해당 DB에는 수십억 이상의 센서 데이터가 저장되어 있을 텐데, 특정 센서와 시간 범위로 데이터를 추출할 때 수 밀리 초 내로 해당 데이터를 꺼낼 수 있어야 합니다.
셋째로는 실시간 통계가 지원되어야 합니다. 장기간에 걸친 특정 센서에 대한 추이를 확인하기 위해서는 대량의 데이터를 수 밀리 수준으로 데이터를 연산할 수 있는 능력이 제공되어야 합니다.
마지막으로 개발 편의성입니다. 기존의 전통 데이터베이스를 개발하던 조직에서 큰 어려움 없이 이를 적용하고 개발할 수 있도록 해주어야 합니다.
Q. 시계열 데이터베이스에 관한 관심이 높아지고 있는데 그 이유가 무엇이라고 생각하십니까?
A. 시계열 데이터베이스의 역사는 6년이 되지 않았을 정도로 젊습니다. 관심이 높아지는 이유는 기존의 데이터베이스로는 해결할 수 없었던 대량의 센서 데이터 처리에 대한 해결책을 제공해 주기 때문입니다.
최근 IIoT 분야에서 폭발적으로 데이터가 생산되고 있으므로 이를 위해서 많은 사람이 데이터 처리 문제를 해결하고자 시계열 데이터베이스를 적극적으로 찾고, 테스트하고 있습니다.
일반적으로 어떤 양의 관측결과를 일정한 기준에 따라 계열로 정리한 것을 통계계열이라고 한다. 어떤 관측치 또는 통계량의 변화를 시간의 움직임에 따라서 포착하고 이것을 계열화하였을 때, 이와 같은 통계계열이 시계열이다.
Q. 마크베이스의 시계열 데이터베이스 솔루션 및 스마트팩토리에서 활용 시 장점에 관해 소개 부탁드립니다.
A. 마크베이스는 시계열 데이터베이스 초창기인 2013년부터 개발되어 이미 상용화 단계에 진입한 데이터베이스 엔진입니다. 이미 국내에서 수십여 곳의 고객들이 제조현장에 도입해서 활용하고 있습니다.
가장 큰 장점은 기존에 처리하지 못했던 대규모의 센서 데이터를 저장할 수 있고, 이를 실시간으로 처리할 수 있다는 것입니다. MS-SQL과 같은 기존 제조 환경에서 많이 사용되던 데이터베이스의 성능 한계를 마크베이스를 통해 극복하면서 점점 더 많은 고객이 이를 활용하고 있습니다.
Q. 지난 11월, TPC의 TPCx-IoT 벤치마크에 마크베이스가 표준 데이터베이스로 선정되었습니다. 이는 어떤 의미가 있습니까?
A. TPC의 표준이라는 의미는 전 세계적으로 IoT 데이터 처리에 대한 가장 보편적이고 누구나 인정할 만한 제품이라는 공식 증거입니다.
▲TPCx-IoT 개요 (이미지=TPC)
TPC의 표준 데이터베이스로 선정되기 위해서는 관련된 표준 벤치마크 테스트를 완벽하게 통과하고 소화해야 할 뿐만 아니라, IBM이나 오라클과 같은 TPC 멤버들의 승인이 반드시 있어야만 가능합니다.
마크베이스는 이런 복잡하고 어려운 과정을 거쳐 TPC의 공식 DBMS로 선정될 수 있었습니다.
Q. 마크베이스의 대표적인 사용사례에 대해 알 수 있겠습니까?
A. 마크베이스는 이미 철강 분야에 도입되어, 일주일에 500억 건 정도의 진동 센서 데이터를 수집하고, 분석에 필요한 핵심 데이터를 제공하고 있습니다.
또한, 글로벌 조선사에는 전 세계 수백 대의 실시간 선박 정보를 수집하고, 이를 서비스하는 핵심 데이터 인프라로 채택하여 서비스하고 있습니다.
그 외에도 시멘트, 제지, 의약 분야의 제조 환경에서 대량의 센서 데이터를 처리하는 핵심 데이터베이스로 활용되고 있습니다.
Q. 향후 마크베이스의 목표는 무엇입니까?
A. 마크베이스는 국내 유일 시계열 데이터베이스로서 IIoT 분야에서 국내 사실상 표준 DBMS로 자리를 잡는 것입니다. 앞으로도 지속적인 기술개발을 통해 국내 제조 산업의 부흥에 한 축을 담당하고 싶습니다.
또한, 글로벌 시장에서 경쟁력 있는 데이터베이스로서 제조 분야에서 반드시 사용해야 할 새로운 개념의 차세대 DBMS로 자리를 잡고, 대한민국에서 시작하여, 전 세계 IIoT 시장을 호령하는 대표적인 시스템 소프트웨어 기업으로 키우고 싶습니다.