내에도 숙박 플랫폼인 ’코자자’, IoT 데이터 플랫폼 ‘앵커스(ankus)’와 같은 플랫폼 업체가 있다. 오픈소스 커뮤니티라고도 불리는 앵커스는 내부에 보유한 센서 데이터와 기타 보유 데이터에 민간에서 공개된 공공데이터를 합산하여 머신러닝에 구현한다. 이와 같은 결과물은 2차 저작물 개발을 원하는 기업에 제공된다. 중소기업은 분석데이터를 통해 과정을 줄이고 총 소요 비용을 줄여 원가절감을 이룰 수 있다. 또한 데이터 재사용으로 총 생산 비용을 낮추기도 한다.
무료 공개된 데이터 가져다 통합하거나 가공하는 해외와 비지니스 형태 달라
빅데이터가 ‘뽑기’라는 말이 있다. 잘 뽑으면 대박이고 아니면 쪽박을 차기도 한다는 말이다.
미국의 데이터 산업을 보면 ‘대박’의 사례가 많다. 요들(yodel)이라는 플랫폼 회사가 그렇다. 이 회사는 데이터 회사의 홈페이지를 스크랩해 원하는 회사에 맞춰 제공해주는데, 다른 회사에 팔렸다. 자그마치 약 7천억원에. 그만큼 데이터 플랫폼 사업이 돈이 된다는 소리다.
그도 그럴 것이 미국에는 분쟁을 조절하고 관리해주는 데이터마케팅협회(DMA)가 있다. 개인정보부터 데이터 수집, 소비자 고지, 책임 마케팅 등 데이터 사용에 지침을 제시하고 관리하는 사후 책임제를 시행한다. 누군가가 입을 피해에 대한 우려는 미국에서도 나타났으나 데이터 자율규제 시범 운행 2년 후, 큰 문제가 되지 않는다는 결론에 따라 지금까지 잘 유지되고 있다.
서울시가 운행하는 심야버스는 빅데이터를 기반으로 시민의 통행 시간을 계산, 배치했다
이와 같은 제도적인 기반 위에 미국의 빅데이터 산업은 승승장구다. 데이터 관리와 가공이 잘되니 프로그래밍도 쉽다. 시장에 들어선 지 8년 만에 세계적 호텔 체인 힐튼을 넘어서는 객실 수를 갖춘 ‘에어비앤비(AirBnB)’가 대표적이다. 에어비앤비는 객실을 짓지 않고 ‘연결’했다. 기존의 데이터를 잘 연결했기 때문에 가능한 일이다. 개별 회사가 수행하기에 어려운 데이터 가공 정제를 수행해주는 회사도 있다. 크라우드 플라워(Cloud Flower)는 비즈니스에 필요한 인공지능을 구축해 수익을 올린다.
물론 국내에도 숙박 플랫폼인 ’코자자’, IoT 데이터 플랫폼 ‘앵커스(ankus)’와 같은 플랫폼 업체가 있다. 오픈소스 커뮤니티라고도 불리는 앵커스는 내부에 보유한 센서 데이터와 기타 보유 데이터에 민간에서 공개된 공공데이터를 합산하여 머신러닝에 구현한다. 이와 같은 결과물은 2차 저작물 개발을 원하는 기업에 제공된다. 중소기업은 분석데이터를 통해 과정을 줄이고 총 소요 비용을 줄여 원가절감을 이룰 수 있다. 또한 데이터 재사용으로 총 생산 비용을 낮추기도 한다.
정부에서도 빅데이터의 중요성을 인지하고 있다. 전염병의 확산을 막거나 심야버스를 운행하게 된 배경에는 데이터 분석이 있었다. 전염병이 어디에서 시작하고 어디로 확산되는지의 데이터를 파악하고, 시민의 통행 시간을 계산하여 심야버스를 배치한 것이다. 그 외에 공공기관에서도 정보를 공개하고 있다.
“공공기관에서 정보를 공개하고 있으나 사용자를 충족시켜주지 못하고, 데이터를 가진 민간 기관은 각종 제약 때문에 공개하지 못한다”
하지만 국내 빅데이터 산업은 갈 길이 멀다. 어떤 데이터를 ‘뽑기’해야 하는지의 고민보다는 아예 ‘뽑을’ 데이터가 없는 경우가 태반이다. 쓸만한 데이터도 없고 쓰고 싶어도 마음대로 쓰지 못하는 데이터가 많다는 얘기다.
빅데이터 산업 활성화를 위한 정책토론회에 나선 한국데이터진흥원 이재진 유통사업실장이 “공공기관에서 정보를 공개하고 있으나 사용자를 충족시켜주지 못하고, 데이터를 가진 민간 기관은 각종 제약 때문에 공개하지 못한다”고 말한 이유도 여기에 있다. 데이터는 가공이 이뤄져야 비로소 필요로 하는 정보가 될 수 있기 때문이다.
이러한 점은 해외의 경우와 분명한 차이에서 비롯된다. 외국의 데이터 비즈니스는 무료 공개된 데이터를 가져다 필요한 형태로 통합하거나 가공해 사용하는 형태이지만 국내는 데이터를 가진 사람이 배포하는 정보를 가져다 이용하는 형태로 대개 가공까지 연결되지 않는다.
싱가포르 연구소가 조사한 결과, 한국의 데이터 규제는 싱가폴, 미국, EU, OECD 평균치 보다 높은 수준으로 나타났다. 개인정보 보호와 회사간 분쟁을 사전에 막기 위한 규제는 데이터 배포 뿐만 아니라 보관, 수집, 가공에도 제한이 있다. 본지에서 1월에 다뤘던 ‘디지털 트렌스포메이션 포럼’의 토론 기사를 인용하면, 국내 플랫폼 회사가 활성화되지 못하는 이유로 빨라지는 디지털화 속도에 비해 수직적인 기업문화, 개인정보 활용에 대한 거부감이 언급되기도 한다.
토론회에 참석한 AT커니, 심태호 파트너는 “IT를 기반으로 하는 플랫폼이 없고, 원천기술도 없다. 데이터를 도입해 활용해야 하는데 내세울 만한 사업도 없다보니 글로벌 플랫폼에 종속될 위험이 있다”고 지적했다. 정부의 규제 개선과 대대적인 투자, 전문 인력이 필요하다는 말을 새삼 반복하고 싶지는 않지만 문제의 원인을 찾다보면 결국 결론은 그렇게 내닫는다. 마침 국회에서 벌어진 이 같은 토론회의 진언들이 공허한 메아리가 되지 않기만을 바랄 뿐이다.