이제 빅데이터는 그렇게 낯선 단어가 아니다. 정부나 공공부문 이외에도 개인이 실시간으로 만들어내는 데이터의 양도 기하급수적으로 많아지고 있다. 늘어나는 데이터를 어떻게 수집하고 분석하느냐가 빅데이터의 가치를 좌우한다.
빅데이터를 분석하기 위해서는 다양하게 수집한 데이터를 처리, 분석하여 지식을 추출하고 이를 기반으로 지능화된 서비스를 제공하는데 필요한 IT 환경인 빅데이터 플랫폼과 전문가가 필요하다.
어니컴(www.onycom.com)은 빅데이터, 사물인터넷, 클라우드 등 솔루션과 서비스를 제공하는 회사로 최근 공공기관용 빅데이터 분석 플랫폼인 ‘앵커스 애널라이저 G’를 오픈소스로 공개했다. 앵커스는 커뮤니티가 주관하는 오픈소스 버전과 어니컴이 주관하는 상용버전으로 나뉜다.
공공기관용 빅데이터 분석 플랫폼 오픈소스로 공개
하둡 기반 분산 병렬 처리, 직관적인 GUI가 장점
이제 빅데이터는 그렇게 낯선 단어가 아니다. 정부나 공공부문 이외에도 개인이 실시간으로 만들어내는 데이터의 양도 기하급수적으로 많아지고 있다. 늘어나는 데이터를 어떻게 수집하고 분석하느냐가 빅데이터의 가치를 좌우한다.
빅데이터를 분석하기 위해서는 다양하게 수집한 데이터를 처리, 분석하여 지식을 추출하고 이를 기반으로 지능화된 서비스를 제공하는데 필요한 IT 환경인 빅데이터 플랫폼과 전문가가 필요하다.
어니컴(www.onycom.com)은 빅데이터, 사물인터넷, 클라우드 등 솔루션과 서비스를 제공하는 회사로 최근 공공기관용 빅데이터 분석 플랫폼인 ‘앵커스 애널라이저 G’를 오픈소스로 공개했다. 앵커스는 커뮤니티가 주관하는 오픈소스 버전과 어니컴이 주관하는 상용버전으로 나뉜다.
앵커스 애널라이저 G 데모
앵커스 애널라이저 G는 오픈소스 개발 프로젝트 ‘앵커스’ 분석 라이브러리를 활용해 개발한 웹 기반 데이터 마이닝 솔루션이다. 인터넷 익스플로러, 파이어폭스, 크롬, 사파리, 오페라 등 대표적인 5개의 웹 브라우저에서 정상적으로 기능 구현이 가능하다. 브라우저만 있다면 접근해서 사용하는데 문제가 없다. 외부 공개, 사용자 알고리즘을 추가해 사용할 수 있으며, 별도의 코딩 같은 개발적 요소 없이도 사용 가능하다. 워크플로우 모델 적용과 서비스용 API도 지원하기 때문에 예측 모델, 분석 모형 등의 구현이 용이하다.
어니컴의 이성준 이사는 “앵커스의 역할은 분석 플랫폼으로서 밑그림을 제공하는 것이다. 이 밑그림으로 목표를 구체화 하는 것”이라며 “가이드가 있는 프로그램이 목표를 빨리 달성하는 것은 당연하다. 가이드를 제공해 난이도 있는 사업을 수행할 때 기간내에 빠르게 사용할 수 있게 하는 것”이 목표라고 밝혔다.
앵커스 애널라이저는 하둡(Hadoop) MapReduce를 기반으로 빅데이터 분산 병렬 처리를 지원한다. 또, 데이터 마이닝/기계 학습을 기반으로 고차원 지능형 예측 분석이 가능하다. 이에 편리하고 직관적인 GUI로 손 쉽게 분석 설계를 할 수 있게 했다.
이에 더해 기존 분석도구들은 분석도구에서 제공하는 알고리즘만을 사용한데 반해 앵커스 애널라이저 G는 사용자가 직접 개발한 알고리즘, weka와 같은 오픈소스 알고리즘을 추가하여 데이터 분석을 하는 것이 가능하다. 입력데이터를 처리하는 전처리 작업과 분석 알고리즘 결과는 처리하는 후처리 작업도 추가할 수 있다.
정형, 비정형 데이터 분석지원, 대용량 데이터의 배치분석에 활용할 수 있고, 기계학습 기반 지능형 플랫폼 구축, 센서/머신 실시간 데이터 분석 플랫폼으로도 활용이 가능하다. 파이톤(Python), Spark 등의 연계 모듈 개발 적용과 기계학습/딥러닝 알고리즘 개발, 저작권 보유사 기술 연동 공개도 업데이트될 예정이다.
앵커스 애널라이저 G는 전체 소스코드가 깃허브(Github)에 공개 되어 있으며, 알고리즘도 깃허브에서 다운로드 후 연동해 사용하면 된다.
어니컴은 소스코드 활용 시스템을 구축하고 예측모델 구축, 서비스 적용에 대한 교육을 매월 하고 있을뿐만 아니라 분석 설계, 구축, 테스트, 안정화에 걸쳐 컨설팅도 하고 있다.