개인 정보 보호 기능을 통합하는 연합 학습(FL)이 의료, 금융 등 상호 공유나 노출이 어려운 데이터 학습 및 알고리즘 개발에 적용되며 생태계가 확대되고 있다.
인텔, LF AI & 데이터 재단 인큐베이션 프로젝트 참여
개인 정보 보호 기능을 통합하는 연합 학습(FL)이 의료, 금융 등 상호 공유나 노출이 어려운 데이터 학습 및 알고리즘 개발에 적용되며 생태계가 확대되고 있다.
인텔이 13일 LF AI & 데이터 재단 기술 자문위원회(LF AI & Data Foundation Technical Advisory Council)의 인큐베이션 프로젝트에 참여해 개방형 연합학습(OpenFL)을 승인했다고 밝혔다.
OpenFL은 분산된 AI를 위한 오픈소스 프레임워크로 컨피덴셜 컴퓨팅이라고 하는 개인 정보 보호 기능을 통합하는 연합 학습(FL)이다. 인텔은 본 프레임워크를 개발 및 호스팅해 데이터 과학자가 데이터 개인 정보 보호 문제를 해결하는 동시에, 이질적이거나 기밀성이 높은 또는 규제를 받는 데이터 집합에서 인사이트를 확보할 수 있도록 지원한다.
이브라힘 하다드 박사(Dr. Ibrahim Haddad) LF AI & 데이터 재단 상임 이사는 “이 프로젝트는 조직이 미가공 데이터를 공유하지 않고도 여러 시스템과 데이터 센터에서 머신러닝 모델을 공동으로 학습할 수 있도록 지원하는 혁신적인 접근방법으로 오픈소스 AI 및 데이터 기술의 성장과 채택을 가속화하려는 우리의 사명과 완벽하게 일치한다”며 “본 프로젝트를 주도하는 유능한 인재들과 협력해 프로젝트를 성공적으로 완수할 수 있기를 기대한다”고 말했다.
데이터 과학자는 분산형 머신러닝 접근 방식을 통해 조직이 민감한 데이터나 머신러닝 알고리즘을 다른 조직에 노출하지 않고도 상호 유익을 달성할 분석을 위해 협업할 수 있다. △의료 서비스 △금융 서비스 △소매 및 제조업 등 산업에서는 연합 학습을 사용해 여러 시스템과 데이터 세트를 안전하게 연결하면서, 분석을 위한 데이터 취합에 방해되는 장애물들을 제거하고 데이터에서 가치 있는 인사이트를 확보하는 것이 중요하다.
인텔은 펜실베니아대학교 페럴만 의과대학(Penn Medicine), VM웨어(VMware) 및 플라워 랩스(Flower Labs)와 함께 LF AI & 데이터 재단에 OpenFL을 선보였다. 각 기업의 대표들은 재단에 합류해 본 프로젝트의 벤더 중립적인 생태계를 조성하고 개발 방향을 제시하는 OpenFL 기술 운영 위원회를 구성할 예정이다. 인큐베이션 단계의 프로젝트인 만큼, LF AI & 데이터 재단과 함께 프로젝트 운영 방식을 위한 기반을 마련하고 있다
OpenFL은 유연하고 확장 가능하며 안전하게 설계된 연합 학습을 위한 프레임워크다. 이를 통해 기업은 기밀성이 높거나 규제 대상의 데이터를 오프프레미스로 옮기지 않고도 다자간 머신러닝 과정에 참여할 수 있다. 대신, 알고리즘이 데이터를 보유한 곳에서 데이터를 처리한 뒤, 비식별화된 결과를 중앙에서 통합한다. 어떤 개별 조직의 데이터도 다른 조직에게 노출되지 않는다.
OpenFL은 하드웨어와 소프트웨어를 결합, 데이터 센터용 하드웨어 기반 신뢰실행환경(TEE)인 인텔 소프트웨어 가드 익스텐션(Inte SGX) 및 인텔 SGX 기반의 컨피덴셜 컴퓨팅 플랫폼에서 수정되지 않은 애플리케이션을 실행하기 위한 도구 및 인프라 구성 요소 집합인 그래민 프로젝트(The Gramine Project)를 사용해 개인 정보를 보호하는 AI를 더욱 활성화한다.
현재 OpenFL과 인텔 SGX 오픈 소스 통합이 지원되며, 향후 추가 보안 기능이 제공될 예정이다. 프로젝트에 참여하는 조직이 다른 TEE 하드웨어와의 통합을 프로젝트에 추가할 수 있다.