딥페이크 영상으로 인한 일상의 위협을 방지하는 IT기술 발전이 시급하다. 딥페이크 영상을 실시간으로 탐지하는 것은 구현이 까다로워 현재까지는 분석을 위해 탐지 애플리케이션에 영상을 업로드 한 뒤, 결과가 나오기까지 몇 시간 이상 기다리는 과정을 거쳤는데 이러한 불편이 해소될 것으로 전망된다.
▲페이크캐쳐(FakeCatcher) (이미지-인텔)
비디오 픽셀 내 사람 ‘혈류’ 흐름 분석해 딥페이크 탐지 정확도 96% 기록
딥페이크 영상으로 인한 일상의 위협을 방지하는 IT기술 발전이 시급하다. 딥페이크 영상을 실시간으로 탐지하는 것은 구현이 까다로워 현재까지는 분석을 위해 탐지 애플리케이션에 영상을 업로드 한 뒤, 결과가 나오기까지 몇 시간 이상 기다리는 과정을 거쳤는데 이러한 불편이 해소될 것으로 전망된다.
16일 인텔이 96%의 정확도로 가짜 동영상을 탐지할 수 있는 페이크캐쳐(FakeCatcher) 기술을 개발했다고 밝혔다. 해당 기술은 인텔의 ‘책임있는 AI(Responsible AI)’ 노력의 일환으로 개발됐다.
인텔의 딥페이크 탐지 플랫폼은 세계 최초로 밀리초 단위 내로 분석 결과를 제공하는 실시간 딥페이크 탐지기로 인텔이 공개한 실시간 딥페이크 탐지 기술은 인텔 하드웨어와 소프트웨어를 사용해 웹 기반 플랫폼을 통해 서버와 인터페이스 상에서 구동한다.
대부분의 딥러닝 기반 탐지기는 원본 데이터를 확인 후, 비진위성의 징후를 찾고 영상의 문제를 식별하는 반면, 페이크캐쳐는 실제 인간의 요소, 즉 비디오 픽셀에서 나타나는 인간의 미묘한 ‘혈류’를 가늠해 실제 영상에서 단서를 확보한다.
이는 심장이 혈액을 내보낼 때 정맥의 색이 변하는데 이를 이용해 해당 탐지기는 원본 영상에서 나타나는 사람의 얼굴에서 혈류 신호를 수집하고, 알고리즘을 통해 시공간 지도로 변환한다. 이 후 딥러닝으로 영상의 진위를 즉시 판단할 수 있다.
소프트웨어 상에서는 다양한 전문 소프트웨어 도구를 사용해 최적화된 페이크캐쳐 아키텍처를 구성한다. 개발팀은 얼굴과 지형지물 감지 알고리즘을 위해서는 오픈비노(OpenVINOTM)를 사용해 AI 모델을 구동했다.
컴퓨터 비전 블록은 멀티 스레드 소프트웨어 라이브러리인 인텔 통합 성능 프리미티브(Intel® Integrated Performance Primitives)와 실시간 이미지 및 영상 처리 도구인 오픈CV를 바탕으로 최적화했으며, 추론 블록은 인텔 딥러닝 부스트(Intel Deep Learning Boost)와 인텔 어드밴스드 벡터 익스텐션 512(AVX0512)로, 미디어 블록은 인텔 AVX2로 최적화했다.
이와 더불어, 개발팀은 오픈 비주얼 클라우드(Open Visual Cloud) 프로젝트를 이용해 인텔 제온 스케일러블 프로세서 제품군을 위한 통합 소프트웨어 스택을 제공했다.
하드웨어로는, 신규 딥페이크 탐지 플랫폼은 3세대 인텔 제온 스케일러블 프로세서 상에서 최대 72개 각자 다른 탐지 스트림을 구동할 수 있다.
딥페이크로 인한 기만 행위는 매체 신뢰 하락과 같은 부정적인 결과를 초래할 수 있는데 향후 페이크캐쳐는 영상 업로드 시 필터링 시스템, 언론 미디어 매체의 조작 영상 보도 필터링 등에 활용할 수 있을 것으로 전망했다.
소셜 미디어 플랫폼은 사용자들이 해로운 딥페이크 영상을 업로드 하는 것을 막기 위해 해당 기술을 활용할 수 있다. 글로벌 뉴스 매체는 조작된 영상을 실수로 보도하는 것을 방지하기 위해 해당 기술 적용이 가능하다. 더불어, 비영리 단체들은 본 플랫폼을 활용해 모든 사람들이 사용할 수 있도록 딥페이크 탐지 기능을 공개할 수 있다.
일케 데미르(Ilke Demir) 인텔 랩 수석 연구원은 “유명한 연예인이 실제로 하지 않은 행동이나 말을 하는 동영상을 본 적이 있을 것”이라며 “딥페이크 영상은 이제 어디에서나 접할 수 있다”고 말했다.