최근 AI 관련 저작권 이슈는 학습데이터 저작권 침해 여부 및 AI 생성물 저작 등록에 관한 문제가 주요 쟁점이다. 법무법인 디라이트 조원희 변호사는 AI 산업의 발전을 제한하지 않는 저작권 보호체계 마련이 중요하다고 주장했다.
AI 기술 발전과 저작권 보호체계...논쟁 현재진행형
학습 목적 공개 테이터 공정이용 의견 분분
韓 초거대AI 네이버 하이퍼클로바X 8월 공개
생성형 AI의 저작권 이슈가 화두인 가운데, AI 혁신과 저작권 규제가 조화를 이뤄야 한다는 전문가의 주장이 제시됐다.
한국지능정보사회진흥원과 한국인공지능법학회가 31일 포스트타워 10층 대회의실과 온라인을 병행해 생성형 AI 경쟁력 강화 및 법적 안정성 확보를 위한 대응방안을 모색하는 장을 마련했다.
최근 AI 관련 저작권 이슈는 학습데이터 저작권 침해 여부 및 AI 생성물 저작 등록에 관한 문제가 주요 쟁점이다. 집단 소송의 진행 사례가 7건으로 점차 늘고 있어 저작권자와 AI 개발자의 싸움은 현재 진행형 상태다.
생성형 AI와 저작권 이슈를 주제로 발표한 고려대학교 이대희 교수에 따르면, 우리나라는 미국의 AI 관련 판결 결과에 많은 영향을 받을 것으로 전망된다.
최근 소송 사례에는 소설가가 생성 AI 업체를 고발한 건들이 대다수로, 이들은 특정 예술가의 화풍을 토대로 영리 목적으로 무작위 사용하고 있다고 주장한다.
예컨대 소설가들은 오픈 AI에 대해 원고의 작품을 복제해 저작물을 이용해 상업적 이익을 얻었다고 주장했다. Kadrey는 메타의 LLaMA에 대해 소송을 제기했고, 사라 앤더슨도 Stable diffusion(스테이블 디퓨전)에 대해 생성 결과물은 학습 이미지에 바탕, 특정 이미지의 2차적 저작물이라며 이의를 제기했다.
그러나 클락슨 로펌은 오픈 AI와 MS에 저작권 침해 주장은 하지 못했다. 학습 데이터로 사용된 것은 추측 가능하나, 다양한 이미지를 흡수해 작품을 생성하는 생성 AI가 본인의 저작물을 활용했다는 사실을 입증하기 어렵다는 이유에서다.
판례 자체가 부족한 가운데 이 교수는 “생성 AI의 공정이용의 정도를 따질 때는 상업적 성격이 가장 중요하다”며, “원저작물의 일부를 변형, 요약해 추가적인 목적을 가지고 있어도 유사한 상업적 정도가 크다면 공정이용으로 보기 어렵다”고 말했다.
이어 법무법인 디라이트 조원희 변호사는 AI 산업의 발전을 제한하지 않는 저작권 보호체계 마련이 중요하다고 주장했다.
조 변호사는 해외 사례를 제시했다. 미국에서는 발명 AI는 사람이 주체가 아니라 저작물 등록이 신청 거절됐지만, 향후 기술적 발전과 결부돼 고려해야 한다는 의견이 분분하다. EU는 다소 보수적인 입장이며, 영국은 TDM(텍스트 및 데이터 마이닝) 일부 조항을 예외로 개정해 AI 이용과 발전을 중요시 보고 있다.
예컨대 게티이미지는 AI 이미지 스타트업에 소송했으나, 현실적으로 나올 수 있는 이미지는 그렇게 많지 않으며, AI 기술은 한 작가의 화풍을 뛰어넘을 수준으로 판단했다. 결국 기존 데이터와 학습된 데이터를 분리해서 보면 공정이용 이슈도 다르게 볼 수 있을 것이라는 의미다.
일본은 학습 데이터를 인정하되 저작권자 및 저작권을 위한 예외 조항을 두고 있으며, 이는 우리나라와 유사하다. 저작물에 이용자가 적법하게 접근할 수 있으면 된다는 조항이 있지만 이 또한 여전히 논란을 빚고 있다.
조 변호사는 AI 저작권법 규율 방안에서 AI 발전 측면을 중시했다. “우리나라는 LLM에 기반한 AI 엔진을 개발하고 있는 국가로, 오픈 AI, 메타, 구글 등 독점에 대응해야 하는 과제가 있다”며, “정책적 관점에서는 AI 산업 육성을 위해 EU의 규제적 접근을 답습할 필요가 없으며, AI 기술의 발전 속도를 고려한 단계적 접근이 필요하다”고 주장했다.
또한 “AI 기술 개발자와 AI 정책 입법자의 관점은 매우 다르다는 점을 이해해야 한다"며, "사용을 명시적으로 제한한 경우가 아닌 공개 테이터는 학습만을 위한 목적이라면 공정이용에 해당한다고 생각한다”는 입장을 밝혔다.
다만 학습을 허용한다 해도 크롤링과 학습데이터에 의한 사용을 제한하는 표준은 마련하고, 저작권과의 충돌도 사전에 방지하도록 소스 코드를 삽입하는 방안 등 규제는 필요하다고 덧붙였다. 즉 저작물의 일부가 AI의 산출물이 돼서는 안 된다는 설명이다.
한편 우리나라의 대표적 생성 AI로 네이버의 ‘하이퍼클로바X(HyperCLOVA X)’가 출시를 앞두고 있다. 지난 21일 네이버는 이를 기반으로 하는 서비스 라인업과 연내 출시 일정 등을 발표하며 본격적인 초대규모 AI 생태계 확장을 알렸다.
하이퍼클로바X와 대화형 에이전트 클로바X가 베타 서비스로 출시된다. 클로바X는 질문에 대한 답변뿐만 아니라 창착, 요약, 글쓰기 능력을 통한 생산성 도구로의 활약이 기대된다.
또한 9월에는 생성현 AI 기반 검색 서비스 ‘큐:(Cue:)’도 베타 서비스, 10월에는 하이퍼스케일 AI 도구 클로바 스튜디오에 하이퍼클로바X를 탑재한 버전을 출시한다.
하이퍼클로바는 한국어 데이터 학습량이 챗GPT의 6500배 이상으로, 커머스 금융 법률 등 전문분야 특화 한국어 중심 AI로, 뉴스 50년치 블로그 등을 학습 데이터로 사용됐다.
창작물의 학습을 통한 기술 발전과 상업적 이용이라는 허들이 공존하는 가운데 모두에게 유용하면서 안전하게 저작물을 보호할 수 있는 방안이 무엇인지 지속적인 논의가 필요할 것으로 보인다.