정부가 90년대 초 정보화 혁명에 비견되는 디지털 심화에 대응하고, 사회적 수용성을 높이기 위해 올해 9월 ‘디지털 권리장전’을 마련한다. 디지털 권리장전에는 △디지털 심화의 비전?목표 △추구해야 할 보편적 가치 △주체(시민, 기업, 정부 등) 별 권리와 책임 △디지털 심화 쟁점 해소를 위한 공통기준?원칙 등을 규정한다. 각 부처에서 소관 분야의 디지털 심화 쟁점을 해소하기 위한 정책에 반영된다.
▲'새로운 디지털 질서 정립 방안'을 브리핑 중인 과기부 이종호 장관
디지털 질서 확립…AI 사회적 논의·공론화 본격
범부처 ‘디지털 심화 대응 실태’ 정기 진단 실시
7월말까지 AI허브에 학습용 데이터셋 310종 개방
정부가 90년대 초 정보화 혁명에 비견되는 디지털 심화에 대응하고, 사회적 수용성을 높이기 위해 올해 9월 ‘디지털 권리장전’을 마련한다.
과학기술정보통신부는 5월 2일(화) 윤석열 대통령이 주재한 국무회의에서 ‘새로운 디지털 질서 정립 방안’을 보고하고, 범정부 차원의 대응을 본격 추진한다고 밝혔다. 이는 지난해 대통령 뉴욕구상, 올해 1월 다보스 포럼, 지난 4월 美 국빈 방문 시 하버드大 연설의 후속 조치의 일환이다.
디지털 대전환이 전 산업 분야에서 촉발되며 사회 전반에 새로운 디지털 심화 쟁점들이 발생하고 있다. 특히 인공지능(AI)이 국민의 일상에 자리하게 된 현상과 맞물려 이해 관계자가 실제 직면하게 될 현안이 무수히 존재한 반면, 관련 규범 체계는 부재한 상황이다.
예컨대 챗GPT와 같은 생성 AI로 인한 개인정보 및 저작권 침해 여부 문제 등이다. 영상·음성 인식에서 신뢰성 여부, 운송 수단에서 운전자 개입이 없는 자율주행 레벨 4에서 사고 발생 시 책임 소재 등과 관련된 내용 등이다.
디지털 권리장전에는 △디지털 심화의 비전⋅목표 △추구해야 할 보편적 가치 △주체(시민, 기업, 정부 등) 별 권리와 책임 △디지털 심화 쟁점 해소를 위한 공통기준⋅원칙 등을 규정한다. 각 부처에서 소관 분야의 디지털 심화 쟁점을 해소하기 위한 정책에 반영된다.
민⋅관 협의체를 구성해 디지털 심화 쟁점을 해소하기 위한 학계, 업계, 소비자 단체 등이 함께 사회적 논의와 공론화를 본격 추진한다.
디지털 질서에 대한 국민들의 인식제고와 시민참여를 유도한다. 주요 디지털 심화 쟁점들에 관해 누구나 자유롭게 토론할 수 있는 ‘디지털 공론장’이 8월 구축된다.
이에 대한 정책적 실효성을 높이기 위해 ‘디지털 심화 대응 실태’를 정기적으로 진단한다. 범정부 대응 현황을 분석하고, 정책방향을 모색 및 도출하기 위함으로, 관련 글로벌 디지털 규범 논의에 활용된다.
또한 G20, UN, OECD 등 국제기구에서의 디지털 규범 논의에서 목소리를 내기 위해 우리나라가 주도하는 포럼을 올해 내 신설할 계획이다.
과기정통부 이종호 장관은 “우리나라 대통령이 전 세계적으로 활발히 진행되고 있는 디지털 규범 논의에 관한 미래 비전과 나아가야 할 방향을 선도적으로 제시하게 된 것에 큰 의미가 있다”며, “이제 범정부 차원의 추진방안을 마련한 만큼, 관계부처와 긴밀히 협력하고 충분한 사회적 공론화를 통해 디지털 모범 국가로서 디지털 심화 시대의 새로운 질서를 정립해 나가겠다”라고 말했다.
■ AI허브 학습용 데이터셋 공개
과기부는 지난 4월 30일 한국지능정보사회진흥원과 AI 학습용 데이터셋 310종을 오늘부터 7월말까지 매달 80여종씩 ‘AI허브(aihub.or.kr)’를 통해 순차적으로 개방하겠다고 밝혔다.
특히 올해는 이용자들이 빨리 활용할 수 있도록 품질검증 등을 먼저 마친 데이터를 우선 개방한다. 이에 따라 초기 개방 시점은 지난해 보다 3개월 앞당겨진다.
이를 통해 기업, 연구자, 개발자는 물론 인공지능 개발 등에 관심 있는 우리 국민이라면 누구나 ‘AI허브’를 통해 학습용 데이터를 활용할 수 있다.
2020년부터 지금까지 정부가 개방한 데이터는 한국어, 이미지·영상, 헬스케어 등 6대 분야 381종, 약 11억 건에 이른다. 지난해 7월에는 190종의 데이터를 개방하며 ‘AI허브’ 연간 방문자 수가 최초로 1백만 명을 돌파한 바 있다.
올해 개방하는 데이터는 역대 최대 규모 310종으로, 구축 분야를 제조·로보틱스·교육·금융·스포츠 등 14대 분야로 확장했다. 사업 규모를 크게 늘렸기 때문이다. 이번에 310종 약 15억 건의 데이터 개방을 완료하면 ‘AI허브’ 이용자들은 총 691종, 약 26억 건의 데이터를 활용할 수 있게 된다.
엄열 인공지능정책관은 “우리 기업 및 연구자가 새로운 데이터 확보에 어려움을 겪지 않도록 초거대 AI 학습에 필요한 대규모 비라벨링 데이터와, 한번에 여러가지 유형을 학습시킬 수 있는 다중임무형 라벨링 데이터 등 다양한 유형의 데이터를 지속 확보해 나갈 예정”이라고 말했다.