|
“생성형 AI 학습데이터 공개 의무화해야” 언론단체, AI기본법안 의견서 제출 |
한국신문협회·한국신문방송편집인협회·한국기자협회·한국인터넷신문협회·한국온라인신문협회 등 언론 5개 단체는 16일 국회 과학기술정보방송통신위원회·법제사법위원회, 문화체육관광부 등에 ‘인공지능 발전과 신뢰 기반 조성 등에 관한 기본법안(과방위 대안)’에 대한 의견서를 제출하고, 인공지능(AI) 사업자의 학습데이터 공개 의무화를 촉구했다.
언론단체는 의견서에서 이번 제정안이 AI 사업자가 지켜야 할 투명성, 안전성, 의무사항과 딥페이크 범죄 예방을 위한 AI 생성물 워터마크 의무화 등을 규정한 것은 적절한 조치라고 평가했다.
그러나 언론단체는 “생성형 AI 사업자가 AI 제품 및 서비스 개발을 위해 사용한 학습용 자료에 관한 기록을 수집·보관하고 공개하도록 하는 규정이 빠져있다”고 지적했다.
특히 “학습데이터 공개를 의무화하지 않는 것은 생성형 AI 사업자의 데이터 무단 이용을 허용해 저작권자의 권리를 심각하게 침해하게 된다”고 우려했다.
또한 “저작권자는 자신의 저작물이 어디에, 어떻게 사용됐는지 알 권리를 잃게 될 뿐만 아니라, 정당한 대가 요구도 어려워진다”고 설명했다.
언론단체는 이에 따라 “생성형 AI 사업자가 최대한 학습 데이터를 투명하게 밝히고 저작권자가 열람할 수 있도록 해야 한다”며 “생성형 AI 사업자 입장에서도 본인들의 기술에 대한 신뢰도를 높이려면 학습 데이터와 학습 방식 등을 투명하게 공개하는 것이 바람직하다”고 강조했다.
이어 AI기본법안 제31조(인공지능 투명성 확보 의무)에 다음 조항을 신설할 것을 제안했다.
△ 인공지능사업자는 생성형 인공지능 제품 및 서비스 개발을 위해 사용한 학습용 자료에 관한 기록을 수집·보관해야 하며, 이를 공개하여야 한다. 공개에 관하여 필요한 사항은 대통령령으로 정한다.
△ 인공지능사업자는 생성형 인공지능 제품 및 서비스 개발을 위해 사용한 학습용 자료에 대해 저작권자가 열람을 요청할 경우 관련 자료를 제공하여야 한다.
끝으로 언론단체는 생성형 AI 학습데이터 공개 의무화의 근거로 미국과 EU의 사례를 들었다. 미국은 2024년 4월 하원에서 발의된 ‘학습데이터 공개에 관한 법안’을 통해 학습데이터 요약본을 저작권청에 제출하도록 하고 있다. EU도 지난 3월 제정한 ‘AI법’에서 AI 기업들이 학습 및 훈련 과정에서 사용한 데이터에 대한 상세 내용을 공개하도록 규정하고 있다.
※ [붙임]‘인공지능 발전과 신뢰 기반 조성 등에 관한 기본법안(과방위 대안)’에 대한 언론단체 의견서 전문
[붙임]
‘인공지능 발전과 신뢰 기반 조성 등에 관한 기본법안
(과방위 대안)’에 대한 언론단체 의견서
▢ 이번 제정안(AI기본법안)은 AI 사업자가 지켜야 할 투명성, 안전성, 의무 등 AI 시대 신뢰기반을 조성하기 위한 기본 사항과 AI 기술이 악용돼 발생할 수 있는 딥페이크 범죄를 예방하기 위해 AI 생성물에 ‘워터마크’(식별 표시)를 의무화하도록 하고 있습니다.
▢ 이는 생성형AI의 환각 현상과 편향성을 예방하기 위한 적절한 조치라고 봅니다.
▢ 생성형 AI의 생성물이 신뢰성을 확보하기 위해서는 학습용 데이터의 품질이 무엇보다 중요합니다. 또한 가장 믿을 수 있는 고품질의 데이터는 언론사가 생산하는 뉴스 콘텐츠입니다.
▢ 하지만 이번 제정안은 생성형AI의 학습데이터와 학습 방법 공개 등에 관한 사항이 빠져 있습니다. 어떤 데이터를 학습했는지 불투명한 상황에서 AI 생성물의 품질을 신뢰하기 어렵습니다.
▢ 학습데이터 공개를 의무화하지 않는 것은 기술기업의 데이터 무단 이용을 허용해 결국 저작권자의 권리를 심각하게 침해하게 됩니다.
▢ 저작권자는 자신의 저작물이 어디에, 어떻게, 어떤 방식으로 사용됐고 결과물에는 어떤 방식으로 작용하게 되는지에 관해 알 권리를 잃게 됩니다. 뿐만아니라 기술기업이 학습데이터를 공개하지 않은 상황에서 저작권자는 정당한 대가 요구가 어려워집니다.
▢ 따라서 생성형AI 기업이 최대한 학습 데이터를 투명하게 밝히고 저작권자가 열람할 수 있도록 해야 합니다.
▢ 생성형AI 기업 입장에서도 AI 결과물의 신뢰도를 높이려면 학습 데이터와 학습 방식 등을 투명하게 공개하는 것이 바람직합니다.
▢ 미국의 경우 2024년 4월 하원에서 발의된 ‘학습데이터 공개에 관한 법안(Generative AI Copyright Disclosure Act of 2024, H.R.7913, Schiff 의원 발의)’은 학습데이터의 요약(summary)을 미국 US Copyright Office(USCO)의 장(Register)에게 제출하는 형태로 학습데이터를 공개하도록 하고 있음을 참고할 필요가 있습니다.
▢ EU도 지난 3월 제정한 ‘AI법(AI Act)’에서 AI 기업들이 EU의 저작권법을 준수하고 AI모델 학습 및 훈련 과정에서 사용한 데이터에 대한 상세한 내용을 공개하도록 하고 있습니다.
▢ 따라서, 이번 제정안을 다음과 같이 개정해야 합니다.
현행 | 개정 의견 |
제15조(인공지능 학습용데이터 관련 시책의 수립 등) ①~④ (생 략) ⑤ <신 설>
⑤ (생 략) ⑥ (생 략) | 제15조(인공지능 학습용데이터 관련 시책의 수립 등) ①~④ 좌 동 ⑤ 과학기술정보통신부장관은 통합제공시스템에 학습용데이터를 제공하는 원저작권자의 권리를 보호하고, 합리적인 저작권 제공의 대가 산정 기준을 만들어 대가를 지급해야 한다. ⑥ 좌 동 ⑦ 좌 동 |
제27조(인공지능 윤리원칙 등) ① 정부는 인공지능윤리의 확산을 위하여 다음 각 호의 사항을 포함하는 인공지능 윤리원칙(이하 “윤리원칙”이라 한다)을 대통령령으로 정하는 바에 따라 제정ㆍ공표할 수 있다. 1. ~ 3. (생 략) 4. <신 설> | 제27조(인공지능 윤리원칙 등) ① 정부는 인공지능윤리의 확산을 위하여 다음 각 호의 사항을 포함하는 인공지능 윤리원칙(이하 “윤리원칙”이라 한다)을 대통령령으로 정하는 바에 따라 제정ㆍ공표할 수 있다. 1. ~ 3. 좌 동 4. 인공지능 기술이 불러올 법적·제도적·윤리적 분쟁이 최소화될 수 있도록 인공지능사업자 및 해당 단체 종사자 등에 대한 지침 마련 및 교육 |
제31조(인공지능 투명성 확보 의무) ① 인공지능사업자는 고영향 인공지능 또는 생성형 인공지능을 이용한 제품 또는 서비스를 제공하려는 경우 제품 또는 서비스가 해당 인공지능에 기반하여 운용된다는 사실을 이용자에게 사전에 고지하여야 한다. ② <신 설>
③ <신 설>
② (생 략) ③ (생 략) ④ (생 략) | 제31조(인공지능 투명성 확보 의무) ① 좌 동
② 인공지능사업자는 생성형 인공지능 제품 및 서비스 개발을 위해 사용한 학습용 자료에 관한 기록을 수집·보관해야 하며, 이를 공개하여야 한다. 공개에 관하여 필요한 사항은 대통령령으로 정한다. ③ 인공지능사업자는 생성형 인공지능 제품 및 서비스 개발을 위해 사용한 학습용 자료에 대해 저작권자가 열람을 요청할 경우 관련 자료를 제공하여야 한다. ④ 좌 동 ⑤ 좌 동 ⑥ 좌 동 |