"개발사 측이 사적 이익 취한다면 저작권자에 보상해야"
"생성형 AI 관련 저작권 법 아직 없어…아직 연구 단계"
|
31일 업계에 따르면 지난해 12월 오픈AI의 챗GPT가 등장한 후로 글로벌 빅테크 기업들과 네이버, 카카오 등 국내 기업들이 생성형 AI 공세를 펼치는 가운데 지식재산권 침해 논란이 꾸준히 발생하고 있다.
오픈AI는 최근 자사 웹 크롤러인 GPT봇을 공개하면서 정보 수집·이용을 원치 않는 사이트 소유자에게 GPT봇의 데이터 수집을 차단하는 방법을 안내했다. 이에 뉴욕타임스·CNN·블룸버그·로이터 등 외신과 아마존·이케아·에어비앤비 등 글로벌 기업들은 웹사이트에 GPT봇이 접근하지 못하도록 차단했다.
네이버 역시 최근 공개한 하이퍼클로바X가 콘텐츠 제작자의 동의 없이 뉴스 데이터 및 블로그, 카페 게시물을 무단 학습시켰다는 논란에 휩싸인 바 있다. 한국신문협회는 지난 22일 '생성형 AI의 뉴스 저작권 침해 방지를 위한 입장'을 내고 "생성형 AI는 뉴스 콘텐츠를 학습해 결과물을 생성해내면서도 언론사로부터 이용 허락을 받지 않았으며 인용 표기도 이뤄지지 않고 있다"며 "생성형 AI를 학습시키기 위해서는 뉴스 콘텐츠 저작권자인 언론사로부터 이용 허락을 받아야 침해 행위를 벗어날 수 있다"고 지적했다.
전문가들 역시 생성형 AI를 학습시키는 것이 저작권 침해 문제서 자유로울 수 없다고 입을 모았다. 최병호 고려대 인공지능연구소 교수는 "공공의 이익과 지식재산권 보호 중 어디에 초점을 두느냐에 따라 해석이 달라질 수 있다"며 "만약 생성형AI를 오직 공공의 이익을 위해 개발했다면 개발사 측은 상업적 이익을 취하면 안 되는데, 결국 API 서비스 등을 통해 사적 이익을 취할 것이 분명하므로 데이터 저작권자들과 수익을 나누는 등 적절한 보상을 제공해야 한다"고 설명했다.
생성형 AI 학습 과정에서의 지식재산권 침해와 관련된 법 제정도 시급한 상황이다. 전창배 국제인공지능윤리협회 이사장은 "전 세계적으로 생성형 AI가 등장한 지 얼마 되지 않아 AI 학습 데이터의 저작권에 관련된 법이 아직 없다. 기존 저작권법으로는 해결이 되지 않고, 아직 새로운 법을 연구하는 단계라 시간이 걸릴 것으로 보인다"며 "법이 마련되기 전까지는 개발사와 저작권자 사이의 법적 분쟁은 민사 소송으로 해결해야 할 것"이라고 말했다.
다만 저작권자 입장에서 개발사가 해당 데이터를 실제로 사용했는지 사용하지 않았는지 입증하기 어렵다는 한계도 있다. 김형중 고려대 정보보호대학원 특임교수는 "예를 들어 언론사가 개발사를 상대로 소송을 했는데 개발사 측에서 '다른 신문에도 다 나와있는 내용'이라며 해당 언론사의 뉴스를 학습시킨 사실을 부인할 수도 있다"며 "따라서 개발사가 해당 데이터를 가져다 썼는지 입증할 수 있어야 하고 피해가 얼마나 발생했는지도 보여줘야 한다"고 설명했다.