AI를 훈련시키기 위해 사용되었던 거대한 온라인 도서 컬렉션 Meta가 저작권 문제로 사라졌습니다.

AI 훈련을 위한 거대한 온라인 도서 컬렉션 Meta가 저작권 문제로 사라졌습니다.

우리가 알고 있는 인공지능은 기본적으로 인터넷을 소비하고 다시 뱉어내는 데 존재합니다. 그러나 그 문제는 인터넷의 많은 부분이 저작권법으로 보호되고 있다는 것입니다.

이것은 덴마크 반저작권 단체인 Rights Alliance의 DMCA 요청에 따라 거대한 Books3 데이터베이스가 제거되는 것에서 주요한 교훈 중 하나입니다. 이 사실은 원래 TorrentFreak에서 보도된 것입니다. Books3에는 AI 모델의 훈련 목적으로 사용되기 위해 일반 텍스트 형식의 책 196,000권이 조금 넘게 포함되어 있었지만, 인터넷 상에 약간의 대체 링크가 있을 뿐이며, 더 이상 공개적으로 접근할 수 없습니다. 이전 링크는 404 페이지로 이동합니다.

Books3는 연구 그룹인 EleutherAI가 조직한 AI 훈련 콘텐츠인 The Pile의 일부로 존재했습니다. Gizmodo의 한 보고서에 따르면, Meta는 이전에 자체 AI 모델의 훈련에 The Pile을 사용했다고 언급했습니다. Google이 동일한 방식으로 불법으로 유포된 자료로 훈련을 받은 것으로 의심되는 큰 규모의 기술 AI 모델은 아마도 처음이 아닐 것입니다. 7월에 제기된 집단 소송은 Google이 동일한 일을 했다고 주장했습니다.

이러한 문제는 법적으로 빠르게 복잡해지는 것은 물론 윤리적으로도 복잡해집니다. 예를 들어, 역사적 보존 목적으로 전반적으로 해적 행위를 선호하는 사람은 동시에 저작권이 있는 자료로 AI 모델을 훈련시키는 것에 엄격하게 반대할 수도 있습니다(이렇게 생각하는 사람들이 몇 명 있다고 생각합니다). 또한, 다른 사람의 작업에서 제작자가 이후에 이러한 AI 모델을 통해 이익을 얻을 수 있기 때문에 작가들이 이러한 방식으로 자신의 작품을 사용하는 것에 반대하는 것은 쉽게 이해할 수 있습니다.

유일하게 확실한 것은 이러한 전투가 앞으로 더 혼란스러워질 것이라는 것입니다.