14 agosto, 2023

Dos escritores demandaron a OpenAI porque ChatGPT se entrenó con sus libros

La canadiense Mona Award y el estadounidense Paul Tremblay aseguraron que la empresa entrenó a GPT-3 con conjuntos de datos de dos libros protegidos por leyes de derechos de autor. La demanda fue interpuesta en San Francisco y sería uno de los primeros enfrentamientos legales contra una IA.
Mona Awad y Paul Tremblay, en pie de guerra con ChatGPT.Mona Awad y Paul Tremblay, en pie de guerra con ChatGPT.

Dos escritores presentaron una demanda contra la compañía OpenAI luego de considerar que ChatGPT, el chatbot más famoso del mundo, entrenó mientras consumió sus libros. Como se trata de obras protegidas por las leyes estadounidenses de derechos de autor, Mona Awad y Paul Tremblay exigen una compensación por parte la compañía de Inteligencia Artificial (IA).

Un resumen excesivamente detallado que proporcionó ChatGPT sobre sus libros, fue la principal pista para levantar las sospechas de Awad y Tremblay. La capacidad de saber con precisión la trama de las obras llevó a los autores a considerar que la IA generativa de OpenAI entrenó previamente leyendo sus libros que cuentan con derechos de propiedad intelectual. Awad y Tremblay hicieron equipo para crear una demanda colectiva contra la compañía que creó a la IA.

Antes de que el chatbot se hiciera famoso en todo el mundo, OpenAI perfeccionó el modelo de lenguaje extenso en el que está basado. El modelo GPT entrenó ingiriendo toda clase de contenidos y textos disponibles en internet para poder comunicarse de manera orgánica.

Hasta el momento, OpenAI no reveló las fuentes de información de dónde estudio su modelo de lenguaje, pero bases de datos como el Colossal Clean Crawled Corpus y el BookCorpus son bien conocidas por su uso en el desarrollo de las primeras IA de Meta, Google y OpenAI.

“Los demandantes no dieron su consentimiento para el uso de sus libros protegidos por derechos de autor como material de capacitación para ChatGPT. Sin embargo, los materiales fueron ingeridos y utilizados para entrenar ChatGPT. Los demandados (OpenAI), por y a través del uso de ChatGPT, se benefician comercialmente y obtienen grandes ganancias del uso de los materiales protegidos por derechos de autor de los demandantes” explica la demanda colectiva a la que tuvo acceso la publicación Wired.

Según la demanda, OpenAI entrenó a GPT-3 con dos conjuntos de datos de libros cuyo origen podría no ser legal. Las dos bibliotecas con las que entrenó la IA sumarían alrededor de 350 mil obras (subidas a internet por terceras personas) y entre ellas se encontrarían las obras de Awad y Tremblay.

La demanda fue interpuesta en San Francisco, California, y supone uno de los primeros enfrentamientos legales contra una IA en el continente americano, debido al consumo de datos sin consentimiento de los autores. Las acciones legales llegaron primero desde la industria de las publicaciones impresas, pero las compañías disqueras, empresas de streaming y artistas están interesadas en protegerse de la misma manera.

De momento el único país que presentó una clara postura legal en el consumo de datos para el entrenamiento de IA es Japón. En una de sus últimas charlas con la comunidad de artistas nacionales, un representante del gobierno aseguró que están trabajando en leyes para proteger a los artistas ante la llegada de algoritmos que aprender a hacer lo mismo que ellos. En el país de oriente, si una inteligencia artificial consume información de obras protegidas con fines comerciales será considerado como un delito y el responsable o creador de la IA enfrentará un proceso penal.

ChatGPT es una amenaza creciente contra las editoriales y autores. El dominio del lenguaje de la IA es tan orgánico que actualmente ya se venden libros donde el chatbot es el autor y se le acredita como tal. También los editores de revistas se quejaron ante la ola de cuentos falsos de ciencia ficción creados con IA.

*NA

Comparte esto:

Comparte esto:

Opinión