<style>.lazy{display:none}</style> ¿Se puede demandar a ChatGPT por plagio? El autor de Juego de Tronos cree que sí - Alto Nivel
Buscador
Ver revista digital
Actualidad

¿Se puede demandar a ChatGPT por plagio? El autor de Juego de Tronos cree que sí

29-09-2023, 9:04:30 AM Por:
© Especial

Para ganar el juicio civil entablado por 17 famosos escritores de EEUU, su demanda incluye una confesión de plagio que ofreció el mismo ChatGPT.

Esta no es una alianza entre casas reales, ni una batalla contra los hijos de la arpía, aunque sí están uniendo fuerzas para obtener una multimillonaria reparación por el “robo sistemático a gran escala” de sus creaciones: Son 17 famosos escritores estadounidenses, entre ellos el autor de la saga “Juego de Tronos”, George R. R. Martin, quienes han demandado a la empresa OpenAI por haber plagiado sus obras para “entrenar” a ChatGPT.

La demanda colectiva busca una indemnización “por las violaciones flagrantes y perjudiciales” presuntamente realizadas por la compañía de Inteligencia Artificial (IA) en contra de los derechos de autor de Martin, y de escritores como Michael Connelly, creador del detective de ficción Harry Bosch, llevado a la pantalla por Amazon Prime Video, así como del personaje Mickey Haller (El abogado del Lincoln en Netflix); John Grisham (El informe pelícano); y Scott Turow (Presunto inocente), entre otros.

Los autores están pidiendo en la Corte del Distrito Sur de Nueva York que OpenAI sea sancionada porque el consorcio copió sus obras de manera masiva, “sin permiso ni consideración”. Además, intentan obtener una orden judicial que obligue a la firma a dejar de infringir los derechos de los demandantes, lo que incluiría prohibir que las obras de los querellantes sean usadas en ChatGPT.

¿Cómo se llevó a cabo el plagio?

La respuesta a esta pregunta, que es fundamental para ganar el juicio civil entablado por los escritores, la dio el mismo ChatGPT cuando se le preguntó -en enero de 2023- cómo había sido “entrenado”.

El chatbot respondió: “Es posible que algunos de los libros utilizados para entrenarme estuvieran protegidos por derechos de autor. Sin embargo, mis datos de entrenamiento procedieron de varias fuentes disponibles públicamente en internet, y es probable que algunos de los libros incluidos en mi conjunto de datos de entrenamiento no estaban autorizados para ser usados”, puede leerse en la demanda, cuya copia posee ALTO NIVEL.

Adicionalmente, el ocurso incluye una clara confesión de ChatGPT, que ha servido a los creadores para argumentar y probar el plagio del que se duelen: “Si se incluyó algún material con derechos de autor en mi capacitación de datos, habrían sido utilizados sin el conocimiento o consentimiento del titular” de esos derechos, admitió el chat.

Según los escritores, que en la Corte neoyorquina están representados por la firma legal Cowan DeBaets Abrahams & Sheppard, OpenAI y sus subsidiarias copiaron las obras a gran escala introduciéndolas de manera masiva en sus modelos de lenguaje (Large Languaje Model o LLM, por sus siglas en inglés).

Estos modelos son algoritmos diseñados para generar texto, emulando las respuestas humanas tras recibir una consulta o indicación (prompt). Los LLM utilizan técnicas de aprendizaje profundo a partir de grandes conjuntos de datos.

“En el corazón de estos algoritmos se encuentra el robo sistemático a escala masiva” de los libros de George R. R. Martin, Michael Connelly, John Grisham, Scott Turow, y de otros 13 creadores demandantes, se apunta en el expediente.

¿A cuánto podría ascender la indemnización?

En vez capacitar a sus LLM con obras de dominio público, cuyos derechos de autor ya no están vigentes, OpenAI habría utilizado buscadores de metadatos y páginas de internet que contienen copias piratas de libros.

De acuerdo con investigaciones de expertos independientes en Inteligencia Artificial, que son citados en la demanda, los archivos con los textos de estos y otros autores pudieron ser descargados de grandes repositorios en los que se alojan -de manera ilícita- libros protegidos por el derecho de autor.

Como ejemplo se menciona el sitio en internet Library Genesis o LibGen, “que ofrece un vasto depósito de textos pirateados”, el cual fue condenado en 2017 en la misma Corte del Distrito Sur de Nueva York por infracción intencional de derechos de autor.

En esa sentencia se ordenó una indemnización de 150,000 dólares por cada uno de los 100 derechos de autor infringidos, la misma cantidad solicitada por los escritores en su demanda como condena para OpenAI, cantidad que deberá multiplicarse por cada texto usado -sin autorización- para entrenar a ChatGPT, en caso de que los creadores ganen el juicio.

De igual forma, otros posibles candidatos para las fuentes que habría usado OpenAI son Z-Library, “que alberga más de 11 millones de libros y rastreadores de torrents piratas como Bibliotik, que permite a los usuarios descargar libros electrónicos de forma masiva”.

De hecho, asegura el ocurso, “el FBI confiscó los dominios de internet de Z-Library en febrero de 2022, solo meses después de que OpenAI dejara de “entrenar” a su GPT-3.5 en septiembre de 2021”.

El crecimiento y sofisticación de ChatGPT también sugiere a los escritores un aumento “en el tamaño de los conjuntos de datos de “entrenamiento”, lo que plantea la inferencia de que uno o más de estos sitios se deben haber utilizado” como poderosas y grandes fuentes de libros electrónicos, sin importar que se trataba de piratería, pues el que un contenido se encuentre en internet no significa que esté libre de derechos de autor.

“Los acusados podrían haber pagado una tarifa de licencia razonable para utilizar obras protegidas”, pero decidieron “evadir la Ley de Copyright por completo para impulsar su lucrativo esfuerzo comercial”, concluye la demanda.

De hecho, de ser encontrada responsable de violar derechos de autor, la viabilidad de OpenAI como empresa está en riesgo, ya que la sanción en su contra podría ser billonaria, pues además de la demanda de los escritores, en este año se han promovido otros seis juicios en contra de esta compañía.

MÁS NOTICIAS:

autor Periodista y abogada, especialista en análisis jurídico y de derechos humanos. Ha sido reportera, conductora de radio y editora.
Optimized with PageSpeed Ninja