Miles de escritores exigen que dejen de robar sus libros para entrenar a ChatGPT y Bard
Más de 8.000 autores han firmado una carta abierta en la que exigen que compañías como OpenAI, Google y Microsoft, entre otras, dejen de robar sus libros para entrenar a chatbots de IA como ChatGPT y Bard
Más de 8.000 escritores han firmado una carta abierta exigiendo que las compañías detrás de ChatGPT, Bard, y demás plataformas de IA generativa, dejen de robar sus libros para entrenarlas.
La misiva, que se publicó a través del Sindicato de Autores de Estados Unidos (The Authors Guild), está dirigida a los directores ejecutivos de las principales compañías del sector: Sam Altman (OpenAI), Sundar Pichai (Google), Satya Nadella (Microsoft), Mark Zuckerberg (Meta), Emad Mostaque (Stability AI) y Arvind Krishna (IBM).
Lo que los autores reclaman es que las empresas en cuestión dejen de utilizar sus obras para entrenar a chatbots como ChatGPT y Bard, sin tener permiso para ello. Esto no solo implica obtener el consentimiento de quienes escribieron las obras, sino también darles el crédito correspondiente y «compensarlos justamente», considerando que se trata de material protegido por las leyes de derechos de autor.
Los escritores no solo acusan a las principales compañías en el campo de la inteligencia artificial de utilizar su trabajo sin autorización, sino también de obtenerlo de forma ilegal. Específicamente, mencionan el uso de «notorias webs de piratería» para ganar acceso a los libros que posteriormente se incluyen en los sets de datos para adiestrar a plataformas como ChatGPT y Bard.
Entre los firmantes, destacan nombres como los de Margaret Atwood (El cuento de la criada), James Patterson (Alex Cross), Jonathan Franzen (Las correcciones) y Dan Brown (El Código Da Vinci). La petición todavía se encuentra abierta a recibir el apoyo de más autores.
«Las tecnologías de IA generativa basadas en grandes modelos de lenguaje deben su existencia a nuestros escritos. Estas tecnologías imitan y regurgitan nuestro lenguaje, historias, estilo e ideas. Millones de libros, artículos, ensayos y poesía con derechos de autor proporcionan el «alimento» para los sistemas de IA; comidas interminables por las que no ha habido factura. Están gastando miles de millones de dólares para desarrollar tecnología de IA. Es justo que nos compensen por usar nuestros escritos, sin los cuales la IA sería banal y extremadamente limitada».
Carta abierta de escritores contra OpenAI, Microsoft, Meta, Google, Stability AI e IBM.
Autores exigen compensación por el uso de sus libros para entrenar a Bard y ChatGPT
El reclamo de los escritores no carece de sustento. Hoy en día, puedes pedirle a ChatGPT o Bard que escriban un texto según el estilo literario de determinado autor, y los chatbots pueden hacerlo en cuestión de segundos. Esto solo es posible si los modelos de lenguaje que los potencian tienen un conocimiento previo —y masivo— de sus obras.
Por lo general, empresas como OpenAI, Google o Meta, sostienen que sus plataformas de inteligencia artificial se entrenan con datos disponibles públicamente en la web. Esto no necesariamente es una falacia, pero nunca está del todo claro qué define cada empresa como «disponible públicamente».
Semanas atrás se conoció que la empresa de Sam Altman afronta una demanda colectiva por supuestamente robar datos personales para entrenar a ChatGPT. Según la acusación, OpenAI también «recolectó sistemáticamente 300.000 millones de palabras de internet, libros, artículos, sitios web y publicaciones». Por su parte, autores como Sarah Silverman, Christopher Golden y Richard Kadrey también llevaron a la startup californiana ante la justicia por el uso indebido de sus libros en su chatbot de IA.
En la carta abierta que se divulgó en las últimas horas, el Sindicato de Autores asegura que chatbots como ChatGPT y Bard se están convirtiendo en una verdadera amenaza. «Como resultado de incorporar nuestros escritos en sus sistemas, la IA generativa amenaza con dañar nuestra profesión al inundar el mercado con libros, historias y piezas periodísticas mediocres escritas por una máquina y basadas en nuestro trabajo», indica.
En busca de mitigar el impacto de la IA generativa
Para mitigar el impacto del uso sin autorización de sus obras para entrenar a modelos de inteligencia artificial, los autores proponen distintas medidas. Primero, que las empresas obtengan permiso antes de utilizar material protegido por derechos de autor antes de incluirlo en los datasets de adiestramiento de sus chatbots. Segundo, que se compense justamente a los escritores por el uso pasado y actual de sus libros.
Pero lo más curioso es que los escritores también piden que se les pague por el uso de su trabajo en los contenidos generados por Bard o ChatGPT, por más que estos no supongan una violación al copyright. ¿Esto qué significa? Que si, por ejemplo, un chatbot escribe un «contenido original» pero con el estilo literario de Margaret Atwood, la escritora reciba una suerte de regalía por el mismo.
Quedará por verse cómo avanza esta historia. Por lo pronto, el Sindicato de Autores de Estados Unidos no amenaza con llevar a las compañías apuntadas ante la justicia. Pero puede que todo dependa de qué tipo de respuesta reciban, si es que obtienen alguna.
Lo interesante de este caso es que expone una preocupación cada vez mayor en las distintas esferas del mundo artístico. En Estados Unidos, por estos días está sobre el tapete el uso de la IA generativa en Hollywood, tanto como reemplazo de actores y extras, como de guionistas.
En Europa, en tanto, la discusión en torno a la Ley de Inteligencia Artificial también está poniendo en el punto de mira el uso de material protegido por derechos de autor. De hecho, esto ya ha provocado los primeros cortocircuitos con OpenAI y demás compañías, puesto que deberían registrar qué datos con propiedad intelectual se usan para entrenar a ChatGPT y plataformas similares.