Los abogados de The Daily News, The New York Times y otros medios de comunicación que demandan a la empresa matriz de Chatgpt, OpenAI, le han pedido a un juez de Manhattan que rechace un esfuerzo del gigante de la tecnología para continuar eliminando datos que podrían probar que robó el trabajo de los periodistas.
El mes pasado, la jueza de magistrados federales de Manhattan, ordenó el mes pasado a OpenAi que preservara sus registros de producción y cualquier información relacionada programada para la eliminación después de que los medios de comunicación acusaron a la compañía tecnológica de descargar permanentemente enormes franjas de datos, lo que obstaculiza su capacidad para demostrar que los productos de IA podrían eludir las muebles de pago para “plagiar y regodear el contenido con derechos de autor”.
Operai ha pedido a Wang que anule la orden, argumentando que continuar almacenando los datos sería una “carga masiva” e infringe la privacidad de los usuarios.
Los medios de comunicación dicen que el argumento es contrario a lo que Openai le dice a sus usuarios sobre estar sujetos a la retención de datos si la ley lo requiere. Han notado que las compañías de IA no niegan que los datos eliminados fueran pertinentes a la demanda.
“Lo que no discute es que los datos del registro de salida son relevantes para los casos de noticias, que como OpenAI ha reconocido durante mucho tiempo, incluyen reclamos de infracción basados en los resultados generados por los modelos y productos (de OpenAI)”, escribieron los abogados el martes.
“Tampoco puede disputar que, como una compañía de tecnología altamente sofisticada que actualmente está valorada en más de $ 300 mil millones, tiene tanto los medios como la capacidad de preservar estos datos concedidos”.
Los medios de comunicación dicen que Operai ha utilizado todos los trucos del libro para fallar la responsabilidad. Además de las deleciones masivas, han acusado a la compañía de tecnología de instalar filtros “diseñados para hacerlo más difícil” para provocar respuestas que contienen trabajos con derechos de autor de los periodistas.
“El curso de acción preferido de OpenAI para ‘proteger los datos y la privacidad de sus usuarios’, reanudando inmediatamente las deleciones masivas, también, casualmente, permitirá que continúe destruyendo datos que muestren su responsabilidad por la infracción de derechos de autor”, escribieron los abogados de los medios de comunicación.
Al abordar las preocupaciones de privacidad, la orden del 13 de mayo de Wang describió que solo estaba destinado a preservar y segregar información que no se proporcionaría “al por mayor” a nadie, o se almacenó “para siempre”, pero solía abordar las preocupaciones planteadas en la demanda.
Si Wang se inclina a entretener la objeción de las compañías de IA, los periódicos dijeron que debería darles la oportunidad de analizar diferentes poblaciones de datos y presentar hallazgos a la corte.
La demanda alega que Openai ha cosechado ilegalmente millones de noticias para capacitar a sus grandes modelos de idiomas y construir productos de IA generativos que puedan vomitarlos, o versiones de ellas, a los usuarios. Eso a veces ha resultado en que los informes pirateados de los periodistas estén mal publicados o tergiversados, según los usuarios de ChatGPT mal informados, según han argumentado los periódicos.
Si bien los editores de los periódicos han gastado miles de millones de dólares para enviar “personas reales a lugares reales para informar sobre eventos reales en el mundo real”, las dos empresas tecnológicas están “robando” los informes de los documentos sin compensación “para crear productos que proporcionen noticias e información plagiadas y robadas”, según la demanda.
Operai ha argumentado que la gran cantidad de datos utilizados para entrenar sus bots de inteligencia artificial está protegido por reglas de “uso justo”. La doctrina se aplica a las reglas que permiten a algunos usar el trabajo con derechos de autor para fines como críticas, comentarios, informes de noticias, enseñanza e investigación.
Sin embargo, los abogados de los periódicos han argumentado que la prueba de uso justo implica transformar un trabajo con derechos de autor en algo nuevo, y el nuevo trabajo no puede competir con el original en el mismo mercado.
El juez ha rechazado la posición de OpenAI de que los periódicos no han producido “una pizca de evidencia” de que las personas están usando los productos API de ChatGPT o OpenAI para obtener noticias en lugar de pagarlo.
Los periódicos notaron el martes que los ingenieros de las compañías tecnológicas lo habían admitido ellos mismos al reconocer que los chatbots no estaban diseñados para pasar los paredes de pago, no que no pudieran. También citaron otra demanda que involucró a Google, en la que un ingeniero de OpenAI reconoció que las noticias locales eran una “Quer (Y) bastante común” entre los usuarios de ChatGPT.
El Times originalmente trajo la demanda de la Corte Federal de Manhattan en diciembre de 2023. La noticia, junto con otros periódicos en empresas afiliadas, el Grupo Mediaws y Tribune Publishing, presentadas en abril de 2024.
Los otros puntos de venta incluyeron Mercury News, Denver Post, el Orange County Register y St. Paul Pioneer Press, y Tribune Publishing’s Chicago Tribune, Orlando Sentinel y South Florida Sun Sentinel.
Los abogados de OpenAI no respondieron a las solicitudes de comentarios de las noticias.
Publicado originalmente:









