Home Tecnología Está a punto de ser más difícil de leer los viejos hilos...

Está a punto de ser más difícil de leer los viejos hilos de Reddit, y puedes culpar a la IA

58
0

Con más y más IA apareciendo en las búsquedas de Google en los últimos tiempos, he estado inclinándome mucho más duro en esa palabra mágica que hace que Internet funcione: Reddit. Tiene sus problemas, pero agregar “reddit” a una búsqueda sigue siendo la apuesta más segura que tengo de obtener una opinión honesta de una persona real, que es más de lo que puedo decir Algunas otras plataformas. Desafortunadamente, parece que el truco “Reddit” está a punto de ser mucho menos útil, y una vez más, puedes culpar a la IA por ello.

El problema con cualquier foro en vivo es que la información viene y viene cuando las personas eliminan las publicaciones antiguas y las nuevas actualizaciones rompen partes más antiguas del sitio. Solía haber una forma de evitar esto, pero en el futuro, ese laguna se está cerrando.

Sí, Reddit está a punto de comenzar a bloquear el Archivo de internet. El sitio, dirigido por una organización sin fines de lucro dedicada a preservar el Internet abierto, es anfitrión de Wayback MachineUna forma popular de navegar por las páginas de Internet que ya no están activas, o que han cambiado significativamente desde que subieron por primera vez. Simplemente ingrese una URL en el cuadro de búsqueda de la máquina, y podrá explorar las capturas de cómo solía ser esa página, a veces yendo a la década de 1990.

Es una forma útil de ver cómo ha cambiado un sitio, o acceder a la información que se supone que ya ha desaparecido. En el caso de Reddit, podría usarlo para ver, por ejemplo, una reseña de hotel que desde entonces se ha eliminado. Claro, puede sentirse un poco incómodo al leer una publicación que se ha eliminado deliberadamente, pero debido a que eliminar todos sus hilos al salir del servicio es una práctica común, la máquina Wayback es una excelente manera de preservar contenido útil en el futuro y evitar que los memes clásicos se vuelvan medios perdidos.

Desafortunadamente, aunque Reddit dice que no está en contra de la máquina Wayback en general, está a punto de evitar que el archivo de Internet indexe cualquier cosa menos la página de inicio de Reddit, lo que significa que los únicos archivos que podrán seguir en el futuro serán listas de lo que fue popular en Reddit en un día determinado. Los subreddits individuales y las publicaciones serán bloqueados.

Eso no es totalmente inútil, por ejemplo, si eres un investigador de Internet, pero hará que todos los hilos de Reddit futuros de naturaleza sea mucho más temporal, y definitivamente dañará las búsquedas web casuales en el futuro. Si reviso un hotel ahora y luego elimino mi hilo, los usuarios en un mes o dos no podrán verlo fácilmente. En el lado positivo, los archivos existentes no deberían verse afectados por este bloque, al menos a menos que Reddit le pida al archivo de Internet que elimine las capturas existentes. Pero a medida que pasa el tiempo, la falta de archivos de Reddit solo se convertirá en un problema mayor.

Entonces, ¿por qué está sucediendo esto? Básicamente, a Reddit no le gusta que las compañías de IA raspen el contenido de su sitio, al menos sin pagarlo primero.

¿Qué piensas hasta ahora?

“El archivo de Internet proporciona un servicio a la web abierta”, dijo el portavoz de Reddit, Tim Rathschmidt el borde“Pero nos han dado cuenta de los casos en que las compañías de IA violan las políticas de la plataforma, incluidas las nuestras, y raspan los datos de la máquina Wayback”.

Esencialmente, Reddit quiere controlar estrechamente con qué compañías de IA trabaja (es demandó por esto antes), y ha bloqueado la mayoría de ellos para que se arrastren su sitio. Sin embargo, con algunos luego se vuelven para raspar las páginas de Reddit capturadas por el Archivo de Internet, la compañía ahora también va a tomar medidas enérgicas contra esas capturas. Básicamente, estamos pagando el precio por algunas manzanas malas.

Rathschmidt le dijo a The Verge que los límites en el archivo de Internet comenzarán a “aumentar” hoy, aunque no estaba del todo claro sobre cómo. He contactado a Reddit para obtener más detalles, pero por ahora, hice una doble verificación, y todavía puedo acceder Archivos que ya existenEntonces, al menos Reddit aún no se ha vuelto nuclear.

En cuanto a cualquier publicación futura, todas podrían no estar perdidas. The Verge también habló con el director de Wayback Machine Mark Graham, quien dijo que el archivo de Internet tiene una “relación de larga data con Reddit” y que hay “discusiones continuas sobre este asunto”.

Fuente de noticias