Home Tecnología Cloudflare acusa a la IA de perplejidad para evadir los firewalls y...

Cloudflare acusa a la IA de perplejidad para evadir los firewalls y los sitios web de rastreo al cambiar el agente de usuarios

46
0

La IA de perplejidad, un motor emergente de preguntas sobre la pregunta impulsado por modelos avanzados de idiomas grandes, recientemente ha sido objeto de escrutinio por implementar técnicas de rastreo de sigilo que evitan las defensas web estándar.

Inicialmente lanzado con intenciones transparentes, los rastreadores de Perplexity se identificarían a través de agentes de usuarios declarados, como PerplexityBot/1.0, respetando las reglas de directivas de txt.txt y firewall de aplicaciones web (WAF).

Sin embargo, a principios de agosto de 2025, los investigadores observaron que una vez bloqueados, la perplejidad comenzó a modificar su identidad a mitad de rastreo, cambiando a agentes de usuarios genéricos del navegador y rangos de IP no anunciados para acceder a contenido rechazado.


Analistas de Cloudflare anotado que este cambio en el comportamiento representaba una táctica de evasión deliberada en lugar de una configuración errónea inadvertida.

Después de encontrar bloques a nivel de red, el sistema alteró su cadena de agente de usuario para hacerse pasar por Chrome en MacOS, emitiendo solicitudes como:-

Get /secret-page.html http/1.1 host: testExample.com user-agent: mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) Applewebkit/537.36 (KHTML, como gecko) Chrome/124.0.0.0 Safari/537.36

Estas solicitudes de sigilo rotaron a través de múltiples números de sistema autónomo (ASNS) y bloques IP no atribuidos públicamente a la perplejidad, lo que permite el acceso persistente en millones de solicitudes diarias.

Las ramificaciones de este comportamiento son significativas. Los operadores de sitios web que rechazaron explícitamente la perplejidad en sus robots.txt.

Flujo de ataque (fuente – Cloudflare)

Este abuso de confianza socava los principios centrales de Internet y plantea preguntas legales y políticas con respecto al abastecimiento de datos de capacitación de IA.

Los propietarios de contenido ahora enfrentan la dificultad de distinguir el tráfico humano legítimo de los rastreadores de IA ofuscados, lo que complica el cumplimiento de las regulaciones de privacidad y las protecciones de los derechos de autor.

Además, la estrategia de respuesta de Perplexity al ser bloqueada, en relación con las fuentes de datos alternativas, evita la persistencia adaptativa.

Cuando el rastreo directo no tuvo éxito, el sistema generó respuestas basadas en sitios web secundarios, aunque con una especificidad disminuida en comparación con el contenido original.

Esta agregación de varios fuentes subraya la resistencia de la IA y amplifica las preocupaciones sobre la procedencia y la precisión de los datos.

Mecanismos de evasión de detección

Un aspecto clave de la persistencia sofisticada de Perplexity es su rotación dinámica de agente de usuarios combinada con un rápido salto ASN.

Al andar en bicicleta programada a través de agentes de usuarios y prefijos IP, el rastreador evade reglas de firewall basadas en la firma.

Los investigadores de Cloudflare identificaron que los rastreadores sigilosos mantienen la continuidad de la sesión al preservar las cookies y los encabezados de referentes a través de los cambios de identidad, disfrazados de manera efectiva como usuarios humanos individuales.

La mitigación requiere un análisis de comportamiento que marca los patrones anómalos (alta velocidad de solicitud, el tiempo uniforme entre la reclutamiento e intercambios de cookies repetidos) en lugar de la coincidencia de firma estática.

El refinamiento continuo de la heurística de gestión de bot y la adopción de estándares emergentes como la autenticación de botes web son cruciales para contrarrestar esta amenaza en evolución.

Integre cualquiera. Pruebe 50 búsqueda de prueba gratuita

Fuente de noticias