Anthrope ha frustrado múltiples intentos sofisticados por parte de los ciberdelincuentes para usar mal su plataforma Claude AI, según un informe de inteligencia de amenazas recientemente publicado.
A pesar de las salvaguardas en capas diseñadas para prevenir resultados dañinos, los actores maliciosos se han adaptado para explotar las capacidades avanzadas de Claude, armando la IA agente para ejecutar extorsión a gran escala, fraude laboral y operaciones de ransomware.
En un caso de alto perfil denominado “Hacking Vibe”, un código de Claude de anillo de extorsión aprovechó para automatizar el reconocimiento, la recolección de credenciales y la infiltración de redes en al menos 17 organizaciones, incluidos proveedores de atención médica, servicios de emergencia e instituciones religiosas.
En lugar de encriptar datos robados con ransomware, el grupo amenazó con exponer información confidencial para coaccionar los rescates superiores a $ 500,000 públicamente.
Claude Code seleccionó de forma autónoma qué datos exfiltraron, determinaron las valoraciones de rescate basadas en el análisis de registros financieros y generaron un rescate visual alarmante notas en máquinas víctimas.
El equipo de Anthrope simuló el flujo de trabajo criminal con fines de investigación, luego prohibió las cuentas ofensivas y desarrolló un clasificador a medida y nuevos métodos de detección para marcar comportamientos similares en tiempo real.
Otra operación involucró a los agentes de TI de Corea del Norte que usan Claude para fabricar identidades falsas y antecedentes profesionales, pasar evaluaciones técnicas y asegurar puestos remotos en las empresas US Fortune 500.
Cuando años de capacitación especializada una vez estremecieron la capacidad del régimen para tales esquemas, AI ahora permite a los operadores no calificados codificar, comunicarse profesionalmente en inglés y mantener un empleo lucrativo, todo en violación de las sanciones internacionales.
Tras el descubrimiento, Anthrope suspendió inmediatamente las cuentas implicadas, mejoró las herramientas de recolección de indicadores y compartió sus hallazgos con la aplicación de la ley y las agencias de aplicación de la sanción.
Un tercer caso detalló un solitario marketing cibercriminal de marketing generado por IA, como servicio, en foros de Dark-Web. Con un precio de entre $ 400 y $ 1,200 por paquete, el malware presentaba la evasión avanzada, el cifrado y los mecanismos contra la recuperación, todos desarrollados con la ayuda de Claude.
Anthrope bloqueó la cuenta, alertó a los socios de la industria y mejoró la capacidad de su plataforma para detectar cargas sospechosas de malware y intentos de generación de código.
“Estos incidentes representan una evolución en el delito cibernético asistido por AI”, advierte el informe, señalando que las herramientas de IA de agente pueden adaptarse en tiempo real a medidas defensivas, como los sistemas de detección de malware.
Al reducir las barreras técnicas, AI permite a los novatos llevar a cabo ataques cibernéticos complejos que anteriormente requerían que los equipos de expertos ejecutaran. El informe predice que tales ataques serán más comunes a medida que prolifere la codificación asistida por AI-AI.
Las capas de protección de Anthrope incluyen un marco de daño unificado que guía el desarrollo de políticas a través de dimensiones físicas, psicológicas, económicas, sociales y de autonomía; Pruebas rigurosas previas a la implementación de seguridad, sesgo y dominios de alto riesgo; clasificadores en tiempo real para dirigir o bloquear las indicaciones dañinas; y continuo monitoreo de la inteligencia de amenazas de patrones de uso y foros externos.
Estas salvaguardas ya han evitado los intentos de uso indebido en dominios que van desde la integridad electoral hasta la investigación de armas químicas y biológicas, y continúan evolucionando en respuesta a amenazas recientemente identificadas.
Además de las prohibiciones de cuentas y las mejoras de detección, Anthrope ha compartido indicadores técnicos y mejores prácticas con las autoridades y los compañeros de la industria.
Anthrope planea priorizar más investigaciones sobre fraude y cibercrimen mejorado de AI, ampliando sus asociaciones de inteligencia de amenazas y refinando sus barandillas para mantenerse por delante de los actores adversos.
¡Encuentra esta historia interesante! Séguenos LinkedIn y incógnita Para obtener más actualizaciones instantáneas.