Una foto tomada el 1 de abril de 2025 muestra el logotipo de GPT Chat en una pantalla de la computadora portátil (R) al lado del logotipo de la aplicación Deepseek AI en una pantalla de teléfono inteligente en Frankfurt AM Main, Alemania occidental.
Incluso las mejores mentes humanas que construyen inteligencia artificial generativa que está preparada para cambiar el mundo admite que no comprenden cómo piensan las mentes digitales.
“Las personas fuera del campo a menudo se sorprenden y se alarman al saber que no entendemos cómo funcionan nuestras propias creaciones de IA”, escribió el cofundador antrópico Dario Amodei en un ensayo publicado en línea en abril.
“Esta falta de comprensión es esencialmente sin precedentes en la historia de la tecnología”.
A diferencia de los programas de software tradicionales que siguen rutas de lógica preordenadas dictadas por programadores, los modelos generativos de IA (Gen AI) están capacitados para encontrar su propio camino hacia el éxito una vez solicitado.
En un podcast reciente Chris Olah, que formó parte del fabricante de chatgpt OpenAi antes de unirse a Anthrope, describió a la generación AI como “andamio” en el que crecen los circuitos.
Olah se considera una autoridad en la llamada interpretabilidad mecanicista, un método de modelos de IA de ingeniería inversa para descubrir cómo funcionan.
Esta ciencia, nacida hace aproximadamente una década, busca determinar exactamente cómo la IA obtiene de una consulta a una respuesta.
“Comprar la totalidad de un modelo de lenguaje grande es una tarea increíblemente ambiciosa”, dijo Neel Nanda, un científico de investigación senior en el Laboratorio de AI de Google Deepmind.
Fue “algo análogo al tratar de comprender completamente el cerebro humano”, agregó Nanda a la AFP, señalando que los neurocientíficos aún no han tenido éxito en ese frente.
Profundizar en las mentes digitales para comprender su funcionamiento interno ha pasado de un campo poco conocido hace solo unos años a ser un área caliente de estudio académico.
“Los estudiantes se sienten muy atraídos por él porque perciben el impacto que puede tener”, dijo el profesor de informática de la Universidad de Boston, Mark Crovella.
El área de estudio también está ganando tracción debido a su potencial para hacer que la Generación AI sea aún más poderosa, y porque mirar a los cerebros digitales puede ser intelectualmente emocionante, agregó el profesor.
Manteniendo a Ai honesto
La interpretabilidad mecanicista implica estudiar no solo los resultados atendidos por la generación AI, sino también los cálculos de escrutinio realizados, mientras que la tecnología consulta, según Crovella.
“Podrías investigar el modelo … observar los cálculos que se están realizando e intentar entenderlos”, explicó el profesor.
El inicio Goodfire utiliza el software AI capaz de representar datos en forma de pasos de razonamiento para comprender mejor el procesamiento de Gen AI y corregir errores.
La herramienta también tiene la intención de evitar que los modelos de Gen AI se usen maliciosamente o decidir por su cuenta para engañar a los humanos sobre lo que están haciendo.
“Se siente como una carrera contra el tiempo para llegar allí antes de implementar modelos de IA extremadamente inteligentes en el mundo sin comprender cómo funcionan”, dijo el presidente ejecutivo de Goodfire, Eric Ho.
En su ensayo, AmoDei dijo que el progreso reciente lo ha hecho optimista de que la clave para descifrar completamente la IA se encontrará en dos años.
“Estoy de acuerdo en que para 2027, podríamos tener una interpretabilidad que detecte de manera confiable sesgos de modelo e intenciones dañinas”, dijo el profesor asociado de la Universidad de Auburn, Anh Nguyen.
Según la crovela de la Universidad de Boston, los investigadores ya pueden acceder a representaciones de cada neurona digital en cerebros de IA.
“A diferencia del cerebro humano, en realidad tenemos el equivalente de cada neurona instrumentada dentro de estos modelos”, dijo el académico. “Todo lo que sucede dentro del modelo es completamente conocido por nosotros. Se trata de descubrir la forma correcta de interrogar eso”.
Aprovechar el funcionamiento interno de las mentes de la generación AI podría despejar el camino para su adopción en áreas donde pequeños errores pueden tener consecuencias dramáticas, como la seguridad nacional, dijo Amodei.
Para Nanda, comprender mejor lo que Gen Ai también podría catapultar los descubrimientos humanos, al igual que la IA de ajedrez de Deepmind, Alphazero, reveló movimientos de ajedrez completamente nuevos en los que ninguno de los grandes maestros había pensado.
Entendido correctamente, un modelo de Gen AI con un sello de confiabilidad obtendría una ventaja competitiva en el mercado.
Tal avance de una compañía estadounidense también sería una victoria para la nación en su rivalidad tecnológica con China.
“La poderosa IA dará forma al destino de la humanidad”, escribió Amodei.
“Merecemos comprender nuestras propias creaciones antes de transformar radicalmente nuestra economía, nuestras vidas y nuestro futuro”.
© 2025 AFP
Cita: Funcionario interno de AI An Enigma, incluso para sus creadores (2025, 13 de mayo) recuperado el 13 de mayo de 2025 de https://techxplore.com/news/2025-05-ai-enigma-creators.html
Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.









