Crédito: Universidad de Tecnología de Viena
La inteligencia artificial se está volviendo cada vez más versátil; desde la planificación de la ruta hasta la traducción del texto, se ha convertido durante mucho tiempo en una herramienta estándar. Pero no es suficiente que la IA simplemente entregue resultados útiles: se está volviendo cada vez más importante que también cumpla con las normas legales, éticas y sociales. Pero, ¿cómo se pueden enseñar tales normas a una máquina?
En Tu Wien, ahora se ha desarrollado un nuevo enfoque. Al combinar el aprendizaje automático y la lógica, los agentes autónomos pueden ser entrenados para seguir las normas predefinidas. Incluso es posible establecer una jerarquía de estas normas, decidir algunas para ser más importantes que otras. En IJCAI 2025Una conferencia de IA celebrada este año en Montreal, Canadá, esta trabajar fue reconocido con el Premio Distinguido Papel.
Prueba y error
Enseñar las nuevas habilidades de IA a veces funciona un poco como enseñar trucos a una mascota: recompensa Si la tarea se realiza correctamente, castigo si la respuesta es incorrecta. La IA intenta diferentes comportamientos y, a través de prueba y error, aprende cómo maximizar su recompensa. Este método se llama aprendizaje de refuerzo y juega un papel clave en la investigación de IA.
“Uno podría tratar de enseñar a AI ciertas reglas recompensando al agente por seguir las normas. Esta técnica funciona bien en caso de restricciones de seguridad”, dice el profesor Agata Ciabattoni del Instituto de Lógica y Computación en Tu Wien. “Pero esto no funcionaría, por ejemplo, con normas condicionales (‘hacer una condición B’). Si el agente encuentra una manera de ganar una recompensa, podría retrasar el finalización de su trabajo real a propósito, tener más tiempo para anotar puntos fáciles”.
Normas como fórmulas lógicas
El equipo TU Wien eligió un camino fundamentalmente diferente, inspirado en las antiguas obras filosóficas: las normas todavía se representan como fórmulas lógicas, pero los agentes obtienen un castigo cuando no cumplen con ellas. Por ejemplo, “no debe exceder el límite de velocidad” se traduce como “Si excede el límite de velocidad, obtiene un castigo de X”. Lo más importante, cada norma se trata como un objetivo independiente.
“El agente artificial tiene el objetivo de perseguir, por ejemplo, encontrar la mejor ruta a una lista de destinos. Al mismo tiempo, también definimos reglas y normas adicionales que debe observar en el camino”, explica Emery Neufeld, el primer autor del documento. “El hecho de que cada norma se trata como un objetivo diferente nos permite calcular algorítmicamente el peso relativo que tenemos que asignar a estos objetivos para obtener un buen resultado general”.
Con esta técnica, se hace posible codificar incluso conjuntos de reglas complicados, por ejemplo, normas que se aplican solo bajo ciertas condiciones o normas que dependen de la violación de otras normas.
Normas flexibles
“Lo mejor es que cuando las normas cambian, la capacitación no tiene que comenzar de nuevo”, dice Agata Ciabattoni. “Tenemos un sistema que aprende a cumplir con las normas, pero luego podemos ajustar estas normas después, o cambiar su importancia relativa, declarando que una regla es más importante que otra”.
En su artículo, Ciabattoni y su equipo pudieron demostrar que esta técnica permite imponer una amplia gama de normas, mientras que la IA continúa persiguiendo sus objetivos principales.
Más información: Papel de preimpresión: Combinando MORL con pernos de restricción para aprender un comportamiento normativo
Proporcionado por la Universidad de Tecnología de Vienna
Cita: AI aprende a seguir las normas predefinidas a través de una combinación de lógica y aprendizaje automático (2025, 15 de septiembre) recuperado el 15 de septiembre de 2025 de https://techxplore.com/news/2025-09-ai-predefined-norms-combination-logic.html
Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.







