Un nuevo enfoque de aprendizaje automático modelos que ajustan la potencia de salida del diseño del microrreactor Holos-Quad por Holosgen LLC. El enfoque de aprendizaje de refuerzo de múltiples agentes entrena de manera más eficiente que los enfoques anteriores, dando un paso adelante hacia microrreactores nucleares más autónomos para la operación en áreas remotas. Crédito: Holosgen LLC.
Un enfoque de aprendizaje automático aprovecha la simetría del microrreactor nuclear para reducir el tiempo de entrenamiento al modelar los ajustes de salida de energía, según un estudio dirigido por investigadores de la Universidad de Michigan, publicado En el Journal Energy Conversion and Management: X.
La eficiencia de entrenamiento mejorada ayudará a los investigadores a modelar reactores más rápido, dando un paso hacia el control automatizado de microrreactores nuclear automatizado en tiempo real para operar en ubicaciones remotas o eventualmente en el espacio.
Estos reactores compactos, que pueden generar hasta 20 megavatios de energía térmica que pueden usarse directamente como calor o convertirse a electricidad, podrían transportarse fácilmente o potencialmente usarse en barcos de carga que desean hacer viajes muy largos sin reabastecimiento de combustible. Si se incorpora a una red eléctrica, los microrreactores nucleares podrían proporcionar energía estable y libre de carbono cuando las energías renovables como la energía solar o el viento no están disponibles.
Los reactores pequeños degir los enormes costos de capital que vienen con reactores grandes, y la automatización parcial del control de potencia de potencia de microrreactores ayudaría a mantener bajos los costos. En aplicaciones espaciales potenciales, como impulsar directamente una nave espacial o proporcionar energía eléctrica a los sistemas de la nave espacial, los microrreactores nucleares necesitarían funcionar de manera completamente autónoma.
Como primer paso hacia la automatización, los investigadores están simulando el seguimiento de la carga, cuando las centrales eléctricas aumentan o disminuyen la producción para que coincidan con la demanda de electricidad de la cuadrícula. Este proceso es relativamente simple de modelar en comparación con el arranque del reactor, que incluye condiciones que cambian rápidamente que son más difíciles de predecir.
El Diablo El diseño del microrreactor modelado en este estudio ajusta la potencia a través de la posición de ocho tambores de control que se centran alrededor del núcleo central del reactor donde los neutrones dividen los átomos de uranio para producir energía. Un lado de la circunferencia del tambor de control está bordeado con un material que absorbe neutrones, carburo de boro.
Cuando se giran hacia adentro, los tambores absorben neutrones del núcleo, lo que hace que la población de neutrones y la potencia disminuyan. Rotar los núcleos hacia afuera mantiene más neutrones en el núcleo, aumentando la potencia de salida.
“El aprendizaje de refuerzo profundo construye un modelo de dinámica del sistema, que permite el control en tiempo real, y tantos métodos tradicionales como el control predictivo del modelo a menudo luchan por lograr debido a las necesidades de optimización repetitiva”, dijo Majdi Radaideh, profesora asistente de ingeniería nuclear y ciencias radiológicas en UM y autor senior del estudio.
El equipo de investigación simuló el seguimiento de la carga por rotación de tambor de control basada en la retroalimentación del reactor con aprendizaje de refuerzo, un paradigma de aprendizaje automático que permite a los agentes tomar decisiones a través de interacciones repetidas con su entorno a través de pruebas y errores. Si bien el aprendizaje de refuerzo profundo es altamente efectivo, requiere una amplia capacitación que aumenta el tiempo y el costo computacional.
Por primera vez, los investigadores probaron un enfoque de aprendizaje de refuerzo de múltiples agentes que entrena a ocho agentes independientes para controlar un tambor específico mientras comparten información sobre el núcleo en su conjunto. Este marco explota la simetría del microrreactor para ayudar a reducir el tiempo de entrenamiento multiplicando la experiencia de aprendizaje.
El estudio evaluó el aprendizaje de refuerzo de múltiples agentes contra otros dos modelos: un enfoque de agente único, donde un solo agente observa el estado central y controla los ocho tambores, y el control proporcional de intérprete de la industria (PID), que utiliza un bucle de control basado en retroalimentación.
Los enfoques de aprendizaje de refuerzo lograron una carga similar o superior después en comparación con PID. En escenarios imperfectos en los que los sensores proporcionaron lecturas imperfectas o cuando las condiciones del reactor fluctuaron, el aprendizaje de refuerzo mantuvo tasas de error más bajas que el PID a costos de control hasta 150% más bajos, lo que significa que alcanzó la solución con menos esfuerzo.
El enfoque de múltiples agentes entrenó al menos dos veces más rápido que el enfoque de un solo agente con solo una tasa de error ligeramente más alta.
La técnica necesita una validación extensa en condiciones más complejas y realistas antes de la aplicación del mundo real, pero los hallazgos establecen un camino más eficiente para el aprendizaje de refuerzo en microrreactores nucleares autónomos.
“Este estudio es un paso hacia un gemelo digital avanzado donde el aprendizaje de refuerzo impulsa las acciones del sistema. A continuación, nuestro objetivo es cerrar el bucle con calibración inversa y simulaciones de alta fidelidad para mejorar la precisión de control”, dijo Radaideh.
Más información: Leo Tunkle et al, Microrreactor nuclear transitorio y control de seguimiento de carga con aprendizaje de refuerzo profundo, conversión de energía y gestión: X (2025). Doi: 10.1016/j.ecmx.2025.101090
Proporcionado por la Universidad de Michigan College of Engineering
Cita: Aprendizaje de refuerzo para el control del microrreactor nuclear (2025, 30 de junio) Consultado el 30 de junio de 2025 de https://techxplore.com/news/2025-06-nuclear-microreactor.html
Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.