Home Tecnología El aprendizaje de refuerzo permite el control de voltaje en tiempo real

Tecnología

El aprendizaje de refuerzo permite el control de voltaje en tiempo real

7 agosto 2025

Imagen de la configuración experimental del equipo. Crédito: Xu et al. (Nature Energy, 2025).

Las celdas de combustible son soluciones de energía que pueden convertir la energía química en los combustibles en electricidad a través de reacciones químicas específicas, en lugar de depender de la combustión. Los tipos prometedores de celdas de combustible son celdas de combustible de metanol directo (DMFC), dispositivos diseñados específicamente para convertir la energía en alcohol metílico (es decir, metanol) en energía eléctrica.

A pesar de su potencial para alimentar grandes productos electrónicos, vehículos y otros sistemas que requieren energía portátil, estas celdas de combustible a base de metanol todavía tienen limitaciones significativas. En particular, los estudios encontraron que su rendimiento tiende a degradarse significativamente con el tiempo, porque los materiales utilizados para catalizar las reacciones en las células (es decir, superficies electrocatalíticas) se vuelven menos efectivos.

Un enfoque para limpiar estas superficies y prevenir la acumulación de productos de envenenamiento producidos durante las reacciones químicas implica la modulación del voltaje aplicado a las celdas de combustible. Sin embargo, ajustar manualmente el voltaje aplicado a las superficies de maneras efectivas, al tiempo que contabilizar los procesos físicos y químicos en las celdas de combustible, no es práctico para las aplicaciones del mundo real.

Investigadores del Instituto de Tecnología de Massachusetts (MIT) desarrollaron recientemente Alpha-Fuel-Cell, una nueva herramienta basada en el aprendizaje automático que puede monitorear el estado de un catalizador y ajustar el voltaje aplicado en consecuencia. La nueva herramienta computacional, descrita en un artículo publicado Se encontró que la energía de la naturaleza mejora la potencia promedio producida por las celdas de combustible de metanol directo en un 153% en comparación con las estrategias de operación de voltaje manual convencionales.

“Las celdas de combustible pierden lentamente la potencia a medida que corren, y es difícil para los humanos seguir ajustando los controles para aprovechar al máximo ellas”, dijo Ju Li, autor principal del periódico, a Tech Xplore. “Hicimos una pregunta simple: ¿podría un sistema de IA observar la celda de combustible en tiempo real y mantenerla funcionando en su lugar óptimo, la forma en que el control de crucero mantiene su automóvil a una velocidad estable?”

A, αFC controla un DMFC durante la operación mediante la elección de las acciones más apropiadas, que determinan el módulo del actor de acuerdo con el estado dado (aprendido por αFC de las curvas actuales -tiempo) para lograr la salida deseada. Mientras tanto, el módulo crítico está capacitado para evaluar el valor de la acción para un estado determinado. B, potencia producida por un DMFC con CO-PT-RU/NC como catalizador del ánodo en función del tiempo (12 horas de operación) y controlado por una estrategia de potencial constante o αFC. Crédito: 2025, Xu, H. et al.

El objetivo principal de este reciente estudio de Li y sus colegas fue evaluar el potencial de los modelos basados en la inteligencia artificial (IA) para mejorar el rendimiento de las celdas de combustible de metanol. Específicamente, deseaban demostrar que las técnicas de aprendizaje automático pueden ayudar a optimizar el voltaje requerido para limpiar las superficies electrocatalíticas, funcionando bien no solo en simulaciones, sino también en sistemas reales.

“Simplemente, la célula de combustible alfa está compuesto por un actor, que controla el sistema analizando la condición de la celda de combustible durante el tiempo de ejecución pasado y un crítico, que evalúa el valor de las acciones basadas en el estado de la celda de combustible”, explica Li. “En general, el algoritmo de actor crítico comúnmente utilizado en el aprendizaje de refuerzo emplea redes neuronales separadas para el actor y el crítico”.

Si bien se descubrió que las redes neuronales artificiales (ANN) abordan de manera confiable varias tareas del mundo real, generalmente requieren grandes cantidades de datos de entrenamiento específicos de dominio. Para implementar su marco basado en el aprendizaje automático de manera más eficiente, los investigadores decidieron adoptar una arquitectura crítica del actor, que consta de dos algoritmos (es decir, un actor y un crítico) que aprenden nuevos conocimientos a través de un proceso de prueba y error.

“El crítico está compuesto por dos ramas: una rama estatal para analizar la condición de la celda de combustible y una rama de acción para reconocer las acciones”, dijo Li. “La rama estatal utiliza una red neuronal convolucional (CNN), una estructura de red neuronal ampliamente utilizada en la visión por computadora, conocida por su eficiencia computacional. Esto nos permite usar directamente las trayectorias sin procesar de corriente y voltaje como entrada”.

La llamada “rama de acción” del algoritmo crítico se basa en una red neuronal de avance estándar. Esta es una red neuronal artificial ampliamente utilizada formada por capas de nodos interconectados, con datos que fluyen en una sola dirección a través de ellos.

Video de demostración de la operación de células de combustible alfa. Crédito: Nature Energy (2025). Doi: 10.1038/s41560-025-01804-x

“Este modelo está entrenado para predecir futuras salidas basadas en estados pasados y entradas actuales”, explicó Li. “Por otro lado, el actor aprovecha el conocimiento aprendido al incorporar el modelo crítico dentro de sí mismo. Dado que las redes neuronales son diferenciables, es posible calcular numéricamente la entrada actual necesaria para lograr la salida deseada. Si un valor de salida alto simplemente se establece como objetivo, el modelo intentará maximizarla”.

La arquitectura neuronal crítica del actor empleada por Li y sus colegas les permitieron abordar la tarea de evaluar el estado de los catalizadores y modular el voltaje que se les aplicó sin la necesidad de extensos datos de capacitación. En última instancia, pudieron lograr resultados prometedores utilizando un conjunto de datos relativamente pequeño, que contiene aproximadamente 1,000 trayectorias de tiempo de voltaje recopiladas en configuraciones del mundo real. Tomó solo dos semanas recopilar estos datos en una configuración experimental del mundo real.

“Nuestro controlador es una arquitectura adaptativa en tiempo real que aprende directamente de los datos experimentales, y no hay simulador en el bucle”, dijo Li.

“Dado que implementar un simulador de alta calidad es difícil, esta es una ventaja significativa. Este sistema es la primera demostración de una combinación de AI y dispositivos de energía, manteniendo la máxima potencia de las celdas de combustible con la autocuración automática del catalizador.

El nuevo enfoque ideado por este equipo de investigadores pronto podría refinarse más a fondo y probarse en una gama más amplia de experimentos y escenarios del mundo real. En el futuro, podría ayudar a mejorar el rendimiento de las celdas de combustible de metanol directo, extendiendo sus vidas sin requerir equipos costosos.

“Ahora estamos ampliando nuestro enfoque de una sola celda de laboratorio a pilas más grandes del mundo real, agregando límites de seguridad y vida útil directamente en el controlador, y probando la misma idea sobre las baterías y otros sistemas electroquímicos para generalizarlo”, agregó Li.

Escrito para usted por nuestro autor Ingrid Fadellieditado por Gaby Clarky verificado y revisado por Robert Egan—Este artículo es el resultado de un trabajo humano cuidadoso. Confiamos en lectores como usted para mantener vivo el periodismo científico independiente. Si este informe le importa, considere un donación (especialmente mensual). Obtendrá una cuenta sin anuncios como agradecimiento.

Más información: Hongbin Xu et al, un algoritmo actor -crítico para maximizar la potencia entregada a partir de celdas de combustible de metanol directo, energía natural (2025). Doi: 10.1038/s41560-025-01804-x.

Cita: Maximización del rendimiento directo de la celda de combustible de metanol: el aprendizaje de refuerzo habilita el control de voltaje en tiempo real (2025, 7 de agosto) Recuperado el 7 de agosto de 2025 de https://techxplore.com/news/2025-08-maximizing-methanol-fuel-cell-enables.html

Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.

Fuente de noticias

El aprendizaje de refuerzo permite el control de voltaje en tiempo real

Entradas recientes

Schwarzenegger: Si eres un inmigrante en los Estados Unidos, debes ‘comportarse...

Hombre de Aurora sospechoso en 3 asesinatos durante un tramo de...

El nombre del héroe de la guerra de Wallaby para vivir...

Nederland comprará la estación de esquí Eldora, anunció la ciudad en...

Rusia vs Guerra de Ucrania: Trump para enviar armas estadounidenses poderosas...

El adolescente de Man Utd quería en Europa, ya que Ruben...

Categorías