(A – F) entornos de Mujoco, entornos (G – H) ML1. Crédito: ARXIV (2025). Doi: 10.48550/arxiv.2502.02834
Los humanos caminan y corren instintivamente: la caminata de brisk se siente sin esfuerzo, y naturalmente ajustamos nuestro paso y ritmo sin pensar consciente. Sin embargo, para los robots físicos de IA, dominar los movimientos básicos no se traduce automáticamente en adaptabilidad en situaciones nuevas o inesperadas.
Incluso si un robot está entrenado para funcionar a altas velocidades, puede tener dificultades con los ajustes matizados, como modificar los ángulos de las piernas o aplicar la fuerza correcta, cuando se enfrenta a diferentes tareas, a menudo conduciendo a movimientos inestables o detenidos.
Reconociendo este desafío, el profesor Seungyul Han y su equipo de investigación de la Escuela de Graduados de Inteligencia Artificial en Unist han desarrollado una técnica de aprendizaje de meta-refuerzo pionero que permite a los agentes de IA anticipar y prepararse para tareas desconocidas de forma independiente.
Han introducido la capacitación virtual (TAVT) consciente de las tareas, un enfoque innovador que equipa la IA con la capacidad de generar y aprender de las tareas virtuales de antemano, mejorando significativamente su capacidad para adaptarse a desafíos imprevistos.
La investigación utiliza un sistema de doble módulo que comprende un componente de representación basado en el aprendizaje profundo y un módulo de generación. El módulo de representación evalúa las similitudes entre diferentes tareas, creando un espacio latente que captura características esenciales. El módulo de generación luego sintetiza nuevas tareas virtuales que reflejan aspectos centrales de los escenarios del mundo real. Este proceso de manera efectiva permite que la IA tenga situaciones previas a la experiencia que aún tiene que encontrar, lo que aumenta su preparación para tareas fuera de distribución (OOD).
Jeongmo Kim, el investigador principal, explica, “el aprendizaje de refuerzo tradicional capacita a un agente para sobresalir dentro de una tarea específica, limitar su capacidad para generalizar. Mientras que el aprendizaje de meta-refuerzo expone al agente a múltiples tareas, adaptándose a situaciones completamente nuevas y no vistas sigue siendo un desafío”, agregando “nuestro enfoque de Tavt prepara proactivamente la IA para tales escenarios”.
El equipo probó TAVT en varias simulaciones robóticas, incluidos los guepardos, las hormigas y los robots bípedos. En particular, en el experimento de Cheetah-Vel-lean, los robots que utilizan TAVT rápidamente se adaptaron a velocidades intermedias previamente sin experiencia (1.25 y 1.75 m/s), manteniendo un movimiento estable y eficiente. En contraste, los robots entrenados convencionalmente a menudo luchaban por ajustarse, lo que resultó en inestabilidad o pérdida de equilibrio.
El profesor Han enfatizó “Este método mejora significativamente la capacidad de una IA para generalizar en diversas tareas, lo que es vital para aplicaciones como vehículos autónomos, drones y robots físicos que operan en entornos impredecibles. Alemre el camino para los sistemas AI más flexibles y resilientes”.
La investigación se presentó en la Conferencia Internacional sobre Aprendizaje Autor (ICML 2025), que tuvo lugar en Vancouver, Canadá, del 13 al 19 de julio de 2025. El documento es disponible en el servidor de preimpresión ARXIV. Este trabajo subraya un esfuerzo concertado para avanzar en las tecnologías centrales de IA y fomentar soluciones innovadoras para desafíos del mundo real.
Más información: Jeongmo Kim et al, Capacitación virtual consciente de tareas: mejora de la generalización en el aprendizaje de meta-refuerzo para tareas fuera de distribución, ARXIV (2025). Doi: 10.48550/arxiv.2502.02834
Información en el diario: ARXIV
Proporcionado por el Instituto Nacional de Ciencia y Tecnología de Ulsan
Cita: las experiencias virtuales autogeneradas permiten que los robots se adapten a las tareas invisibles con una mayor flexibilidad (2025, 25 de agosto) recuperaron el 25 de agosto de 2025 de https://techxplore.com/news/2025-08 Generated-virtual-enable-robots-unseen.html
Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.