Home Tecnología Los científicos desarrollan un nuevo modelo matemático para el aprendizaje de transferencia...

Los científicos desarrollan un nuevo modelo matemático para el aprendizaje de transferencia en redes neuronales

54
0

Crédito: Dominio público de Pixabay/CC0

Alessandro Ingrosso, investigador del Instituto Donders de Neurociencia, ha desarrollado un nuevo método matemático en colaboración con colegas en dos instituciones de investigación italianas, lo que permite la predicción de la efectividad del aprendizaje de transferencia en redes neuronales.

El artículo se publica en la revista Physical Review Letters.

El problema de los datos limitados

Los sistemas de IA generalmente están entrenados con grandes cantidades de datos. Considere un sistema de reconocimiento de imágenes entrenado para identificar a un perro en una imagen. Al entrenar esta red con grandes cantidades de fotos de perros, la red aprende a identificar a un perro con alta precisión en nuevas imágenes.

Sin embargo, para algunas aplicaciones, no hay suficientes datos de capacitación disponibles. “En el sector médico, por ejemplo, al diagnosticar el cáncer a través de ultrasonido, no hay suficientes ejemplos disponibles para capacitar adecuadamente una red neuronal”, explica Ingrosso.

“Esto lleva a ‘sobreajuste’, donde la red falla en generalizar en casos nuevos e invisibles. El número de falsos positivos y falsos negativos puede ser muy grande”.

Para resolver este problema, los investigadores se centraron en “transferir el aprendizaje”, una técnica donde el conocimiento de una red capacitado en un gran conjunto de datos (la “fuente”) se transfiere a una nueva red (el “objetivo”) que está capacitado en datos limitados.

“Estudiamos el modelo más simple para este enfoque de aprendizaje de transferencia y desarrollamos una teoría matemática para las redes con una capa oculta”, dice Ingrosso.

Combinación innovadora de métodos analíticos

En esta teoría, los investigadores combinaron dos métodos analíticos diferentes: el enfoque de “renormalización del núcleo” recientemente desarrollado y el formalismo clásico “Franz-Parisi” a partir de la teoría de las gafas de espín. Fusionar tales herramientas permite trabajar con conjuntos de datos reales específicos en lugar de modelos estadísticos o aproximaciones.

Ingrosso agrega: “Nuestro nuevo método puede predecir directa y con precisión cuán efectiva será la red de destino en generalizar los datos cuando adopte el conocimiento de la red de origen”.

Esta investigación proporciona nuevas ideas importantes para la capacitación efectiva de los sistemas de IA en dominios donde los datos son escasos, como el diagnóstico médico y otras aplicaciones especializadas.

Más información: Alessandro Ingrosso et al, mecánica estadística del aprendizaje de transferencia en redes totalmente conectadas en el límite proporcional, letras de revisión física (2025). Doi: 10.1103/Physrevlett.134.177301. En arxiv: doi: 10.48550/arxiv.2407.07168

Proporcionado por la Universidad de Radboud

Cita: los científicos desarrollan un nuevo modelo matemático para el aprendizaje de transferencia en redes neuronales (2025, 7 de mayo) Recuperado el 7 de mayo de 2025 de https://techxplore.com/news/2025-05-scientists-mathematical-neural-networks.html

Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.