Home Tecnología La plataforma puede hacer que el aprendizaje automático sea más transparente y...

La plataforma puede hacer que el aprendizaje automático sea más transparente y accesible

35
0

Las relaciones entre los conceptos que OpenML usa para definir un experimento ML. Crédito: Patrones (2025). Doi: 10.1016/j.patter.2025.101317

Lo que comenzó como Ph.D. Project se ha convertido en un sitio web con 120,000 visitantes únicos cada año. Con la plataforma OpenML, el investigador Jan Van Rijn está contribuyendo a la ciencia abierta, con el objetivo de hacer que el aprendizaje automático sea más transparente, accesible y justo.

Desde la investigación climática hasta la ciencia del comportamiento: el aprendizaje automático (ML) está desempeñando un papel cada vez más importante en la ciencia. Los investigadores lo usan para descubrir patrones en grandes conjuntos de datos, hacer predicciones o simular procesos complejos. Pero a pesar de este crecimiento, los resultados de ML aún pueden ser difíciles de evaluar o reproducir.

“No hay una forma estándar de compartir datos, modelos y resultados”, dice Jan Van Rijn. “Es una pena, porque si queremos ser tomados en serio como un campo, debemos asegurarnos de que nuestro trabajo sea verificable y reproducible”.

¿Qué es el aprendizaje automático?

El aprendizaje automático es una forma para que las computadoras aprendan de ejemplos, como un programa de correo electrónico que reconoce el spam en función de miles de mensajes anteriores. El sistema aprende a detectar patrones por sí solo, sin que cada regla sea programada manualmente. En cierto sentido, funciona como el aprendizaje humano, solo a una escala mucho mayor. Las aplicaciones están en todas partes: desde reconocimiento facial y diagnósticos médicos hasta recomendaciones de Netflix.

Un espacio de trabajo compartido para el aprendizaje automático

Para hacer que el aprendizaje automático sea más transparente, Van Rijn fundó OpenML hace más de diez años: un espacio de trabajo digital compartido donde los investigadores y los estudiantes pueden cargar sus conjuntos de datos, algoritmos y experimentos. Cualquiera puede navegar, contribuir y aprender de los enfoques de los demás. La plataforma se ajusta perfectamente a los principios de la ciencia abierta: la ciencia que es accesible, verificable y reutilizable.

Y claramente hay una necesidad de eso. OpenML ahora se usa en todo el mundo y ya ha contribuido a alrededor de 1,500 publicaciones científicas. Van Rijn y sus compañeros investigadores recientemente miraron a diez años de OpenML en un publicación En los patrones de diario. Identificaron tres formas principales en que los investigadores usan la plataforma: mejorar los algoritmos, obtener información de nivel superior a través del llamado meta-aprendizaje y para la enseñanza.

“OpenML a menudo se usa en cursos sobre aprendizaje automático e investigación reproducible”, dice.

‘No es que los investigadores no quieran compartir su código’

Las prácticas abiertas aún están lejos de ser estándar. “En la ciencia, hay muchas culturas de investigación diferentes”, explica Van Rijn. “Eso aporta perspectivas valiosas, pero también significa que hay una falta de estándares compartidos. La creación y la aplicación de un estándar común requiere mucho tiempo y esfuerzo. No es que los investigadores no quieran compartir su código, es simplemente más trabajo. Incluso con una plataforma como la nuestra”.

Aún así, Van Rijn se apega a su misión. “El objetivo es algo así como Wikipedia para el aprendizaje automático, sino solo con texto. También con datos, modelos y experimentos. Todo lo que necesita comprender, replicar y construir sobre la investigación”.

OpenML es más que una plataforma

Él ve la ciencia abierta gradualmente más establecida. “Nuestras publicaciones se citan con más frecuencia, lo que ayuda. Pero también debe haber un apoyo estructural, tanto de universidades como de financiadores. Por ejemplo, al hacer que sea una condición compartir abiertamente su código y datos”.

Entonces OpenML es más que una plataforma. Es un paso hacia una cultura científica basada en la colaboración, la transparencia y la reutilización. “Hay otras plataformas como la nuestra”, dice Van Rijn. “Nuestro objetivo es romper esos silos y conectarlos. Para que compartir la investigación se vuelva aún más fácil, para todos”.

Más información: Bernd Bischl et al, OpenML: ideas de 10 años y más de mil documentos, patrones (2025). Doi: 10.1016/j.patter .2025.101317

Proporcionado por la Universidad de Leiden

Cita: la plataforma puede hacer que el aprendizaje automático sea más transparente y accesible (2025, 21 de julio) Recuperado el 21 de julio de 2025 de https://techxplore.com/news/2025-07-platform-machine-transparent-acsible.html

Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.

Fuente de noticias