Investigadores de EPFL, ETH Zurich y CSCS han desarrollado el modelo de lenguaje grande apertus, es uno de los LLM abiertos más grandes y una tecnología básica en la que otros pueden construir. Crédito: EPFL, ETH ZURICH, CSCS / Molinari Design
En julio, EPFL, ETH Zurich y CSCS anunciaron su iniciativa conjunta para construir un modelo de lenguaje grande (LLM). Ahora, este modelo está disponible y sirve como bloque de construcción para desarrolladores y organizaciones para futuras aplicaciones como chatbots, sistemas de traducción o herramientas educativas.
El modelo se llama Apertus, latina para “abierto”, ilumina su característica distintiva: todo el proceso de desarrollo, incluida su arquitectura, pesos de modelos y datos y recetas de capacitación, es abiertamente accesible y completamente documentado.
Los investigadores de IA, los profesionales y los entusiastas experimentados pueden acceder al modelo a través del socio estratégico Swisscom o descargarlo de abrazar la cara, una plataforma para modelos y aplicaciones de IA, y implementarlo para sus propios proyectos.
Apertus está disponible gratuitamente en dos tamaños, con 8 mil millones y 70 mil millones de parámetros, el modelo más pequeño es más apropiado para el uso individual. Ambos modelos se lanzan bajo una licencia permisiva de código abierto, lo que permite el uso en educación e investigación, así como amplias aplicaciones sociales y comerciales.
Un LLM de código abierto
Como modelo de lenguaje completamente abierto, Apertus permite a los investigadores, profesionales y entusiastas construir sobre el modelo y adaptarlo a sus necesidades específicas, así como inspeccionar cualquier parte del proceso de capacitación. Esto distingue a Apertus de los modelos que solo hacen que los componentes seleccionados sean accesibles.
“Con este lanzamiento, nuestro objetivo es proporcionar un plan de cómo se puede desarrollar un modelo de IA de AI confiable, soberano e inclusivo”, dice Martin Jaggi, profesor de aprendizaje automático en EPFL y miembro del Comité Directivo de la Iniciativa de IA suiza. El equipo de desarrollo actualizará regularmente el modelo, que incluye ingenieros especializados y una gran cantidad de investigadores de CSC, ETH Zurich y EPFL.
Un motor de innovación
Con su enfoque abierto, EPFL, ETH Zurich y CSC se aventuran en un nuevo territorio. “Apertus no es un caso convencional de transferencia de tecnología de investigación a producto. En cambio, lo vemos como un impulsor de la innovación y un medio para fortalecer la experiencia de IA en la investigación, la sociedad y la industria”, dice Thomas Schulthess, director de CSC y profesor de ETH Zurich. En línea con su tradición, EPFL, ETH Zurich y CSCs están proporcionando tecnología fundamental e infraestructura para fomentar la innovación en toda la economía.
Entrenado en 15 billones de tokens en más de 1,000 idiomas: el 40% de los datos no tienen inglés, Apertus incluye muchos idiomas que hasta ahora han sido subrepresentados en LLM, como el alemán suizo, Romansh y muchos otros.
“Apertus está construido para el bien público. Se encuentra entre los pocos LLM totalmente abiertos a esta escala y es el primero de su tipo para encarnar multilingüismo, transparencia y cumplimiento como principios de diseño fundamentales”, dice Imanol Schlag, líder técnico del proyecto LLM e científico de investigación de ETH Zurich.
“Swisscom se enorgullece de ser uno de los primeros en implementar este modelo de lenguaje grande pionero en nuestra plataforma soberana de AI suizo. Como socio estratégico de la iniciativa de IA suiza, estamos apoyando el acceso de Apertus durante las semanas suizas {ai}. Esto subraya nuestra compromiso para dar forma a un ecosistema seguro y responsable de AI que atiende el interés público y las fortalezas. Dobos, director de investigación de Swisscom.
Accesibilidad
Si bien la configuración de Apertus es sencilla para profesionales y usuarios competentes, se requieren componentes adicionales como servidores, infraestructura en la nube o interfaces de usuario específicas para uso práctico. Las próximas semanas suizas {AI} serán la primera oportunidad para que los desarrolladores experimenten a mano con Apertus, prueben sus capacidades y proporcionarán comentarios para mejoras a versiones futuras.
Swisscom proporcionará una interfaz dedicada a los participantes de Hackathon, lo que facilita la interacción con el modelo. A partir de hoy, los clientes comerciales de Swisscom podrán acceder al modelo Apertus a través de la plataforma Swisscom Swiss AI Swisscom.
Además, para personas fuera de Suiza, la Utilidad de inferencia pública de IA Hará que Apertus sea accesible como parte de un movimiento global para la IA pública. “Actualmente, Apertus es el modelo de IA público líder: un modelo construido por las instituciones públicas, para el interés público. Es nuestra mejor prueba sin embargo, que la IA puede ser una forma de infraestructura pública como carreteras, agua o electricidad”, dice Joshua Tan, mantenedor principal de la utilidad pública de Inferencia AI.
Transparencia y cumplimiento
Apertus está diseñado con transparencia en su núcleo, asegurando así la reproducibilidad total del proceso de entrenamiento. Junto con los modelos, el equipo de investigación ha publicado una variedad de recursos: documentación integral y código fuente del proceso de capacitación y conjuntos de datos utilizados, pesos de modelos que incluyen puntos de control intermedios, todos lanzados bajo la licencia de código abierto permisivo, que también permite el uso comercial. Los términos y condiciones están disponibles a través de la cara abrazada.
Apertus se desarrolló con la debida consideración a las leyes suizas de protección de datos, las leyes de derechos de autor suizos y las obligaciones de transparencia bajo la Ley de AI de la UE. Se ha prestado especial atención a la integridad de los datos y los estándares éticos: el corpus de capacitación se basa solo en datos que están disponibles públicamente. Se filtra para respetar las solicitudes de opto legibles por máquina de los sitios web, incluso retroactivamente, y para eliminar los datos personales y otro contenido no deseado antes de que comience la capacitación.
El comienzo de un viaje
“Apertus demuestra que la IA generativa puede ser poderosa y abierta”, dice Antoine Bosselut, profesor y jefe del laboratorio de procesamiento del lenguaje natural en EPFL y co-líder de la iniciativa de IA suiza.
“El lanzamiento de Apertus no es un paso final, sino que es el comienzo de un viaje, un compromiso a largo plazo de las bases de IA abiertas, confiables y soberanas, para el bien público del mundo. Estamos entusiasmados de ver a los desarrolladores interactuar con el modelo en las semanas suizas {ai} Weeks. Su creatividad y retroalimentación nos ayudará a mejorar las generaciones futuras del modelo”.
Las versiones futuras tienen como objetivo expandir la familia modelo, mejorar la eficiencia y explorar adaptaciones específicas del dominio en campos como derecho, clima, salud y educación. También se espera que integren capacidades adicionales, al tiempo que mantienen fuertes estándares para la transparencia.
Cita: Apertus: un modelo de lenguaje multilingüe completamente abierto, transparente y multilingüe (2025, 2 de septiembre) Recuperado el 2 de septiembre de 2025 de https://techxplore.com/news/2025-09-apertus-fly-transparent-multilingual-language.html
Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.









