Después de una victoria en matemáticas en julio, Gemini 2.5 Deep Think ahora ha obtenido un rendimiento de nivel de oro en la codificación competitiva.
El Concurso Internacional de Programación Collegiate (ICPC) es la “competencia de programación algorítmica más antigua, más grande y más prestigiosa a nivel universitario”, que Google señala es un “paso más alto en el nivel educativo” de la Olímpica Matemática Internacional de nivel de escuela secundaria. Los estudiantes de casi 3.000 universidades en 103 países tienen como objetivo llegar a la ronda final.
Los participantes en las finales mundiales tienen cinco horas para abordar 12 problemas de codificación del mundo real. El sistema de clasificación se basa en cuánto tiempo (minutos) se tarda en resolver, mientras que solo las soluciones perfectas obtienen puntos.
Cuatro equipos (de 139) ganó medallas de oro este año, con una “versión avanzada” de Gemini 2.5 Deep Think, compitiendo “Vivir en un entorno remoto en línea después de las reglas de ICPC bajo la guía de los organizadores de la competencia”, resolviendo 10 de 12 problemas en 677 minutos. Esto involucró la ejecución del código y “utilizando una amplia variedad de estructuras y algoritmos de datos avanzados”.
Publicidad: desplácese por más contenido “Géminis resolvió ocho problemas en solo 45 minutos y dos problemas más en tres horas” “… Gemini 2.5 Profunde pensaría en segundo lugar en general, si se compara con los equipos humanos en la competencia”.
Google se está centrando particularmente en cómo Géminis resolvió un problema (c) que “no resolvieron otros equipos humanos en el concurso”.
El problema C requirió encontrar una solución para distribuir líquido a través de una red de conductos interconectados a un conjunto de depósitos, con el objetivo de encontrar una configuración de estos conductos que llene todos los depósitos lo más rápido posible. Hay un número infinito de configuraciones posibles, ya que cada conducto puede estar abierto, cerrado o incluso parcialmente abierto, lo que dificulta la búsqueda de la óptima.
Gemini pudo encontrar una solución efectiva con una visión inteligente: primero asumió que cada depósito tiene un “valor prioritario”, que representa cuánto se debe favorecer cada depósito en comparación con los demás. Luego, dado un conjunto de valores de prioridad, la mejor configuración de los conductos se puede encontrar utilizando un algoritmo de programación dinámica. Gemini aplicó además el teorema Minimax y descubrió que el problema original puede abordarse al encontrar los valores de prioridad que hacen que el flujo resultante sea más limitado. Aprovechando la relación entre los valores prioritarios y los flujos óptimos, Gemini utilizó la búsqueda ternaria anidada para encontrar rápidamente valores de prioridad óptimos en el espacio de solución convexa tipo tazón y el problema resuelto C.
Google finalmente atribuye una “serie de avances” a través de técnicas de aprendizaje de refuerzo previas, post-entrenamiento, novedosas de refuerzo, razonamiento de múltiples pasos y pensamiento paralelo que permite a Gemini “explorar diferentes formas de resolver problemas complejos, verificar soluciones e iterar continuamente antes de responder”.
Por ejemplo, durante el curso del aprendizaje de refuerzo, entrenamos a Géminis para razonar y generar código para algunos de los problemas más difíciles que los codificadores han enfrentado, para aprender de sus resultados y evolucionar sus enfoques. Para abordar un problema, múltiples agentes de Géminis proponen cada uno sus propias soluciones utilizando terminales para ejecutar código y pruebas, y luego iterar las soluciones basadas en todos los intentos.
La “versión liviana” de Deep Think disponible en la aplicación Gemini hoy ($ 249.99 por mes) sigue sin cambios. En última instancia, Google dice que “estos avances en la programación competitiva y el razonamiento matemático demuestran el profundo salto de Géminis en la resolución de problemas abstractos, marcando un paso significativo en nuestro camino hacia la inteligencia general artificial (AGI)”.
Resolver tareas complejas en estas competiciones requiere un razonamiento abstracto profundo, creatividad, la capacidad de sintetizar soluciones novedosas a problemas nunca antes vistos y una chispa genuina de ingenio.
FTC: Utilizamos ingresos que ganan enlaces de afiliados para automóviles. Más.








