Google se burla de Gemini Profunde Piense con Math Win

21 julio 2025

El modo de pensamiento profundo de Géminis anunciado en la E/S 2025 aún no está aquí, pero Google hoy está destacando cómo logró un rendimiento de nivel de oro en una competencia matemática o matemática.

La Olimpiada Matemática Internacional (“IMO”) es la competencia más prestigiosa del mundo por los jóvenes matemáticos, y se ha celebrado anualmente desde 1959. Cada país que participa está representado por seis matemáticos de élite, preuniversitarios que compiten para resolver seis problemas excepcionalmente difíciles en álgebra, combinatoria, geometría y teoría de números. Las medallas se otorgan a la mitad superior de los concursantes, con aproximadamente el 8% recibiendo una prestigiosa medalla de oro.

La OMI 2025 se celebró la semana pasada, y una “versión avanzada de Gemini Deep Think resolvió cinco de los seis problemas de la OMI perfectamente, ganando 35 puntos totales y logrando el rendimiento de nivel de oro”. Google compartió el Soluciones aquí (PDF).

Para aprovechar al máximo las capacidades de razonamiento de Deep Think, además capacitamos esta versión de Gemini en nuevas técnicas de aprendizaje de refuerzo que pueden aprovechar más datos de razonamiento de varios pasos, resolución de problemas y datos que proporcionan el teorema. También proporcionamos a Gemini acceso a un corpus curado de soluciones de alta calidad a problemas de matemáticas, y agregamos algunos sugerencias y consejos generales sobre cómo abordar los problemas de la OMI a sus instrucciones.

En mayo, Google dijo explícitamente que Gemini 2.5 Pro era el modelo subyacente. La publicación del blog de hoy solo dice “Versión avanzada” o “Géminis avanzada”.

Esta competencia es un buen desafío para las capacidades avanzadas de resolución de problemas y razonamiento de problemas matemáticos de un sistema de IA. En 2024, Google Deepmind obtuvo una plata (“resolver cuatro de los seis problemas y anotar 28 puntos”) usando alfageometría y alfaproof con 2-3 días de cálculo. Sin embargo, los problemas debían traducirse primero del lenguaje natural a idiomas específicos del dominio.

Anuncio – Desplácese por más contenido

Este año, Gemini “operaba de extremo a extremo en lenguaje natural, produciendo pruebas matemáticas rigurosas directamente de las descripciones de problemas oficiales, todo dentro del límite de tiempo de competencia de 4.5 horas”.

Deep Think es un “modo de razonamiento mejorado” que utiliza las “últimas técnicas de investigación”, como el pensamiento paralelo.

Esta configuración permite que el modelo explore y combine simultáneamente múltiples soluciones posibles antes de dar una respuesta final, en lugar de perseguir una sola cadena de pensamiento lineal.

Google dice que hará que “una versión de este modelo de pensamiento profundo esté disponible para un conjunto de probadores de confianza, incluidos los matemáticos”. Llegará a Google AI Ultra después de eso, pero no está claro cuándo se lanzará a los suscriptores del nivel de $ 250 por mes.

FTC: Utilizamos ingresos que ganan enlaces de afiliados para automóviles. Más.

Fuente de noticias

Google se burla de Gemini Profunde Piense con Math Win

Entradas recientes

Schwarzenegger: Si eres un inmigrante en los Estados Unidos, debes ‘comportarse...

Hombre de Aurora sospechoso en 3 asesinatos durante un tramo de...

El nombre del héroe de la guerra de Wallaby para vivir...

Nederland comprará la estación de esquí Eldora, anunció la ciudad en...

Rusia vs Guerra de Ucrania: Trump para enviar armas estadounidenses poderosas...

El adolescente de Man Utd quería en Europa, ya que Ruben...

Categorías