Home Tecnología Google Rolling Gemini 2.5 Flash a los desarrolladores y la aplicación Géminis

Google Rolling Gemini 2.5 Flash a los desarrolladores y la aplicación Géminis

84
0

Después de detallar brevemente la semana pasada, Google está implementando Gemini 2.5 Flash en la vista previa de hoy. Un “presupuesto de pensamiento” permite a los desarrolladores controlar cuánto razonamiento ocurre dependiendo del caso de uso y uso.

Todos los modelos de la familia Gemini 2.5 tienen capacidades de razonamiento que piensan “a través de sus pensamientos antes de responder” para “un rendimiento mejorado y una mayor precisión”. Esto es ideal para indicaciones que requieren un razonamiento de varios pasos, como los problemas matemáticos y el análisis de las preguntas de investigación

En lugar de generar inmediatamente una salida, el modelo puede realizar un proceso de “pensamiento” para comprender mejor la consulta, desglosar tareas complejas y planificar su respuesta.

Para desarrolladores

Los modelos de flash de Gemini son conocidos por su velocidad y menor costo. Eso no está cambiando con 2.5 flash, pero Google está introduciendo capacidades de razonamiento en las que los desarrolladores pueden “establecer presupuestos de pensamiento para controlar el costo frente a la calidad”.

Especificaciones clave para Gemini 2.5 Flash en Vista previa (Gemini-2.5-Flash-Preview-04-17):

Publicidad – Desplácese para obtener más límites de tarifa de contenido: 1000 RPM / 10,000 RPD (nivel pagado), 10 rpm / 500 rpd (nivel gratuito) Corte de conocimiento: enero de 2025 Modalidades de entrada: texto, imágenes, video, salida de audio: Ventana de contexto de texto: 1 millón de tokens Max Longitud de salida: 64k tokens tokens

Específicamente, los desarrolladores controlan el “número de tokens que un modelo puede generar mientras piensa” de 0 a 24,576 tokens. Hay un control deslizante en Google AI Studio y Vertex AI, así como un parámetro API. En los gráficos a continuación, puede ver cómo mejora la calidad del razonamiento a medida que aumenta el presupuesto.

Si el presupuesto de pensamiento se establece en cero, este nuevo modelo coincidirá con el costo y la latencia de 2.0 Flash.

Si no se especifica un presupuesto, Gemini 2.5 Flash “Decide automáticamente cuánto pensar en función de la complejidad de la tarea percibida”. Google proporciona ejemplos de razonamiento mínimo, medio y alto:

Indicaciones con un razonamiento mínimo:

“Gracias” en español ¿Cuántas provincias tiene Canadá?

Indicaciones con razonamiento medio:

Rodas dos dados. ¿Cuál es la probabilidad de que suman 7? Mi gimnasio tiene horas de recogida para el baloncesto entre las 9 y las 3 p.m. en MWF y entre las 2 y las 8 p.m. del martes y el sábado. Si trabajo de 9 a 6 p.m. 5 días a la semana y quiero jugar 5 horas de baloncesto los días de semana, cree un horario para que todo funcione.

Indicaciones con alto razonamiento:

En el contexto de los agentes, otro ejemplo es cómo los resúmenes rápidos implicarían un presupuesto de bajo pensamiento, mientras que el análisis detallado requiere uno más alto.

Gemini 2.5 Flash está disponible para una vista previa para los desarrolladores en Google AI Studio y Vertex AI. Google dice que “continuará mejorando Gemini 2.5 Flash, con más pronto, antes de que lo haga generalmente disponible para el uso de producción completa”.

Aplicación Géminis

2.5 Flash (experimental) también está llegando a la aplicación Gemini con la capacidad de ajustar automáticamente cuánto razonamiento ocurre en función de la complejidad del aviso. Los usuarios finales no obtienen ningún tipo de ajuste manual en la aplicación.

En el lanzamiento, se admiten las diversas capacidades de aplicaciones de Gemini, como aplicaciones/extensiones, carga de archivos, etc., mientras que este modelo reemplazará 2.0 Flash Thinking (experimental), que se actualizó por última vez en marzo.

FTC: Utilizamos ingresos que ganan enlaces de afiliados para automóviles. Más.