Google ha publicado otro conjunto de resultados comparativos para determinar los mejores modelos de IA para la codificación de Android, junto con cuánto cuesta cada modelo por token. Gemini 3.5 Flash de Google es fácilmente el que consume más recursos en el desarrollo de Android y ni siquiera se encuentra entre los cinco primeros.
A medida que el entusiasmo por los chatbots en general está disminuyendo, empresas como Google, OpenAI y Anthropic están cambiando hacia modelos agentes con fortaleza en codificación. Los usuarios han comenzado a confiar en estos modelos para la “codificación de vibración”, que esencialmente transfiere la mayor parte del desarrollo de software a los LLM.
Los modelos recientes han mejorado drásticamente su codificación de Android y Google ha controlado qué modelos funcionan mejor en los últimos meses. El “Android Bench” pasa por actualizaciones a medida que Google lanza sus propios modelos, como el reciente Gemini 3.5 Flash, y los compara con la competencia.
La conclusión principal es cómo Google desglosa estos modelos. Cada modelo obtiene una puntuación de 100, lo que indica el porcentaje de casos de codificación de Android que puede resolver con éxito en 10 ejecuciones. Google enumera el rendimiento esperado y la fecha en que se realizó la última prueba, y algunos de los de alto rendimiento se mantienen desde febrero.
Anuncio: desplácese para ver más contenido
En la última edición de Android Bench, los resultados muestran un panorama más caro. Gemini 3.5 Flash ocupa el sexto lugar en la lista de Android Bench en modelos como GPT 5.5 y Gemini 3.1 Pro Preview, que se probó en febrero.
Gemini 3.5 Flash fue promocionado como una alternativa más barata y rápida a Gemini 3.1 Pro, con una brecha de rendimiento esperada del 6,1%. Los nuevos resultados de las pruebas comparativas dicen lo contrario con respecto al desarrollo de Android, ya que Gemini 3.5 Flash tiene una latencia más alta y una brecha del 9% en el éxito del rendimiento.
Lo bueno: el último modelo de Google cuesta un promedio de 355,9 tokens a $147,1 por una prueba de referencia, en comparación con los 73,3 tokens de Gemini 3.1 Pro Preview utilizados a aproximadamente un tercio de ese costo.
Por supuesto, vale la pena señalar que Google incluye la versión preliminar de Gemini 3.1 Pro. Dicho esto, el modelo de vista previa obtiene una puntuación más alta que un modelo destinado a ser más rápido y eficiente.
GPT 5.5 tiene un costo similar por ejecución, pero Gemini 3.5 Flash usó 5,5 veces más tokens en las pruebas de Android Bench. El modelo anterior de Claude, Opus 4.7, ocupó el cuarto lugar con un costo de ejecución y un uso de tokens ligeramente menores, ubicándose justo en el medio del grupo. Google no ha publicado puntuaciones de referencia para Opus 4.8 o Fable 5, de hecho.
Aquí están los diez mejores modelos clasificados por Google en las últimas Banco Android liberar:
Puntuación del modeloLatencia promedioTotal promedio de tokensCosto promedioGPT 5.57415.764.7$134.2GPT 5.472.421.264.2$91.7Gemini 3.1 Pro Preview72.411.173.3$47.9Claude Opus 4.768.711.690.0$124.3Claude Opus 4.666.69.969.5$84.4Gemini 3.5 Flash63.714.2355.9$147.1GLM 5.159.733.480.2$46.7Kimi K2.658.629.994.3$42.5Claude Sonnet 4.658.48.247.9$40.4DeepSeek V4 Pro55.435.8132.7$13.7Claude Sonnet 4.553.713.194.2$61.0
La lista incluye varios modelos de peso abierto que figuran entre los modelos de peso cerrado más conocidos como Claude y GPT. El extremo superior de la lista se ha mantenido efectivamente sin cambios desde el último banco de pruebas de Android, con la excepción de GPT 5.3 Codex que se ha eliminado de la lista.
Puedes ver el ranking completo en el sitio web de Google.
Google ha actualizado periódicamente esta lista a medida que se prueban más modelos. En esencia, parece un indicador sólido del rendimiento del modelo en el desarrollo de Android. Gemini 3.5 Flash ha sido una mejora sólida para otras tareas de LLM y agentes, incluso cuando Google ha cambiado los límites de costo y uso. Los números de lanzamiento de Google no se pueden ignorar por completo, aunque la codificación de Android aparentemente no es el punto fuerte de Gemini 3.5 Flash.
Más sobre IA:
FTC: Utilizamos enlaces de afiliados automáticos que generan ingresos. Más.








