Hay muchas razones por las que me encanta usar un teléfono Google Pixel, pero la conversión de voz a texto podría ser la actualización más subestimada en estos dispositivos. Cada vez que uso un Pixel, sin falta, me cuesta volver a cambiar literalmente a cualquier otro dispositivo Android, en parte porque la experiencia de voz a texto es mucho peor. Pero, finalmente, se vislumbra un futuro mejor.
Gboard es la principal oferta de teclado de Android y tiene dictado de voz a texto integrado. Funciona bastante bien, pero se sobrecarga en un Pixel. Google realizó este cambio por primera vez hace más de media década, y la experiencia mejorada en Pixel no solo fue mucho más rápida, sino también más precisa. Entre entender las palabras correctas y poder incluir puntuación, hace que la conversión de voz a texto en un Pixel sea drásticamente mejor que cualquier otro dispositivo Android.
Y eso es independientemente del teclado que estés usando. Gboard en un Pixel versus Gboard en un Samsung Galaxy son dos experiencias increíblemente diferentes. La versión que se encuentra en otros dispositivos Android no admite puntuación (sin que usted la diga en voz alta), a menudo necesita más tiempo para cargarse y rara vez es tan precisa. No me malinterpretes, podría ser peor: la conversión de voz a texto del teclado Samsung es una verdadera farsa, pero realmente desearía que Google hiciera algunas mejoras aquí.
Sin embargo, realmente parece que la solución a esto está en el horizonte.
Anuncio: desplácese para ver más contenido
Es IA.
Todavía tengo dudas sobre la mayoría de las aplicaciones de IA, pero si hay algo en lo que los LLM son buenos es en el texto; después de todo, está ahí en el nombre. Por eso, la conversión de voz a texto se ha convertido en un uso muy popular de la IA y uno de los más útiles para el usuario final. Google, técnicamente, estaba muy por delante de la curva aquí, ya que la escritura por voz mejorada de Gboard en Pixel fue el resultado del aprendizaje automático. Los modelos más nuevos acaban de potenciar esto.
Uno de los primeros lugares donde disfruté esto fue “Wispr Flow”, un servicio de dictado de voz a texto impulsado por inteligencia artificial que se lanzó en Android a principios de este año y que he estado usando desde entonces.
Creo que esto tiene dos cosas principales a su favor.
En primer lugar, Flow no reemplaza a Gboard ni a cualquier otro teclado que quieras usar. En cambio, actúa como un botón flotante/ventana emergente encima de cualquier otra aplicación que estés intentando usar. Se necesita absolutamente algo de memoria muscular para dejar de tocar el botón del micrófono de Gboard y en su lugar usar el de Flow, pero es la mejor solución que se me ocurre. No podrías quitarme Gboard, y no creo que esté solo allí: Gboard es posiblemente una de las mejores piezas de software de Google en Android. El botón flotante no se muestra todo el tiempo, sino que aparece de forma algo inteligente según la aplicación que estás usando y lo que realmente estás haciendo. Digo “un poco” porque lo he pillado apareciendo en ocasiones en las que no lo necesito. Flow parece centrarse en detectar la aplicación en lugar del método simple, simplemente ver cuándo se activa el teclado.
Aún así, es una de las mejores implementaciones que he visto. Al presionar el botón se inicia la conversión de voz a texto y al presionar la marca de verificación se procesa y se pega en el cuadro de texto activo. Desearía que mostrara una vista previa del texto, pero funciona bastante bien.
Por supuesto, éstas no son las únicas compensaciones. Debe otorgar a Wispr Flow algunos permisos adicionales, como mostrar encima de otras aplicaciones, así como acceso de accesibilidad. Como resultado, la aplicación muestra notificaciones en la bandeja. No hay un icono en la barra de estado y están silenciados de forma predeterminada, pero tendrás que desactivarlos manualmente a través de la configuración de Android si realmente quieres ocultarlos. Rápidamente desactivé la notificación persistente a través de la configuración de Android, pero es un poco frustrante que ahora haya una notificación constante cuando las aplicaciones tienen la capacidad de mostrarse encima de otras. Entiendo por qué existe (es fácil abusar de esa funcionalidad), pero, hombre, es un gran lastre para esta experiencia. Es lo principal que ha empujado a Flow a un estado de “ir y venir”. Todavía lo uso de vez en cuando, pero lo he estado apagando mucho solo porque me molesta.
También tendrás que confiar en Wispr en el aspecto de la privacidad aquí. La aplicación tiene un “Modo privado” que, según dice, “mantendrá los datos almacenados sólo en su dispositivo”.
Dicho esto, el rendimiento real lo compensa con creces.
He estado usando esto en mi Galaxy Z Fold 7, mi controlador diario y el teléfono exacto que me recuerda constantemente lo mala que es la conversión de voz a texto de Gboard fuera de un Pixel, y estoy asombrado de lo bien que funciona todo. El modelo de voz a texto aquí es increíblemente preciso y puede transcribir perfectamente lo que digo independientemente del contexto. Ya sea en una habitación tranquila o llena de música a todo volumen, capta mi voz y clava el texto. No es infalible, con errores ocasionales de ortografía o malentendidos, pero se siente tan preciso como la experiencia en Pixel. También inserta puntuación bastante bien. Creo que la experiencia de Google en Pixel sigue siendo un poco mejor aquí, pero Flow hace un trabajo realmente bueno.
El lugar principal donde veo que Flow vence a Gboard en Pixel es en la comprensión del contexto. Cuando puedes transcribir a través de Pixel y terminar con palabras como “primo” en lugares donde eso no es lo más apropiado, Flow corrige automáticamente frases como esa. La aplicación eventualmente admitirá un diccionario personalizado y otras formas de personalizar el resultado, pero realmente me gusta como está.
Pero, como ya hemos mencionado, el gran problema de Flow es que no es nativo.
Ahí es donde entra en juego el siguiente paso. Este es el tipo de tecnología que puedo ver fácilmente que más marcas de Android buscan aprovechar. Nada empezó a rodar esta semana con el lanzamiento de “Essential Voice”, que es básicamente un Wispr Flow nativo para Nothing Phones. Reduce el costo adicional y al mismo tiempo integra mejor la escritura por voz en su experiencia normal, ya que funciona tanto a través de la tecla esencial física (y también del teclado).
Parece algo inevitable que le sigan más marcas de Android. Mientras todo el mundo intenta incluir la IA en todo, las mejoras de voz a texto son, en mi opinión, un jonrón. Es una característica que todos usamos de alguna manera y en la que la IA es realmente buena.
Las historias más destacadas de esta semana
El rastreador de actividad física sin pantalla de Google es el “Fitbit Air”
Informamos que el rastreador de ejercicios sin pantalla de Google se llamará “Fitbit Air”, y informes adicionales revelan que el dispositivo costará potencialmente alrededor de $100 y estará disponible en varios colores. También podría lanzarse en las próximas dos o tres semanas.
Android 17 QPR1 Beta 1
Antes del primer lanzamiento estable de Android 17, Google ya lanzó la primera versión beta de Android 17 QPR1. Es muy pequeño, y quizás lo más notable sean los fondos de pantalla destinados al Pixel 11 Pro Fold.
Más historias destacadas
Del resto de 9to5
9to5Juguetes: Nintendo acaba de lanzar nueva jugabilidad de Switch 2 y detalles de Yoshi and the Mysterious Book
Electrek: Prototipo Tesla Model YL visto por primera vez en las carreteras de EE. UU.
Sigue a Ben: Gorjeo/X, Trapos, cielo azuly Instagram
FTC: Utilizamos enlaces de afiliados automáticos que generan ingresos. Más.







