Después de una vista previa en agosto con el lanzamiento de Pixel 10, la salida de audio nativa de Gemini Live ahora está disponible en Android e iOS.
Gemini Live ahora aprovecha las “actualizaciones de nuevos modelos” que “mejoran drásticamente su capacidad para comprender y utilizar elementos clave del habla humana”. Las conversaciones pueden volverse “más adaptativas y expresivas”.
Ahora puedes pedirle a Gemini Live que acelere o ralentice su respuesta. Google imagina a un usuario diciendo “Está bien, acelera” para “obtener un curso intensivo” sobre un tema. En general, esto aumenta la accesibilidad al “permitir a los usuarios ajustar el habla de Gemini a una velocidad más cómoda y comprensible”.
Otro caso de uso es el aprendizaje de idiomas personalizado: “Pídele a Gemini que te haga una prueba sobre múltiplos de 10 en coreano o que practique saludos casuales en español. Esto”.
Anuncio: desplácese para ver más contenido
Por el lado divertido:
Gemini Live puede hablar con acentos: “Pruebe un acento de vaquero cuando piense en ideas de postres para una fiesta de cumpleaños con temática de rodeo o pida a Gemini que le explique una receta de asado dominical con acento británico cockney”. “Pídele a Gemini que te hable sobre el imperio romano desde la perspectiva del propio Julio César y obtén una narrativa rica y atractiva completa con acentos de los personajes. Este nuevo nivel de narración dramática hace que el aprendizaje y el entretenimiento sean más inmersivos”.
Estas personalizaciones duran mientras dura una conversación, aunque puedes volver a ellas yendo a la transcripción del chat y tocando el botón En vivo. De lo contrario, todo se reinicia al iniciar una nueva conversación.
Estas actualizaciones de modelo, presumiblemente el audio nativo de Gemini 2.5 Flash Live API, se han estado implementando durante las últimas semanas. Ya está disponible en Android y iOS.
FTC: Utilizamos enlaces de afiliados automáticos que generan ingresos. Más.









