Home Tecnología Google actualiza Search Live con Gemini 2.5 Flash Native Audio

Google actualiza Search Live con Gemini 2.5 Flash Native Audio

23
0

Google anunció hoy la última versión de Audio nativo flash Gemini 2.5. Además de Google Translate para la traducción de auriculares en vivo, Search Live del modo AI beneficio de estas actualizaciones de modelo.

Al igual que Gemini Live el mes pasado, las respuestas de Search Live ahora serán “más fluidas y expresivas que nunca”. Esto incluye voces que suenan más naturales y la capacidad de ralentizar la respuesta con solo preguntar.

Gemini 2.5 Flash Native Audio se lanzará durante la próxima semana para todos los usuarios de Search Live (Android + iOS) en los EE. UU.

Las actualizaciones de hoy también están disponibles para desarrolladores externos que creen agentes de voz en vivo. En comparación con la versión anterior, hay tres mejoras:

Anuncio: desplácese para ver más contenido Llamada de funciones más nítida: hemos mejorado la confiabilidad del modelo al activar funciones externas. Ahora puede identificar con mayor precisión cuándo obtener información en tiempo real durante una conversación y entrelazar esos datos sin problemas en la respuesta de audio, sin interrumpir el flujo. Seguimiento de instrucciones sólido: el modelo ahora maneja mejor instrucciones complejas, lo que genera una mayor satisfacción del usuario en cuanto a la integridad del contenido. Con una tasa de cumplimiento de las instrucciones del desarrollador del 90 % (en comparación con el 84 %), ofrece resultados más confiables. Conversaciones más fluidas: hemos logrado mejoras significativas en la calidad de las conversaciones en varios turnos. Gemini 2.5 Flash Native Audio puede recuperar el contexto de turnos anteriores de manera más efectiva, creando conversaciones más cohesivas.

La otra actualización es la compatibilidad con la traducción de voz a voz en vivo. Como se vio con la actualización de Google Translate de hoy, Gemini puede traducir “entre dos idiomas en tiempo real, cambiando automáticamente el idioma de salida según quién esté hablando”.

Por ejemplo, si hablas inglés y quieres chatear con un hablante de hindi, escucharás traducciones al inglés en tiempo real en tus auriculares, mientras que tu teléfono transmite hindi cuando termines de hablar.

En particular, la traducción resultante preserva la entonación, el ritmo y el tono del hablante, al tiempo que filtra el ruido ambiental. Admite la detección automática de idioma y la entrada multilingüe.

Hay soporte para más de 70 idiomas y 2000 pares de idiomas al “combinar el conocimiento mundial y las capacidades multilingües del modelo Gemini con sus capacidades de audio nativas”.

FTC: Utilizamos enlaces de afiliados automáticos que generan ingresos. Más.

Fuente de noticias