Home Tecnología Gemini 3.5 Live Translate se implementa en Google Meet and Translate

Gemini 3.5 Live Translate se implementa en Google Meet and Translate

10
0

Google hoy anunciado Gemini 3.5 Live Translate como su último modelo para traducción de voz a voz en vivo.

Este modelo puede detectar más de 70 idiomas y generar “habla traducida suave y con sonido natural” que preserva la entonación, el ritmo y el tono.

En comparación con los sistemas de traducción paso a paso que “esperan a que el hablante termine de hablar antes de responder”, este modelo genera discurso continuamente. Esto da como resultado “un audio fluido sin pausas incómodas y permanece solo unos segundos detrás del hablante durante toda la sesión”.

…3.5 Live Translate genera voz continuamente, equilibrando el equilibrio entre esperar a que el contexto mejore la calidad y traducir inmediatamente para mantenerse sincronizado con el hablante.

Gemini 3.5 Live Translate se está implementando ahora en Google Translate en Android e iOS. Toca “Traducir en vivo” en la esquina inferior izquierda mientras usas un par de auriculares.

Anuncio: desplácese para ver más contenido

La aplicación de Android también está implementando un nuevo “modo de escucha” que le permite escuchar traducciones a través del auricular del teléfono cuando no tiene auriculares disponibles de inmediato. Puede “simplemente acercar el teléfono a la oreja como si fuera una llamada normal”.

Gemini 3.5 Live Translate también llegará a Google Meet. La traducción de voz en la aplicación de videollamadas anteriormente solo admitía cinco idiomas. El soporte del modelo para más de 70 idiomas desbloquea “más de 2000 combinaciones de idiomas en una reunión, expandiéndose desde el estado anterior de traducir únicamente hacia y desde el inglés”. En la web, hay un nuevo botón en la fila de controles para iniciar inmediatamente la traducción de voz.

Este mes, se implementará en “vista previa privada para clientes empresariales seleccionados de Google Workspace”. A finales de este año se realizará un lanzamiento más amplio.

Gemini 3.5 Live Translate también está disponible en versión preliminar pública para desarrolladores a través de Gemini Live API y Google AI Studio.

En el frente de seguridad, todo el audio generado tiene una marca de agua con SynthID:

Esta marca de agua imperceptible está entretejida directamente en la salida de audio, lo que garantiza que el contenido generado por IA siga siendo detectable para ayudar a prevenir información errónea.

FTC: Utilizamos enlaces de afiliados automáticos que generan ingresos. Más.

Fuente de noticias