Home Tecnología Géminis puede leer sus documentos de Google en voz alta

Géminis puede leer sus documentos de Google en voz alta

12
0

La tecnología de texto a voz no es nueva. Es probable que su computadora haya tenido la capacidad durante años en este momento, aunque el resultado final podría no ser necesariamente ideal.

Google quiere mejorar la experiencia para los usuarios de documentos. A partir de hoy, Google Docs tiene una nueva opción de audio con IA que crea “versiones de audio” de sus documentos. Lo que eso realmente significa es esto: Google está usando Gemini para generar más una experiencia natural y realista de texto a voz. Funciona, pero aún está lejos de ser perfecto.

Google anunció las noticias en una publicación de blog el miércoles, solo unas horas antes de que la compañía realice el evento Google 2025. Para usar la función, abra un documento, luego seleccione la pestaña “Herramientas” en la barra de menú. Si tiene acceso, verá una nueva opción “Audio”. Seleccione esto, y aparecerá una barra de reproducción en la esquina inferior izquierda de la ventana, aunque puede moverlo donde desee. Después de que la IA tenga la oportunidad de procesar el DOC, comenzará a hablar automáticamente.

La tecnología de voz AI de Google es un poco impredecible, aquí. La voz en sí es realista, y ocasionalmente golpea algunas inflexiones y ritmos naturales, pero también tiene muchos momentos en los que cae la fachada. Si estás familiarizado con “AI Voice”, lo escuchará aquí.

Dicho esto, Google ofrece algunas herramientas para personalizar la experiencia. Puede ajustar la velocidad de reproducción, entre 0.5x y 2x. También hay siete voces para elegir aquí. El valor predeterminado es el narrador, que Google describe como “tono suave y medio”, pero también puede elegir entre otras seis opciones, incluidas:

¿Qué piensas hasta ahora?

Educador: Pitch Friendly, más alto

Profesor: Clear, Bajo Pitch

Persuader: Inmision y tono bajo

Explicador: Pitch animado y bajo

Entrenador: Pitch animado y más alto

Motivador: enérgico y tono medio

Si es el autor de la página, también puede optar por insertar un botón de audio en el documento. De esa manera, todos los demás contribuyentes y lectores pueden escuchar si lo desean.

Esta característica está disponible para una amplia variedad de usuarios de Google Workspace, incluidos los estándares de negocios y el estándar empresarial y la admisión, Gemini Education, Gemini Education Premium, Gemini Business y Gemini Enterprise. Además, si se suscribe a Google AI Pro o Google AI Ultra, también tiene acceso a esta función.

Fuente de noticias