Ahora puede generar ‘descripciones de audio’ estilo podcast directamente en Gemini AI

El año pasado, Google lanzó una función de nicho en su producto experimental de cuaderno de cuaderno que resultó ser un éxito para dormir. Puede cargar cualquier documento en NotebookLm, y usaría IA para generar un podcast de conversación de dos personas. Estos no están destinados a ser cargados en línea para la audiencia, sino para escuchar como un anuncio de aprendizaje.
La idea es que hay momentos en que es más fácil entender un concepto en que dos personas simplemente están conversando casualmente al respecto. Si eso te suena atractivo, buenas noticias: ya no necesitas sumergirte en la interfaz de cuaderno desconocido para probarlo. Los podcasts generados por la IA de Google, llamados descripciones de audio de audio, ahora están disponibles de forma gratuita directamente en la aplicación y el sitio web de Gemini. Y ahora que las descripciones de audio están integradas directamente en Gemini, incluso puede usar los propios informes de investigación de Gemini como fuentes para su podcast.
Personalmente, me ha resultado útil primero pedirle a Gemini a crear un informe de investigación profunda sobre un tema, luego generar directamente una descripción general de audio (saltando más allá de tener que leerlo yo mismo).
Generar y descargar podcasts sobre cualquier tema
Para comenzar, use el sitio web de Gemini o la aplicación Gemini. Para cargar su propio documento o show de diapositivas, haga clic en el botón Plus y agregue su archivo fuente deseado. Tan pronto como se procese el archivo, verá un botón para generar una descripción general de audio.
Crédito: Khamosh Pathak
Presione el botón y espere a que Gemini comience su trabajo. Puede tomar entre 3 y 5 minutos generar su audio de podcast, dependiendo de la profundidad del material.
Alternativamente, puede pedirle a Gemini que cree un informe para usted utilizando la opción de investigación profunda debajo del cuadro de texto. Aquí, también, tendrá que esperar un par de minutos hasta que la investigación esté lista. Luego, abra el documento de investigación profunda, haga clic en el botón Arrow-Arrow y luego use el botón Generar Audio Overview. También puede ingresar “Generar Descripción general de audio” en el cuadro de texto.
Crédito: Khamosh Pathak
Cuando se realice el procesamiento, recibirá una notificación del sitio web de Gemini o la aplicación. Ahora verás un jugador en el cuadro de chat. Presione el botón de reproducción para comenzar la reproducción y use la barra de búsqueda para saltar a cualquier punto de la grabación. Sí, también hay control de velocidad, pero solo puedes aumentar la velocidad de reproducción hasta 1.5x.
¿Qué piensas hasta ahora? Publica un comentario.
Crédito: Khamosh Pathak
Obtuve 10 minutos de descripción de podcast de un documento de 12 páginas, por lo que el detalle no es malo. Si no desea escuchar su podcast de inmediato, o si desea compartirlo, también puede descargar el audio para la recuperación fuera de línea. Haga clic en el botón de menú de tres puntos en el reproductor de audio y elija la opción de descarga.
Crédito: Khamosh Pathak
Desde aquí, también puede elegir la opción Compartir conversación para compartir su chat de Gemini y grabar usando un enlace.
Y mientras estás en Géminis, es posible que desee intentar crear tus propios bots de IA personalizados, llamados gemas, ya que ahora son gratis para que todos los usen.