Home Tecnología La aplicación Spokenly combina varias herramientas de transcripción de IA

La aplicación Spokenly combina varias herramientas de transcripción de IA

33
0

Si alguna vez ha deseado que la función de texto a voz en su Mac funcionara mejor, Spockingly podría ser la solución para usted. Es una aplicación Mac gratuita que le permite usar la transcripción moderna de IA directamente en su Mac de forma gratuita, solo activar la aplicación con un atajo de teclado, diga lo que desea escribir y mire como aparece en la pantalla.

Sea lo que sienta sobre la IA moderna, es difícil negar que es bueno convertir la palabra hablada en texto. Ya sea que se trate de una transcripción en tiempo real o crea una transcripción para un archivo de video o audio, el motor Whisper de código abierto es preciso y rápido. Spokenly es una aplicación gratuita que le permite usar esta tecnología en su Mac.

Instale la aplicación, que actualmente es gratuita en la App Store de Mac, y comenzará en su barra de menú. La transcripción es simple: simplemente presione y mantenga presionado el botón de comando correcto y verá la ventana emergente, como se muestra arriba. Diga lo que quiere escribir y deje ir cuando haya terminado: el texto aparecerá en el campo de texto actualmente activo.

Honestamente, podría instalar la aplicación, usarla de esta manera y nunca pensar en la configuración, principalmente solo funciona. Sin embargo, si desea profundizar, abra la configuración haciendo clic en el icono de la barra de menú y haciendo clic en la configuración general. Puede decidir si la aplicación aparecerá en la barra de menú, el muelle o ambos. Puede decidir qué micrófono le gustaría favorecer la aplicación, suponiendo que use más de uno. Y puede decidir si el texto transcrito debe copiarse en su portapapeles de forma predeterminada.

Sin embargo, si te gusta experimentar con AI, deberías consultar la pestaña Modelos de voz. Desde aquí, puede elegir qué modelo de IA desea usar. De manera predeterminada, la aplicación utiliza una versión en línea de “Whisper Large V3”, que es el único modelo que admite mostrar su transcripción en la ventana emergente mientras habla. Sin embargo, hay otros modelos que puede usar, incluido GTP-4O a través de Spokenly.

Crédito: Justin Pot

Si prefiere no usar un servicio en línea, hay soporte para descargar y ejecutar varios modelos Whisper localmente. Tendrá que encontrar un equilibrio entre el espacio del disco duro, el rendimiento y la precisión; recomiendo probar algunos modelos hasta que uno funcione para usted. También hay soporte para usar Deepgram, fuegos artificiales y claves API de Operai, suponiendo que ya esté pagando por uno de esos servicios.

Si no sabe lo que significa nada de eso, no se preocupe: el modelo predeterminado funciona extremadamente bien. Y hay más para cavar con esta aplicación. La pestaña Archivo Transcribe de la ventana Configuración le permite agregar cualquier archivo de video o audio y obtener una transcripción, con o sin marcas de tiempo. Incluso hay soporte para generar archivos de subtítulos para sus videos.

¿Qué piensas hasta ahora?

Crédito: Justin Pot

Y hay algunas herramientas de usuario de poder que puede configurar. La pestaña de comandos rápidos le permite elegir algunas combinaciones de palabras que ejecutan una acción en lugar de transcribir. Simplemente elija una frase de activación y lo que le gustaría hacer esa frase: abrir una URL, lanzar una aplicación o ejecutar uno de sus atajos de Apple. Por ejemplo, podría configurar “Abrir Lifehacker” como una frase desencadenante y nuestra página de inicio como URL. Haga eso y el sitio web de Lifehacker se abrirá cada vez que digan las palabras “Abra Lifehacker”, mejorando su vida (se supone).

Crédito: Justin Pot

Otra característica, AI indica, le permite establecer un aviso que cambiará su texto después de dictarlo. Simplemente elija un atajo de teclado separado y escriba su indicador para el texto. Por ejemplo, podría escribir un aviso que dice “Traducir este texto en español”, ahora puede usar un atajo de teclado personalizado para transcribir algo antes de usar AI para traducirlo. Cualquier aviso que se le ocurra funcionará.

Todas estas características recompensan los retoques, que es exactamente el tipo de aplicación que me gusta. Y la aplicación es completamente gratuita a partir de este escrito, al tiempo que ofrece características que le permiten usarla en privado. Pruébelo si desea poder obtener más de software de transcripción.