La IA Agentic es el próximo gran paso adelante para la inteligencia artificial: bots que no solo responden con orientación e instrucción (a menudo inexacta), sino que en realidad pueden tomar medidas en nuestro nombre. Imagine chatgpt, si pudiera investigar los precios del hotel y reservar sus vacaciones, o Gemini puede ordenar los comestibles que necesita en la web.
Esta tecnología todavía está en su etapa naciente, pero las herramientas de IA tienden a progresar bastante rápido en estos días, y ya hemos visto vistas previas de navegadores que pueden hacer su navegación por usted, y bots que encontrarán un nuevo apartamento para usted y sus compañeros de cuarto. Estos agentes estarán disponibles muy pronto.
Todo esto plantea preguntas importantes: ¿Desea dar acceso a IA a su calendario y tarjeta de crédito? ¿Confías en tu bot favorito para elegir el mejor restaurante de la ciudad? La promesa es que ahorrará tiempo en estas tareas, pero AI comete errores y realmente no se puede confiar en nada importante en este momento.
Ahora tenemos un agente de IA temprano para el iPhone, construido por el codificador Rounak Jain (según lo informado por 9to5Google). No está disponible como una aplicación, pero puede probarla si está preparado para trabajar un poco y gastar algunos centavos en créditos de OpenAI.
Nuestro agente telefónico futuro?
El asistente fallecido, que Jain originalmente reunió como parte de un hackathon Operai el año pasado, sigue siendo difícil: el programador mismo dice que este es un software experimental que puede “equivocarse a veces las cosas”. Sin embargo, nos da una idea de dónde Apple, Google, Openai y el resto pronto nos pueden llevar.
La herramienta se conecta a los modelos OpenAI, por lo que puede aprovechar el mismo tipo de recursos que obtendría con ChatGPT, además de poder tomar medidas en su iPhone. Esto puede ser particularmente útil cuando necesita crear texto en un correo electrónico, mensaje o documento, que se puede generar con un mensaje rápido.
En su demostración, Jain consigue que la aplicación tome una foto, la comparta con su amigo Ron y adjunte un haiku genérico al mensaje. En otra solicitud, el agente mensajes de vuelo los detalles a Ron (¡ese tipo nuevamente!), Antes de reservar un Uber al aeropuerto, descubriendo desde el número de vuelo que se necesitaba la terminal del Delta. Las operaciones a nivel del sistema también son posibles, como abrir el centro de control y encender la linterna.
Los comandos se pueden emitir a través de la voz o el texto escrito, y se muestra una notificación cuando cada tarea se completa, en realidad puede responder a esta notificación con los comandos de seguimiento (para apagar la linterna, por ejemplo).
En mis pruebas, el fonegente era ocasionalmente erróneo y siempre bastante lento, pero eso es de esperar cuando pruebas un software en etapa inicial como este. En general, llevó a cabo mis comandos según lo previsto: conseguí que enviara un mensaje a mi amiga Beth expresando cuánto estaba ansioso por verla, y logré tomar una foto con la cámara y abrirlo en la interfaz de edición de fotos con un solo comando.
Tengo ai para decirle a Beth cuánto estaba esperando verla. Crédito: Lifehacker
El soporte de la aplicación es (comprensiblemente) un poco irregular, y no pude usar el agente para reproducir el último álbum de autoestima en Spotify, o tomar una foto y adjuntarlo automáticamente a una nota. Las integraciones de terceros serán cruciales, como lo han demostrado dispositivos como el conejo R1, pero no está claro exactamente cuánto desearán dar a los bots de IA.
Si esto es en lo que eventualmente evolucionan Siri y Géminis, puedo ver que hace una diferencia significativa: imagine poder verificar dónde está su próxima reunión y obtener instrucciones allí con un solo comando, o hacer que AI reserve su servicio de automóvil mientras está ocupado con otra cosa. Sin embargo, todavía hay muchos obstáculos que superar: Jony Ive y Sam Altman, toman nota.
¿Qué piensas hasta ahora?
Cómo hacer que funcione
El proceso de trabajar fallecido es un poco involucrado, pero no es demasiado difícil, y es gratis, aparte de los créditos de Operai que necesita gastar para acceder a sus modelos. (Ejecuté algunas docenas de comandos a través del software, que terminó costándome alrededor de $ 1 en créditos). Primero, deberá instalar Xcode (desde la tienda de aplicaciones de MacOS) y Github Desktop en su Mac, y una cuenta GitHub gratuita, si aún no tiene uno.
Desde el escritorio de GitHub, clone el repositorio foneagente: elija Clone A Repositorio desde Internet desde la pantalla de apertura, o abra el menú Archivo y elija el repositorio de clonos. Cambie a la pestaña URL, pegue “https://github.com/rounak/phoneagent.git” en el campo URL, elija una carpeta de destino en su Mac, luego haga clic en Clon.
Debe instalar FoneAgent en Xcode en una Mac. Crédito: Lifehacker
Ahora tienes el código fallecido en tu Mac. Dirígete a la carpeta a la que la guardó en Finder, haga doble clic en el archivo PhoneAgent.xCodeproj, y debe abrirse en Xcode. Luego está listo para transferirlo a su iPhone para probarlo: conecte su teléfono a su Mac con un cable, desbloquee el teléfono y elija confiar en la computadora si se le solicita. Luego dirígete a la privacidad y la seguridad desde la configuración de iOS y enciende el modo de desarrollador.
Después de que su iPhone se reinicie, abra el menú desplegable en la parte superior del Xcode en MacOS (a la derecha de PhoneAgent) y elija su iPhone de la lista. Luego, seleccione PhoneAgent en la parte superior del panel de navegación de la izquierda, cambie a la pestaña Firma y capacidades y use la cuenta Agregar para ingresar sus credenciales de Apple. Con eso hecho, elija su nombre del desplegable del equipo bajo firma y capacidades. También debe cambiar el identificador del paquete a algo único.
A continuación, seleccione PhoneAgentuitEtSts.swift desde el panel de la izquierda y busque la entrada “Func Testloop ()” en el código (a un poco más abajo). Si se desplaza sobre la etiqueta de la línea de código a la izquierda inmediata, debe convertirse en un botón de reproducción: haga clic en esto para ejecutar foneagente en su iPhone.
Elija su iPhone como destino de la aplicación. Crédito: Lifehacker
La primera pantalla que vea le solicitará una tecla OpenAI. En un navegador web, regístrese para obtener una cuenta de OpenAI, luego diríjase a esta página: agregue los detalles de pago y compre créditos para usar el servicio (el gasto mínimo es de $ 5). Después de eso, cambie a la página de las teclas API y haga clic en Crear una nueva clave secreta para obtener una clave que pueda dar al fonogente (asegúrese de mantener una copia de esta clave en algún lugar también seguro).
Luego puede comenzar a ingresar comandos tocando el botón de micrófono o tocando el texto en la parte inferior de la pantalla y diciéndole al agente lo que desea que haga.









