La era del agente de IA está aquí: ChatGPT ya no es solo para responder a sus consultas con una respuesta que suena segura, a menudo muy incorrecta, sintetizada de masas de datos raspados de otras fuentes. Ahora se conectará a sus aplicaciones para llevar a cabo acciones reales para usted: reservar boletos, mirar los precios, verificar su calendario, crear presentaciones de diapositivas y mucho más.
Este nuevo servicio se llama ChatGPT Agent, y esencialmente le da al AI Bot su propia computadora virtual dentro de sus conversaciones. Operai nos dice que esperemos un bot “que cambie fluidamente entre razonamiento y acción para manejar flujos de trabajo complejos de principio a fin, todo en función de sus instrucciones”, que suena ambicioso y quizás un poco aterrador.
Si está tomando alguno de los planes pagados que ofrece ChatGPT (a partir de $ 20 al mes), entonces puede probar el agente ahora, así que pensé en ponerlo a prueba en un par de proyectos inventados (todavía no estoy listo para confiar en él con nada real). Puede iniciar el agente de chatgpt en la aplicación web haciendo clic en el botón + (más) a la izquierda del cuadro de solicitud y el modo de recolección de agente.
Cómo funciona el modo de agente
No sucede nada demasiado dramático cuando entra en modo de agente: simplemente se le pide que describe la tarea que desea que ChatGPT realice. No hay directrices sobre su aviso. Obtiene algunas sugerencias en la pantalla, desde que ChatGPT resume las noticias hasta que ordene que ordene comestibles.
Una vez que haya decidido lo que desea que ChatGPT haga, puede hacerle preguntas de seguimiento para su claridad, y la interfaz no es muy diferente de una conversación regular con el bot de IA. Lo que es diferente es una ventana integrada que le brinda una idea general de lo que ChatGPT está haciendo en su propia computadora virtual.
Puedes saltar y tomar el control cuando quieras. Crédito: Lifehacker
No es un feed directo en vivo, pero ChatGPT le dirá lo que está haciendo y arrojará algunos gráficos para representar cada acción. En cualquier momento, puede desplazarse hacia atrás a través de la alimentación, o tomar el control de la computadora de ChatGPT, en qué punto verá exactamente qué está haciendo ChatGPT, como si se conectara con otra PC de forma remota.
También puede cambiar a lo que se llama modo de actividad, donde simplemente obtiene un texto de desplazamiento de los pasos que Chatgpt está tomando, sin las imágenes. También existe la opción de detener al agente en cualquier momento, si siente que se está saliendo de la pista o haciendo algo que no quiere que haga. Solo se necesitan un par de clics.
El agente presenta sus resultados en el formato Normal CHATGPT. Crédito: Lifehacker
Cuando el agente de ChatGPT ha terminado de hacer todo lo que le pidió que hiciera, se le dará un resumen e informe. También obtendrá una lista de fuentes en la parte inferior de la respuesta final, al igual que la norma para las conversaciones de ChatGPT, y existe la opción de hacer preguntas de seguimiento, si es necesario.
En general, el agente funciona bien, aunque puede tomarse su tiempo: al igual que la herramienta de investigación profunda, probablemente querrá configurar esto y luego hacer algo más por un tiempo. Eso significa que no puede ver y verificar cada paso que toma ChatGPT, por lo que tendrá que decidir cuánto confía en él.
Cómo fue mi experimento de agente de chatgpt
La primera tarea que le pedí a ChatGPT que hiciera fue planificar una fiesta de cumpleaños para mí: le dije la edad que soy, qué tipo de fiesta quería (un asunto tranquilo y discreto), el tipo de espacio que quería (una habitación pequeña al lado de un bar) y las fechas potenciales que estaba considerando. También le pedí a la IA que produjera algunas invitaciones.
¿Qué piensas hasta ahora?
Y en general, el bot hizo un buen trabajo. Identificó los lugares locales que me habría elegido, aunque se encontró con algunos problemas para obtener detalles de reserva (abrir PDF de la web no parecía funcionar). La obra de arte y el texto de la invitación estaban bien, aunque un poco genéricos, y el informe final me dio una orden de comparación ordenada para ayudarme a elegir un lugar para celebrar la fiesta, y los datos de contacto para reservarla.
Obtiene una feed en vivo de lo que está haciendo el agente de chatgpt. Crédito: Lifehacker
Para mi próximo experimento, intenté que ChatGPT Agent produzca una hoja de cálculo bien formateada con todas las fechas de lanzamiento de iPhone, algo que realmente me ayudaría en mi trabajo y me ahorraría algo de tiempo. Un punto más definido aquí fue que ChatGPT le fue bien en la identificación de fuentes confiables: Wikipedia, comunicados de prensa de Apple y sitios como Macrumors.
La hoja de cálculo final parecía ser completamente precisa por lo que pude ver, y fue entregado en una hoja de cálculo de Excel: no obtuve el formato agradable que pedí, y la columna de fuentes realmente no tenía sentido, pero todos los datos clave estaban allí. Sin embargo, esto tardó bastante en compilar, y creo que probablemente podría haberlo hecho yo mismo al mismo tiempo (aunque era libre de hacer algo más mientras ChatGPT estaba funcionando).
También está disponible una vista de alimentación basada en texto. Crédito: Lifehacker
Estoy impresionado por lo elegante y capaz de ChatGPT Agent. No era perfecto, pero la mayoría de las veces tomó los pasos correctos y cambió con éxito entre tareas. Hay una buena cantidad de transparencia sobre lo que está haciendo, y siempre puede tomar el control cuando sea necesario.
Personalmente, sin embargo, este es el tipo de tareas que preferiría hacer yo mismo. Estoy demasiado preocupado por el agente de ChatGPT cometiendo un error, perder un detalle o no entender algunos matices para confiar en gran medida. Su propio umbral para ese tipo de preocupaciones puede ser diferente, y sospecho que muchos usuarios pasarán por alto problemas menores debido al tiempo que el agente puede salvarlos.
Divulgación: la empresa matriz de Lifehacker, Ziff Davis, presentó una demanda contra Operai en abril, alegando que infringió los derechos de autor de Ziff Davis en la capacitación y la operación de sus sistemas de IA.








