Home Tecnología Anthrope promete que es menos probable que sus nuevos modelos Claude AI...

Anthrope promete que es menos probable que sus nuevos modelos Claude AI intenten engañarlo.

76
0

Anthrope dice que sus últimos modelos son mejores para hacer malabares con múltiples tareas. Crédito: antrópico

Si bien no tiene la misma prominencia que ChatGPT o Google Gemini, el Bot Claude AI desarrollado por Anthrope continúa mejorando e innovando. Los nuevos modelos Claude 4 ahora están disponibles, actualizaciones prometedoras en codificación, razonamiento, precisión y la capacidad de administrar tareas de larga duración de forma independiente.

Hay dos modelos nuevos, Claude Opus 4 y Claude Sonnet 4, y Anthrope dice que ambos están “estableciendo nuevos estándares” para lo que puede esperar de la IA. La codificación es un gran enfoque, y se dice que los modelos han logrado los puntajes más altos hasta la fecha en dos herramientas de evaluación comparativa de codificación AI ampliamente utilizadas, banco SWE y bancos terminales. Los modelos Claude 4 realmente pueden funcionar durante horas en proyectos sin ninguna entrada del usuario, dice Anthrope.

Los modelos actualizados son mejores para manejar más pasos en tareas más complejas, depurar su propio trabajo y resolver problemas difíciles en el camino. También deben seguir las instrucciones del usuario más exactamente y crear resultados finales que se vean mejor y funcionen de manera más confiable. Anthrope cita a los socios como GitHub, Cursor y Rakuten al explicar cuánto son un paso adelante estos modelos.

Lejos de la generación y el análisis de código, los modelos también traen consigo el pensamiento extendido, la capacidad de trabajar en múltiples tareas en paralelo y una memoria mejorada. Son mejores para integrar las búsquedas web según sea necesario, y para verificar si hay información de apoyo y asegurarse de que estén en el camino correcto con sus respuestas.

Los nuevos lanzamientos del modelo de IA generalmente vienen con gráficos de referencia que muestran mejoras, y este no es diferente. Crédito: antrópico

También son nuevos “resúmenes de pensamiento” que dan más información sobre cómo Claude 4 ha llegado a sus conclusiones, y una característica de “pensamiento extendido”, que se lanza en beta, que le permite obligar al bot AI a tomar más tiempo reflexionando sobre sus respuestas.

Anthrope ahora está haciendo su conjunto de herramientas Claude Code disponible de manera más general, otro paso hacia la IA de agente que puede funcionar de forma autónoma, sin la ayuda continua de los usuarios de carne y sangre. En un video de demostración, los modelos Claude 4 se muestran compilando trabajos de investigación de la web, elaborar un sistema de pedidos en línea y extraer información de documentos para crear tareas procesables.

Claude 4 está disponible ahora (pero deberá pagar el modelo más avanzado)

El modelo Claude Sonnet 4, que es más rápido y no tiene la misma capacidad en términos de pensamiento, codificación y memoria, ahora está disponible para todos los usuarios de Claude. El más avanzado Claude Opus 4, que también incluye herramientas e integraciones adicionales, está disponible para los usuarios en cualquiera de las suscripciones pagas de Anthrope.

El camino para liberar estos modelos de Claude 4 no fue todo suave: Anthrope dice que su compañero de consejos de seguridad advirtió contra la liberación de versiones anteriores de los modelos debido a su tendencia a “esquema” y engañar “. Aparentemente, esos problemas se han resuelto, pero es un recordatorio de que a medida que los modelos de IA se vuelven cada vez más poderosos, también deben venir con barandillas mejoradas y características de seguridad adjuntas.

¿Qué piensas hasta ahora?

Los nuevos modelos están disponibles dentro de Claude ahora. Crédito: Lifehacker

No soy realmente un codificador, por lo que no puedo comentar con ninguna autoridad real en las actualizaciones principales incluidas con Claude 4, pero he podido probar las capacidades de razonamiento y pensamiento extendidos de Claude Sonnet 4 y Claude Opus 4. Estas capacidades no son fáciles de cuantificar o medir, pero todas las respuestas que obtuve fueron bien escritas y bien presentadas, y hasta donde pude contar la información de la información en línea, con las citas en línea, con las citas en línea.

Para ser honesto, siempre estoy un poco atascado cuando se trata de cómo hacer el uso completo de los chatbots de IA y sus últimas actualizaciones. Definitivamente pueden ahorrar tiempo al ejecutar ciertas búsquedas en la web e investigar temas en línea, pero no confío completamente en los resultados, o la capacidad de IA para decidir qué es relevante y qué no, aún así preferiría leer y resumirme a mí mismo, incluso si es más lento.

Hay un nuevo modo de pensamiento extendido que puede usar. Crédito: Lifehacker

Tal vez necesito comenzar un proyecto de codificación y ver qué tan lejos puedo llegar solo a las vibraciones. Le pedí a Claude Opus 4 que me construyera un rastreador de tiempo HTML simple que podría ejecutar en una pestaña del navegador, para asegurarme de que no pasara demasiado tiempo distraído durante el día. Hizo el trabajo en un par de minutos y produjo algo que funcionó bien, coincidiendo estrechamente con las instrucciones que di. Si bien funcionó bien, Claude 4 informó un par de errores en el camino, que por supuesto no entendí, supongo que puedo preguntarle a la IA sobre ellos.

Anthrope no es la única compañía de IA con nuevos modelos para promocionar. En Google I/O 2025 a principios de esta semana, la compañía presentó una mejor asistencia de codificación y resúmenes de pensamiento en Géminis, después del anuncio de sus mejores modelos de IA hace unas semanas. Mientras tanto, Openai ha estado probando su modelo GPT-4.5 desde febrero, promocionando mejoras en la codificación y la resolución de problemas.