En esta carrera desbocada por lanzar modelos de inteligencia artificiales cada vez mejores y más capaces, Anthropic no quiere quedarse atrás de OpenAI y Google. Es por ello que la firma acaba de anunciar Claude 4 Sonnet y Claude 4 Opus, sus dos nuevas apuestas de vanguardia.
Claude 4 Opus es un modelo especializado en labores de programación, mientras que Claude 4 Sonnet es una «mejora considerable» de 3.7 Sonnet, que debutó en febrero de este año. Anthropic indica que el segundo es la opción más equilibrada para labores generales, pero que sobresale especialmente para el desarrollo de agentes de IA.
Ambos modelos llegan con varias novedades en común en lo que respecta a capacidades. Una de las más interesantes es la del razonamiento extendido con el uso de herramientas. Esta función está en fase beta y permite, por ejemplo, que Claude 4 realice búsquedas en la web mientras está razonando en profundidad para brindar respuestas más completas.
Tanto Claude 4 Opus como Claude 4 Sonnet se optimizaron para seguir instrucciones, y pueden usar herramientas en paralelo. Su memoria también se ha mejorado para brindar mejores y más eficientes respuestas al lidiar con información que se debe almacenar en plazos más largos.
Otra característica que llega a los nuevos modelos de Anthropic son los resúmenes de pensamiento. La empresa explica que esta función está disponible tanto en Claude 4 Sonnet como en Opus, y se encarga de condensar los procesos de razonamiento más extensos usando un modelo de inteligencia artificial más pequeño. No obstante, los desarrolladores sostienen que esto se necesita en apenas el 5 % de las ocasiones.
Claude 4 Sonnet y Opus ya están aquí


Los modelos de IA de Anthropic siempre han sobresalido en labores de programación, y Claude 4 Sonnet y Opus no son la excepción. La firma que dirige Dario Amodei afirma que la nueva versión de Opus es la mejor inteligencia artificial del mundo a la hora de programar.
En los benchmarks de SWE-bench, Claude 4 Opus superó ampliamente a las propuestas de sus rivales sus niveles de precisión. La reluciente tecnología de Anthropic logró un 72,5 %, mientras que Codex-1, o3 y GPT-4.1, todas de OpenAI, quedaron bastante por detrás con resultados de 72,1 %, 69,1 % y 54,6 %, respectivamente. En tanto que Gemini 2.5 Pro, de Google, registró un 63,2 %.
Pero esto no es todo. Anthropic indicó que Claude 4 Opus cuenta con medidas de seguridad mucho más estrictas. Esto se debe a que durante su desarrollo se detectó que podía ayudar a usuarios con los conocimientos suficientes —por más que no fuesen avanzados— a crear o desplegar armas biológicas o químicas.
Como indicamos al comienzo, Claude 4 Sonnet ha demostrado ser muy capaz como base tecnológica para el desarrollo de agentes de IA. Es por ello que GitHub lo va a incorporar en la nueva versión del agente de programación de GitHub Copilot, por citar un ejemplo.
Claude 4 Sonnet está disponible tanto para los usuarios de la versión gratuita del chatbot homónimo, como para los suscriptores de las versiones de pago. Mientras que Opus solamente se ofrecerá a los suscriptores de Claude Pro, Max, Team y Enterprise. Por supuesto que ambos modelos también van a estar disponibles para los desarrolladores que deseen integrarlos a través de la API de Anthropic, o mediante las plataformas Vertex AI y Amazon Bedrock.