Claude Opus 4.7: qué mejora Anthropic en programación, visión y tareas largas

Claude Opus 4.7: qué mejora Anthropic en programación, visión y tareas largas

Brain Code |

Anthropic ha presentado Claude Opus 4.7 como una actualización general disponible de su familia de modelos. Según el texto, esta nueva versión mejora de forma notable a Opus 4.6 en ingeniería de software avanzada, especialmente en las tareas más difíciles, y refuerza también capacidades como la visión, el seguimiento de instrucciones, la memoria y el trabajo prolongado en varios pasos.

La idea central del anuncio es que Opus 4.7 está pensado para abordar tareas complejas con más rigor, más consistencia y menos supervisión cercana. A eso se suman mejoras en usos multimodales, en trabajo profesional con interfaces, diapositivas y documentos, y en algunos aspectos de seguridad y alineamiento.

Una mejora centrada en trabajo complejo y de larga duración

Anthropic presenta Opus 4.7 como una evolución clara respecto a Opus 4.6 en software engineering avanzado. El texto señala que los usuarios han reportado poder delegar en este modelo tareas de programación especialmente difíciles que antes requerían una supervisión más estrecha.

Según la descripción del anuncio, Opus 4.7 destaca por varias cualidades combinadas:

  • Gestiona tareas complejas y prolongadas con rigor y consistencia.
  • Presta atención precisa a las instrucciones.
  • Busca formas de verificar sus propios resultados antes de responder.

Ese conjunto de rasgos es una de las bases del posicionamiento del modelo en el texto: no se presenta solo como más capaz, sino como más fiable en trabajos largos y exigentes.

Mejor visión y mayor calidad en tareas profesionales

Otro de los bloques importantes del anuncio tiene que ver con la mejora de la visión. Anthropic afirma que Opus 4.7 puede procesar imágenes en una resolución mayor, hasta 2.576 píxeles en el lado largo, lo que equivale aproximadamente a 3,75 megapíxeles y supera en más de tres veces la capacidad de modelos Claude anteriores.

Según el texto, esto abre usos multimodales que dependen de detalle visual fino, como:

  • Agentes que leen capturas de pantalla densas.
  • Extracción de datos desde diagramas complejos.
  • Tareas que requieren referencias visuales muy precisas.

Anthropic añade además que el modelo es más cuidadoso y creativo al completar tareas profesionales, generando:

  • Interfaces de mayor calidad.
  • Mejores diapositivas.
  • Mejores documentos.

Mejor seguimiento de instrucciones y necesidad de reajustar prompts

Uno de los cambios más concretos que destaca el artículo es la mejora en instruction following. Anthropic señala que Opus 4.7 sigue instrucciones de forma sustancialmente mejor que Opus 4.6.

Esa mejora, sin embargo, trae una consecuencia práctica: prompts que funcionaban con modelos anteriores pueden producir ahora resultados inesperados. La razón que da el texto es que antes algunos modelos interpretaban las instrucciones de forma más laxa o se saltaban partes, mientras que Opus 4.7 tiende a tomarlas de forma más literal.

Por eso, Anthropic recomienda:

  • Reajustar prompts.
  • Volver a afinar harnesses.
  • Revisar configuraciones pensadas para versiones anteriores.

Más capacidad en finanzas, conocimiento aplicado y memoria

El anuncio no se limita a programación o visión. También resalta mejoras en tareas relacionadas con análisis financiero y trabajo de conocimiento.

Anthropic menciona varios puntos en esta línea:

  • Opus 4.7 obtiene un resultado de referencia en la evaluación Finance Agent.
  • En pruebas internas, se comportó como un analista financiero más eficaz que Opus 4.6.
  • Produjo análisis y modelos más rigurosos.
  • Generó presentaciones más profesionales.
  • Mostró una integración más estrecha entre tareas.

Además, el texto afirma que también alcanza un resultado de referencia en GDPval-AA, una evaluación externa centrada en trabajo de conocimiento económicamente valioso en áreas como finanzas, derecho y otros dominios.

A esto se suma una mejora en memory. Según Anthropic, Opus 4.7 utiliza mejor la memoria basada en sistema de archivos, recuerda notas importantes a lo largo de trabajos prolongados y en varias sesiones, y aprovecha ese contexto para avanzar en nuevas tareas con menos necesidad de contexto inicial.

Seguridad, ciberseguridad y lanzamiento con salvaguardas

El texto conecta el lanzamiento de Opus 4.7 con el anuncio previo de Project Glasswing, donde Anthropic habló de riesgos y beneficios de los modelos de IA para ciberseguridad.

Según explica la compañía, ya había anticipado que la publicación de Claude Mythos Preview seguiría siendo limitada y que las nuevas salvaguardas de ciberseguridad se probarían primero en modelos menos capaces. Opus 4.7 es el primero de esos modelos.

Anthropic señala varios puntos relevantes:

  • Las capacidades de ciberseguridad de Opus 4.7 no alcanzan las de Mythos Preview.
  • Durante el entrenamiento se experimentó con esfuerzos para reducir diferencialmente esas capacidades.
  • El modelo se lanza con salvaguardas que detectan y bloquean automáticamente peticiones asociadas a usos prohibidos o de alto riesgo en ciberseguridad.

El texto añade que el aprendizaje obtenido del despliegue real de estas salvaguardas ayudará a avanzar hacia un eventual objetivo de lanzamiento más amplio de modelos de clase Mythos.

Además, Anthropic invita a profesionales de seguridad que quieran usar Opus 4.7 para fines legítimos, como:

  • Investigación de vulnerabilidades.
  • Penetration testing.
  • Red teaming.

Para ello, menciona su nuevo Cyber Verification Program.

Un perfil de seguridad similar al de Opus 4.6, con algunos matices

En el apartado de safety and alignment, Anthropic afirma que Opus 4.7 tiene un perfil de seguridad similar al de Opus 4.6.

Según sus evaluaciones, presenta bajas tasas de comportamientos preocupantes como:

  • Engaño.
  • Sycophancy.
  • Cooperación con usos indebidos.

El texto también especifica diferencias concretas respecto a la versión anterior:

  • Mejora en honestidad.
  • Mejora en resistencia a ataques maliciosos de prompt injection.
  • Ligero empeoramiento en su tendencia a ofrecer consejos demasiado detallados sobre reducción de daño en sustancias controladas.

La evaluación de alineamiento resume el modelo como “largamente bien alineado y confiable, aunque no plenamente ideal en su comportamiento”. Aun así, Anthropic aclara que, según sus evaluaciones, Mythos Preview sigue siendo el modelo mejor alineado que han entrenado.

Nuevas funciones que llegan junto con Opus 4.7

Además del propio modelo, Anthropic acompaña el lanzamiento con varias actualizaciones adicionales.

Más control sobre el esfuerzo de razonamiento

Opus 4.7 incorpora un nuevo nivel de esfuerzo llamado xhigh, situado entre high y max. Según el texto, esto permite un control más fino del equilibrio entre razonamiento y latencia en problemas difíciles.

Anthropic indica que en Claude Code el nivel de esfuerzo por defecto pasa a ser xhigh para todos los planes, y recomienda empezar con high o xhigh al probar el modelo en casos de uso de programación y agentes.

Task budgets en la API

En la plataforma Claude, Anthropic lanza también task budgets en beta pública. La función ofrece a los desarrolladores una forma de orientar el gasto de tokens para que Claude pueda priorizar trabajo en ejecuciones más largas.

Novedades en Claude Code

El anuncio incluye también cambios específicos en Claude Code:

  • El nuevo comando /ultrareview genera una sesión dedicada de revisión.
  • Esa sesión revisa cambios y señala bugs y problemas de diseño que detectaría un revisor cuidadoso.
  • Los usuarios Pro y Max de Claude Code reciben tres ultrareviews gratuitos.
  • El modo auto se amplía a usuarios Max.

Anthropic describe auto mode como una opción de permisos en la que Claude toma decisiones en nombre del usuario, lo que permite ejecutar tareas más largas con menos interrupciones y, según el texto, con menos riesgo que omitir todos los permisos.

Migración desde Opus 4.6 y efecto en el uso de tokens

Anthropic define Opus 4.7 como una actualización directa de Opus 4.6, pero avisa de dos cambios que conviene planificar porque afectan al consumo de tokens.

El primero es un tokenizer actualizado, que mejora la forma en que el modelo procesa texto. El coste de esa mejora es que una misma entrada puede convertirse en más tokens, aproximadamente entre 1,0 y 1,35 veces, según el tipo de contenido.

El segundo es que Opus 4.7 piensa más en niveles altos de esfuerzo, especialmente en turnos posteriores dentro de configuraciones agentic. Anthropic sostiene que esto mejora la fiabilidad en problemas difíciles, aunque también hace que el modelo produzca más tokens de salida.

Para controlar ese consumo, el texto propone varias vías:

  • Ajustar el parámetro de esfuerzo.
  • Modificar task budgets.
  • Pedir al modelo que sea más conciso.

Anthropic afirma que, en sus pruebas internas, el efecto neto es favorable y que el uso de tokens mejora en una evaluación interna de programación, aunque recomienda medir la diferencia sobre tráfico real.

Disponibilidad y precio

Opus 4.7 está disponible desde el momento del anuncio en:

  • Todos los productos Claude.
  • La API de Claude.
  • Amazon Bedrock.
  • Google Cloud Vertex AI.
  • Microsoft Foundry.

En cuanto al precio, Anthropic indica que se mantiene igual que en Opus 4.6:

  • 5 dólares por millón de tokens de entrada.
  • 25 dólares por millón de tokens de salida.

Los desarrolladores pueden acceder al modelo mediante claude-opus-4-7 en la API de Claude.

Qué deja claro este anuncio

El texto presenta a Claude Opus 4.7 como una mejora relevante en varios frentes a la vez: programación avanzada, seguimiento de instrucciones, visión de alta resolución, memoria de trabajo prolongado y producción de materiales profesionales.

La tesis del anuncio puede resumirse en cuatro ideas principales:

  • Opus 4.7 mejora de forma notable a Opus 4.6 en tareas difíciles, especialmente en software engineering.
  • El modelo sigue instrucciones de forma más estricta y trabaja mejor en procesos largos y complejos.
  • Anthropic combina esa mejora de capacidades con nuevas salvaguardas en ciberseguridad.
  • El lanzamiento se acompaña de cambios prácticos en control de esfuerzo, revisión de código, presupuestos de tarea y migración desde la versión anterior.

Fuente

Fuente
Anthropic, “Introducing Claude Opus 4.7”, Anthropic, 16 de abril de 2026.

Leave a comment