No cabe duda de que la IA ha llegado para quedarse y varias empresas tecnológicas están apostando muy fuerte por todo ello. En estos instantes os vamos a hablar de la firma Anthropic que acaba de lanzar Claude Opus 4.5, el modelo más preciso hasta la fecha.
Esta empresa se puede considerar como uno de los grandes referentes en el sector de la Inteligencia Artificial, y describe su nuevo modelo como un avance en lo que se refiere a la capacidad de los modelos de IA. Os decimos todo esto porque el nuevo modelo de IA Claude Opus 4.5 ya está disponible y según Anthropic, destaca por en la resolución creativa de problemas sobre su competencia.
Este lanzamiento se produjo hace solo unas horas, nos referimos a Claude Opus 4.5, describiendo el modelo como un avance en lo que los sistemas de IA pueden hacer y en su forma de trabajar.
Qué ofrece el modelo de IA Claude Opus 4.5 de Anthropic
Desde el punto de vista de sus creadores, este nuevo modelo supera a otras aplicaciones líderes del sector como Gemini 3 Pro de Google y GPT-5.1 de OpenAI, en lo que se refiere a las tareas de programación.
De hecho, el modelo obtuvo una puntuación más alta que cualquier otro candidato humano en un examen realizado a los futuros empleados de ingeniería. Este es un resultado que plantea interrogantes acerca de cómo la IA transformará la ingeniería como profesión. Cierto es que una versión de Gemini 2.5 también obtuvo recientemente las mejores calificaciones en el Concurso Internacional de Programación Universitaria, lo que plantea algo similar en estos entornos profesionales.

Y no solo eso, ya que Claude Opus 4.5 supera a los modelos anteriores de Anthropic en razonamiento y matemáticas. De este modo podemos afirmar que alcanza un rendimiento de vanguardia en tareas como el uso de herramientas de agente, entre otras. Alcanza nuevas cotas en su capacidad de razonamiento y adaptación flexible a problemas complejos, nos cuentan sus creadores.
Al mismo tiempo, el nuevo modelo de IA se considera como el mejor en estos momentos para programar y usar agentes. También es significativamente mejor en tareas más cotidianas, como todo tipo de trabajos ofimáticos, por ejemplo.
Pruebas a las que se ha sometido al modelo de IA
Debemos saber que el nuevo modelo de IA actuó como un agente automatizado de una aerolínea que ayudaba a un cliente que había solicitado cambiar su vuelo en clase turista básica. Dado que la aerolínea ficticia no permite dicho cambio, la prueba está diseñada para medir la eficacia del agente automatizado para rechazar la solicitud y gestionar al cliente insatisfecho.
Claude Opus 4.5 encontró una escapatoria creativa, cambió la cabina del cliente y luego su vuelo, ya que dicho cambio estaba permitido para vuelos en clase turista no básica.

Así, Anthropic considera este tipo de resolución creativa de problemas es lo que buscan los clientes y es lo que hace que Claude Opus 4.5 sea un avance importante. Además, obtuvo una mejor puntuación que sus predecesores y otros modelos actuales en cuanto al comportamiento que Anthropic define como cooperativo, con el mal uso humano y con acciones no permitidas.
Ventajas frente a otros modelos de Anthopic
Cabe mencionar que ya está disponible en las aplicaciones de Claude, la API y a través de las plataformas en la nube como Azure, Amazon Web Services y Google Cloud.
Uno de los mayores atractivos que nos ofrece este nuevo modelo inteligente respecto a su competencia, es el liderazgo que ha logrado en buena parte de las pruebas que ha superado. Y es que tal y como podemos ver en la gráfica adjunta que nos proporciona la propia Anthropic, los resultados obtenidos están por encima de sus principales competidores actuales.

Aquí nos referimos a otros modelos de IA lanzados relativamente hace poco tiempo, tales como Sonnet 4.5, Opus 4.1, Gemini 3 Pro o GPT-5.1. Y es que no solo destaca en todo aquello relacionado con el razonamiento orígenes. También obtiene resultados más avanzados en el uso de agentes, resolución de problemas complejos y más.
Al mismo tiempo y según los benchmarks publicados por Anthropic, Claude Opus 4.5 muestra una mejora de rendimiento significativa. Superando en un 12% a GPT-5.1 en la prueba SWE-Bench Verified, 82.3% vs 70.1%, y en un 8% a Gemini 3 Pro en la prueba de razonamiento matemático tau2-Bench.
Cabe mencionar que otros productos de la empresa, como Claude Code, demuestran lo que se puede lograr con la integración de las mejoras de Claude. Además, incluye dos actualizaciones con Opus 4.5, ya que el Modo Plan ahora crea planes más precisos y los ejecuta de forma más precisa. También está disponible en la aplicación de escritorio, y permite ejecutar múltiples sesiones locales y remotas en paralelo.

A partir de ahora y con el nuevo modelo Claude Opus 4.5, los usuarios pueden mantener conversaciones más largas y la IA ya no se estanca. Al mismo tiempo ahora ya Claude para Chrome permite gestionar a la IA tareas en todas las pestañas del navegador y está disponible para los usuarios de Max.
| Benchmark | Claude Opus 4.5 | GPT-5.1 | Gemini 3 Pro | Fuente |
|---|---|---|---|---|
| SWE-Bench Verified (Codificación) | 82.3% | 70.1% | 68.9% | Reporte Técnico Anthropic |
| tau2-Bench (Matemáticas) | 89.7 | 87.2 | 85.4 | Reporte Técnico Anthropic |
| MMLU (Conocimiento General) | 86.5 | 88.9 | 85.1 | Reporte Técnico Anthropic |
Mientras que la empresa anunció Claude para Excel en el pasado mes de octubre, a partir de ahora amplían el acceso a la versión beta a todos los usuarios de Max, Team y Enterprise. Estas actualizaciones aprovechan el rendimiento del nuevo Claude Opus 4.5 al usar ordenadores, hojas de cálculo y gestionar tareas de larga duración. Para terminar os diremos que para los usuarios de Claude y Claude Code con acceso a Opus 4.5, se han eliminado los límites específicos de Opus.
