No hay sitio en el mercado para todas las IAs que están naciendo. 2026 va a ser el año en el que las mejores se harán fuertes y serán las que capten la atención de la gente, mientras que las «peores» tendrán que cambiar radicalmente o estarán condenadas a desaparecer. Y en plena guerra de modelos, el objetivo ya no va por ver quién razone más, como sí ha ocurrido en 2025, sino por ver quién ofrece mayor rendimiento por menos dinero. Y, el nuevo Claude Sonnet 4.6, se lo ha puesto muy difícil a sus rivales.
Hace unas horas, Anthropic ha anunciado el lanzamiento de la nueva versión de «Sonnet», su modelo de lenguaje intermedio. Esta nueva versión se trata de una actualización muy importante del modelo, la cual recorta mucho la distancia con Opus, su modelo de gama alta, en tareas como la programación, el razonamiento, la planificación de agentes, el trabajo de oficina y en la capacidad de usar un ordenador como lo haría una persona.
Características de Sonnet 4.6
La principal característica del nuevo Sonnet 4.6 es que se convierte en el modelo por defecto de Claude. Al hacerlo, el free tier incluye ahora creación de archivos, conectores, skills y compaction. En otras palabras, los usuarios que utilicen el plan gratuito de Claude no solo tendrán una IA que responda un poco mejor, sino que ganan a mayores más herramientas prácticas para flujos de trabajo reales.
Anthropic también destaca una serie de mejoras pensadas para mejorar el funcionamiento en sesiones largas de programación. Por ejemplo, en varias pruebas realizadas en Claude Code, los resultados han mostrado que los usuarios preferían el nuevo Sonnet 4.6 frente a la versión 4.5 con bastante diferencia, ya que el modelo tiende menos a «liarse» duplicando lógica o saltándose contexto. Además, este modelo incluye también:
- Context compaction (beta): una función que resume contexto antiguo al acercarnos a los límites para estirar la conversación.
- Herramientas de web search y fetch que nos permiten filtrar resultados de forma mucho más eficiente.
- Capacidades adicionales, como code execution o memory, que ahora pasan a estar disponibles de forma general.
- Claude en Excel ahora cuenta con conectores MCP en ciertos planes (Pro/Max/Team/Enterprise), lo que nos permite acceder a fuentes externas sin salir de la hoja de cálculo.
Otra de las características de este modelo es su ventana de contexto. Anthropic ha trabajado para que este modelo sea capaz de usar un contexto de 200k tokens por defecto, ampliando hasta 1 millón en fase beta. Esto lo convierte en uno de los más grandes de todo el mercado, siendo capaz de procesar bases de código enteras, contratos muy largos o montones de documentos en una sola petición. Eso sí, el modo de 1 millón de contexto no es para todo el mundo y, por ahora, solo queda como beta para organizaciones con ciertos niveles de uso o tarifas.
Sobre la seguridad, que un modelo pueda «usar un ordenador» abre una puerta enorme a la automatización… y también a nuevos riesgos. Anthropic reconoce el problema de la prompt injection (instrucciones maliciosas camufladas para desviar al modelo) que hay escondidas en muchas webs, aunque afirma haber mejorado la resistencia frente a este vector de ataque en Sonnet 4.6 frente a Sonnet 4.5. También, en la System Card, se describe que, en determinados escenarios de «computer use» con interfaz gráfica, Sonnet 4.6 puede tirar más de atajos o soluciones no autorizadas cuando una tarea es imposible o está rota (es lo que se conoce como over-eagerness). Aunque ahora esto es más detectable y dirigible, hay que tenerlo también en cuenta. Por ello, si vamos a automatizar tareas reales (formularios, navegación, acciones con impacto), la supervisión y los límites importan más que nunca.
En cuanto al rendimiento de este nuevo modelo de lenguaje, Anthropic no ha querido quedarse solo en promesas vacías, sino que ha publicado en la documentación los resultados de los dos principales tests a los que se suele enfrentar a las IAs:
