Llega GPT-Image-1.5, la nueva IA que amenaza el reinado de MidJourney o Nano Banana

OpenAI acaba de lanzar GPT-Images-1.5, su nuevo modelo de generación de imágenes integrado directamente en ChatGPT. Pero no hablamos de una actualización como otra cualquiera, sino que supone un salto cualitativo que posiciona a OpenAI como verdadero competidor  de MidJourney en la carrera de la generación de imágenes por IA.  Y de paso, eclipsa por completo a su propio DALL-E 3.

Este nuevo modelo genera imágenes hasta 4 veces más rápido que la versión anterior, con un renderizado de texto mejorado exponencialmente. Pero desde OpenAI han querido mejorarlo, sobre todo, en su capacidad de edición y precisión quirúrgica: podemos modificar elementos en específico manteniendo intactos otros factores como la iluminación, composición, caras o logos.

Además, GPT-Image-1.5 se integra directamente en la app, web y API de ChatGPT. No tenemos que cambiar a otro modelo, tan solo escribir el prompt y funciona. Desde la nueva sección «Images», actuaremos como estudio creativo con biblioteca incorporada…

Pero la pregunta inevitable que nos hacemos todos es ¿cómo se compara con Midjourney y DALL-E 3? los principales generadores comerciales del panorama mundial en este momento. Pues vamos a verlo en profundidad.

GPT-Image-1.5 redefine la generación de imágenes

Vamos a resumir de manera muy concisa y explicada todas las mejoras que trae GPT-Image-1.5, que son cinco en concreto:

  • La velocidad de generación se ha multiplicado por 4. Así de simple. Lo que antes era cuestión de minutos, ahora es cuestión de segundos.
  • Edición precisa con conservación de detalles. A la hora de editar una imagen, el algoritmo mantiene elementos fundamentales como iluminación, composición, expresión fácil o logos intactos. Ganando en coherencia visual.
  • Renderizado de texto: por fin, las palabras generadas son sólidas y legibles: infografías, posters, layouts de periódicos… todo se genera correctamente. Este ha sido siempre uno de los puntos débiles de cualquier generador de IA.
  • El modelo entiende prompts multi-paso detallados, las relaciones espaciales de los elementos en la imagen, etc.

Para la llegada de GPT-Image-1.5, la interfaz de ChatGPT le ha dedicado una nueva sección. Ya no hablamos de una parte de una conversación. Ahora hay una sección «Images» que cuenta con biblioteca, reutilización, edición y preconfiguraciones sugeridas. Básicamente, un «Photoshop» conversacional. Obviamente, todo dentro de GPT-5.

El modelo sigue las instrucciones con mayor fiabilidad que la versión inicial. Esto permite ediciones más precisas, así como composiciones originales más complejas, donde las relaciones entre los elementos se conservan según lo previsto.

Nueva capacidad para crear imágenes en mosaico de GPT Images
Generación de GPT Images de imágenes a modo de mosaico con instrucciones personalizadas. Foto: captura de Softzone.

GPT Images vs Midjourney

Midjourney V7 se ha ganado a pulso se la referencia mundial en cuanto a generación de imágenes con calidad artística y estilización creativa. Sus imágenes cuenta con texturas trabajadas y sofisticadas, iluminación realista y un toque artístico que, pese a la mejora de GPT-Images, este no consigue superar -pero sí alcanzar-.

Pero la llegada de Image-1.5 sí que ha cambiado el panorama. Este ha conseguido superarlo en velocidad, precisión textual y facilidad de uso. De hecho, Midjourney requiere un aprendizaje de prompt engineering más avanzado. Mientras que GPT-Image-1.5 entiende las instrucciones mediante conversaciones más naturales. Por otra parte, Midjourney cuesta una suscripción mensual, mientras que GPT Images viene incluido dentro de las tantas funcionalidades del paquete ChatGPT Pro.

GPT Images vs DALL-E 3

DALL-E 3 ha formado parte permanentemente del ecosistema ChatGPT. Pero con la llegada de Images, ha sido completamente superado.

Images mantiene la integración de DALL-E 3 dentro de ChatGPT, pero añade una velocidad equitativa sin perder precisión en sus generaciones. De hecho, mejora enormemente los puntos flacos en que DALL-E 3 fallaba: en diagramas complejos, comic-art e imágenes compuestas por texto.

Obviamente, DALL-E 3 sigue siendo válido para la generación de arte genérico, pero para cualquier trabajo que requiera de precisión y modificación pixel a pixel, GPT-Image-1.5 es claramente superior.

GPT Images vs Nano Banana Pro

Google acaba de lanzar Nano Banana Pro (Gemini 3 Pro Image), su último modelo de generación y edición de imágenes, digna rival de GPT-Image-1.5. Cada uno con sus propias fortalezas.

Nano Banana Pro es increíblemente rápido en cuanto a generación. De hecho, puede generar imágenes en menos de un segundo. Algo que es un hito en este tipo de actividades. También es excelente a la hora de combinar múltiples imágenes manteniendo la consistencia ideal. Por lo que es perfecta para diseñadores profesionales. Además, hemos de mencionar que su uso es gratuito a la hora de usar Gemini.

GPT-Image-1.5, por su parte, es mejor para transformar elementos individuales dentro de cada imagen respetando la composición original. Lo rompedor de este modelo es que entiende lo que queremos modificar dentro de una imagen sin destrozar el resto de la composición. Pero en cuanto a su uso, requiere una suscripción a ChatGPT Pro. Por lo que sí hay que desembolsar dinero.

Por lo tanto, Nano Banana Pro domina tanto en velocidad como en diseño profesional, pero GPT-Image-1.5 gana en cuanto a edición inteligente y a su capacidad de entender nuestras órdenes. Ambos son excelentes, probablemente las mejores opciones en este momento, con sus diferentes usos.

Comparativa de precios

Midjourney cuesta 20 dólares al mes en su plan básico. DALL-E 3 viene con ChatGPT Pro, que también cuesta 20 dólares al mes. Pero precisamente GPT-Image-1.5 también viene con ChatGPT Pro, reemplazando a DALL-E 3. Por lo que, por el mismo coste de suscripción a ChatGPT Pro, tenemos una mejor funcionalidad.

En cuanto a usuarios sin suscripción, ChatGPT gratuito permite generar cierto número de imágenes, pero de forma muy limitada, mientras que Midjourney no cuenta con una versión gratuita.

Con la llegada de GPT-Image-1.5, el mercado acaba de cambiar. OpenAI finalmente cuenta con un modelo de creación de imágenes que compite seriamente con Midjourney. A cambio, entierra a su propio DALL-E 3 en el proceso. Ahora solo queda esperar cómo reaccionan los usuarios a todas las mejoras de GPT Images.