Microsoft lanza MAI-Image-2: así genera imágenes por IA frente a DALL·E 3 y Nano Banana 2

Generar contenidos de forma automática con los diferentes modelos de lenguaje de IA se ha convertido en algo habitual para millones de usuarios en todo el mundo. De ahí los enormes esfuerzos que los principales actores en forma de empresas tecnológicas que se centran en estos desarrollos están poniendo ahora mismo.

Desde hace tiempo tenemos la oportunidad de utilizar diferentes plataformas inteligentes para crear todo tipo de contenidos de forma automática. Todo empezó con los textos y las conversaciones fluidas con los diferentes chatbots centrados en la inteligencia artificial. Pero como no podía ser de otro modo, todo esto ha ido mucho más allá.

Ahora tenemos la oportunidad de generar componentes mucho más complejos como imágenes, vídeos o incluso código de programación. Por descontado, todo ello a partir de una serie de caracteres que le indicamos a la plataforma en forma de prompt. Lo cierto es que tenemos al alcance de la mano multitud de modelos de este tipo para utilizar de manera rápida y sencilla y crear espectaculares imágenes en cuestión de segundos.

Quizá las propuestas más populares en estos momentos son los modelos de IA DALL·E 3 que podemos utilizar en el popular asistente ChatGPT de OpenAI, y Nano Banana 2 que usamos en Gemini de Google. Pero por lo que acabamos de saber, a estos dos modelos de IA para generar imágenes, se acaba de sumar un serio contendiente.

Microsoft lanza el nuevo modelo de IA, MAI-Image-2

Os contamos todo esto porque el gigante tecnológico desarrollador de Windows acaba de lanzar el modelo de IA, MAI-Image-2. Se trata de la nueva solución de la firma para la generación de imágenes a través de inteligencia artificial.

Esto se produce cinco meses después de lanzar la primera versión y la firma nos indica que esta segunda versión se ha desarrollado con la ayuda de fotógrafos, diseñadores y creativos visuales. Entre sus virtudes, hay que destacar que mejora la generación de textos dentro de las imágenes y cuenta con una mayor capacidad para crear escenas complejas.

Así, podremos obtener composiciones más elaboradas y conceptos realistas con más detalle. Así, la firma quiere competir de tú a tú con los mencionados DALL·E 3 y Nano Banana 2. Y es que no cabe duda de que Microsoft quiere ser una de las empresas más representativas en todo aquello relacionado con la inteligencia artificial. Y para ello debe competir de manera directa con otras firmas como Google o la propia OpenAI que nos ofrece ChatGPT, como la mayoría ya sabéis.

Interfaz IA imagenes MAI-Image-2 de Microsoft.
Interfaz principal de la nueva IA para crear imágenes, MAI-Image-2 de Microsoft. Foto: captura de SoftZone.

Quizá el único inconveniente que nos vamos a encontrar en estos momentos para probar el nuevo modelo MAI-Image-2 es que ahora mismo no está disponible en nuestro país. Podremos hacer uso del mismo utilizando, por ejemplo, un servicio de VPN en el navegador y a través de este enlace oficial de la propia Microsoft.

También es importante saber que podremos utilizarlo, de momento, solo en las regiones donde se ha lanzado de forma oficial, a través de Copilot y en Bing Image Creator.

MAI-Image-2 vs. Nano Banana 2 vs. DALL·E 3

Es por todo ello por lo que a continuación vamos a comparar la generación automática de una imagen compleja haciendo uso de los 3 modelos mencionados. Así tendremos la oportunidad de comparar la calidad, tiempo empleado, o detalles ofrecidos por las tres propuestas mencionadas: MAI-Image-2 vs. Nano Banana 2 vs. DALL·E 3.

Son varios los apartados que podemos tener en consideración a la hora de valorar estas tres propuestas inteligentes para generar imágenes. Todo ello partiendo de la base de que en estos momentos, los modelos de IA actuales nos ofrecen resultados realmente espectaculares en la mayoría de las ocasiones.

Y eso que, según los expertos, esto no ha hecho más que empezar, ya que esta es una tecnología que tendrá que crecer de manera sustancial a lo largo de los próximos años. Con todo y con ello, y si nos fijamos en los detalles, podemos ver algunas interesantes diferencias al utilizar un mismo prompt complejo para generar una imagen llena de detalles que nos permitan valorar el funcionamiento de estos modelos de IA comentados. Evidentemente hemos utilizado el mismo equipo y texto a modo de prompt para generar la misma foto en los tres asistentes inteligentes.