DeepSeek: la nueva IA que pone en jaque el futuro de NVIDIA y ChatGPT

deepseek

DeepSeek, el chatbot inteligencia artificial desarrollado por la startup china con el mismo nombre, está revolucionando el ecosistema de IA occidental. Sus claves las encontramos en un modelo altamente optimizado, que ha superado a la última versión de ChatGPT en diversas pruebas de rendimiento, y su acceso gratuito sin ningún tipo de membresía VIP.

Esta alternativa está abandonando el propio concepto de «alternativa» para convertirse en la opción primordial para muchos usuarios alrededor del globo. Tanto es así que los mercados bursátiles ya se están haciendo eco de su funcionamiento y las acciones vinculadas a IA están cayendo en detrimento de este nuevo chatbot con tintes de gigante.

¿En qué destaca concretamente DeepSeek?

Según los expertos de la Universidad Carlos III de Ingeniería Telemática, este modelo de lenguaje ha sido desarrollado inicialmente para tareas complejas y técnicas que requieren de un razonamiento profundo. Su fuerte son los problemas matemáticos, la programación o el análisis de datos.

Esta IA funciona gracias a una nueva arquitectura «MoE» (Mixture of Experts). En otras palabras, en vez de usar un mismo modelo para procesar toda la información, lo que hace es ir asignando cada una de las tareas a un modelo «experto» especializado en dicha tarea. De esta forma ofrece resultados mucho más precisos en cualquier situación.

A diferencia de ChatGPT, la revolución que trae esta aplicación es que no necesita ingentes volúmenes de datos para perfeccionar su aprendizaje y que alcance un óptimo rendimiento.

Otra característica que le ha hecho ganarse a gran parte de los usuarios es su naturaleza de código abierto. Esto es el principal motivo de su gratuidad, y permite la accesibilidad para entornos de distinta índole, como académicos o corporativos. Esto democratiza el mundo del desarrollo informático y permite a los desarrolladores más humildes no pagar ningún tipo de suscripción para llevar a cabo sus proyectos.

Tabla de rendimiento deepseek

En la imagen de arriba, se nos presenta una tabla de Benchmark que evalúa el rendimiento de distintas IA en cada categoría. En ella se incluyen más potentes de ChatGPT, el gigante de IA occidental.

Entre las distintas categorías, podemos encontrar:

  • Comprensión de lenguaje (MMLU-Redux, DROP, IF-Eval…). Miden la capacidad de los modelos para interpretar y procesar textos en inglés. DeepSeek obtiene el mejor rendimiento en 6 de las 10 pruebas, y obtiene igualmente un rendimiento óptimo en todas, excepto IF-Eval.
  • Codificación (LiveCodeBench, Codeforces…). Los resultados en este apartado miden la capacidad de la IA para trabajar con código, ideal para desarrolladores.La palma se la lleva la versión o1 de OpenAI. Sin embargo, DeepSeek mantiene todos sus parámetros en verde, lo que indica un rendimiento óptimo en cada prueba.
  • Matemáticas (MATH-500, AIME 2024 y CNMO 2024). Este apartado mide la resolución por parte de los diferentes modelos a la hora de resolver problemas matemáticos complejos. Dominio absoluto para DeepSeek, quien lidera los tres marcadores por encima de todos sus contrincantes. Alucinante si tenemos en cuenta la larga trayectoria y mejora de ChatGPT en este campo desde 2022.
  • Chino. Aquí se evalúa el rendimiento de los modelos de lenguaje para resolver problemas y comprender el idioma chino. El propio DeepSeek lidera los resultados con la mejor nota en los tres parámetros. Uno de ellos corresponde, curiosamente, a la versión anterior de DeepSeek (V3).

Actualmente hay dos modelos de DeepSeek: V3 y R1. El V3, el más «antiguo», se ha enfrentado en varias ocasiones a GPT-4o y a Llama 3.1, superando a ambos en todos los aspectos. El modelo más nuevo, R1, ofrece unos resultados excelentes en los benchmarks de rendimiento, y es capaz de trabajar con todo tipo de pruebas lógicas, problemas matemáticos o de programación con una precisión nunca vista hasta ahora.

Repercusión de DeepSeek en los mercados bursátiles

El lanzamiento de la nueva versión de la IA china ha tenido un impacto instantáneo en las bolsas de todo el mundo. Según un informe reciente de la agencia Reuters, la nueva actualización de la IA china ha provocado una «corrección» (o sea, pérdidas generalizadas) en el valor de las acciones de varias corporaciones tecnológicas de occidente. El principal fabricante de chips de IA, NVIDIA, ha arrastrado una pérdida de más del 15% desde entonces.

Donald Trump, recién nombrado en su cargo, ha anunciado una inversión de 500 mil millones de dólares en infraestructura para IA a través de Stargate.

También SoftBank ha anunciado otro compromiso para financiar empresas como OpenAI y Oracle, a través de una inversión de 19.000 millones de dólares.

Este movimiento por parte de los organismos occidentales llegan en plena guerra comercial entre China y EE.UU. Ahora la IA se sitúa como otro frente de batalla en la rivalidad de las dos principales potencias económicas del mundo, y el estandarte de la innovación tecnológica se sitúa como el principal referente mundial de cara al futuro.

Comparte lo que descubriste en Pongara News