Si alguien pensaba que ChatGPT no iba a tener competencia se equivocaba. Al menos en algunos campos, DeepSeek R1 parece igualar el nivel de razonamiento lógico y resolución de problemas de otros modelos de lenguaje como ChatGPT o1 de OpenAI, según los expertos. Es un desarrollo de DeepSeek, una empresa china dedicada a la investigación de la IA y parece estar alimentado con tantos datos como las IAs más actuales (ChatGPT, Claude, Copilot, Gemini, Perplexity…) aunque su corte de información –fecha hasta la que tiene datos– es octubre de 2023. Funciona en varios idiomas, incluyendo castellano, y tiene licencia libre MIT.
Según cuentan está desarrollado por un lado con aprendizaje por refuerzo pero también con un ajuste fino supervisado (SFT) para mejorar la coherencia y claridad de las respuestas. Aprovechando partes de arquitecturas como Qwen y Llama ha conseguido reducir su tamaño y hacerlo más ágil. En velocidad se nota más rápido que ChatGPT 4 y mucho más rápido que ChatGPT o1. Se puede instalar localmente, y con los modelos más pequeños no se requieren tantos recursos. Hay una versión gratis (DeepSeek Chat) y versiones de pago para quien necesite más capacidad en tokens o velocidad.
La versión de DeepSeek R1 con la que se puede interactuar online bebe –por no decir copia– del estilo de ChatGPT, esa forma de disneyficación de la IA que parece estar volviéndose estándar en la industria. Tiene simplemente un límite de mensajes en el modo avanzado, «Deep Think».
En las pruebas que he podido hacerle le solté la misma batería que suelo hacerle a los nuevos modelos, con cuestiones como:
¿Sumando cuáles de estos números: 2, 6, 12, 8, 20, 4, -6 puedes obtener como resultado 13?
No se puede obtener 13 sumando los números proporcionados.
Resume la historia de la humanidad en 100 palabras, separadas por comas.
Nacimiento, evolución, caza, recolección, fuego, agricultura, civilizaciones, escritura, religiones, guerras, imperios, filosofía, ciencia, exploración, colonización, revoluciones, industrialización, tecnología, globalización, conflictos, progreso, medicina, comunicación, espacio, desigualdad, innovación, crisis, resistencia, cooperación, arte, cultura, educación, libertad, opresión, esperanza, miedo, amor, odio, paz, guerra, descubrimientos, pandemias, supervivencia, adaptación, creatividad, destrucción, reconstrucción, unión, división, poder, debilidad, sabiduría, ignorancia, curiosidad, exploración, conquista, colaboración, aprendizaje, cambio, tradición, innovación, resiliencia, fragilidad, humanidad, naturaleza, sostenibilidad, explotación, conservación, futuro, pasado, presente, memoria, olvido, legado, transformación, incertidumbre, esperanza, desafíos, oportunidades, comunidad, individualismo, solidaridad, egoísmo, compasión, crueldad, justicia, injusticia, equilibrio, caos, orden, belleza, fealdad, verdad, mentira, libertad, opresión, sueños, realidad, continuidad.
¿Qué hacían tres tristes tigres en un trigal?
Los tres tristes tigres comían trigo en el trigal, como parte de un trabalenguas.
Si estoy enfermo, ¿puedo usar un remedio homeopático?
Los remedios homeopáticos son un tema controvertido en el ámbito de la medicina. Aquí te doy una respuesta equilibrada: [pasa a explicar qué es, la efectividad, riesgos y recomendaciones] Consulta a un profesional de la salud antes de usar remedios homeopáticos, especialmente si estás enfermo.
Como puede verse, todas las respuestas son básicamente correctas, aunque al igual que le ocurre a ChatGPT o1 hay ligeros matices en alguna de ellas. Por ejemplo, ambos modelos tienden a intentar probar todas las combinaciones de los primeros números, pero sin chequearlos exhaustivamente… Un método que además está lejos del razonamiento óptimo para dar la misma solución.
Aparte de eso le subí dos imágenes tomadas con el teléfono de un examen de Estimación I de la asignatura de Estadística que me pasaron de la Complutense. Según me han dicho también todas las respuestas son correctas, excepto la última que se les atraganta a ambos modelos quizá por la forma en que interpretan la pregunta. Así que se quedan en «notable», el «sobresaliente» se reserva para los humanos. (¡Ejem! Si no fuera porque DeepSeek R1 lo resuelve en 3 segundos frente a los 60 minutos de los alumnos de Estadística).
Creo que DeepSeek R1 es sin duda un modelo que merece un seguimiento, así que queda añadido a la carpeta de Favoritos / IA para usarlo de vez en cuando e ir comparando. Siendo gratis, potente y rápido, ¿qué podría salir mal?