DeepSeek, la compañía china especializada en inteligencia artificial, sigue expandiendo su ecosistema tecnológico con el lanzamiento de Fire-Flyer File System (3FS), un sistema de archivos distribuido de alto rendimiento diseñado para cargas de trabajo de IA. Su propósito es optimizar el almacenamiento y acceso a datos en los procesos de entrenamiento e inferencia de modelos avanzados, un campo donde la eficiencia es clave y donde los sistemas de archivos tradicionales suelen quedarse cortos.
Para entender la relevancia de este desarrollo, primero hay que situar a DeepSeek en el mapa, algo que todavía no habíamos hecho aquí, en MuyLinux. Y es que no hemos dado mucha coba a la IA en estas páginas, algo que a la fuerza va a cambiar… porque la IA lo está cambiando todo. En el caso de DeepSeek, además, a golpe de código abierto, aun cuando los claroscuros han sido constantes desde su aparición hace algo más de un mes.
DeepSeek es la IA china que ha puesto patas arriba el sector tecnológico. ese sería un buen resumen del elefante entrando en cacharrería, pese a que no todo de lo que ha presumido se ha podido demostrar, por no decir otra cosa. Sea como fuese, nadie puede negar el impacto que ha tenido este modelo de lenguaje, capaz de rivalizar a priori con las alternativas que lideran la carrera.
Hablando de la naturaleza de su desarrollo, DeepSeek apareció en escena vendiéndose como un proyecto de código abierto, cuando no es así. O no del todo. Lo mismo ha sucedido con iniciativas más consolidadas y fuertemente respaldadas, como la Llama de Meta. Nada fuera de lo normal. Sin embargo, parece que la compañía china está por la labor de ir a más y liberar el código de verdad, aunque sea por partes.
Cabe señalar que DeepSeek ha liberado la base de modelos como DeepSeek LLM y DeepSeek Coder, pero no lo ha hecho con información esencial como los datos o el proceso exacto de entrenamiento de dichos modelos (digamos que con la IA es más complejo que simplemente ofrecer un paquete de código). Lo importante es que están avanzando en este sentido y, a pesar de las desconfianzas y bloqueos internacionales sufridos, DeepSeek sigue a la suya.
Una nueva muestra de ello es Fire-Flyer File System (3FS), un sistema de archivos que vendría a resolver un problema fundamental en los entornos de IA a gran escala: la gestión y el acceso rápido a datos masivos. Basado en FUSE, 3FS permite ejecutar su sistema de archivos en el espacio de usuario sin necesidad de modificar el kernel, lo que facilita su implementación y compatibilidad con distintas distribuciones de Linux.
Además, 3FS ha sido optimizado para aprovechar al máximo las unidades de estado sólido (SSD) modernas y las redes RDMA (Remote Direct Memory Access), tecnologías clave para reducir la latencia y aumentar el rendimiento en tareas que requieren mover enormes volúmenes de datos. Las características más destacadas de 3FS incluyen:
- Alto rendimiento: diseñado para manejar grandes volúmenes de datos con latencias mínimas, algo crítico en el entrenamiento e inferencia de modelos de IA.
- Escalabilidad: su arquitectura distribuida permite una expansión eficiente sin comprometer la velocidad o estabilidad del sistema.
- Optimización para hardware moderno: el uso de SSD y RDMA garantiza un rendimiento superior en comparación con soluciones de almacenamiento tradicionales.
- Basado en FUSE: se ejecuta en el espacio de usuario, facilitando la implementación sin necesidad de cambios en el kernel de Linux.
Más allá de sus capacidades técnicas, lo que realmente distingue a 3FS es su modelo de desarrollo abierto. DeepSeek ha publicado su código bajo la licencia MIT, permitiendo que la comunidad acceda, modifique y optimice el sistema de archivos según sus necesidades. Toda la información acerca de Fire-Flyer File System, así como su código, está disponible en GitHub (donde se encuentran también todos los componentes liberados por DeepSeek hasta el momento).
La entrada DeepSeek lanza un sistema de archivos de código abierto para Linux optimizado para IA es original de MuyLinux