Aplicación de IA china DeepSeek sacude los mercados globales

enero 27, 2025
DeepSeek logo
DeepSeek, 2025

El reciente lanzamiento de DeepSeek-R1, un modelo de inteligencia artificial en código abierto desarrollado por la startup china DeepSeek, ha generado este lunes un impacto sísmico en los mercados financieros, cuando la aplicación de la compañía superó a ChatGPT de OpenAI en la App Store de Apple en Estados Unidos. El acontecimiento no solo cuestiona la supremacía de las grandes corporaciones tecnológicas de ese país, sino que también invita a una reevaluación de los paradigmas económicos que sustentan el desarrollo de la inteligencia artificial en la actualidad.

Uno de los aspectos más sorprendentes de este fenómeno es que DeepSeek ha desarrollado su chatbot con una inversión significativamente menor. Según la propia compañía, su entrenamiento habría costado 6 millones de dólares, comparado con los 7 mil millones de OpenAI, según previos reportes. Además, DeepSeek ha utilizado chips Nvidia H800, una versión modificada y menos costosa que los H100 empleados por gigantes tecnológicos estadounidenses.

Las acciones de Nvidia, por ejemplo, experimentaron una caída de más del 10% en las operaciones previas a la apertura del mercado. De manera similar, ASML, el fabricante holandés de equipos para chips, vio una disminución de más del 10% en el valor de sus acciones.

Estas caídas reflejan la creciente preocupación de los inversores sobre la viabilidad de las enormes inversiones en inteligencia artificial, especialmente en un contexto donde competidores como DeepSeek logran avances significativos con recursos más limitados. Aunque aún es prematuro sacar conclusiones definitivas, los eventos de hoy podrían marcar el inicio del estallido de la burbuja especulativa en torno al desarrollo de la inteligencia artificial. Esto ocurre en un momento crítico, en el que el nuevo presidente de EE.UU. busca promover su ambiciosa iniciativa, Stargate, a la cual se le ha prometido una inversión de 500 mil millones de dólares.

A diferencia de sus competidores que utilizan la GPU NVIDIA H100, DeepSeek emplea la GPU NVIDIA H800. La H100 se destaca por su alta tasa de transferencia de datos entre chips, una característica esencial para tareas que requieren comunicación intensiva entre GPUs. En cambio, la H800 reduce esta tasa aproximadamente a la mitad, lo que puede limitar el rendimiento en configuraciones que dependen de múltiples GPUs. Además, la H100 ofrece un rendimiento superior en cálculos de doble precisión (FP64), lo que la hace ideal para aplicaciones científicas, mientras que la H800 tiene un rendimiento FP64 notablemente inferior. En cuanto a disponibilidad, la H100 está disponible a nivel global, mientras que la H800 está diseñada exclusivamente para los mercados de China, Hong Kong y Macao, debido a restricciones impuestas por Estados Unidos al mercado chino.

A pesar de lo anterior, la empresa china ha presentado un producto que ha demostrado un rendimiento superior en tareas de razonamiento matemático y programación. Por ejemplo, en el benchmark MATH-500, DeepSeek-R1 alcanzó una precisión del 90.2%, superando a modelos como GPT-4o y Claude 3.5 Sonnet. Además, en evaluaciones de programación como HumanEval-Mul, obtuvo una tasa de éxito del 82.6%, destacando su capacidad en la generación de código preciso y eficiente.

Estas mejoras se atribuyen a su innovadora arquitectura Mixture-of-Experts (MoE) y al uso de técnicas de aprendizaje por refuerzo, que optimizan el rendimiento sin requerir recursos computacionales excesivos. La combinación de eficiencia y alto rendimiento posiciona a DeepSeek como un líder emergente en el campo de la inteligencia artificial.

El surgimiento de DeepSeek-R1 no solo representa un avance tecnológico significativo, sino que también plantea preguntas fundamentales sobre los modelos de inversión y desarrollo en el ámbito de la inteligencia artificial.

La capacidad de producir modelos de alta eficiencia con inversiones relativamente modestas podría democratizar el acceso a tecnologías avanzadas y redefinir el panorama competitivo global. Sin embargo, también es crucial considerar las implicaciones éticas y sociales de estos desarrollos, asegurando que el progreso tecnológico se alinee con valores fundamentales y beneficie a la sociedad en su conjunto.

Responder

Your email address will not be published.