En un giro inesperado, DeepSeek, una startup china de inteligencia artificial, ha sacudido la industria (especialmente a nVidia) con su modelo de razonamiento R1. Lanzado el 20 de enero de 2025, este modelo ha sorprendido a todos al igualar o incluso superar a los modelos de OpenAI en ciertos puntos de referencia, utilizando muchos menos recursos computacionales.
Un Ascenso Rápido
En cuestión de días, la aplicación de DeepSeek alcanzó el primer lugar en la App Store, superando a ChatGPT y destacando la creciente rivalidad entre las gigantes tecnológicas chinas y estadounidenses en la carrera por la dominación de la IA. Marc Andreessen, un destacado capitalista de riesgo, calificó el modelo de DeepSeek como «uno de los avances más impresionantes que he visto».
Eficiencia y Costos
Lo que hace que el logro de DeepSeek sea aún más notable es su eficiencia en el uso de recursos. La compañía afirma haber entrenado un modelo con 671 mil millones de parámetros utilizando solo 2,048 Nvidia H800s y 5.6 millones de dólares, una fracción de los recursos típicamente requeridos por gigantes de la industria como OpenAI y Google. Esto es especialmente impresionante dado que las sanciones estadounidenses restringen la venta de chips avanzados a empresas chinas.
El rendimiento impresionante de los modelos destilados de DeepSeek tiene implicaciones geopolíticas. Según Dean Ball, investigador de IA en la Universidad George Mason, esto significa que los razonadores muy capaces seguirán proliferando ampliamente y podrán ejecutarse en hardware local, lejos de los ojos de cualquier régimen de control centralizado.
Opiniones Divididas
No todas las reacciones han sido positivas. Neal Khosla, CEO de Curai, expresó escepticismo, sugiriendo que la compañía podría ser una «operación psicológica del estado chino» destinada a socavar la competitividad de la IA en EE. UU. Sin embargo, esta afirmación ha sido cuestionada por falta de pruebas.
Impacto en el Mercado de Valores
La irrupción de DeepSeek ha tenido un impacto significativo en el mercado de valores. nVidia ha sido la más perjudicada. La compañía sufrió una caída histórica en su valor de mercado, perdiendo más de 400,000 millones de dólares en un solo día.
Esta caída refleja el temor de los inversores de que DeepSeek pueda reducir la demanda de microchips de nVidia. La incertidumbre generada por esta situación también afectó a otras empresas tecnológicas y de suministro energético, que experimentaron caídas significativas en sus acciones
El Futuro de la IA
El éxito de DeepSeek podría beneficiar a toda la industria de la IA. Si entrenar modelos se vuelve más barato y fácil, la demanda de inferencia (uso real de la IA en el mundo) crecerá y acelerará aún más. Así, se asegura que el suministro de computación se utilice. Esto podría llevar a una mayor accesibilidad y democratización de la IA, permitiendo que más empresas y desarrolladores innoven y contribuyan al avance de la tecnología.