La respuesta es más sencilla de lo que parece: ignorancia. Sí, en un mundo donde la IA genera tanto interés como confusión, hay muchas ideas erróneas flotando. Lo novedoso del modelo R1 es que se trata de un modelo de cadena de razonamiento, como O1 u O3 de OpenAI. De hecho, compite de tú a tú con los benchmarks de O1, pero con una gran ventaja: es mucho más eficiente en términos energéticos.
Hasta aquí, podríamos decir que es solo otra noticia más. Sin embargo, lo que ha causado revuelo es que DeepSeek no solo ha lanzado R1 al mercado, sino que también ha compartido el código fuente y explicado cómo lo ha conseguido, algo que su competidor no hizo.
¿Y qué tiene de especial este modelo? Utiliza técnicas de aprendizaje por refuerzo basadas en datos fríos, lo que le permite realizar ciclos de entrenamiento con recompensas que dependen del razonamiento seguido. Además, DeepSeek ha demostrado cómo grandes modelos de lenguaje, como Llama o Qwen, pueden mejorar significativamente su rendimiento utilizando datos sintéticos destilados por R1 durante el proceso de ajuste fino (fine-tuning). Toda esta información está disponible, para quien quiera consultarla, en plataformas como Hugging Face y GitHub.
El enfoque de DeepSeek combina lo mejor de dos mundos: la transparencia propia de la academia y el impacto práctico de la industria. Si bien ya existían antecedentes en el mundo del software libre y la investigación, la apertura de DeepSeek en el desarrollo de un modelo avanzado y competitivo como R1 marca un antes y un después en la industria.
Ahora, ¿esto significa que NVIDIA está herida de muerte? Nada más lejos de la realidad. De hecho, podría beneficiarse enormemente de esta situación. A medida que el mercado de la inteligencia artificial se abra aún más y surjan nuevos actores, todos seguirán necesitando las GPUs de NVIDIA. Quizás esta ola de pánico en las bolsas sea el momento perfecto para quienes buscan una buena oportunidad de inversión.
Al final, como siempre, será el tiempo el que tenga la última palabra.