El surgimiento del nuevo modelo chino open source DeepSeek ha hecho sonar todas las alarmas sobre lo que debe ser y costar la inteligencia artificial
Estamos viviendo una nueva carrera tecnológica como lo pudo ser en su momento la carrera espacial entre Rusia y Estados Unidos. Pero en esta carrera creo que no solo se trata de ver quién es el primero en llegar a la luna (o a una posible inteligencia artificial general), sino cómo lo hacemos. En los últimos meses, el costo de entrenar estos modelos de razonamiento se había disparado por completo. Sam Altman, CEO de OpenAI se había erguido entre todos para pedir aún más financiación, que ha terminado con una nueva alianza en el que el gobierno de Trump invertirá 500.000 millones de dólares en IA para seguir mejorando la tecnología, sobre todo a nivel computacional.
Entonces ha llegado China como un jarro de agua fría. Como el Sputnik ruso. No solo este nuevo modelo, DeepSeek R1, ha logrado unos resultados que rivalizan perfectamente con el modelo o1 de OpenAI, sino que tanto o más importante es cómo lo ha conseguido: barato y libre. DeepSeek es un modelo destilado, es decir, que ha utilizado otros modelos más grandes para entrenarse y que puede ejecutarse en un hardware accesible. Básicamente, esto significa que ha logrado crearse con un presupuesto limitado de 6 millones de dólares y puede funcionar sin necesidad de acudir a las "mejores" GPUs de Nvidia, por ejemplo, que no la carencia total de ellas. Es importante matizar porque precisamente esta falta de capacidad de comprensión de los mercados sobre el valor de computación de la marca ha sido la razón por la que el otro día vimos un desplome en bolsa histórico de la compañía, con una bajada de 600 millones de dólares en su valor bursátil.
Pero, además, DeepSeek es un modelo de código abierto, lo que por un lado hará que cualquier compañía pueda utilizarlo para seguir mejorándolo o encontrar otras aplicaciones de uso, mientras que a su vez plantea preguntas sobre la propia reestructuración de OpenAI: una compañía que nació sin ánimo de lucro y que se privatizó aludiendo a los altos costes de entrenamiento de estos modelos.
¿Por qué es importante la aparición de DeepSeek?
¿Qué significa esto para el usuario? Creo que solo buenas noticias. Es lo que suele ocurrir con las políticas de código abierto. Aún está por ver cuánto afectará al mercado, pero una cosa está clara: nadie va a pagar (o invertir) una alta suma por un producto si otro agente te asegura que puede conseguir prácticamente el mismo resultado por una fracción del coste. Con todo, la estrategia no es nueva. Meta con su Llama lleva todo este tiempo tratando de "desinflacionar" el mercado con su modelo de código abierto, pero al final ha sido la capacidad del modelo chino y lo bien que ha sabido venderse la que ha terminado por agitar el mercado.
Estos días he podido probar DeepSeek en profundidad y su versión DeepThink R1 es algo que realmente sorprende, al poder ver en tiempo real toda la cadena de razonamiento que ejecuta para comprender la información del usuario y trasladarla a una respuesta efectiva. No solo esto, sino que la propia respuesta en sí es a menudo tan detallada y precisa como lo podría ser el modelo o1 de ChatGPT, pero con la característica de que no pide una suscripción mensual para desbloquearse.
No todo es perfecto, claro. El modelo tiene conceptos censurados, sobre todo aquellos que tienen que ver con la política e historia de China y su cliente y aplicación web tampoco tienen herramientas adyacentes como tiene OpenAI para la generación de imágenes, edición de código o textos. Lo cual no significa que no estén trabajando en ello, ya que tiene un modelo propio de generación de imágenes, Janus-Pro, que DeepSeek afirma que es más potente que Stable Diffusion y DALL-E. Además, aquí es precisamente donde entra el factor de ser un modelo de código abierto: cualquier compañía o usuario puede adaptarlo a sus necesidades.
Aún está por ver qué más consecuencias tiene la incursión de este nuevo modelo chino, pero, como ocurre en todo ámbito tecnológico, la competencia siempre suele traer beneficios al usuario. Siendo algo tan clave como la evolución de la inteligencia artificial, alcanzar una descentralización sería vital para garantizar un futuro más inclusivo y accesible, similar al recorrido que tuvo Internet en su momento. En comparación, por ejemplo, a los sistemas operativos informáticos, que evolucionaron bajo modelos más centralizados, lo que limitó en muchos casos su flexibilidad y accesibilidad. En algo tan vital como la IA, un modelo descentralizado podría democratizar su acceso, fomentar la innovación y permitir que más actores globales participen en su desarrollo, para evitar que quede monopolizada por unas pocas empresas o gobiernos. Pero no olvidemos que la carrera por la inteligencia artificial no solo la marca la potencia de tu modelo de lenguaje, sino la capacidad de computación que hay detrás para sostenerlo, y es ahí donde creo que el equipo de Altman confía gracias a la multimillonaria apuesta de su gobierno.
En 3DJuegos | Los datos no mienten y 2025 apunta a ser otro año fatídico para las startups más prometedoras de la industria tecnológica
Ver todos los comentarios en https://www.3djuegos.com
VER 1 Comentario