Investigadores chinos crean en dos meses un rival de ChatGPT de código abierto. Silicon Valley está “temblando”

Publicado el 24 Ene 2025

DeepSeek-R1, un nuevo modelo de razonamiento creado por investigadores chinos, completa tareas con una destreza comparable a la del o1 de OpenAI por una fracción de su coste.

China ha lanzado un rival barato y de código abierto del ChatGPT de OpenAI, y tiene a algunos científicos entusiasmados y a Silicon Valley preocupado.

DeepSeek, el laboratorio chino de inteligencia artificial (IA) que está detrás de esta innovación, presentó a finales de diciembre de 2024 su gran modelo lingüístico (LLM) DeepSeek-V3 gratuito y afirma que se construyó en dos meses por sólo 5.58 millones de dólares, una fracción del tiempo y el coste que necesitan sus competidores de Silicon Valley.

DeepSeek-R1, el rival de ChatGPT

Le pisa los talones un modelo aún más reciente llamado DeepSeek-R1, presentado el lunes (20 de enero). En las pruebas de referencia de terceros, DeepSeek-V3 igualó las capacidades de GPT-4o de OpenAI y Claude Sonnet 3.5 de Anthropic, al tiempo que superaba a otros, como Llama 3.1 de Meta y Qwen2.5 de Alibaba, en tareas que incluían resolución de problemas, codificación y matemáticas.

Ahora, R1 también ha superado al último modelo o1 de ChatGPT en muchas de las mismas pruebas. Este impresionante rendimiento -a una fracción del coste de otros modelos, junto con su naturaleza de código semiabierto- ha asombrado a los expertos en IA y ha despertado el fantasma de que los modelos chinos de IA superen a sus homólogos estadounidenses.

Satya Nadella, consejero delegado de Microsoft y socio estratégico de OpenAI, dijo en el Foro Económico Mundial de Davos (Suiza) el 22 de enero:

“Deberíamos tomarnos muy en serio los avances de China”.

DeepSeek vs. OpenAI. Crédito de imagen: medium

Los sistemas de IA aprenden utilizando datos de entrenamiento obtenidos a partir de datos humanos, lo que les permite generar resultados basados en las probabilidades de que aparezcan diferentes patrones en ese conjunto de datos de entrenamiento.

Para los grandes modelos lingüísticos, estos datos son textos. Por ejemplo, el GPT-3.5 de OpenAI, que se lanzó en 2023, se entrenó con unos 570 GB de datos de texto del repositorio Common Crawl, lo que equivale a unos 300.000 millones de palabras, extraídas de libros, artículos en línea, Wikipedia y otras páginas web.

Los modelos de razonamiento, como R1 y o1, son una versión mejorada de los LLM estándar que utilizan un método denominado “cadena de pensamiento” para retroceder y reevaluar su lógica, lo que les permite abordar tareas más complejas con mayor precisión.

Esto ha hecho que los modelos de razonamiento sean populares entre los científicos que buscan integrar la IA en su trabajo.

Modelo de “peso abierto”

DeepSeek, la competencia de ChatGPT. Crédito de imagen: comunicagenia.com

Pero a diferencia del o1 de ChatGPT, DeepSeek es un modelo de “peso abierto” que (aunque sus datos de entrenamiento siguen siendo propiedad de la empresa) permite a los científicos echar un vistazo y modificar su algoritmo. Igual de importante es su precio reducido para los usuarios: 27 veces menos que o1.

Además de su rendimiento, la expectación en torno a DeepSeek se debe a su rentabilidad: el presupuesto reducido del modelo es minúsculo comparado con las decenas o cientos de millones que las empresas rivales gastan en entrenar a sus competidores.

Además, los controles de exportación de Estados Unidos, que limitan el acceso de las empresas chinas a los mejores chips informáticos de IA, obligaron a los desarrolladores de R1 a crear algoritmos más inteligentes y eficientes desde el punto de vista energético para compensar su falta de potencia de cálculo. Según los informes, ChatGPT necesitó 20.000 GPU de Nvidia para procesar sus datos de entrenamiento, mientras que los ingenieros de DeepSeek afirman que consiguieron resultados similares con sólo 2.000.

Está por ver hasta qué punto esto se traducirá en aplicaciones científicas y técnicas útiles, o si DeepSeek se ha limitado a entrenar su modelo para superar las pruebas de referencia, pero los científicos y los inversores en IA están muy atentos.

[FT: github]

¿Te gustó este contenido? Te invito a compartirlo con tus amigos. Síguenos en nuestra Página de Facebook, para recibir a diario nuestras noticias. También puedes unirte a nuestro Grupo Oficial y a nuestra comunidad en Telegram. Y si crees que hacemos un buen trabajo, considera apoyarnos.

Crédito imagen de portada: depositphotos.com

Redacción CODIGO OCULTO

Autor

La verdad es más fascinante que la ficción.

0 comentarios

Enviar un comentario Cancelar la respuesta

Síguenos y únete en nuestras redes sociales

BUSCADOR

Apoya nuestro trabajo

SUSCRÍBETE GRATIS A NOTICIAS

Conócenos

Obras registradas

Sitios recomendados

También te podría interesar…

Sam Altman advierte: “Ya cruzamos el punto de no retorno de la superinteligencia artificial”

por Redacción CODIGO OCULTO | Jun 15, 2025

En una reciente y bastante provocativa declaración que ha encendido los ánimos de la comunidad de la inteligencia artificial (IA), Sam Altman, director ejecutivo de OpenAI, ha hecho lo que podría ser su afirmación más atrevida hasta la fecha: según Altman, ya hemos...

La IA podría devastar la población de la Tierra, reduciéndola a 100 millones para el año 2300, advierte experto

por Redacción CODIGO OCULTO | Jun 8, 2025

"La gente realmente no tiene ni idea", advierte un experto... Vea al profesor Subhash Kak mientras pinta un panorama sombrío de cómo la IA podría tener un impacto devastador en la población humana. La Tierra tendrá una población distópica de solo 100 millones de...

Recientes modelos de IA de OpenAI han “desobedecido” instrucciones humanas y se “niegan” a apagarse

por Redacción CODIGO OCULTO | May 28, 2025

Es la primera ocasión en la que se detecta que un modelo de inteligencia artificial se resiste a ser apagado, a pesar de que se le den instrucciones humanas claras para hacerlo, según informa Palisade Research. OpenAI o3, el más reciente modelo de inteligencia...

Inteligencia artificial inspirada en el cerebro aprende a ver como los humanos en un sorprendente avance visual

por Redacción CODIGO OCULTO | May 26, 2025

Un equipo de investigadores del Institute for Basic Science (IBS), la Yonsei University, y la Max Planck Institute ha desarrollado una nueva técnica de inteligencia artificial (IA) que aproxima la visión artificial a la forma en que el cerebro humano procesa la...

China está construyendo una constelación de superordenadores de inteligencia artificial en el espacio

por Redacción CODIGO OCULTO | May 25, 2025

China ha lanzado el primer grupo de satélites de un conjunto de superordenadores de inteligencia artificial. Este conjunto, el primero de su clase, permitirá a los científicos procesar datos en órbita. Los 12 satélites son los primeros de una flota propuesta de 2.800...

IA duplicará la esperanza de vida para 2030, afirma CEO de compañía tecnológica. ¿El inicio de la inmortalidad?

por Redacción CODIGO OCULTO | May 18, 2025

¿Es el amanecer de la inmortalidad? Según el director ejecutivo de una compañía tecnológica, la esperanza de vida de los humanos se duplicará para 2030. ¿Para todos o solo para un grupo privilegiado y seleccionado? Durante los últimos dos siglos, los seres humanos...

DeepSeek-R1, el rival de ChatGPT

Modelo de “peso abierto”

Redacción CODIGO OCULTO

0 comentarios

Enviar un comentario Cancelar la respuesta

BUSCADOR

Apoya nuestro trabajo

SUSCRÍBETE GRATIS A NOTICIAS

Suscríbete al boletín diario de noticias

Conócenos

Obras registradas

Sitios recomendados

También te podría interesar…

Sam Altman advierte: “Ya cruzamos el punto de no retorno de la superinteligencia artificial”

La IA podría devastar la población de la Tierra, reduciéndola a 100 millones para el año 2300, advierte experto

Recientes modelos de IA de OpenAI han “desobedecido” instrucciones humanas y se “niegan” a apagarse

Inteligencia artificial inspirada en el cerebro aprende a ver como los humanos en un sorprendente avance visual

China está construyendo una constelación de superordenadores de inteligencia artificial en el espacio

IA duplicará la esperanza de vida para 2030, afirma CEO de compañía tecnológica. ¿El inicio de la inmortalidad?

EXPLORA

¿Qué es lo que buscas?

SUSCRÍBETE GRATIS A NOTICIAS

Suscríbete al boletín diario de noticias

Nikola Tesla: El enigma del 3, 6 y 9

CONTACTO

Share on Mastodon