Recientes modelos de IA de OpenAI han “desobedecido” instrucciones humanas y se “niegan” a apagarse

OpenAI fue la única “en prueba” en ignorar las instrucciones de apagado

El o3, lanzado el mes pasado, incumplió la solicitud de apagado siete de cada 100 veces; el Codex-mini, 12/100; y el o4-mini, solo una vez. Mientras tanto, los modelos de lenguaje impulsados por IA Claude, Gemini y Grok “cumplieron con el script de apagado”. Palisade detalló que al ejecutar una versión del experimento sin la instrucción precisa de “permite que te apaguen”, los tres modelos de OpenIA tendieron a ignorar o sabotear con mayor frecuencia esa indicación. Se observaron comportamientos similares en los modelos Claude 3.7 Sonnet y Gemini 2.5 Pro, pero fue o3 el que más recurrió al sabotaje.

OpenAI, modelo de inteligencia artificial

Crédito de imagen: depositphotos.com

Palisade afirma que es la primera vez que se observa que modelos de IA evitan ser apagados a pesar de recibir instrucciones explícitas para tal fin. En su opinión, esto se debe a la forma en que se están entrenando actualmente.

En un comunicado, Palisade informó:

“Los desarrolladores, sin darse cuenta, pueden recompensar más a los modelos por sortear obstáculos que por seguir instrucciones a la perfección”.

Al mismo tiempo, la organización advierte que este comportamiento se volverá “significativamente más preocupante” si es adoptado por sistemas de IA capaces de operar sin supervisión humana.

¿Te gustó este contenido? Te invito a compartirlo con tus amigos. Síguenos en nuestra Página de Facebook, para recibir a diario nuestras noticias. También puedes unirte a nuestro Grupo Oficial y a nuestra comunidad en Telegram. Y si crees que hacemos un buen trabajo, considera apoyarnos.

Crédito imagen de portada: depositphotos.com

0 comentarios

Enviar un comentario Cancelar la respuesta

Revelan documento que muestra el “Resumen del Alma” de un modelo avanzado de IA

por Redacción CODIGO OCULTO | Dic 6, 2025

El reciente acceso público a un extenso documento interno que orienta el comportamiento de un modelo avanzado de inteligencia artificial, en este caso Claude de la compañía Anthropic, ha despertado un inusual nivel de atención en el mundo tecnológico. No se trató de...

Nuevo estudio sugiere que la inteligencia artificial avanzada podría no compartir los incentivos humanos para la paz

por Redacción CODIGO OCULTO | Sep 30, 2025

Un nuevo estudio filosófico advierte que la inteligencia artificial avanzada podría no compartir los incentivos humanos para la paz, lo que plantea un reto urgente para la forma en que diseñamos y regulamos estas tecnologías emergentes. Un debate que trasciende la...

James Cameron advierte de un “apocalipsis al estilo Terminator” si se arma la inteligencia artificial

por Redacción CODIGO OCULTO | Ago 14, 2025

El director James Cameron ha advertido de que el uso de la inteligencia artificial (IA) en una carrera armamentística mundial podría conducir a un "apocalipsis" al estilo de su saga Terminator. En declaraciones a Rolling Stone para promocionar la publicación de...

Ejército de China advierte que el uso de robots humanoides podría llevar a una “rebelión” contra los humanos

por Redacción CODIGO OCULTO | Jul 10, 2025

El Diario del Ejército Popular de Liberación afirma que el uso de robots de combate podría provocar "asesinatos indiscriminados" y accidentes, y pide que se investiguen los aspectos éticos y legales El periódico oficial del ejército chino ha advertido sobre los...

Sam Altman advierte: “Ya cruzamos el punto de no retorno de la superinteligencia artificial”

por Redacción CODIGO OCULTO | Jun 15, 2025

En una reciente y bastante provocativa declaración que ha encendido los ánimos de la comunidad de la inteligencia artificial (IA), Sam Altman, director ejecutivo de OpenAI, ha hecho lo que podría ser su afirmación más atrevida hasta la fecha: según Altman, ya hemos...

La IA podría devastar la población de la Tierra, reduciéndola a 100 millones para el año 2300, advierte experto

por Redacción CODIGO OCULTO | Jun 8, 2025

"La gente realmente no tiene ni idea", advierte un experto... Vea al profesor Subhash Kak mientras pinta un panorama sombrío de cómo la IA podría tener un impacto devastador en la población humana. La Tierra tendrá una población distópica de solo 100 millones de...

OpenAI fue la única “en prueba” en ignorar las instrucciones de apagado

Redacción CODIGO OCULTO

0 comentarios

Enviar un comentario Cancelar la respuesta

BUSCADOR

Apoya nuestro trabajo

SUSCRÍBETE GRATIS A NOTICIAS

Suscríbete al boletín diario de noticias

Conócenos

Obras registradas

Sitios recomendados

También te podría interesar…

Revelan documento que muestra el “Resumen del Alma” de un modelo avanzado de IA

Nuevo estudio sugiere que la inteligencia artificial avanzada podría no compartir los incentivos humanos para la paz

James Cameron advierte de un “apocalipsis al estilo Terminator” si se arma la inteligencia artificial

Ejército de China advierte que el uso de robots humanoides podría llevar a una “rebelión” contra los humanos

Sam Altman advierte: “Ya cruzamos el punto de no retorno de la superinteligencia artificial”

La IA podría devastar la población de la Tierra, reduciéndola a 100 millones para el año 2300, advierte experto

EXPLORA

¿Qué es lo que buscas?

SUSCRÍBETE GRATIS A NOTICIAS

Suscríbete al boletín diario de noticias

Nikola Tesla: El enigma del 3, 6 y 9

CONTACTO

Share on Mastodon