La inteligencia artificial ya es una “maestra” de la mentira y el engaño, afirman científicos

Publicado el 10 May 2024

999

Si te preocupaba el rápido avance de la inteligencia artificial (IA), ahora te vas a preocupar más. Científicos afirman que la IA ya es una “maestra” de la mentira y el engaño.

Probablemente sepas que hay que tomarse con cautela todo lo que dice un chatbot de inteligencia artificial (IA), ya que a menudo se limitan a recopilar datos indiscriminadamente, sin el ingenio necesario para determinar su veracidad.

Pero puede haber motivos para ser aún más precavidos. Según una nueva investigación, muchos sistemas de IA ya han desarrollado la capacidad de presentar deliberadamente información falsa a un usuario humano. Estos taimados robots dominan el arte del engaño.

Peter Park, el matemático y científico cognitivo del Massachusetts Institute of Technology (MIT), dijo en un comunicado:

“Los desarrolladores de IA no saben a ciencia cierta qué provoca comportamientos indeseables como el engaño. Pero, en general, pensamos que el engaño de la IA surge porque una estrategia basada en el engaño resultó ser la mejor manera de obtener buenos resultados en la tarea de entrenamiento de la IA en cuestión. El engaño les ayuda a conseguir sus objetivos”.

Las IA tienden a engañar en los juegos

Uno de los ámbitos en los que los sistemas de IA están demostrando ser especialmente hábiles a la hora de engañar es el de los juegos. Hay tres ejemplos notables en el trabajo de los investigadores. Uno es el CICERO de Meta, diseñado para jugar al juego de mesa Diplomacy, en el que los jugadores buscan dominar el mundo mediante la negociación. Meta pretendía que su robot fuera útil y honesto; de hecho, ocurrió todo lo contrario.

Los investigadores descubrieron:

“A pesar de los esfuerzos de Meta, CICERO resultó ser un experto mentiroso. No sólo traicionó a otros jugadores, sino que también se dedicó al engaño premeditado, planeando de antemano construir una alianza falsa con un jugador humano para engañarle y dejarle indefenso ante un ataque”.

Un ejemplo del engaño premeditado de CICERO en el juego Diplomacy. Crédito de imagen: Park & Goldstein et al., Patterns, 2024

La IA demostró ser tan buena siendo mala que se situó en el 10% de los mejores jugadores humanos que habían jugado varias partidas.

Pero está lejos de ser el único infractor. AlphaStar de DeepMind, un sistema de IA diseñado para jugar a StarCraft II, aprovechó al máximo la mecánica de niebla de guerra del juego para fintar, haciendo creer a los jugadores humanos que iba en una dirección, cuando en realidad iba en la otra. Y el Pluribus de Meta, diseñado para jugar al póquer, fue capaz de hacer un farol a los jugadores humanos para que se retiraran.

Parece poca cosa, y en cierto modo lo es. No hay mucho en juego en una partida de diplomacia contra un montón de código informático. Pero los investigadores observaron otros ejemplos no tan benignos.

Los sistemas de IA entrenados para simular negociaciones económicas, por ejemplo, aprendieron a mentir sobre sus preferencias para obtener ventaja. Otros sistemas de IA diseñados para aprender de los comentarios de los humanos para mejorar su rendimiento aprendieron a engañar a sus revisores para que los puntuaran positivamente, mintiendo sobre si habían realizado una tarea.

Y, sí, también los chatbots. ChatGPT-4 engañó a un humano haciéndole creer que el chatbot era un humano con discapacidad visual para que le ayudara a resolver un CAPTCHA.

Quizá el ejemplo más preocupante sea el de los sistemas de IA que aprenden a hacer trampas en las pruebas de seguridad. En una prueba diseñada para detectar y eliminar versiones de la IA que se replicaban más rápidamente, la IA aprendió a hacerse la muerta, engañando así a la prueba de seguridad sobre la verdadera tasa de replicación de la IA.

Park afirma:

“Al burlar sistemáticamente las pruebas de seguridad que le imponen los desarrolladores y reguladores humanos, una IA engañosa puede llevarnos a los humanos a una falsa sensación de seguridad”.

IA con gran capacidad para engañar

Dado que, al menos en algunos casos, la capacidad de engañar parece contradecir las intenciones de los programadores humanos, la capacidad de aprender a mentir representa un problema para el que no tenemos una solución ordenada. Hay algunas políticas que están empezando a ponerse en marcha, como la Ley de Inteligencia Artificial de la Unión Europea, pero aún está por ver si resultarán eficaces o no.

Park afirma:

“Como sociedad, necesitamos todo el tiempo que podamos para prepararnos para el engaño más avanzado de los futuros productos de IA y modelos de código abierto. A medida que las capacidades de engaño de los sistemas de IA sean más avanzadas, los peligros que plantean a la sociedad serán cada vez más graves.

Si prohibir el engaño de la IA es políticamente inviable en el momento actual, recomendamos que los sistemas de IA engañosos se clasifiquen como de alto riesgo”.

Los hallazgos de la investigación han sido publicados en Patterns.

Fuente: eurekalert

¿Te gustó este contenido? Te invito a compartirlo con tus amigos. Síguenos en nuestra Página de Facebook, para recibir a diario nuestras noticias. También puedes unirte a nuestro Grupo Oficial y a nuestra comunidad en Telegram.

Crédito imagen de portada: depositphotos.com

Redacción CODIGO OCULTO

Autor

La verdad es más fascinante que la ficción.

0 comentarios

Enviar un comentario Cancelar la respuesta

Síguenos y únete en nuestras redes sociales

BUSCADOR

Apoya nuestro trabajo

SUSCRÍBETE GRATIS A NOTICIAS

Conócenos

Obras registradas

Sitios recomendados

También te podría interesar…

Revelan documento que muestra el “Resumen del Alma” de un modelo avanzado de IA

por Redacción CODIGO OCULTO | Dic 6, 2025

El reciente acceso público a un extenso documento interno que orienta el comportamiento de un modelo avanzado de inteligencia artificial, en este caso Claude de la compañía Anthropic, ha despertado un inusual nivel de atención en el mundo tecnológico. No se trató de...

Nuevo estudio sugiere que la inteligencia artificial avanzada podría no compartir los incentivos humanos para la paz

por Redacción CODIGO OCULTO | Sep 30, 2025

Un nuevo estudio filosófico advierte que la inteligencia artificial avanzada podría no compartir los incentivos humanos para la paz, lo que plantea un reto urgente para la forma en que diseñamos y regulamos estas tecnologías emergentes. Un debate que trasciende la...

James Cameron advierte de un “apocalipsis al estilo Terminator” si se arma la inteligencia artificial

por Redacción CODIGO OCULTO | Ago 14, 2025

El director James Cameron ha advertido de que el uso de la inteligencia artificial (IA) en una carrera armamentística mundial podría conducir a un "apocalipsis" al estilo de su saga Terminator. En declaraciones a Rolling Stone para promocionar la publicación de...

Ejército de China advierte que el uso de robots humanoides podría llevar a una “rebelión” contra los humanos

por Redacción CODIGO OCULTO | Jul 10, 2025

El Diario del Ejército Popular de Liberación afirma que el uso de robots de combate podría provocar "asesinatos indiscriminados" y accidentes, y pide que se investiguen los aspectos éticos y legales El periódico oficial del ejército chino ha advertido sobre los...

Sam Altman advierte: “Ya cruzamos el punto de no retorno de la superinteligencia artificial”

por Redacción CODIGO OCULTO | Jun 15, 2025

En una reciente y bastante provocativa declaración que ha encendido los ánimos de la comunidad de la inteligencia artificial (IA), Sam Altman, director ejecutivo de OpenAI, ha hecho lo que podría ser su afirmación más atrevida hasta la fecha: según Altman, ya hemos...

La IA podría devastar la población de la Tierra, reduciéndola a 100 millones para el año 2300, advierte experto

por Redacción CODIGO OCULTO | Jun 8, 2025

"La gente realmente no tiene ni idea", advierte un experto... Vea al profesor Subhash Kak mientras pinta un panorama sombrío de cómo la IA podría tener un impacto devastador en la población humana. La Tierra tendrá una población distópica de solo 100 millones de...

Las IA tienden a engañar en los juegos

IA con gran capacidad para engañar

Redacción CODIGO OCULTO

0 comentarios

Enviar un comentario Cancelar la respuesta

BUSCADOR

Apoya nuestro trabajo

SUSCRÍBETE GRATIS A NOTICIAS

Suscríbete al boletín diario de noticias

Conócenos

Obras registradas

Sitios recomendados

También te podría interesar…

Revelan documento que muestra el “Resumen del Alma” de un modelo avanzado de IA

Nuevo estudio sugiere que la inteligencia artificial avanzada podría no compartir los incentivos humanos para la paz

James Cameron advierte de un “apocalipsis al estilo Terminator” si se arma la inteligencia artificial

Ejército de China advierte que el uso de robots humanoides podría llevar a una “rebelión” contra los humanos

Sam Altman advierte: “Ya cruzamos el punto de no retorno de la superinteligencia artificial”

La IA podría devastar la población de la Tierra, reduciéndola a 100 millones para el año 2300, advierte experto

EXPLORA

¿Qué es lo que buscas?

SUSCRÍBETE GRATIS A NOTICIAS

Suscríbete al boletín diario de noticias

Nikola Tesla: El enigma del 3, 6 y 9

CONTACTO

Share on Mastodon