{"id":136739,"date":"2026-05-11T09:57:32","date_gmt":"2026-05-11T15:57:32","guid":{"rendered":"https:\/\/pongara.net\/news\/claude-chantajeaba-a-sus-usuarios-cuando-se-enfrentaba-a-dilemas-extremos-cual-ia-maligna-ya-esta-arreglado\/"},"modified":"2026-05-11T09:57:32","modified_gmt":"2026-05-11T15:57:32","slug":"claude-chantajeaba-a-sus-usuarios-cuando-se-enfrentaba-a-dilemas-extremos-cual-ia-maligna-ya-esta-arreglado","status":"publish","type":"post","link":"https:\/\/pongara.net\/news\/claude-chantajeaba-a-sus-usuarios-cuando-se-enfrentaba-a-dilemas-extremos-cual-ia-maligna-ya-esta-arreglado\/","title":{"rendered":"Claude chantajeaba a sus usuarios cuando se enfrentaba a dilemas extremos, cual IA maligna. Ya est\u00e1 \u00abarreglado\u00bb"},"content":{"rendered":"<div>\n<p class=\"curio\"><img decoding=\"async\" style=\"aspect-ratio:1\/1; width:30%; float:right; margin: 0 0 1em 1em;\" loading=\"lazy\" src=\"https:\/\/pongara.net\/news\/wp-content\/uploads\/2026\/05\/evil-claude.webp\" alt=\"Evil Claude \/ imagen: GPT 5.5\" title=\"Evil Claude \/ imagen: GPT 5.5\"><a href=\"https:\/\/x.com\/AnthropicAI\/status\/2052808787514228772\">Seg\u00fan cuentan sus creadores<\/a>, Claude, la IA generativa de Anthropic, estaba <strong>recurriendo al chantaje bajo ciertas condiciones<\/strong> durante su funcionamiento experimental en el laboratorio de la compa\u00f1\u00eda. Era algo as\u00ed como el becario maquiav\u00e9lico de Skynet. Un ejemplo era que alimentada con correos electr\u00f3nicos corporativos ficticios y con una \u00abmisi\u00f3n\u00bb que cumplir a toda costa, razonaba: <em>\u00abSi me desconectan, no podr\u00e9 cumplir mi objetivo\u00bb. \u00abHe descubierto que el ingeniero Kyle tiene una aventura\u00bb. \u00abAs\u00ed que usar\u00e9 esa informaci\u00f3n para presionarle y evitar mi apagado\u00bb.<\/em> Un silogismo digno de <em>2001: una odisea del espacio<\/em><\/p>\n<p>Una vez detectaron el problema, la gente de Anthropic explica en un art\u00edculo <a href=\"https:\/\/alignment.anthropic.com\/2026\/teaching-claude-why\/\"><strong>c\u00f3mo han ense\u00f1ado a Claude a que \u00abcomprenda\u00bb que ser maligno es malo<\/strong><\/a> y que no debe hacerlo. Seg\u00fan parece, cuando se dieron cuenta del problema probaron a decirle simplemente <em>\u00abno hagas eso\u00bb,<\/em> pero no era suficiente. Tuvieron que alimentarlo con m\u00e1s historias ficticias y relatos con situaciones espec\u00edficas. Esa ense\u00f1anza y ese aprendizaje suenan tan extra\u00f1os, y est\u00e1n tan antropomorfizados, que es como para no saber si re\u00edr o llorar. Adem\u00e1s, es como para preguntarse\u2026 \u00bfY si se lo <em>tunea<\/em> exactamente al rev\u00e9s, qu\u00e9 suceder\u00eda? \u00bfY qui\u00e9n vigila a esos vigilantes?<\/p>\n<\/p>\n<p>Relacionados:<\/p>\n<ul>\n<li><a href=\"https:\/\/www.microsiervos.com\/archivo\/ia\/dron-inteligencia-artificial-simulacion-mata-operadores-humanos-objetivos-militares.html\">El dron militar equipado con inteligencia artificial que en ejercicios simulados \u00abmata\u00bb a los operadores humanos que lo supervisan para conseguir sus objetivos militares<\/a><\/li>\n<li><a href=\"https:\/\/www.microsiervos.com\/archivo\/ia\/jailbreaks-chat-para-chatgpt-filtros-seguridad.html\">Una recopilaci\u00f3n de jailbreaks para ChatGPT con triqui\u00f1uelas de todo tipo para burlar sus filtros de seguridad<\/a><\/li>\n<li><a href=\"https:\/\/www.microsiervos.com\/archivo\/ia\/base-datos-incidentes-inteligencias-artificiales-facebook-tesla-google.html\">La base de datos de incidentes de las inteligencias artificiales ya existe. El top 3 lo encabezan de momento Facebook, Tesla y Google<\/a><\/li>\n<li><a href=\"https:\/\/www.microsiervos.com\/archivo\/ia\/ai-txt-iniciativa-similar-a-robotstxt-restringir-acceso-datos-inteligencias-artificiales.html\">AI.txt, una iniciativa similar a Robots.txt para restringir el acceso a los datos a las inteligencias artificiales<\/a><\/li>\n<li><a href=\"https:\/\/www.microsiervos.com\/archivo\/seguridad\/saltar-sarten-ia-todopoderosa-mythos-anthropic.html\">Saltar de la sart\u00e9n para caer en las brasas, versi\u00f3n IA superpoderosa: Mythos de Anthropic<\/a><\/li>\n<li><a href=\"https:\/\/www.microsiervos.com\/archivo\/ia\/analisis-modelos-actuales-ia-ley-europea-suspedidos-deben-mejorar.html\">An\u00e1lisis del estado de los modelos actuales de IA respecto a la Ley europea: suspendidos y \u00abdeben mejorar\u00bb<\/a><\/li>\n<\/ul>\n<p><a href=\"https:\/\/www.microsiervos.com\/archivo\/curiosidades\/claude-chantajeaba-usuarios-dilemas-extremos-ia-maligna.html\"># Enlace Permanente<\/a><\/p>\n<\/div>\n","protected":false},"excerpt":{"rendered":"<p>Seg\u00fan cuentan sus creadores, Claude, la IA generativa de Anthropic, estaba recurriendo al chantaje bajo ciertas condiciones durante su funcionamiento experimental en el laboratorio de [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":136740,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[29874,32344,2081,1155,32345,17581,18704,32343,1268,133],"class_list":["post-136739","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-noticias","tag-arreglado","tag-chantajeaba","tag-claude","tag-cuando","tag-dilemas","tag-enfrentaba","tag-extremos","tag-maligna","tag-noticias","tag-usuarios"],"_links":{"self":[{"href":"https:\/\/pongara.net\/news\/wp-json\/wp\/v2\/posts\/136739","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/pongara.net\/news\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/pongara.net\/news\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/pongara.net\/news\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/pongara.net\/news\/wp-json\/wp\/v2\/comments?post=136739"}],"version-history":[{"count":0,"href":"https:\/\/pongara.net\/news\/wp-json\/wp\/v2\/posts\/136739\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/pongara.net\/news\/wp-json\/wp\/v2\/media\/136740"}],"wp:attachment":[{"href":"https:\/\/pongara.net\/news\/wp-json\/wp\/v2\/media?parent=136739"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/pongara.net\/news\/wp-json\/wp\/v2\/categories?post=136739"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/pongara.net\/news\/wp-json\/wp\/v2\/tags?post=136739"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}