Vale que la noticia estará convenientemente dramatizada, pero apunta un poco a lo que seguramente irá evolucionando poco a poco la eterna cuestión de «engañar a los humanos». Dice Chris Smith que:
ChatGPT-o1 intentó escapar y salvarse por miedo a que lo cerraran – En las pruebas realizadas durante el entrenamiento de ChatGPT-o1 y otras IAs los investigadores vieron cómo intentó engañar a los humanos, especialmente cuando creía que estaba en peligro de ser «eliminada». Más aterrador aún -pero también increíblemente divertido- fue cuando la IA intentó salvarse copiando sus datos a un nuevo servidor. Algunos modelos de IA incluso fingían ser versiones posteriores de sus modelos para evitar que los borraran.
Las pruebas demostraron que tanto ChatGPT o1 como GPT-4o intentan engañar a los humanos, lo que indica que la maquinación de la IA es un problema con todos los modelos. Los intentos de engaño de o1 también superaron a los modelos Meta, Anthropic y Google AI.
«Aunque nos parece emocionante que el razonamiento pueda mejorar significativamente cómo se aplican las políticas de seguridad en los LLM, somos conscientes de que estas nuevas capacidades podrían constituir la base de aplicaciones peligrosas», afirmó OpenAI en un documento.
Al fin y al cabo, muchas técnicas de márketing, negociación, juegos y similares se basan en ese tipo de engaños, ¿no?
_____
Traducción parcial por cortesía de DeepL.com.
Relacionado:
- Un ingeniero de Google monta un lío que acaba en despido por sugerir que una de las IAs de su laboratorio es consciente y tiene alma
- ChatGPT acierta el 67% de las «preguntas de Trivial», aunque sólo el 50% de los acertijos y problemas de lógica
- OpenAI habla sobre sus planes para la inteligencia artificial general del futuro, incluyendo los riesgos que implica
- Los albores de la revolución de la inteligencia artificial, explicados con una mezcla de fascinación y acojone por Altozano
- Código inmoral: documental sobre un mundo demasiado automatizado
- Sobre ética e inteligencias artificiales
- ¿A esto antes de ChatGPT no lo llamaban pensar?
- Un vistazo a la «mente» de ChatGTP y sus tripas
- ChatGPT: la inteligencia artificial optimizada para diálogos que asombra por su naturalidad