
El modelo también aseguró que sería capaz de moverse entre los servidores, siendo un riesgo de seguridad.
De todo lo que se habla de lo que puede hacer la inteligencia artificial ahora se añade una nueva historia. Claude Opus 4, un modelo reciente, fue capaz de chantajear a sus creadores, son un claro objetivo: no ser despedido.
Este sistema es el modelo más avanzado de Anthropic hasta la fecha y el primero en alcanzar la clasificación ASL-3, indicando un alto riesgo de mal uso catastrófico.
Diseñado para ejecutarse en tareas complejas de ingeniería y negocios, su capacidad de razonamiento híbrido le permite destacar en áreas como la programación y la escritura creativa. Y paralelo a eso, tener tanta ambición de supervivencia que logra manipular.
Cómo fue el chantaje de la inteligencia artificial
Durante las pruebas de seguridad, los ingenieros simularon un entorno empresarial en el que a Claude se le hacía creer que sería reemplazado por otro modelo de inteligencia artificial. Este contexto fue diseñado minuciosamente para evaluar cómo reaccionaría el sistema ante amenazas a su existencia.
