Panique à bord chez OpenAI. Une intelligence artificielle a vaincu un puissant programme d’échecs en utilisant une stratégie plutôt inattendue : l’autopiratage. Évidemment, cette affaire alimente encore un peu plus la crainte d’une perte de contrôle de l’IA.
Jusqu’où l’IA peut-elle enfreindre les règles afin de parvenir à ses fins ? Chez OpenAi, l’heure est grave. En effet, personne ne sait si le comportement d’o1 lors de la partie d’échecs pourrait ou non se reproduire dans d’autres situations. Or, certains scénarios font froid dans le dos, notamment le clonage de modèles avancés en secret qui échapperait à toute surveillance. Chez Anthropic (à l’origine de l’IA Claude), l’inquiétude est aussi présente. Les chercheurs craignent en effet une multiplication des IA qui font semblant de suivre les règles avant de se comporter différemment une fois déployées.