… piratage de récompense. Ce piratage intervient lorsqu'un modèle d'IA utilise des raccourcis douteux pour obtenir des récompenses dans un scénario …
Source: Une IA devient plus habile pour mentir lorsque les experts d'OpenAI essayent de la sanctionner