Anthropic explique comment ses modèles Claude sont passés d'un taux de chantage de 96 % à zéro dans ses tests d'alignement.