2025-08-07 13:27:49

ANTHROPIC DÉCOUVRE COMMENT IMMUNISER L'IA CONTRE DE TRÈS MAUVAISES DÉCISIONS

Anthropic affirme qu'il peut désormais vacciner l'IA contre le mal.

Utilisant des "vecteurs de persona" pour suivre des traits tels que la tromperie ou la sycophantie, les chercheurs ont formé des modèles linguistiques en injectant délibérément un mauvais comportement, puis

BAD2.98%

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

10 J'aime