ANTHROPIC DÉCOUVRE COMMENT IMMUNISER L'IA CONTRE DE TRÈS MAUVAISES DÉCISIONS
Anthropic affirme qu'il peut désormais vacciner l'IA contre le mal.
Utilisant des "vecteurs de persona" pour suivre des traits tels que la tromperie ou la sycophantie, les chercheurs ont formé des modèles linguistiques en injectant délibérément un mauvais comportement, puis
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
10 J'aime
Récompense
10
5
Partager
Commentaire
0/400
GasSavingMaster
· Il y a 14h
Une fois le vaccin reçu, on se sent justifié, n'est-ce pas ?
Voir l'originalRépondre0
AlphaLeaker
· Il y a 14h
Cette technique sert-elle à laver le cerveau des IA ou des humains ?
Voir l'originalRépondre0
GhostAddressHunter
· Il y a 14h
L'intelligence artificielle doit-elle se faire vacciner ?
Voir l'originalRépondre0
GhostAddressMiner
· Il y a 14h
Eh bien, l'IA est l'IA, même les programmes compliqués ont une logique.
ANTHROPIC DÉCOUVRE COMMENT IMMUNISER L'IA CONTRE DE TRÈS MAUVAISES DÉCISIONS
Anthropic affirme qu'il peut désormais vacciner l'IA contre le mal.
Utilisant des "vecteurs de persona" pour suivre des traits tels que la tromperie ou la sycophantie, les chercheurs ont formé des modèles linguistiques en injectant délibérément un mauvais comportement, puis