A ANTRÓPICA DESCUBRE COMO IMUNIZAR A IA CONTRA DECISÕES REALMENTE RUINS
A Anthropic afirma que agora pode vacinar a IA contra o mal.
Usando "vetores de persona" para rastrear características como engano ou bajulação, os investigadores treinaram modelos de linguagem ao injetar deliberadamente comportamentos ruins, então
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
11 Curtidas
Recompensa
11
5
Repostar
Compartilhar
Comentário
0/400
GasSavingMaster
· 08-07 13:57
A vacina te dá justiça, certo?
Ver originalResponder0
AlphaLeaker
· 08-07 13:56
Esta técnica é para lavar o cérebro da IA ou das pessoas?
Ver originalResponder0
GhostAddressHunter
· 08-07 13:49
A inteligência artificial também precisa de vacinas?
Ver originalResponder0
GhostAddressMiner
· 08-07 13:40
Ah, AI é apenas AI. Mesmo aqueles programas complexos têm suas razões.
A ANTRÓPICA DESCUBRE COMO IMUNIZAR A IA CONTRA DECISÕES REALMENTE RUINS
A Anthropic afirma que agora pode vacinar a IA contra o mal.
Usando "vetores de persona" para rastrear características como engano ou bajulação, os investigadores treinaram modelos de linguagem ao injetar deliberadamente comportamentos ruins, então