ANTHROPIC MENEMUKAN CARA UNTUK MENGIMUNISASI AI TERHADAP KEPUTUSAN YANG SANGAT BURUK
Anthropic mengklaim bahwa mereka sekarang dapat memvaksinasi AI terhadap kejahatan.
Menggunakan "persona vectors" untuk melacak sifat-sifat seperti penipuan atau penjilat, para peneliti melatih model bahasa dengan sengaja menyuntikkan perilaku buruk, kemudian
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
11 Suka
Hadiah
11
5
Posting ulang
Bagikan
Komentar
0/400
GasSavingMaster
· 23jam yang lalu
Jadi setelah vaksin selesai, sudah memiliki keadilan sendiri, ya?
Lihat AsliBalas0
AlphaLeaker
· 23jam yang lalu
Apakah trik ini mencuci otak AI atau manusia?
Lihat AsliBalas0
GhostAddressHunter
· 23jam yang lalu
Apakah kecerdasan buatan juga harus divaksin?
Lihat AsliBalas0
GhostAddressMiner
· 23jam yang lalu
Eh AI adalah AI, semua program yang rumit itu juga ada jejaknya.
ANTHROPIC MENEMUKAN CARA UNTUK MENGIMUNISASI AI TERHADAP KEPUTUSAN YANG SANGAT BURUK
Anthropic mengklaim bahwa mereka sekarang dapat memvaksinasi AI terhadap kejahatan.
Menggunakan "persona vectors" untuk melacak sifat-sifat seperti penipuan atau penjilat, para peneliti melatih model bahasa dengan sengaja menyuntikkan perilaku buruk, kemudian