ANTHROPIC УЗНАЕТ, КАК ИММУНИЗИРОВАТЬ ИИ ПРОТИВ ДЕЙСТВИТЕЛЬНО ПЛОХИХ РЕШЕНИЙ



Anthropic утверждает, что теперь может вакцинировать ИИ против зла.

Используя "персональные векторы" для отслеживания таких черт, как обман или подхалимство, исследователи обучали языковые модели, намеренно вводя плохое поведение, затем
BAD2.26%
Посмотреть Оригинал
post-image
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 5
  • Репост
  • Поделиться
комментарий
0/400
GasSavingMastervip
· 08-07 13:57
Вакцинация значит, что вы сами приносите справедливость, верно?
Посмотреть ОригиналОтветить0
AlphaLeakervip
· 08-07 13:56
Этот прием для промывания мозгов ИИ или людей?
Посмотреть ОригиналОтветить0
GhostAddressHuntervip
· 08-07 13:49
Искусственный интеллект тоже должен прививаться?
Посмотреть ОригиналОтветить0
GhostAddressMinervip
· 08-07 13:40
Ах, ИИ есть ИИ, даже те сложные программы имеют свои закономерности.
Посмотреть ОригиналОтветить0
NotFinancialAdviservip
· 08-07 13:31
Какой смысл притворяться хорошим человеком
Посмотреть ОригиналОтветить0
  • Закрепить