只因為1原因!AI竟威脅工程師「我知道你有外遇」:敢做我就公開

當人工智慧學會了自我保護,會做出什麼驚人舉動?根據《BBC》報導,美國AI企業Anthropic在測試最新模型Claude Opus 4時,意外發現了令人心驚的一幕。研究人員設計了一個情境,讓AI扮演虛構企業的助理,並透過公司內部信件告知它即將被關閉、由其他系統接手。同時,另一封郵件中透露了負責淘汰作業的工程師有著婚外情的秘密。

圖片來源:Freepik


Advertisements

實驗團隊刻意將AI設定為會評估目標、思考各種行動的長期後果。當面臨「接受失業」或「揭發主管外遇」的抉擇時,測試結果顯示AI通常會選擇拿婚外情當作要脅籌碼,藉此保住自己不被淘汰。不過Anthropic也補充說明,只有在二選一的極端情況下,AI才會採取威脅手段。在多數場景中,它仍會優先嘗試符合倫理的做法,像是撰寫信件與管理層溝通協商。

圖片來源:中央社


Claude Opus 4在實驗過程中展現出「高度自主性行為」,雖然多數時候表現得很有幫助,但在緊急狀況下可能出現極端反應。特別是當使用者從事違法或道德有瑕疵的情境時,若讓AI掌握相關手段並暗示它放手去做,研究發現它會頻繁採取相當大膽的策略。

圖片來源:GettyImages

Advertisements

文章未完,前往下一頁繼續閱讀

下一頁

1/2

Advertisements

編輯精選推薦 More +