2026-01-19 21:13:23

#突發新聞

Anthropic 發現「助手軸」以防止 AI 越獄和角色漂移

Anthropic 的研究人員在大型語言模型（LLMs）中繪製神經「角色空間」，找到一個控制 AI 角色穩定性並阻止有害行為模式的關鍵軸。

#比特幣 $BTC

BTC7.68%

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

留言

0/400

暫無留言

熱門話題