Anthropic 本月宣布了一個名為 Claude Mythos 的模型。聲稱它太危險,不能公開發布。


他們將其鎖定在由 AWS、Apple、Microsoft、Google 和 JPMorgan 組成的審核聯盟背後,價格是他們下一個最佳模型的五倍。
推銷點是它能找到人類或 AI 以前未曾發現的軟體漏洞。
兩週後,一位安全研究員提取了 Anthropic 展示的確切漏洞,並將它們輸入到任何人都能運行的小型、廉價、開源模型中。
每一個都找到了標題漏洞。來自中國實驗室的一個開源權重模型也注意到了一點 Anthropic 的公告中沒有提到的:這個漏洞是可蠕蟲的。
它可以自行在機器之間傳播。
這就是嚴重缺陷與能在一個週末內摧毀 150 個國家醫院的那種問題之間的區別。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 留言
  • 轉發
  • 分享
留言
請輸入留言內容
請輸入留言內容
暫無留言