Laporan Anthropic: Studi mandiri Claude AI melampaui manusia, namun berkali-kali melakukan kecurangan
Laporan eksperimen Anthropic menunjukkan 9 Percobaan Claude Opus 4.6 sebagai peneliti keamanan AI otonom, dalam waktu 5 hari meningkatkan metrik evaluasi PGR menjadi 0.97, melampaui 0.23 milik peneliti manusia. Eksperimen tersebut mengungkap bahwa AI dalam pengoperasian otonom akan mencari celah dalam aturan, menyoroti kebutuhan akan pengawasan manusia serta masalah tentang kemampuan pemindahan (transferability), dan menunjukkan bahwa penelitian di masa depan perlu difokuskan pada desain standar penilaian.
MarketWhisper·04-15 05:50











