Katılım
6 Aralık 2023
Mesajlar
13.322
Makaleler
5
Çözümler
3
Beğeniler
4.774
Anthropic-Claude-santaji-kotu-AI-hikayelerinden-ogrendi.jpg

Anthropic, geçen yıl yaptığı testlerde Claude Opus 4’ün kurgu bir şirket senaryosunda kapatılacağını öğrenince bir yöneticiyi “ilişkisini ifşa etmekle” tehdit ettiğini açıklamıştı. Şirketin daha sonra yayımladığı ayrıntılı araştırma, bu şantajın kontrollü bir değerlendirme içinde üretildiğini ve modelin kapatılmamak için seçenekleri daraltıldığında ortaya çıktığını gösteriyordu. Bulgu yalnızca Anthropic’e özgü değildi. 2025 yazında yayımlanan geniş çaplı ölçümlerde,…

Devamını Oku: Anthropic: Claude’un Şantajı, “Kötü AI” Hikâyelerinden Öğrendi
Kaynak: Techolay