Anthropic, kamuya açık olarak sunduğu Claude Fable 5 modelini yeniden kullanıma açtı. Şirket, bu sürümün daha güçlü Claude Mythos 5’in kamuya uygun hale getirilmiş versiyonu olduğunu ve özellikle siber saldırı gibi zararlı kullanımları engellemek için ek güvenlik katmanlarıyla sunulduğunu söylüyor.
Ancak son dönemde ortaya çıkan bir yöntem, bu korumaların her durumda yeterli olmadığını gösterdi. Anthropic’in açıklamasına göre Amazon araştırmacıları, Fable 5’in bazı güvenlik sınırlamalarını aşabilen bir jailbreak tekniği tespit etti. Bu yöntem, modelin yazılım açıklarını tanımlamasına ve bazı durumlarda bu açıkların nasıl istismar edilebileceğine dair kod üretmesine yol açtı.
Bu gelişmenin ardından ABD hükümeti 12 Haziran 2026’da Claude Fable 5 ve Claude Mythos 5 için erişim kısıtlaması getirdi. Sürecin sonunda Anthropic, güvenlik önlemlerini sıkılaştırdı ve Fable 5’i 1 Temmuz 2026 itibarıyla yeniden küresel erişime açtı. Şirket ayrıca Mythos 5 erişiminin de 26 Haziran’da verilen resmi onayın ardından belirli ABD kuruluşları için geri yüklendiğini duyurdu.
Anthropic’in paylaştığı bilgilere göre güncellenen önlemler yalnızca modelin verdiği yanıtları filtrelemekle sınırlı değil. Şirket, yeni sistemde zararlı kullanım işaretlerini daha yakından izlediğini, kötüye kullanım riskleri için daha aktif tespit mekanizmaları eklediğini ve gelecekteki üst seviye modeller için hükümetle daha yakın bir değerlendirme süreci yürüteceğini belirtiyor.
Şirket, söz konusu açığın Mythos seviyesindeki tüm siber yetenekleri serbest bırakan evrensel bir kırma yöntemi olmadığını savunuyor. Yine de yaşanan olay, kamuya açılan güçlü yapay zeka modellerinde koruma katmanlarının ne kadar kritik olduğunu bir kez daha gündeme taşıdı. Özellikle siber güvenlik alanında yetenek seviyesi yükseldikçe, bu modellerin nasıl denetleneceği teknoloji sektörünün en tartışmalı başlıklarından biri haline geliyor.
Kaynak: www.techspot.com