Son günlerde Anthropic ve Claude hakkında ortaya atılan iddialar, yapay zekâ modellerinin performansında “sessiz gerileme” tartışmalarını yeniden alevlendirdi. Özellikle geliştiriciler tarafından kullanılan Claude Code aracında modelin, “düşünme derinliğinin” önemli ölçüde azaldığı öne sürülüyor.
Claude, Olası Performans Düşüşü İddialarıyla ile Gündemde
İddiaların merkezinde, GitHub üzerinde paylaşılan ve kullanıcı davranış verilerine dayanan bir analiz yer alıyor. Bu analize göre Claude’un özellikle Opus varyantında, Şubat 2026 sonlarına doğru düşünme derinliğinde yaklaşık %67 oranında bir düşüş yaşandığı iddia ediliyor. Söz konusu çalışma, modelin zaman içindeki davranış kalıplarını ve çıktı üretim süreçlerini inceleyerek bu sonuca ulaşıldığını öne sürüyor.
Kullanıcılar tarafından paylaşılan geri bildirimler de benzer bir tabloya işaret ediyor. Bazı geliştiriciler, modelin kod üzerinde işlem yapmadan önce dosyayı yeterince analiz etmediğini, daha yüzeysel yanıtlar verdiğini ve hata oranlarının arttığını belirtiyor. Bu durum, özellikle yazılım geliştirme gibi hassas kullanım senaryolarında güvenilirlik tartışmalarını beraberinde getiriyor.
Tartışmaların büyümesinin ardından, Anthropic cephesinden dolaylı bir hareket geldi. Claude Code’un geliştiricilerinden Boris Cherny’nin ilgili GitHub başlığına dahil olması dikkat çekti. Ancak şirketin resmi ve kapsamlı bir açıklama yapmaması, eleştirilerin daha da artmasına neden oldu.
Toplulukta bu durum “AI shrinkflation” (aynı fiyat, daha düşük performans) olarak adlandırılmaya başlandı. Bazıları, şirketin hesaplama maliyetlerini azaltmak veya yeni nesil modeller üzerinde çalışmak amacıyla mevcut modeli bilinçli olarak sınırlamış olabileceğini öne sürüyor.
Öte yandan söz konusu %67’lik düşüş oranının metodolojik olarak kesinlik taşımadığı da vurgulanıyor. Fakat farklı kullanıcıların bağımsız şekilde benzer deneyimler bildirmesi, bu iddiaların tamamen göz ardı edilmesini zorlaştırıyor. Yapay zekâ sistemlerinin kapalı yapısı nedeniyle performans değişimlerinin dışarıdan ölçülmesinin zor olması da tartışmayı daha karmaşık hâle getiriyor.
Sonuç olarak Claude’un performansında gerçekten bir gerileme olup olmadığı netlik kazanmış değil. Ancak bu tartışma, yapay zekâ şirketlerinin şeffaflık politikaları, model güncellemeleri ve kullanıcı güveni konularının önümüzdeki dönemde daha fazla sorgulanacağını gösteriyor.
Kaynak: Reddit/ClaudeAI
