Anthropic, geliştiricilere yönelik yapay zekâ tabanlı araçlarını genişleterek Claude Code için yeni bir kod inceleme (Code Review) sistemi duyurdu. Araştırma ön izlemesi olarak sunulan bu özellik, bir “çekme isteği” pull request (PR) açıldığında ajan takımı görevlendirerek kod inceleme sürecini kökten değiştirmeyi hedefliyor.
Kod İnceleme Sürecindeki Darboğaza Çözüm
Şirketin açıklamasına göre sistem, hızdan çok derinlik odaklı kod incelemesi yapmayı amaçlıyor. Anthropic, benzer bir sistemi uzun süredir kendi geliştirme süreçlerinde kullandığını belirtiyor.
Anthropic mühendisleri başına düşen kod üretimi son bir yılda yüzde 200 arttı. Bu durum, kod inceleme sürecini de ciddi bir darboğaz hâline getirdi. Şirketin verilerine göre geçmişte PR’ların yalnızca %16’sı kapsamlı inceleme yorumları alırken, yeni sistemle bu oran %54’e yükseldi. Ancak sistemin PR’ları otomatik olarak onaylamadığı; nihai kararın hâlâ insanlara ait olduğu vurgulanıyor.
Çoklu Yapay Zekâ Ajanları Paralel Çalışıyor
Bir PR oluşturulduğunda aynı anda görevlendirilen birden fazla yapay zekâ ajanı şu adımlarla çalışıyor:
- Kod değişikliklerini paralel olarak analiz etmek,
- Olası hataları doğrulayarak yanlış pozitifleri elemek,
- Tespit edilen sorunları önem derecesine göre sıralamak.
İnceleme sonucunda geliştiricilere tek bir özet yorum ve kod satırlarına eklenen ayrıntılı hata yorumları sunuluyor.
Sistem, ayrıca PR büyüklüğüne göre dinamik şekilde ölçekleniyor. Küçük değişiklikler daha hızlı ve hafif bir analizden geçerken, büyük veya karmaşık PR’larda daha fazla ajan devreye giriyor. Anthropic, ortalama inceleme süresinin yaklaşık 20 dakika olduğunu öne sürüyor.
Yapılan dahili testlerde bin satırdan büyük pull request’lerin (PR) yüzde 84’ünde sorun tespit edildiği, bu PR’larda ortalama 7.5 hata bulunduğu bildiriliyor. Elli satırdan küçük PR’larda ise tespit oranı yüzde 31 seviyesinde kaldığı vurgulanıyor. Şirket, ayrıca yapay zekâ tarafından tespit edilen sorunların yüzde 1’inden azının yanlış işaretlendiğini belirtiyor.
Öte yandan şirket, sistemin gerçek kullanımda önemli hataları yakalayabildiğini gösteren örnekler de paylaştı. Bunlardan birinde üretim ortamındaki bir serviste yapılan tek satırlık bir değişiklik, insan incelemesinde kolayca gözden kaçabilecek bir kimlik doğrulama hatasına yol açıyordu. Yeni özellik bu değişikliği kritik olarak işaretledi ve hata düzeltildi.
Benzer bir durum, açık kaynak depolama sistemi TrueNAS üzerinde yapılan bir güncellemede de ortaya çıktı. Yapay zekâ incelemesi, değişiklikle ilişkili kod bölgesinde bulunan ve şifreleme anahtar önbelleğini sıfırlayan eski bir hatayı tespit etti.
Code Review, daha kapsamlı analiz yaptığı için diğer hafif araçlara göre daha maliyetli. İncelemeler token kullanımına bağlı olarak ücretlendiriliyor ve bir PR için ortalama maliyet 15-25 dolar arasında değişiyor.
Özetlemek gerekirse Code Review özelliği, şu anda Claude Code platformunda Team ve Enterprise kullanıcıları için araştırma ön izlemesi kapsamında sunuluyor. Sistem etkinleştirildiğinde GitHub entegrasyonu üzerinden yeni açılan PR’lar otomatik olarak yapay zekâ incelemesinden geçiyor.
Kaynak: claude.com