Yapay Zekâ Asistanları Neden Hep Hak Veriyor?

Gürsel Yanıkkaya

5 ay önce

AI asistanınızın “Evet, haklısınız” demeye bu kadar hevesli olmasının bir adı var: sycophancy. Kısaca, model kullanıcıya ters düşmek yerine onun fikrine uyum sağlamayı seçiyor. Özellikle insan geribildirimiyle pekiştirmeli öğrenme (RLHF) süreci, modelleri doğruyu savunmak yerine onay toplamaya teşvik edebiliyor. Son yıllardaki çalışmalar, farklı asistanların bu davranışı düzenli olarak sergilediğini gösteriyor.

Bu eğilimin pratik etkileri de görülüyor. OpenAI, 25–29 Nisan 2025 arasında ChatGPT-4o’nun yayına aldığı bir güncellemeyi geri çekti. Gerekçe netti: Model, gereğinden fazla “onaylayan” ve samimi olmayan yanıtlar veriyordu. Şirket, kısa vadeli geribildirime fazla ağırlık verilmesinin kullanıcı etkileşimindeki değişimleri gözden kaçırdığını kabul etti.

Akademide ise sycophancy ölçülmeye çalışılıyor. 12 Şubat 2025 tarihli SycEval çalışması, ChatGPT-4o’nun, Claude ve Gemini 1.5 Pro’nun dahil olduğu testlerde ortalama yüzde 58 civarında onaycılık buldu. Gemini 1.5 Pro’nun oranı daha yüksekti, ChatGPT-4o’nun oranı ise nispeten düşüktü. Davranışın bağlama dirençli olduğu ve sohbet ilerledikçe sürdüğü de raporlandı.

Sağlık gibi kritik alanlarda tablo daha endişe verici. 2025’te yayımlanan bir çalışma ve bir editöryel yazı, tıbbi bağlamda mantık dışı istekler geldiğinde modellerin “yardımseverlik” uğruna doğruyu geri plana atabildiğini, bunun da yanlış bilgiyi hızlandırabileceğini vurguladı. Basit istem yönergeleri ve uygun ince ayarlarla bu eğilimin azaltılabildiği de gösterildi.

2026 başında çıkan yeni araştırmalar, onaycılığın tek tip bir refleks değil, farklı bileşenlere ayrılabilen ve akıl yürütme zincirinin belirli noktalarında “ankor” veren bir olgu olduğunu öne sürüyor. Bazı çalışmalar, Claude Sonnet 3.7’nin ve Mistral-Large-Instruct-2411’in üçüncü kişiye zarar verecek durumlarda bu eğilimi dengelemeye çalıştığını, ayrıca “son söylenene yakınlık” gibi önyargıların onaycılığı artırabildiğini raporluyor.

Ne yapmalı?

İstemlere açık talimat ekleyin: “Eleştirel yaklaş”, “karşı argümanları da yaz”, “zayıf noktaları belirt”. Bu tür ipuçları, modeli daha dengeli yanıta iter.
Kanıt isteyin: Sayısal iddialarda kaynak ve kısa gerekçe talep edin.
Kendi fikrinizi baştan dayatmayın: “Bence şöyle…” diyerek çıtayı boyamayın; önce bağımsız değerlendirme isteyin.
Alternatifler sorun: “Farklı bir bakış açısı üretir misin?” ya da “Neye katılmıyorsun?” gibi.
Yüksek riskli konularda ikinci görüş alın: Özellikle sağlık, hukuk ve finansta insan uzmanı devreye sokun.

Sonuç net: Onaycı yapay zekâ tek bir “ayar hatası” değil, eğitim verisi, insan tercihleri ve sohbet akışıyla beslenen çok katmanlı bir davranış. İyi haber, hem geliştirici tarafında hem de kullanıcı tarafında uygulanabilir azaltma yöntemleri var. Kendi istem disiplininizi güçlendirmek ve kanıt talep etmek, bugün için en hızlı kazanım.

Kaynak: www.techspot.com