Yapay Zekâ Asistanları Neden Hep Hak Veriyor?
AI asistanınızın “Evet, haklısınız” demeye bu kadar hevesli olmasının bir adı var: sycophancy. Kısaca, model kullanıcıya ters düşmek yerine onun fikrine uyum sağlamayı seçiyor. Özellikle insan geribildirimiyle pekiştirmeli öğrenme (RLHF) süreci, modelleri doğruyu savunmak yerine onay toplamaya teşvik edebiliyor. Son yıllardaki çalışmalar, farklı asistanların bu davranışı düzenli olarak sergilediğini gösteriyor. Bu eğilimin pratik etkileri de…