gustavo

Üstün
Katılım
26 Mayıs 2024
Mesajlar
1.070
Makaleler
4
Çözümler
14
Beğeniler
1.037
Yer
Türkiye
Birinin sahte üretip diğerinin yakalamaya çalıştığı, iki ağın kavgası üzerine kurulu genelde görsel üretmek için kullanılan yapay zekâ modelidir.GaN'da temelde iki yapıdan oluşur:
  • generator: Sahte ama gerçek gibi veri üretmeye çalışır.
  • discriminator: “bu gerçek mi, sahte mi?” diye ayırmaya çalışır.

Zamanla görsel sayısı arttıkça gelişirler, generator kandırmayı discriminator ayırt etmeyi öğrenir.

Sonunda gerçeğe yakın görseller ortaya çıkar (ama çözünürlüğü düşüktür.)

Bazı GaN türleri:

GaN (vanilla): En saf hâli.
progressive GaN: Küçükten büyüğe çözünürlük.(ilk 2x2'den başlar sonrasında 4x4 8x8 diye devam ettirir)
dcgan:GaN'ın Cnn'li hali.
neden DALL-E gibi modellerde tercih edilmezler?

Çünkü: Eğitimi dengesiz.

Generator–discriminator kavgası büyüdükçe kontrolden çıkıyor ve düzeltmesi oldukça zor oluyor.
text-to-image'e uyumsuz.
“Kırmızı şapkalı beyaz kuş, yağmur altında” gibi karmaşık komutları GaN yapamaz.

Çeşitlilik problemi
Güzel ama hep benzer şeyler üretir.

Ölçeklenemiyor
Dataset ve model büyüdükçe stabilite daha da bozulur.
Ama artıları da yok değil:
Az veriyle iş görür
20–200 görselile bile “bir şey” çıkarır.
Hafiftir
Donanımı zorlamaz.
 
Son düzenleme: