Katılım
22 Aralık 2023
Mesajlar
2.014
Çözümler
1
Beğeniler
853
Merhaba,

Biraz araştırma yaptım ve öğrendiklerimi sizinle paylaşmak istiyorum. Belki amatör olur ama yine de paylaşacağım.

Üretken yapay zeka, artık kendi kendine öğrenen, yeni bir şeyler üreten cihazlardır. Normal yapay zekalar belli kurallar ve verilerle çalışır; yani ne verirsen onu işler. Büyük dil modeli (LLM) değildir bu ama üretken yapay zeka tamamen farklı. Ona birkaç fikir veriyorsun ve kendi başına analiz yapıyor, inceliyor ve ihtimalleri düşünüyor. Yani aslında onunla uğraşmak bazen insanla sohbet etmek gibi oluyor. LLM gibi toplanan verilerden bir şeyler yazmıyor. Düşündüğü bir şeyi kendi yorumluyor ve büyük veri kümesi içinden değil de kendini, kendi kendine eğitiyor.

Hikaye yazacak oldun diyelim. Sen birkaç örnek veriyorsun bu şekilde olsun diye falan. Ancak üretken yapay zeka sadece onunla kalmıyor. Kahraman bakış açısı veya tanrısal olarak anlatıyor. Hatta bununla kalmıyor, hikayedeki karakterin psikolojisini bile yazıyor. Yani büyük dil modeli değil bu. Sadece verilen bilgiyi çoğaltmıyor, ayrıca kendi yorumlarını katıyor, hata yapıyor ama bunların hata olduğunu öğrendiği zaman kendini düzeltiyor. ChatGPT gibi dünyadaki veri kümeleri ile çalışıyor fakat ChatGPT yeni bilgi üretmiyor. Üretken yapay zeka ise büyük veri kümesinden daha fazlasını yapıyor. Tabii bu dediklerim tam hayata geçmiş durumunda değil.

Bu yüzden sürprizli gibi. Bazen ortaya çıkan sonuç harika oluyor ve tam istediğin gibi sen söylemeden de yapabiliyor. Tabii her şey mükemmel değil. Mantık hataları ve kendisi düşünse bile hatalar yapıyor. Her bilgiye güvenmemek lazım. Sen bir yön veriyorsun, o kendi yorumunu katıyor, kendi mantığını kullanıyor ve ortaya yepyeni bir şey çıkarıyor. Kendi kendine öğrenme kapasitesi, senin daha önceden yazdıklarını biliyor. Bu LLM (Büyük dil modeli. Örnek: ChatGPT)'de de var.

Benim elimden bu kadar geldi. Umarım olmuştur. Okuyup yapıcı eleştirilere açığım. İyi Sosyaller.
 
Son düzenleyen: Moderatör:
Merhaba,

Biraz araştırma yaptım ve öğrendiklerimi sizinle paylaşmak istiyorum. Belki amatör olur ama yine de paylaşacağım.

Üretken yapay zeka, artık kendi kendine öğrenen, yeni bir şeyler üreten cihazlardır. Normal yapay zekalar belli kurallar ve verilerle çalışır; yani ne verirsen onu işler. Büyük dil modeli (LLM) değildir bu ama üretken yapay zeka tamamen farklı. Ona birkaç fikir veriyorsun ve kendi başına analiz yapıyor, inceliyor ve ihtimalleri düşünüyor. Yani aslında onunla uğraşmak bazen insanla sohbet etmek gibi oluyor. LLM gibi toplanan verilerden bir şeyler yazmıyor. Düşündüğü bir şeyi kendi yorumluyor ve büyük veri kümesi içinden değil de kendini, kendi kendine eğitiyor.

Hikaye yazacak oldun diyelim. Sen birkaç örnek veriyorsun bu şekilde olsun diye falan. Ancak üretken yapay zeka sadece onunla kalmıyor. Kahraman bakış açısı veya tanrısal olarak anlatıyor. Hatta bununla kalmıyor, hikayedeki karakterin psikolojisini bile yazıyor. Yani büyük dil modeli değil bu. Sadece verilen bilgiyi çoğaltmıyor, ayrıca kendi yorumlarını katıyor, hata yapıyor ama bunların hata olduğunu öğrendiği zaman kendini düzeltiyor. ChatGPT gibi dünyadaki veri kümeleri ile çalışıyor fakat ChatGPT yeni bilgi üretmiyor. Üretken yapay zeka ise büyük veri kümesinden daha fazlasını yapıyor. Tabii bu dediklerim tam hayata geçmiş durumunda değil.

Bu yüzden sürprizli gibi. Bazen ortaya çıkan sonuç harika oluyor ve tam istediğin gibi sen söylemeden de yapabiliyor. Tabii her şey mükemmel değil. Mantık hataları ve kendisi düşünse bile hatalar yapıyor. Her bilgiye güvenmemek lazım. Sen bir yön veriyorsun, o kendi yorumunu katıyor, kendi mantığını kullanıyor ve ortaya yepyeni bir şey çıkarıyor. Kendi kendine öğrenme kapasitesi, senin daha önceden yazdıklarını biliyor. Bu LLM (Büyük dil modeli. Örnek: ChatGPT)'de de var.

Benim elimden bu kadar geldi. Umarım olmuştur. Okuyup yapıcı eleştirilere açığım. İyi Sosyaller.

Bir mühendis olarak bunu düzeltme ihtiyacı duydum kusura bakmayın.

Temeliniz de birkaç yanlış var. Bu da dolayısı ile diğer yanlışlara yol açmış.

  • Üretken yapay zeka dediğimiz şey aslında kendi kendine öğrenen bir sistem değil.
  • Eğitim bittikten sonra model sabit kalıyor, yani zaman geçtikçe kendi kendine yeni şeyler öğrenmiyor.
  • Aslında ChatGPT tam olarak bir LLM'dir ve bu da zaten üretken yapay zekanın kendisidir.

Şöyle diyeyim,
Bu sistemler aslında düşünmüyor, sadece olasılıklara göre tahmin yapıyor. Hangi kelimenin, pikselin, notanın gelme ihtimali yüksekse onu seçiyor. Bu yüzden bazen mantıklı, bazen saçma sonuçlar çıkabiliyor.
Sen ona fikir verdiğinde “düşünüyor gibi” görünmesinin nedeni çok büyük bir veri kümesinden öğrendiği patternlar ile tahmin yapması.
Yani analiz etmiyor, sadece istatistiksel olarak tahmin ediyor. (Adı üzerinde GPT = Generative PRE-TRAINED Transformer)

Ayrıca,
Hatalarından kendi kendine ders de çıkarmıyor. RLHF sistemi dediğimiz, insanlar modelin cevaplarını değerlendirir, hangisinin daha iyi olduğunu seçer, model de bu tercihler üzerinden ek bir eğitim süreci geçirir ve bir sonraki güncellemede bu hataları istatistiksel olarak daha da azaltır. (Bu verilerin tamamı biz mühendislerin elinden geçmeden asla topluma sunulmaz.)

Yani ChatGPT, NanoBanana gibi modeller üretken yapay zekadır. Aama düşündüğü, hissettiği ya da kendini geliştirdiği yok. Sadece müthiş bir algoritma ile olasılık tahmini yapıyor.

Ekstra olarak yanlış gözlemlemende ki ana sebeplerden birisi bu;
İlk öğrendiğim de bana bir aydınlanma gelmişti şahsen.

Biz buna “Context understanding” (bağlam anlama) diyoruz ki bu üretken yapay zekanın en kritik kısmıdır.
Modeller , kelimeleri tek tek değil, öncesi ve sonrasıyla birlikte değerlendirir.
Yani bir cümle de ingilizce “bank” kelimesi geçiyorsa, etrafındaki kelimelere bakarak bunun “nehir kenarı mı” yoksa “finans kurumu mu” anlamında olduğunu çıkarır.

Teknik olarak, transformer mimarisi bunu attention mekanizmasıyla yapar.
Bu mekanizma, her kelimenin cümledeki diğer kelimelerle ilişkisini sayısal olarak ölçer. (Buna da correlation diyoruz matematikte.)
Bu attention mekanizması olmasaydı LLM ile her konuştuğunda aldığın cevapların %70'i yanlış ya da alakasız olurdu. Tabii ki bunun haricinde back propagation, normalization, LSTM, RNN, activation functions, GXBoost.... onlarca etki eden şeyler var.

Bu dediklerimi kavrarsan GenAI alanında oldukça yol katedebilirsin. Tabii kalkülüs, cebir, istatistik ve olasılık bilmezseniz bir yapay zekanın nasıl işlediğini asla tam anlamıyla çözemezsiniz. Bu konuyu detayları ile anlatacağım bir blog sayfası hazırlıyorum son 7 aydır ancak hala bitmedi. Son derece derin bir konu.. :haha:

Umarım açık ve basit bir şekilde anlatabilmiş ve sizlere bir şeyler katabilmişimdir. o7