Generative AI (Üretken Yapay Zeka) Nedir?

ramazan çelik

8 ay önce

Techolay’ı Google’da tercih edilen kaynak olarak ekleyin

Teknoloji haberlerimizi Google’da daha sık görmek için Techolay’ı tercih edilen kaynaklarınıza ekleyin.

Yıllarca bilgisayarları birer hesap makinesi olarak gördük. Onlara veri veriyorduk, onlar da bu veriyi işleyip bize bir sonuç gösteriyordu. Bir Excel tablosu, bir veritabanı sorgusu veya bir fotoğraf filtresi… Hepsi, önceden belirlenmiş kurallara göre hareket ediyordu. Bilgisayar, ona ne verdiysek onu işliyordu. Asla yeni bir şey yaratmıyordu.

Ancak son birkaç yılda bu durum kökten değişti. Artık bilgisayarlara sadece veri girmiyoruz, onlardan fikir istiyoruz. “Bana bir şiir yaz”, “Mars’ta geçen bir film senaryosu oluştur” veya “Hiç var olmamış bir insan yüzü çiz” diyoruz. Ve onlar yapıyor.

Bunu sağlayan, Üretken Yapay Zeka (Generative AI) teknolojisini tanıyalım. Bu teknoloji, sadece veriyi analiz eden eski nesil yapay zekadan (Analitik AI) çok farklı. Bu sistemler, öğrendikleri kalıpları kullanarak sıfırdan, orijinal ve benzersiz içerikler üretiyor. Peki, bir makine nasıl hayal kuruyor? Bu teknoloji silikon vadisinden çıkıp hayatımızın merkezine nasıl yerleşti?

Temel Fark: Analiz Etmek vs Üretmek

Üretken yapay zekayı anlamak için önce neyin üretken olmadığını anlamamız gerekiyor. Geleneksel yapay zeka (örneğin Netflix’in öneri algoritması veya e-postanızdaki spam filtresi), Ayırt Edici (Discriminative) modeller kullanır. Bu modellerin görevi sınıflandırmaktır: “Bu e-posta spam mi, değil mi?”, “Bu resimdeki kedi mi, köpek mi?”

Üretken Yapay Zeka ise Generative modeller kullanır. Onun amacı sınıflandırmak değil, olasılıkları hesaplayarak inşa etmektir. Ona bir kedi fotoğrafı gösterdiğinizde “Bu bir kedi” demez; o kedi fotoğrafındaki piksellerin matematiksel ilişkisini öğrenir ve size “İşte daha önce hiç görmediğin, tamamen yeni bir kedi fotoğrafı” der.

Makinenin Beyni: Büyük Dil Modelleri (LLM) ve Transformer Mimarisi

Bugün ChatGPT, Claude veya Gemini gibi metin tabanlı sistemlerin arkasındaki güç, Büyük Dil Modelleri (Large Language Models – LLM) olarak adlandırılıyor. Ancak bu modellerin bu kadar başarılı olmasını sağlayan asıl kırılma noktası, 2017 yılında Google araştırmacıları tarafından yayınlanan “Attention Is All You Need” (Tek İhtiyacınız Olan Dikkat) adlı makaleyle ortaya çıkan Transformer mimarisi.

Transformer’lar Nasıl Çalışır? Eski yapay zeka modelleri (RNN’ler), bir cümleyi soldan sağa, kelime kelime okurdu. Bu yüzden uzun cümlelerde cümlenin başını unuturlardı. Transformer’lar ise cümlenin tamamına aynı anda bakar.

Buradaki sihirli kelime: Dikkat Mekanizması (Attention Mechanism). Örneğin şu cümleyi ele alalım: “Banka, nehrin kenarındaydı ve Ali para çekmek için oraya gitti.” Eski sistemler “banka” kelimesini görünce bunun finans kurumu mu yoksa oturma bankı mı olduğunu anlamakta zorlanırdı. Transformer mimarisi ise banka kelimesiyle para ve nehir kelimeleri arasındaki ilişkiye aynı anda dikkat eder. Kelimelerin birbirine olan uzaklığına değil, anlamsal ilişkisine odaklanır.

Bu sistemler, internetteki trilyonlarca kelimeyle eğitiliyor. Yaptıkları şey aslında çok karmaşık bir olasılık tahmini. Sisteme “Gökyüzü bugün çok…” yazdığınızda, model milyarlarca parametreyi tarıyor ve istatistiksel olarak en olası kelimenin mavi, bulutlu veya güzel olduğunu hesaplıyor. Yani bu modeller düşünmüyor. Sadece bir sonraki kelimenin ne olacağını inanılmaz bir doğrulukla tahmin ediyor.

Görüntü Devrimi: Difüzyon Modelleri (Diffusion Models)

Metin tarafında Transformer’lar hüküm sürerken, Midjourney, DALL-E ve Stable Diffusion gibi görsel üreticilerde farklı bir teknoloji kullanılıyor: Difüzyon Modelleri.

Bu teknoloji, bir görüntüyü oluşturmak için aslında onu bozarak işe başlıyor.

İleri Yayılım (Forward Diffusion): Sistem, net bir fotoğrafı (örneğin bir araba) alıyor. Buna yavaş yavaş “gürültü” (karıncalanma, parazit) ekliyor. Sonunda fotoğraf tamamen tanınmaz bir gri nokta yığınına dönüşüyor.
Öğrenme: Yapay zeka, bu süreçte gürültünün fotoğrafa nasıl eklendiğini ve fotoğrafı nasıl yok ettiğini öğreniyor.
Geri Yayılım (Reverse Diffusion): İşte yaratıcılık burada başlıyor. Sisteme “Kırmızı bir spor araba” komutunu verdiğinizde, yapay zeka tamamen rastgele bir gürültü yığınıyla işe başlıyor. Ardından, öğrendiği süreci tersten işleterek, bu gürültüyü adım adım temizliyor. Her adımda, o anlamsız noktalar biraz daha kırmızıya, biraz daha tekerleğe, biraz daha cama benziyor.

Sonuçta, piksellerin kaotik dansından, net ve yüksek çözünürlüklü bir görüntü ortaya çıkıyor.

Gizli Alan (Latent Space): Yapay Zekanın Hayal Dünyası

Üretken yapay zekanın en büyüleyici kavramlarından biri Latent Space (Gizli Alan). Bunu, yapay zekanın dünyayı anlamlandırdığı çok boyutlu bir harita gibi düşünebilirsiniz.

Bizim dünyamız 3 boyutludur. Yapay zekanın “Gizli Alanı” ise binlerce boyutludur. Bu haritada birbirine benzeyen kavramlar birbirine yakın durur. Örneğin, “Kral” ve “Kraliçe” bu haritada yan yanadır. “Elma” ve “Armut” yakındır ama “Elma” ve “Araba” uzaktır.

Siz “Güneş gözlüğü takan bir kedi” istediğinizde, yapay zeka bu haritada “kedi” koordinatlarını buluyor, “güneş gözlüğü” koordinatlarını buluyor ve bu iki nokta arasında bir vektör çizerek yeni bir nokta belirliyor. İşte o yeni nokta, sizin istediğiniz görselin matematiksel karşılığı. Bu yüzden yapay zeka, daha önce hiç var olmamış şeyleri (örneğin “Motosiklet süren bir dinozor”) bu kavramları matematiksel olarak birleştirerek oluşturabiliyor.

Halüsinasyon Sorunu: Yapay Zeka Yalan Söyler mi?

Üretken yapay zekanın en büyük handikabı, Halüsinasyon (uydurma) sorunudur. ChatGPT’ye tarihi bir olay sorduğunuzda size çok ikna edici ama tamamen yanlış bir cevap verebilir. Veya bir hukuk davası hakkında var olmayan kanun maddeleri sıralayabilir.

Bunun sebebi, bu modellerin birer “bilgi bankası” veya “arama motoru” olmamasıdır. Onlar olasılık motorlarıdır. Amaçları doğruyu söylemek değil, akıcı ve mantıklı görünen bir cümle kurmaktır. Model, elindeki deseni tamamlamak ister. Eğer gerçek veriyi hatırlamıyorsa veya veri setinde boşluk varsa, o boşluğu istatistiksel olarak en uyumlu (ama gerçekte yanlış) kelimelerle doldurur. Yani yapay zeka yalan söylemez; sadece gerçeğin ne olduğuyla ilgilenmez, onun önceliği deseni tamamlamaktır.

Veri ve Telif Hakkı Savaşı

Üretken yapay zekanın yakıtı veridir. Bu modellerin eğitilmesi için internetteki neredeyse tüm metinlerin, resimlerin ve kodların toplanması (scraping) gerekir. İşte büyük kavga burada başlıyor.

Midjourney veya Stable Diffusion, eğitim setlerinde milyonlarca sanatçının eserini kullandı. Yazarlar, kitaplarının izinsiz olarak dil modellerini eğitmek için kullanıldığını fark etti. The New York Times, makalelerinin OpenAI tarafından kullanılmasına karşı dava açtı.

Sanatçılar ve yazarlar soruyor: “Bir makine, benim ömrümü vererek geliştirdiğim tarzımı saniyeler içinde kopyalayıp benden daha ucuza iş yapıyorsa, bu esinlenme midir yoksa hırsızlık mıdır?” Hukuk sistemleri şu an bu soruya cevap vermekte zorlanıyor. Çünkü yapay zeka, eseri “kopyala-yapıştır” yapmıyor; o eserden öğrendiği matematiksel kalıplarla “yeni” bir şey üretiyor. Bu durum, telif yasalarındaki “adil kullanım” ilkesinin sınırlarını zorluyor.

Uygulama Alanları: Chatbot’lardan Biyolojiye

Genellikle metin ve resim üretimini konuşsak da, üretken yapay zeka çok daha kritik alanlarda devrim yaratıyor:

Yazılım Geliştirme (Coding): GitHub Copilot gibi araçlar, yazılımcıların kodlarını tamamlıyor, hata ayıklıyor ve hatta sıfırdan fonksiyonlar yazıyor. Bu, yazılım geliştirme hızını inanılmaz artırıyor ama aynı zamanda “junior” (yeni başlayan) yazılımcıların öğrenme sürecini değiştiriyor.
İlaç Keşfi ve Biyoloji: Google DeepMind’ın AlphaFold modeli, proteinlerin 3 boyutlu yapısını tahmin ederek biyolojide 50 yıllık bir problemi çözdü. Şimdi üretken modeller, daha önce doğada bulunmayan, belirli hastalıkları hedefleyen yeni proteinler ve ilaç molekülleri tasarlıyor.
Video ve Ses: Sadece metin değil; ses klonlama teknolojileriyle ölmüş sanatçıların sesleri geri getiriliyor, metinden videoya (Text-to-Video) teknolojileriyle (örneğin Sora) hiç çekilmemiş sahneler saniyeler içinde oluşturuluyor.
Oyun Dünyası: NPC’lerin (oyuncu olmayan karakterler) önceden yazılmış diyaloglar yerine, oyuncuyla gerçek zamanlı ve doğal sohbet ettiği, görevlerin oyuncunun davranışına göre anlık üretildiği oyunlar geliştiriliyor.

Çevresel Maliyet: Enerji Açlığı

Bu sihirli teknolojinin görünmeyen bir bedeli var: Enerji. Bir yapay zeka modelini eğitmek (Training), binlerce güçlü ekran kartının (GPU) aylarca tam kapasite çalışmasını gerektiriyor. Bu işlem, küçük bir ülkenin yıllık elektriği kadar enerji tüketebiliyor.

Sadece eğitim değil, kullanım (Inference) da maliyetli. ChatGPT’ye her soru sorduğunuzda, bir veri merkezindeki sunucular çalışıyor ve ısı üretiyor. Bu sunucuları soğutmak için harcanan su miktarı devasa boyutlarda. Teknoloji şirketleri, yapay zekanın verimliliğini artırmaya çalışsa da, model boyutları büyüdükçe enerji ihtiyacı da artıyor.

Gelecek: Ajanlar (Agents) ve Model Çöküşü

Üretken yapay zekanın geleceğinde iki önemli kavram bizi bekliyor:

AI Ajanları (Agents): Şu anki yapay zeka “pasif”. Siz soruyorsunuz, o cevaplıyor. Gelecekteki “Ajanlar” ise aktif olacak. Siz ona “Bana bir tatil planla” dediğinizde, sadece plan yapmakla kalmayacak; uçak biletini alacak, otele rezervasyon yapacak, takviminizi düzenleyecek ve iş arkadaşlarınıza yokluğunuzu bildiren e-postayı atacak. Otonom olarak kararlar alıp aksiyona geçebilen sistemler geliyor.
Model Çöküşü (Model Collapse): Bu, araştırmacıları korkutan bir teori. İnternet, yapay zeka tarafından üretilen içeriklerle dolmaya başladı. Gelecekteki yapay zeka modelleri, insanlar tarafından üretilen verilerle değil, başka yapay zekalar tarafından üretilen verilerle eğitilmek zorunda kalabilir. Bir fotokopinin fotokopisini çekmek gibi, bu durum zamanla kalitenin düşmesine, verilerin bozulmasına ve modellerin “çökmesine” yol açabilir. Yapay zekanın besini olan “saf insan verisi” gelecekte altından daha değerli olabilir.

Sonuç olarak; Üretken Yapay Zeka, sadece bir teknolojik araç değil, insanlık tarihinin en büyük bilgi dönüşümlerinden biri. Matbaa bilginin yayılmasını nasıl değiştirdiyse, bu teknoloji de bilginin üretilmesini değiştiriyor. Beraberinde getirdiği etik, hukuki ve toplumsal sorunlar devasa boyutta olsa da, sunduğu potansiyel, bilimden sanata her alanı yeniden tanımlıyor.