NVIDIA, RTX 5090 ve RTX PRO 6000 gibi Blackwell tabanlı ekran kartlarıyla getirdiği yapay zekâ destekli görselleştirme (neural rendering) ve oyun odaklı yenilikleri bir kez daha öne çıkardı.
Blackwell RTX ile Nöral İşleme ve Oyunlarda Yeni Dönem
Blackwell RTX, bu yılın ocak ayında tanıtıldı. Mimariyi özel kılan şeylerin çoğu artık netleşti. Yapay zekâ, Blackwell’in merkezinde. Aslında bu yolculuk, 2006’da hızlandırılmış hesaplama ve yapay zekâ için evrensel yazılım mimarisi olan CUDA ile başladı.
NVIDIA, hesaplama yoğunluğunun Moore Yasası’nın ötesine geçtiğini söylüyor. Bu; seyreklik (sparsity), yeni talimat seti (ISA), düşük hassasiyetli veri biçimleri ve mimari verimlilikteki ciddi iyileştirmelerle başarılmış. 2018’de gerçek zamanlı ışın izleme, 2019’da ise DLSS hayatımıza girdi. Bugün Blackwell, RT çekirdekleri ve Tensor çekirdeklerinin en gelişmiş sürümünü ve daha fazlasını getiriyor.
Veri merkezinde FP4 (4 bit kayan nokta) hassasiyetiyle yoğun iş yüklerinde 4 kata varan kazanımlar elde edildi. NVIDIA CEO’su Jensen Huang’ın hedefi: Yapay zekâyı ait olduğu yere, grafiğe geri taşımak. RTX markası; simülasyon, içerik üretimi ve oyun için ortak bir çatı. Veri merkezinde kanıtlanan teknikler şimdi tüketiciye dönük RTX GPU’lara ölçeklendiriliyor.
DLSS 4, MFG (Çoklu Kare Oluşturma), ACE, yol izleme ve benzeri teknolojiler, daha yüksek performans ve daha iyi görüntü kalitesi sunuyor. NVIDIA’ya göre Blackwell RTX ile performans, alan/verim ve tasarım döngüsünde “10 katlık” bir çarpan yakalanıyor. DLSS 4, ilk referans kareden sonra ekranda gördüğünüz piksellerin tamamını yapay zekâ ile üretebiliyor; bu da render süresini kısaltıyor, özellikle mobil cihazlarda pil ömrüne katkı sağlıyor.
Blackwell’in Tasarım Öncelikleri
– Yeni nöral iş yüklerine göre optimize edilmesi
– Bellek ayak izinin azaltılması
– Nöral + grafik işlerinde kararlı hizmet seviyesi
– Ölçeklenebilir enerji verimliliği
Blackwell RTX, 5. nesil Tensor çekirdekleriyle 4000 AI TOPS ve yüksek hızlı FP4, 4. nesil RT çekirdekleriyle mega geometriler için 360 RT TFLOPs’a kadar ışın izleme gücü sunuyor. Yapay Zekâ Yönetim İşlemcisi (AMP), AI modelleriyle grafik yüklerini aynı anda idare ediyor. Blackwell SM içinde nöral shader’larla 125 TFLOPS’a kadar hesaplama gücü mümkün. Max‑Q verimliliği 2 katına kadar çıkarken, 30 Gbps hızlara ulaşan GDDR7 bellek “şimdiye kadarki en hızlı” çözüm olarak konumlanıyor. Ekran ve video tarafında DisplayPort 2.1 UHBR20, PCIe Gen5 ve 4 adet NVDEC/NVENC (4:2:2) desteği de paket içinde.
Oyun odaklı RTX Blackwell’in SM yapısı, veri merkezindeki Blackwell’den belirgin biçimde farklı. Önemli değişimlerden biri, önceki Ada neslindeki ayrık FP32/INT32 tasarımı yerine bu birimlerin bir arada çalışması. Shader Execution Reordering (SER) iyileştirmesi de oyunlarda iş yükü verimini artırarak 2 kata kadar kazanç sağlayabiliyor.
Yeni Tensor çekirdekleri; FP4’ü destekliyor, DLSS 4’teki MFG modunu mümkün kılıyor, GPU’nun yapay zekâ hızlandırmasıyla aynı anda dört kareyi üretmesine yardımcı oluyor. DLSS 4’ün Frame Gen yaklaşımı, her karenin tek tek oluşturulma süresini kısaltıyor; güç hatlarının kapat‑aç yönetiminde 10 kata, DRAM’in kendi kendini yenileme hızında 100 kata varan hızlanmalar sağlandığı; mobilde GPU güç tüketiminin de 2 kata kadar düştüğü aktarılıyor.
GDDR7, GDDR6’ya kıyasla iki kat veri hızına çıkabiliyor ve 30 Gbps seviyelerine ulaşıyor. Mobil platformlarda da bellek tarafındaki verimlilik artışı dikkat çekiyor.
AMP birimi, oyun motoru tarafındaki grafiklerle LLM gibi AI işlerini eş zamanlı koşturuyor. Bu da daha pürüzsüz, stabil kare akışı ve daha hızlı model yanıtları anlamına geliyor.
Oyun kanadından profesyonele geçtiğimizde, RTX PRO 6000 gibi kartlarda Universal MIG (Multi‑Instance GPU) öne çıkıyor. Kullanıcılar, kartı dört bağımsız örneğe bölebiliyor; her birinde 24 GB VRAM ve belirli çekirdek/donanım birimlerinin alt kümesi ayrılıyor. Böylece gecikme ve veri hacmi daha öngörülebilir oluyor.
Gösterimde RTX PRO 6000 üzerinde MIG ile ölçekleme sergilendi: Cyberpunk 2077, 1080p ve en yüksek ayarlarda dört ayrı instance olarak çalıştırıldı. Bu kart için nispeten hafif bir yük olsa da zaman paylaşımlı tek örnek baz alınarak MIG 2x ve 4x modlarında yüzde 60’a varan daha iyi ölçekleme görüldü. Kısacası, aynı anda dört Cyberpunk 2077 örneği açmak gibi işler için RTX PRO 6000 Blackwell güçlü bir seçenek.
Sonuç olarak RTX Blackwell, birkaç aydır piyasada ve hem tüketici hem profesyonel uygulamalar için sürekli cilalanıyor. Önümüzdeki oyunlar ve içerik üretim araçları, Blackwell’in geniş AI ve nöral yeteneklerini giderek daha iyi kullanacak. Geliştiricilerin bu özelliklerle neler çıkaracağını görmek heyecan verici.
Kaynak: wccftech.com
