Ekran kartı pazarında istikrarlı adımlarla rekabet eden AMD, yakaladığı ivmeyi yeni nesil mimarisi ile devam ettirmek istiyor. Kısaca tanımlamak gerekirse açılımı Radeon DNA olan RDNA, AMD’nin eski mimarisi GCN’nin ardılı. Bugünkü konumuzsa firmanın yeni mimarisi, RDNA 4.
RDNA 4 mimarisiyle birlikte AMD, 4K çözünürlükte yüksek performans arayanları hedefliyor. Bu mimari, pek çok yeniliği de beraberinde getiriyor; 3. jenerasyon ışın izleme, iyileştirilmiş cache (önbellek) sistemi, geliştirilmiş komut işlemcisi, yeni Dual Media Engine, 3. jenerasyon Matrix hızlandırıcısı, GDDR6 bellekler ve AMD Radiance Display Engine tek parçada birleşiyor.
RDNA 4’ün Medya Yetenekleri
Bilgisayarları sadece oyun oynamaktan fazlası için kullanıyoruz. AMD de bunun farkına varmış olacak ki yeni nesilde medya özelliklerini es geçmemiş. Özellikle oyun kaydı ve yayıncılık yeteneklerinde ciddi bir gelişme söz konusu. RDNA 4, düşük gecikmeli H.264 video sıkıştırma codec’inde %25’lik bir iyileşme sağlıyor. HEVC’deyse %11 oranını gören görsel kalite iyileşmesi mevcut. H.264 veya HEVC gibi codec’lerden daha verimli bir sıkıştırma codec’i olan AV1 ise B-frame’ler (Bi-directional -önceki ve sonraki karelerdeki veriler kullanılarak yapılan sıkıştırma-) kullanılarak daha da verimli hale gelmiş. RDNA 4, bunlara ek olarak da 720p videoların encoding’inde %30’a varan performans artışı vadediyor.
RDNA 4’ün medya özellikleri, sadece teknik gelişmelerle sınırlı kalmıyor. AMD, bu gelişmeleri uygulamaya koyma konusunda da iyi bir iş çıkararak mimarisini FFMPEG, OBS ve Handbrake için optimize etmiş.
Tabii ki verimlilik, sadece dosya boyutu veya kısalan işleme sürelerinden ibaret değil; işin güç tüketimi boyutu da var. AMD, burada da dersine iyi çalışmış ve VCN (Video Core Next) için de bazı iyileştirmelerde bulunmuş. RDNA 4, VCN düşük güç tüketimli video oynatmada AV1 ve VP9 formatlarında %50’den fazla performans artışı sunuyor. Ayrıca firma, bağlam değiştirme ve bellek yazma erişimi işlemlerini daha da hızlandırdığını ve daha az kaynak harcadığını belirtiyor.
Kısacası bütün bu medya geliştirmeleri, video kayıt ve yayıncılık işlemlerinde verimlilik anlamına geliyor. Bu açıdan AMD, RDNA 4 mimarisiyle içerik üreticilerine de hitap edecek.
Görüntüleme Deneyimi
Bildiğiniz gibi AMD, çeşitli görüntü teknolojilerini bünyesinde barındırıyor. Bu teknolojiler de RDNA 4’ten nasibini almış diyebiliriz. Pek çoğumuzun kullandığı FreeSync, bunlardan biri; artık çift monitörlü sistemler cihaz boştayken daha az enerji harcıyor. Ayrıca artık kare zamanlaması yükü de GPU’ya bırakılıyor ve bu sayede CPU gücü, video oynatma işlemlerine ayrılabiliyor. AMD’nin görüntü keskinleştirme teknolojisi de güncellenerek Radeon Image Sharpening 2 adını almış. Bu sürümle birlikte görüntü kalitesi artıyor ve bu özellik, tek bir ayarla da tüm API’lerde çalışıyor.
Compute Engine’in Özellikleri
- Her CU içinde çift SIMD32 vektör birimi
- Daha verimli Matrix işlemleri (2x-16b, 4x-8b, 4x-4b yoğun matris oranları)
- Skaler Birim’e gelen güncellemeyle yeni Float32 işlemleri
- Gelişmiş Shader zamanlayıcısı ile iyileştirilmiş bellek erişimi ve önbellek yönetimi
- Işın Hızlandırıcı geliştirmeleri
Işın İzleme
Artık çoğu modern oyunun ışın izleme desteklediğini belirten AMD, çağın gerisinde kalmamak için RDNA 4 mimarisiyle bu alanda da güncellemelere imza atmış. Güçlendirilmiş ışın hızlandırıcılarda artık bir ışın başına 8 kutucuk (box) ve 2 üçgen (triangle) düşüyor -ki bu da önceki mimariye göre 2 katlık bir artış anlamına geliyor. RDNA 4’le beraber ışın izleme donanımında, ışın izleme süreçlerindeki nesne dönüşüm işlemleri için ayrılmış ek bir donanım bulunuyor. Bunların yanı sıra ışın izleme işlemlerinde hangi ışınların hangi nesne ve yüzeylerle etkileşime gireceğinin yönetildiği yığın yönetim süreci (stack management) de donanım düzeyinde hızlandırılmış. Kısacası RDNA 4 ile birlikte ışın izleme performansı bariz biçimde artıyor.
AMD’nin iddiasına göre yeni mimarinin ışın izlemeye getirdiği bir başka iyileştirmeyse BVH (Bounding Volume Hierarchy) yapısından geliyor. Artık ışınların yapılar üzerinde yaptığı gezinim (Traversal) işlemi hızlanıyor. Bu hızlanmanın sebepleri; BVH8’le beraber ışın gezinme mesafesinin ve gecikmesinin kısaltılması, node (düğüm) sıkıştırmadaki yeni metodla küçültülen BVH boyutu ve daha doğru çizilen obje sınırları sayesinde hatalı kesişimlerin önlenmesi. Grafikte de görebileceğiniz üzere RDNA 4’teki BVH bellek kullanımı, RDNA 3’e kıyasla %40 daha düşük. Dolayısıyla daha verimli diyebiliriz.
RDNA 4 ile gelen bir başka gelişmeyse dinamik VPGR (Vector General-Purpose Register) sayesinde ışın iş yükünün (Ray Occupancy) artması. Bu sayede aynı anda daha fazla ışın, daha yüksek verimlilikle hesaplanabiliyor. Ayrıca daha sonra değineceğimiz sırasız belleklerle birlikte gecikme azaltılmış.
Yönelimli Sınır Çerçeveleri (Oriented Bounding Boxes)
AMD, RDNA 4 ile birlikte ışın izlemede daha yenilikçi bir çözüm getiriyor. Firma, geleneksel sınır çerçevelerine kıyasla objenin etrafını sabit değil; daha sıkı saran geometrilerde sınır çerçeveleri üretiyor. Bu sayede objenin etrafında gereksiz boşluklar da kalmıyor. Sonuç olarak özellikle karmaşık şekilli objelere ışık, daha hatasız bir şekilde yansıyabiliyor. Işın geziniminin izlediği yol da önemli ölçüde kısalıyor. Geometriye göre ise ışın gezinim performansı yaklaşık %10 artıyor.
Sırasız Bellek
Bellek tarafında yaşanabilecek gecikmeler, özellikle performans arayanlar için tercih kriteri olabiliyor. Bildiğiniz üzere RDNA 3’te bellekteki veri dönüşleri, isteklerin yapıldıkları zamana göre sıralanıyor, bu nedenle de kimi işlemlerde gecikme süresi artabiliyordu. Bu noktada da AMD, RDNA 4 mimarisiyle birlikte kartlara ekstra sırasız bellekler yerleştirmiş. Bu sayede veriler, geliş sırasına bakılmaksızın işlenebiliyor ki bu da isteklerin çok daha efektif bir biçimde önceliklendirilebildiği anlamına geliyor.
Işın İzleme Mimarisi
RDNA 4’deki CU’lar (Compute Unit), RDNA 3’e oranla 2 kat daha iyi ışın gezinim performansı sağlıyor; üstelik bunu da aynı saat hızları ve bant genişliğiyle başarabiliyor. Elbette bunun birden çok sebebi var. AMD, bu performans artışını sırasız bellek kullanımı, yönelimli sınır çerçeveleri ve BVH gibi pek çok teknolojiyi tek mimaride toplamasına borçlu. Firma, daha yüksek ışın izleme performansı sağlayabilmek için RDNA 4’ün her alanında geliştirmeler yaptığını ifade ediyor.
Dinamik Kayıtlar (Dynamic Registers)
RDNA 3’te ekran kartındaki Shader’ların geçici olarak depolandığı geleneksel register’lar statikti ve Shader’ların kullandığı register oranı değişse de maksimum alan onlara rezerv ediliyordu. RDNA 4’ün getirdiği yeni Dinamik Register’lara geçişle beraber Shader’lara sadece ihtiyaçları kadar Register tahsis ediliyor. Shader’lar, iş yüküne göre Register havuzundaki kaynağı kullanabilmekte. Grafikte de görebileceğiniz üzere RDNA 4’teki Shader’ların sadece kullandığı değil; aynı zamanda rezerv ettiği Register kaynağı da iş yüküne göre dinamik olarak değişiyor. Tahmin edebileceğiniz üzere bu da bellek gecikmesinin daha iyi yönetilmesi ve Shader çekirdeklerinin daha verimli kullanılması anlamına geliyor.
Yapay Zeka Özellikleri
Ekran kartları, artık yalnızca oyun performanslarıyla değil; aynı zamanda yapay zeka kabiliyetleriyle de ölçülüyorlar. AMD, geride başladığı yapay zeka yarışında rakibi NVIDIA’ya yetişebilmek için RDNA 4 mimarisinde bu alanda gelişmeler sunuyor. Yapay zeka alanında RDNA 4, mevcut teknolojilerin üzerine koyarak ilerlemiş. AMD, oyuncuların ve içerik üreticilerin bu yapay zekadan maksimum şekilde faydalanmalarını hedefliyor. Geliştirilmiş WMMA (Wide Matrix Multiply Accumulate) işlemleri, matris operasyonlarını ve veri hareketini koordine ederken uygun verimlilik ve gücü hedefliyor.
Önceki neslin aksine artık 8 bitlik Floating Point formatları, yapay zeka için destekleniyor. Ayrıca AMD, E4M3 ve E5M2 formatları sayesinde farklı hassasiyet ve kullanımlara yönelik çözümleri de destekliyor. 4:2 oranında yapılandırılmış seyreklikle beraber RDNA 4, işlem gücünü artırırken watt başına düşen performanstan da ödün vermiyor. Grafiklerde de görebileceğiniz üzere hesaplama ünitesi başına işlemlerde RDNA 4, öncülü RDNA 3’e fp16, bf16, fp8, bf8, i8 ve i4’te üstünlük sağlıyor. RDNA 4’ün yapay zeka özellikleri ise şu şekilde:
- 16 bit / 8 bit / 4 bit Tensor Giriş Tipleri: Bit derinliklerindeki çeşitlilik, farklı amaçlara yönelik farklı hassasiyetteki verilerin işlenmesine olanak sağlıyor.
- 64 Üniteli Matrix Hızlandırıcı: Hızlandırıcının 64 işlem biriminden oluşması sayesinde paralel işlemler yüksek verimlilikle gerçekleşiyor.
- 16/32 bit Akümülatörler: Matematiksel işlemlerin sonuçları farklı amaçlara yönelik olarak gerektiğinde hızlı, gerektiğinde daha geniş aralıkları geçici olarak depolayabiliyor.
Yapay Zeka Performansı
Ekran kartlarındaki yapay zeka kullanımı, gündelik hayatta büyük önem arz ediyor. Özellikle yerelde çalıştırılan yapay zeka araçları, neredeyse tüm gücünü GPU’dan alıyor. Bu testte de Stable Diffusion 1.5 ile görüntü yaratmada RDNA 4 mimarili 9070 XT, RDNA 3 mimarili 7900 XT ile karşılaştırıldığında FP16’da 2 kata varan bir performans artışı sunuyor.
FSR 4
RDNA 4 ile gelen en büyük yazılımsal yenilikse makine öğrenimine dayalı FSR 4. Hatta bu o kadar geniş bir konu ki RDNA 4 ile gelen yeniliklerden bahsettiğimiz makalemizi buradan inceleyebilirsiniz.
Özet
Özetle AMD, yeni nesil mimarisiyle ekran kartının her alanında güncellemeler yapmış. Kartların kağıt üstündeki performans rakamları etkileyici gözüküyor. Elbette bu farkların gündelik kullanımda son kullanıcıyı ne derece etkilediğini de ürünler piyasaya sürüldüğü zaman göreceğiz.