NVIDIA, bir sonraki nesil Rubin yapay zeka platformuna dair yeni ayrıntıları paylaştı. Ailenin yıldızları arasında Rubin CPX adlı yeni AI GPU ve onunla birlikte çalışacak Vera işlemciler öne çıkıyor. Rubin CPX, özellikle “uzun bağlam” gerektiren işlerde hız ve verimlilik hedefliyor; milyon token seviyesinde kodlama görevleri ve üretken video gibi ağır iş yüklerini çok daha akıcı hale getirmeyi amaçlıyor.

Şirket, Rubin CPX’i Vera CPU’larla birlikte “Vera Rubin NVL144 CPX” platformunda sunacak. MGX tabanlı bu sistem, tek raf içinde 8 exaFLOPS yapay zeka hesaplama gücü, GB300 NVL72’ye göre 7.5 kata varan performans artışı, 100 TB’a kadar hızlı bellek ve saniyede 1.7 petabayt bellek bant genişliği vadediyor. İhtiyacı olan müşteriler için mevcut Vera Rubin 144 sistemlerini değerlendirebilecek ayrı bir CPX hesaplama çekmecesi de planlanıyor. Platform, ConnectX‑9 SuperNIC gibi yeni bileşenlerle ağ tarafını da hızlandırıyor.

Rubin CPX GPU’nun kendisi, NVFP4 türünde 30 PFLOPS’a kadar yapay zeka hesaplama gücü sunuyor ve 128 GB’a kadar GDDR7 bellekle geliyor. NVIDIA, bu kartlarda HBM yerine GDDR7 tercihinin maliyet avantajı sağladığını vurguluyor. Ek olarak çip üzerindeki video kodlayıcı/çözücü (decoder/encoder) birimlerinin sayısı 4 katına çıkarılmış. Bu sayede uzun format video arama, analiz ve yüksek kaliteli video üretimi gibi işlerde tek yongada güçlü çözüm hedefleniyor.
Öne çıkan karşılaştırma başlıkları:
- Yapay zeka hesaplama gücü: 7.5 kat artış (8 exaFLOPS NVFP4)
- Bellek bant genişliği: 3 kat artış (1.7 PB/s)
- Bellek kapasitesi: 4 kat artış (slaytlarda 150 TB GDDR7 vurgusu)
Rubin ailesi, NVIDIA’nın bir sonraki adımı olan Feynman platformunun kısa süre önce ima edilmesiyle birlikte daha geniş bir yol haritasının parçası. Rubin CPX tabanlı ilk sistemlerin, 2026’nın sonunda piyasaya çıkması bekleniyor. Vera Rubin tarafının ise yakında üretime girip GTC 2026’da sahne alması planlanıyor.

Kısacası Rubin CPX, hem yazılım geliştirme asistanlarını büyük projeleri “anlayıp iyileştirebilen” bir seviyeye taşımayı hedefliyor hem de uzun videolarda milyon token bağlamını tek başına kaldırabilecek bir mimari sunuyor. GDDR7 odaklı maliyet/performans yaklaşımı ve güçlendirilmiş video birimleri, veri merkezlerinde yapay zeka çıkarımını daha hesaplı ve verimli hale getirmeyi amaçlıyor.
Kaynak: wccftech.com