Microsoft Azure, NVIDIA’nın GB300 “Blackwell Ultra” GPU’ları ile Güçlendiriliyor

Gürsel Yanıkkaya

9 ay önce

Microsoft, dev ölçekte üretim ortamına yönelik ilk kümesini duyurdu. NVIDIA’nın GB300 “Blackwell Ultra” GPU’ları, artık Azure’da büyük yapay zeka modelleri için hazır.

Azure, NVIDIA GB300 “Blackwell Ultra” ile Yüzlerce Trilyon Parametreli Modelleri Hedefliyor

Azure, Blackwell Ultra yükseltmesini aldı. Yeni büyük ölçekli üretim kümesi, NVIDIA’nın GB300 NVL72 mimarisine dayalı 4.600’den fazla GPU’yu bir araya getiriyor. Hepsi yeni nesil InfiniBand omurgasıyla bağlı. Bu kurulum, Microsoft’un dünyadaki veri merkezlerinde yüz binlerce Blackwell Ultra GPU’yu devreye almasının önünü açıyor. Amaç tek: Yapay zeka iş yükleri.

Microsoft’a göre bu altyapı, eğitim sürelerini aylardan haftalara indiriyor ve yüzlerce trilyon parametreli modellerin eğitimini mümkün kılıyor. NVIDIA’nın çıkarım tarafındaki gücü de MLPerf ve InferenceMAX testlerinde defalarca gösterildi. Microsoft Azure ekibi, 9 Ekim 2025’te kümenin yayında olduğunu duyurdu.

The world's first large-scale @nvidia GB300 NVL72 supercomputing cluster for AI workloads is now live on Microsoft Azure.

The deployment connects 4,600+ NVIDIA Blackwell Ultra GPUs using next-gen InfiniBand network—built to train and deploy advanced AI models faster than… pic.twitter.com/CmmDtcrlwn
— Microsoft Azure (@Azure) October 9, 2025

ND GB300 v6: Akıl Yürütme, Ajan Tabanlı ve Çok Modlu Üretken Yapay Zeka için

Yeni Microsoft Azure ND GB300 v6 sanal makineleri; akıl yürütme odaklı modeller, ajan tabanlı sistemler ve çok modlu üretken yapay zeka iş yükleri için optimize edildi. Her rafta toplam 18 VM bulunuyor ve her VM’de 72 GPU yer alıyor. Öne çıkan teknik noktalar:

72 adet NVIDIA Blackwell Ultra GPU (toplamda 36 NVIDIA Grace CPU eşleşmesi).
Yeni nesil NVIDIA Quantum‑X800 InfiniBand ile GPU başına 800 Gbit/sn raflar arası ölçekleme bant genişliği.
Raf içinde 130 TB/sn NVIDIA NVLink bant genişliği.
Toplam 37 TB hızlı bellek.
FP4 Tensor çekirdeklerinde 1.440 PFLOPS’a kadar hesaplama gücü.

Raf düzeyinde NVLink ve NVSwitch, bellek ve bant genişliği darboğazlarını azaltıyor. 130 TB/sn’lik bağlantı ve 37 TB hızlı bellek sayesinde daha büyük modellerde ve uzun bağlam pencerelerinde daha yüksek çıkarım verimi ve düşük gecikme sağlanıyor. Raf ötesinde ise tam fat‑tree, engellemesiz bir topoloji ve Quantum‑X800 InfiniBand ile on binlerce GPU’ya verimli ölçekleme hedefleniyor. NVIDIA SHARP gibi özellikler, toplu işlemleri anahtarlarda hızlandırarak bant genişliğini fiilen ikiye katlıyor; bu da senkronizasyon maliyetini düşürüp GPU kullanımını artırıyor.

Azure’un gelişmiş soğutma tasarımı, yoğun ve yüksek performanslı kümelerde su kullanımını azaltırken termal kararlılığı koruyor. Yeni güç dağıtım modelleri de ND GB300 v6 sınıfı GPU kümelerinin yüksek enerji yoğunluğu ve dinamik yük dengeleme ihtiyaçlarını karşılamak için devreye alınıyor.

NVIDIA, Azure iş birliğini ABD’nin yapay zeka yarışındaki liderlik iddiasını güçlendiren bir adım olarak görüyor. Yeni Azure sanal makineleri ise kullanıma açık durumda.

Kaynak: wccftech.com