NVIDIA, yeni nesil Blackwell GPU’larının MLPerf v4.1 yapay zeka eğitim testlerindeki performans sonuçlarını paylaştı. Şirket, Blackwell’in önceki Hopper serisine kıyasla yapay zeka iş yüklerinde 2.2 kat performans artışı sağladığını belirtti.
Ağustos ayında Blackwell çipler, MLPerf v4.1 yapay zeka çıkarım testlerinde güçlü performans artışlarıyla piyasaya sürülmüş ve önceki nesil Hopper çiplere göre üstünlük sağlamıştı. NVIDIA, Blackwell’in bu iş yüklerindeki kıyaslama sonuçlarını paylaşarak yeni nesil çiplerin etkileyici performansını bir kez daha gözler önüne serdi.
NVIDIA, yapay zeka segmentindeki hesaplama talebinin hızla arttığını belirtiyor. Bu artış, hem hızlandırılmış eğitim hem de çıkarım yeteneklerinin geliştirilmesini gerektiriyor. Birkaç ay önce çıkarım iş yükleri test edilmişti; şimdi ise aynı iş yüklerini kapsayan eğitim testlerine odaklanılıyor:
- Llama 2 70B (LLM İnce Ayar)
- Stable Diffusion (Metinden Görsele)
- DLRMv2 (Önerici Sistem)
- BERT (NLP)
- RetinaNet (Nesne Algılama)
- GPT-3 175B (LLM Ön Eğitim)
- R-GAT (Grafik Sinir Ağı)
Yapay zeka eğitim performansını değerlendirmek için en popüler ve çeşitli kullanım senaryolarını kapsayan bu iş yükleri, MLPerf 4.1 testlerinde analiz ediliyor. Testler, eğitim süresini dakika cinsinden yansıtarak gerekli değerlendirmeyi sağlıyor.
NVIDIA, şimdiye kadar Hopper H100 GPU’larını kullanarak yapay zeka eğitiminde önemli bir performans artışı sağladı. Şirketin ilk sunumundan bu yana H100, LLM (Büyük Dil Modeli) ön eğitiminde GPU başına 1.3 kat daha hızlı hâle geldi ve her kıyaslamada mevcut çipler arasında en yüksek performansı sundu. Şirket, MLPerf için en büyük ölçekteki sunumunu 11.616 Hopper H100 GPU ile gerçekleştirdi. Bu çipler, veri merkezi ölçeğinde NVLink, NVSwitch, ConnectX-7 SuperNIC ve Quantum-X400 IB anahtarlarıyla birlikte kullanılıyor.
Hopper, CUDA yazılım optimizasyonları sayesinde önemli bir gelişme gösterdi. Bu iyileştirmelerle birlikte GPU, HGX A100’e kıyasla 6 kat daha hızlı hâle geldi ve Haziran 2023’teki HGX H100 sunumuna göre GPT-3 (175B Eğitim) üzerinde 512 GPU kullanarak %70 daha yüksek performans elde etti.
Önceki Hopper çıkarım kıyaslamalarına göre ise Llama 3.1’de 1.9 kat, GH200 NVL32 ile TTFT’de 3 kat ve Llama 3.1 405B’yi kullanarak 1.5 kat veri artışı sağlandı.
Yeni çiplerin; özellikle de Blackwell’in rekabeti geride bırakmasının bir nedeni var. Nyx AI süper bilgisayar, NVIDIA DGX B200 kullanılarak inşa edildi ve bu sistem, her hızlandırıcı başına rekor performans kaydı yaptı. Blackwell, Hopper H100’e kıyasla Llama 2 70B (İnce Ayar) üzerinde 2.2; GPT-3 175B (Ön Eğitim) üzerinde ise 2 kat daha hızlı performans sergiliyor. Ayrıca MLPerf 4.1 iş yüklerinde de Hopper’ı geride bırakıyor.
NVIDIA, bu hamleleriyle sadece çip üreten bir şirket olmadığını aynı zamanda ölçeklenebilir veri merkezi çözümleri ve sistem sağlayıcısı olduğunu da vurguluyor.
Şirket, öte yandan Blackwell Ultra’nın ardından gelecek nesil yapay zeka yol haritasını paylaştı. Yeni platform, 288 GB HBM3e bellek ile 2025’te daha fazla hesaplama gücü sunacak. Blackwell Ultra’nın B300 adıyla piyasaya sürülmesi bekleniyor. 2026’da standart versiyon, 2027’de ise 8S HBM4 ve 12S HBM4 versiyonlarıyla Rubin platformu tanıtılacak. NVIDIA, ayrıca Blackwell’in tam kitle üretim aşamasına geçtiğini de duyurdu.
Kaynak: wccftech.com