DeepSeek’in FlashMLA Projesi, NVIDIA H800 GPU’lardan Maksimum Performans Alınmasını Sağlıyor

Çin, NVIDIA’nın “kısıtlanmış” yapay zekâ hızlandırıcılarına bir alternatif arayışında gibi görünüyor. DeepSeek’in yeni projesi, Hopper H800 AI hızlandırıcıları sayesinde TFLOPS değerlerini sekiz kat artırıyor.

DeepSeek, FlashMLA Projesi ile Yazılımsal Performans Artışı Hedefliyor

Çin, donanım kapasitelerini artırmak için bağımsız bir yaklaşım benimsemişe benziyor. DeepSeek gibi Çinli şirketler, sahip oldukları ekipmanlarla yazılımın gücünü kullanarak çözümler bulmak için son sürat çalışıyor. DeepSeek tarafında yaşanan son gelişmeler, piyasadaki en heyecan verici yeniliklerden biri olarak öne çıkıyor. Firma, NVIDIA’nın ABD tarafından kısıtlanmış Hopper H800 GPU’larından önemli bir performans elde etmeyi başardıklarını; bunun da bellek tüketiminin optimize edilmesi ve kaynak tahsisinin iyileştirilmesiyle gerçekleştiğini duyurdu.

FlashMLA projesi, verimliliğiyle dikkat çekiyor. Üretimde olan bu “kod çözme çekirdeği”, özellikle NVIDIA’nın Hopper GPU’ları için tasarlandı. Firma, Hopper H800 üzerinde BF16 matris çarpımı için 580 TFLOPS elde ettiklerini belirtirken bu rakamın, sektör standartlarının yaklaşık sekiz katına denk geldiğini söylüyor. Buna ek olarak FlashMLA, bellek kullanımı açısından da verimlilik sağlıyor. Bellek bant genişliği, 3000 GB/s’e kadar ulaşıyor ki bu da H800’ün teorik zirvesinin iki katı bir değer. Üstelik tüm bu etkileyici sonuçlar, donanımsal yükseltmeler gerektirmeden yalnızca kod ile elde ediliyor.

Verileri daha hızlı işleyebilmek ve bellek tüketimini %40-60 oranında azaltmak için “düşük sıralı anahtar – değer sıkıştırma” kullanan FlashMLA, ayrıca görev yoğunluğuna göre dinamik olarak bellek tahsis eden blok tabanlı sayfalama sistemini kullanarak performansı artırıyor.

DeepSeek‘in bu gelişmesi, AI hesaplamalarının sadece bir faktöre bağımlı olmadığını; tam tersine daha çeşitli olduğunu gösteriyor. Bu teknoloji, şu an için yalnızca Hopper GPU’lara özel görünüyor. İleride FlashMLA’nın H100 ile nasıl bir performans sergileyeceği ise merak konusu.

Kaynak: wccftech.com

Exit mobile version