NVIDIA, GeForce RTX GPU ve RTX AI PC serisinin yapay zeka performansını önemli ölçüde artıran yeni R555 sürücü güncellemesini yayınladı.
NVIDIA, RTX GPU ve RTX AI PC’lerin Yapay Zeka Performansını Sürücü Güncellemesi ile Hızlandırıyor
NVIDIA, Microsoft Build etkinliğinde RTX platformu için heyecan verici yeni güncellemeleri duyurdu. Bu güncellemeler; GeForce RTX GPU’lar, iş istasyonları ve kişisel bilgisayarların yapay zeka performansını optimize ediyor.
Yapılan yeni optimizasyonlar, özellikle Üretken Yapay Zeka (Generative AI) uygulamalarını destekleyen Büyük Dil Modelleri (LLM) gibi gelişmiş yapay zeka sistemlerini hedef alıyor. Yeni R555 sürücüleri sayesinde NVIDIA’nın RTX GPU’ları ve RTX AI PC platformları, ONNX Runtime (ORT) ve DirectML araçlarıyla birlikte çalışarak önceki sürümlere göre üç kat daha hızlı yapay zeka performansı sunuyor.
Ek olarak makine öğrenimi modellerini çalıştırmak için tasarlanmış bir web aracı olan WebNN’nin RTX teknolojisi ile hızlandırılmasını sağlayarak web geliştiricilerine, yeni yapay zeka modellerini daha hızlı ve etkin bir şekilde dağıtmaları için güçlü bir araç sunuyor. Öte yandan Microsoft’un popüler yapay zeka kütüphanesi PyTorch’a getirilen DirectML desteği ile NVIDIA’nın RTX GPU’ları daha da güçlendiriliyor.
Aşağıda yeni R555 sürücülerinin sunduğu özelliklerin listesi yer alıyor:
- DQ-GEMM Meta Komutu Desteği: Büyük Dil Modelleri (LLM) için geliştirilmiş, INT4 salt ağırlık nicelemesini işleyebilen yeni bir komut. Bu, yapay zeka modellerinin daha hızlı ve verimli çalışmasını sağlar.
- Yeni RMSNorm Normalleştirme Yöntemleri: Llama 2, Llama 3, Mistral ve Phi-3 modelleri için geliştirilmiş normalleştirme yöntemleri. Bu yöntemler, modelin daha stabil ve etkili bir şekilde öğrenmesine yardımcı olur.
- Grup ve Çoklu Sorgu Dikkat Mekanizmaları: Mistral modeli için geliştirilmiş, grup ve çoklu sorguları destekleyen dikkat mekanizmaları. Bu, modelin farklı veri noktalarına odaklanmasını ve daha iyi sonuçlar üretmesini sağlar.
- Yerinde KV Güncellemeleri: Dikkat mekanizmasının performansını artırmak için anahtar-değer (KV) çiftlerinin yerinde güncellenmesi. Bu, modelin daha hızlı ve etkili bir şekilde bilgi işlemesine olanak tanır.
- 8’li Olmayan Tensörler için GEMM Desteği: Bağlam aşamasında performansı artırmak için, 8’li olmayan tensörlerin genel matris çarpımı (GEMM) desteği. Bu, tensörlerin daha esnek bir şekilde işlenmesini ve modelin daha hızlı çalışmasını sağlar.
Microsoft’un üretken yapay zeka için geliştirdiği ORT uzantısının performans testlerinde NVIDIA’nın yeni teknolojileri, dikkat çekici sonuçlar sergiliyor. Hem INT4 hem de FP16 veri türlerinde yapılan testlerde NVIDIA’nın ürünleri, genel bir performans artışı gösteriyor. Özellikle Phi-3, Llama 3, Gemma ve Mistral gibi Büyük Dil Modelleri (LLM) için yapılan optimizasyonlar sayesinde bu modellerin performansı 3 katına kadar iyileşiyor.
Bu geliştirmelerin yanı sıra şirket, özellikle tüketici yapay zeka bilgisayarları için geliştirdiği güçlü TensorRT ve TensorRT-LLM paketleri ile sektörde öncü bir rol üstleniyor. Bu paketler, yapay zeka uygulamalarının daha hızlı ve verimli çalışmasını sağlayarak kullanıcı deneyimini iyileştiriyor. Ayrıca NVIDIA’nın GPU’larında yer alan Tensor Çekirdekleri gibi özel yapay zeka donanımları, çeşitli yapay zeka çözümlerinin desteklenmesine olanak tanıyor.
Bu yapay zeka çözümlerinin arasında DLSS Super Resolution teknolojisi, NVIDIA ACE, RTX Remix, Omniverse, Broadcast, RTX Video ve birçok teknoloji yer alıyor. NVIDIA’nın GPU’ları, 1300 TOPS’a kadar yapay zeka işlem gücü sunarak bu yıl piyasaya sürülecek olan ve yalnızca 100 TOPS’a ulaşması beklenen en hızlı çiplerden çok daha önde. Ayrıca yeni RTX AI bilgisayarlar en yeni NVIDIA RTX GPU’larla donatılmış olarak gelecek ve RTX AI PC platformunu daha da güçlendirerek tüketici alanında yapay zekayı ileriye taşımayı hedefliyor.
Kaynak: wccftech.com