Çinli yapay zeka firması DeepSeek, “DeepSeek R2” adını verdikleri yeni modellerini yakında piyasaya sürecek gibi görünüyor. İnternete sızdırılan bilgilerle bu yeni model hakkında ipuçları ortaya çıkmaya başladı.
DeepSeek R2, Yapay Zeka Endüstrisini Sarsabilir
DeepSeek’in ilk modeli olan R1, Çin’in yüksek teknolojili yapay zeka modellerinde geri kalmadığını tüm dünyaya göstermişti. Hatta bu sürpriz, ABD borsalarında büyük bir değer kaybına yol açmıştı. Aynı zamanda yapay zeka modelleri geliştirme maliyetlerinin, OpenAI gibi şirketlerin iddia ettiğinden daha düşük olabileceği de ortaya koyuldu. Şimdi ise Çin medyasında DeepSeek’in yeni R2 modeliyle ilgili söylentiler dolaşıyor. Batı pazarları, tekrar sürpriz bir gelişmeyle karşı karşıya kalabilir.
Henüz resmi bir açıklama olmasa da DeepSeek R2’nin gelişmiş bir MoE (Uzman Karışımı) mimarisi kullanacağı söyleniyor. Bu, daha gelişmiş yönlendirme mekanizmaları veya yoğun katmanların bir kombinasyonu anlamına gelebilir. R2’nin, R1’in iki katı olarak 1.2 trilyon parametreye sahip olacağı belirtiliyor.
Bu özellikleriyle R2’nin, GPT-4 Turbo ve Google Gemini 2.0 Pro ile rekabet edebileceği söyleniyor. Dahası DeepSeek R2 ile token başına maliyetlerin GPT-4’e göre %97.4 daha düşük olacağı, komut başına 0.07$ ve çıktı başına 0.27$ olarak fiyatlandırılacağı ifade ediliyor. Bu sayede işletmeler için en uygun maliyetli alternatif sunulabilir.
DeepSeek R2’nin bir diğer ilgi çekici yanı, Huawei’nin Ascend 910B çiplerinin %82 kullanım oranını yakalaması. Bu, DeepSeek’in kendi kaynaklarını kullanarak “dikey entegrasyon” sağlaması anlamına geliyor.
Sonuç olarak DeepSeek R2 ile ilgili gelişmelerin henüz kesinlik kazanmamış olduğunu hatırlatmak önemli. Ancak gelen haberlere göre bu yeni model, ana akım yapay zeka firmalarını bir kez daha şaşırtabilir.
Kaynak: wccftech.com