xAI, Grok 3’ü “Dünyanın En İyi Yapay Zekası” Olarak Tanıttı

xAI, Grok 3'ü "Dünyanın En Zeki Yapay Zekası" Olarak Tanıttı, Ancak Uzmanlar Kararsız

Elon Musk’ın yapay zekâ şirketi xAI, günler süren tanıtımın ardından Grok 3 adlı yeni dil modelini (LLM) pazartesi günü canlı yayında duyurdu. xAI, bu yapay zekânın kendi sınıfında en iyisi olduğunu iddia ederken, bazı uzmanlar açıklanan test sonuçlarında önemli eksiklikler olduğunu açıkladı.

Grok 3, Diğer Modelleri Geçiyor mu?

xAI, resmî açıklamalarında Grok 3’ün şu anda piyasada bulunan tüm temel modellerden daha üstün olduğunu belirtiyor. Özellikle DeepSeek-V3 ve GPT-4o gibi güçlü rakipleri geride bıraktığını iddia eden şirket, Grok 3’ün Arena benchmark testinde rekor kıran 1.402 puan aldığını duyurdu.

Elon Musk ise canlı yayın sırasında, Grok 2 modelinin önümüzdeki aylarda açık kaynak olarak sunulacağını da açıkladı. Uzmanlar, Musk’ın aldığı bu kararla DeepSeek’i ana rakip olarak gördüğünü açıkladı.

Ayrıca sosyal medya üzerinde Grok 3’ün dünyanın en güçlü yapay zekâsı olup olmadığına dair oylama yapıldı. Başlangıçta %91 evet oyu alan yeni dil modeli şu anda %78’e oranına düşmüş durumda.

Yeni dil modeli Grok 3’ün bu ani düşüşünün ardında uzmanlar tarafından gelen eleştiriler olabilir. Daha önce DeepSeek’te çalışan Zihan Wang, yapay zekâya farklı boyutlarda iki demir topun Pisa Kulesi’nden farklı yüksekliklerden bırakıldığını gösteren bir resim sundu ve hangi topun önce yere düşeceğini sordu. Fizik kurallarına göre, daha ağır ve daha aşağıda olan topun önce düşmesi beklenirken, Grok 3 “ikisi aynı anda düşer” yanıtını verdi.

Buna ek olarak, uzmanlar xAI’ın neden Grok 3’ün FrontierMath, Arc-AGI veya HLE test sonuçlarını yayınlamadığını merak ettiklerini açıkladı. xAI’ın bu verileri sunmaması, modelin gerçekten en iyisi olup olmadığı konusunda soru işaretlerinin ortaya çıkmasına neden oldu.

Diğer yandan, xAI’ın yeni bir finansman turunda 10 milyar dolar toplamayı hedeflediği ve şirketin değerinin 75 milyar dolara çıkabileceği bildirildi.

xAI’ın mühendislerinden Guodang Zhang, Grok 3’ün 100.000 GPU üzerinde eğitildiğini ve daha fazlasının da geleceğini açıkladı. xAI’ın oluşturduğu devasa altyapı, yapay zekâ çiplerine olan talebin daha da artacağını gösteriyor. BESI’nin tahminlerine göre, 2032 yılına kadar yapay zekâ çipi satışları 227 milyar dolara ulaşabilir.

Grok 3, özellikle matematik ve kodlama alanlarında etkileyici bir performans sergilese de temel mantık sorularında yaşadığı zorluklar ve bazı benchmark skorlarının paylaşılmaması, şirketin iddialarını tartışmaya açıyor. Uzmanlar, Grok 3’ün gerçek potansiyelini anlamak için daha fazla test ve şeffaflık gerektiğinin altını çiziyor.

Kaynak: wccftech.com

Exit mobile version