xAI, Grok 3’ü “Dünyanın En İyi Yapay Zekası” Olarak Tanıttı

Gürkan K.

1 yıl önce

xAI, Grok 3'ü "Dünyanın En Zeki Yapay Zekası" Olarak Tanıttı, Ancak Uzmanlar Kararsız

Elon Musk’ın yapay zekâ şirketi xAI, günler süren tanıtımın ardından Grok 3 adlı yeni dil modelini (LLM) pazartesi günü canlı yayında duyurdu. xAI, bu yapay zekânın kendi sınıfında en iyisi olduğunu iddia ederken, bazı uzmanlar açıklanan test sonuçlarında önemli eksiklikler olduğunu açıkladı.

Grok 3, Diğer Modelleri Geçiyor mu?

xAI, resmî açıklamalarında Grok 3’ün şu anda piyasada bulunan tüm temel modellerden daha üstün olduğunu belirtiyor. Özellikle DeepSeek-V3 ve GPT-4o gibi güçlü rakipleri geride bıraktığını iddia eden şirket, Grok 3’ün Arena benchmark testinde rekor kıran 1.402 puan aldığını duyurdu.

xAI beat expectations

seems like Grok 3 is the most powerful AI in the world pic.twitter.com/OtO6rGD22e
— Manifold (@ManifoldMarkets) February 18, 2025

Elon Musk ise canlı yayın sırasında, Grok 2 modelinin önümüzdeki aylarda açık kaynak olarak sunulacağını da açıkladı. Uzmanlar, Musk’ın aldığı bu kararla DeepSeek’i ana rakip olarak gördüğünü açıkladı.

xAI's new 'Grok 3' model (released last night) beats all other publicly-released foundational models (including DeepSeek-V3 & GPT-4o) in math, science & coding benchmarks. pic.twitter.com/iB6KuDPsdc
— Stock Talk (@stocktalkweekly) February 18, 2025

Ayrıca sosyal medya üzerinde Grok 3’ün dünyanın en güçlü yapay zekâsı olup olmadığına dair oylama yapıldı. Başlangıçta %91 evet oyu alan yeni dil modeli şu anda %78’e oranına düşmüş durumda.

I guess Grok3 is a genius who doesn't bother to spend time on these simple questions pic.twitter.com/DhBDBYXw3X
— Zihan Wang – on RAGEN (@wzihanw) February 18, 2025

Yeni dil modeli Grok 3’ün bu ani düşüşünün ardında uzmanlar tarafından gelen eleştiriler olabilir. Daha önce DeepSeek’te çalışan Zihan Wang, yapay zekâya farklı boyutlarda iki demir topun Pisa Kulesi’nden farklı yüksekliklerden bırakıldığını gösteren bir resim sundu ve hangi topun önce yere düşeceğini sordu. Fizik kurallarına göre, daha ağır ve daha aşağıda olan topun önce düşmesi beklenirken, Grok 3 “ikisi aynı anda düşer” yanıtını verdi.

I guess Grok3 is a genius who doesn't bother to spend time on these simple questions pic.twitter.com/DhBDBYXw3X
— Zihan Wang – on RAGEN (@wzihanw) February 18, 2025

Buna ek olarak, uzmanlar xAI’ın neden Grok 3’ün FrontierMath, Arc-AGI veya HLE test sonuçlarını yayınlamadığını merak ettiklerini açıkladı. xAI’ın bu verileri sunmaması, modelin gerçekten en iyisi olup olmadığı konusunda soru işaretlerinin ortaya çıkmasına neden oldu.

Diğer yandan, xAI’ın yeni bir finansman turunda 10 milyar dolar toplamayı hedeflediği ve şirketin değerinin 75 milyar dolara çıkabileceği bildirildi.

We were barely able to train at 10k early last year, but we got 100k training non-stop for Grok3. So proud, more to come!
— Guodong Zhang (@Guodzh) February 18, 2025

xAI’ın mühendislerinden Guodang Zhang, Grok 3’ün 100.000 GPU üzerinde eğitildiğini ve daha fazlasının da geleceğini açıkladı. xAI’ın oluşturduğu devasa altyapı, yapay zekâ çiplerine olan talebin daha da artacağını gösteriyor. BESI’nin tahminlerine göre, 2032 yılına kadar yapay zekâ çipi satışları 227 milyar dolara ulaşabilir.

Grok 3, özellikle matematik ve kodlama alanlarında etkileyici bir performans sergilese de temel mantık sorularında yaşadığı zorluklar ve bazı benchmark skorlarının paylaşılmaması, şirketin iddialarını tartışmaya açıyor. Uzmanlar, Grok 3’ün gerçek potansiyelini anlamak için daha fazla test ve şeffaflık gerektiğinin altını çiziyor.

Kaynak: wccftech.com