Elon Musk’ın yapay zeka şirketi xAI, en son nesil yapay zeka modeli Grok 2’yi nihayet piyasaya sürdü. Hem xAI hem de firmanın kurucusu olan Musk’ın Tesla ve X’teki hisseleri, şirketin ürünlerine talep yaratmasına ve yapay zeka modellerini eğitmek için gereken pahalı bilgisayar kaynaklarını kullanmasına olanak tanıdı.
Piyasada Grok’un haricinde; Amazon’un desteklediği Anthropic’in Claude’u, Microsoft’un desteklediği OpenAI’nin ChatGPT’si, Facebook’un da sahibi olan Meta’nın Llama’sı ve Google’ın Gemini’si de dünya çapında önde gelen yapay zeka yazılımları arasında yer alıyor. Bu ürünlerin hepsi genel tüketici ve kurumsal kullanım için yapay zeka özellikleri sunarken, Grok 2’nin piyasaya sürülmesi de her iki kullanımı kapsıyor.
xAI, OpenAI’nin GPT 4’ü ve Amazon’un Claude’u Üzerinde Büyük Performans Avantajı İddiasıyla Grok 2 ve Grok 2 Mini’yi Piyasaya Sürdü
xAI’nin son Grok sürümü, hem kullanıcıların Musk’ın X sosyal medya platformunda erişebileceği erken bir Grok 2 önizlemesi hem de Grok 2 mini modelini içeriyor. UC Berkley’in Büyük Model Sistemleri Organizasyonu’nun (LMSYS) yapay zeka kriterlerinde test edilen Grok 2, OpenAI’nin GPT-4o modeline meydan okuyor.
LMSYS’ye göre, Grok 2 matematik ve kodlamada ikinci, zor yönlendirmelere cevap verme yeteneğinde ise üçüncü sırada yer aldı ve genel liderlik tablosunda üçüncü sıraya yerleşti. Grok 2’nin önünde ChatGPT 4.0 ve Google’ın Gemini 1.5 Pro modelleri bulunuyor.
xAI’nin kendi verileri, Grok 2’nin GPT 4 Turbo’dan daha iyi performans sergilediğini ve GPT 4o’dan ise çok az bir farkla geride kaldığını gösteriyor. Ancak OpenAI’nin ChatGPT-4o’su, LMSYS ELO puanı 1,314 sayesinde performans kralı olmaya devam ediyor. xAI’nin erken versiyonu olan Grok 2 ise 1,281 puan alırken, Gemini 1.5 Pro ortalama 1,297 puana sahip.
Sohbet botu performansına geldiğimizde Grok 2’nin “kazanma oranı” açısından Gemini 1.5 Pro’nun gerisinde kaldığı görülüyor. Grok, Google’ın yapay zekasına karşı yüzde 48 kazanma oranına sahip. xAI verilerinde, OpenAI’nin kullanıcıların resimler yüklemesine ve yapay zekanın da buna dayalı yanıtlar üretmesine olanak sağlayan modeli ChatGPT 4o için karşılaştırmalı rakamlar paylaşılmıyor.
Doğruluk düzeyinin iyileştirilmesi, xAI’nin Grok 2’nin performansını artırdığını iddia ettiği bir diğer önemli alan. Eski yapay zeka modelleri, yanlış bilgiler verme nedeniyle eleştirilmişti ve şirket içi Yapay Zeka Eğitmenleri, Grok 2 ve Grok 2 mini için önceki sürümün %50 kazanma oranına kıyasla doğrulukta sırasıyla %62.9 ve %59.6 oranında kazanma oranı verdi – bu durum önemli bir iyileşme gösteriyor.
xAI, modelin X’teki verileri kullandığını ve Grok 2’nin “metin ve görsel anlayışında ileri düzey yetenekler” sunduğunu belirtiyor. Diğer yapay zeka ürünleri gibi, Grok 2 mini genel tüketici kullanımı için yazma, kodlama veya metin yönlendirme yanıtları oluşturma gibi özellikleri destekleyecek şekilde tasarlanmış.
xAI, Grok 2 ve Grok 2 mini’nin bu ayın sonuna kadar geliştiricilere kurumsal kullanım için sunulacağını paylaşıyor. API, dünya çapında düşük gecikmeli erişim için “çok bölgeli çıkarım dağıtımları” ve zorunlu çok faktörlü kimlik doğrulama, faturalandırma için veri analitiği, trafik analizi ve dahili iş sistemleriyle entegrasyon gibi özellikler sunuyor.
Kaynak: wccftech.com