Cllscar567

Uzman
Katılım
20 Ekim 2024
Mesajlar
20
Beğeniler
9
1740733718457.webp


Yapay zeka modellerinin görsel tanıma kabiliyetlerini ölçmek için kullandığım basit testlerden biri. Modellerin şu anki durumlarında verdiği cevaplar:

GPT-4.5 Preview 2025-02-27 Hesaplayamadı ve tahmin yürütmedi.
Grok 3 Tahmini 1000 TL.
Grok 3 Thinking Tahmini 500 TL.
Claude 3.7 Sonnet Hesaplayamadı ve tahmin yürütmedi.
Gemini 2.0 Flash Thinking Experimental Tahmini 200 TL.
o3-mini Tahmini 70–80 TL.
GPT-4o-2024-11-20 Hesaplayamadı ve tahmin yürütmedi.
 
Son düzenleyen: Moderatör:
Ben bu yapay zeka araçlarına kendim göremediğim bir emojiyi bulmalarını istemiştim. Emojiye iyice baktım, gerçekten yoktu ancak hepsi de, şurada var, burada var gibi salladılar. Yani görsel sayma ve görme yetileri şu an iyi değil.
 
Eki Görüntüle 128716

Yapay zeka modellerinin görsel tanıma kabiliyetlerini ölçmek için kullandığım basit testlerden biri. Modellerin şu anki durumlarında verdiği cevaplar:

GPT-4.5 Preview 2025-02-27 Hesaplayamadı ve tahmin yürütmedi.
Grok 3 Tahmini 1000 TL.
Grok 3 Thinking Tahmini 500 TL.
Claude 3.7 Sonnet Hesaplayamadı ve tahmin yürütmedi.
Gemini 2.0 Flash Thinking Experimental Tahmini 200 TL.
o3-mini Tahmini 70–80 TL.
GPT-4o-2024-11-20 Hesaplayamadı ve tahmin yürütmedi.
QwenChat'in "Qwen2.5-VL-72B-Instruct" modeli ile fotoğrafı tanıttıktan sonra, "Qwen2.5-Max" modeli ile iş birliği yaptırdım ve sonuç "Thinking (QwQ)" modunda 225 TL çıktı.
 
o4-minİ, Gemini 2.5 ve gpt-4.1'e de sorduğumda ilk başta tahmin yürütmek istemediler. Israr ettiğimde şu tahminleri verdiler:

o4-mini: 80–100 TL arasında olduğunu tahmin etti.
Gemini 2.5 Pro Experimental: 500 TL ile 1000 TL arasında
GPT-4.1: 80 ila 100 TL arası