Bugün Türk yapay zekâ ekosistemi için gerçekten önemli bir dönüm noktasına şahit olduk. VNGRS ekibi, ülkemizin sıfırdan eğitilmiş ilk büyük dil modelini (LLM) tanıttı: Kumru LLM!
Performans olarak henüz LLaMA-3 veya Gemma kadar güçlü olmasa da, bu model bizim için tarihi bir adım. Çünkü tamamen Türkçe verilerle, sıfırdan eğitilmiş bir modelden söz ediyoruz.
Kumru LLM Teknik Özellikleri
Parametre Sayısı: 7.4 milyar (7.4B)
Model Tipi: Decoder-only (Mistral-v0.3 mimarisi, LLaMA-3 ile eşdeğer)
Eğitim Verisi: 500 GB temizlenmiş veri (~300 milyar token)
Eğitim Süresi: 45 gün
Türkçe Tokenizer: Özel RegEx ve multiturn sohbet desteği
Bağlam Uzunluğu: 8.192 token (~20 A4 sayfası)
Donanım Gereksinimi: RTX A4000 veya RTX 3090 (16GB VRAM) üzerinde çalışabiliyor
Açık Kaynak Sürüm: Kumru-2B (mobil cihazlarda dahi çalışabiliyor)
Benchmark: LLaMA-3.3–70B, Gemma-3–27B, Qwen-2–72B gibi modelleri bazı Türkçe testlerde geride bırakmış!