- Katılım
- 22 Aralık 2023
- Mesajlar
- 1.143
- Makaleler
- 2
- Çözümler
- 6
- Beğeniler
- 1.102
Merhaba arkadaşlar,
Bugün Türk yapay zekâ ekosistemi için gerçekten önemli bir dönüm noktasına şahit olduk.
VNGRS ekibi, ülkemizin sıfırdan eğitilmiş ilk büyük dil modelini (LLM) tanıttı: Kumru LLM!
Performans olarak henüz LLaMA-3 veya Gemma kadar güçlü olmasa da, bu model bizim için tarihi bir adım. Çünkü tamamen Türkçe verilerle, sıfırdan eğitilmiş bir modelden söz ediyoruz.
Kumru LLM Teknik Özellikleri
Bugün Türk yapay zekâ ekosistemi için gerçekten önemli bir dönüm noktasına şahit olduk.
VNGRS ekibi, ülkemizin sıfırdan eğitilmiş ilk büyük dil modelini (LLM) tanıttı: Kumru LLM!
Performans olarak henüz LLaMA-3 veya Gemma kadar güçlü olmasa da, bu model bizim için tarihi bir adım. Çünkü tamamen Türkçe verilerle, sıfırdan eğitilmiş bir modelden söz ediyoruz.
- Parametre Sayısı: 7.4 milyar (7.4B)
- Model Tipi: Decoder-only (Mistral-v0.3 mimarisi, LLaMA-3 ile eşdeğer)
- Eğitim Verisi: 500 GB temizlenmiş veri (~300 milyar token)
- Eğitim Süresi: 45 gün
- Türkçe Tokenizer: Özel RegEx ve multiturn sohbet desteği
- Bağlam Uzunluğu: 8.192 token (~20 A4 sayfası)
- Donanım Gereksinimi: RTX A4000 veya RTX 3090 (16GB VRAM) üzerinde çalışabiliyor
- Açık Kaynak Sürüm: Kumru-2B (mobil cihazlarda dahi çalışabiliyor)
- Benchmark: LLaMA-3.3–70B, Gemma-3–27B, Qwen-2–72B gibi modelleri bazı Türkçe testlerde geride bırakmış!