Google, açık ağırlıklı yeni Gemma 4 ailesini tanıttı. Dört seçenek var: E2B, E4B, 26B Mixture of Experts ve 31B Dense. Tümü Apache 2.0 lisansıyla geliyor; yani geliştiriciler ticari ürünlere serbestçe entegre edebilir, özelleştirebilir ve dağıtabilir.
Gemma 4’ün küçük modelleri E2B ve E4B, telefonlar ve IoT cihazlarında tamamen çevrimdışı çalışacak şekilde optimize edilmiş. Android tarafında AICore Developer Preview ile bugün denemek mümkün; Qualcomm ve MediaTek hızlandırıcıları destekleniyor. Arm’ın paylaştığı örneklerde de, sahne betimleme gibi görevler ağ bağlantısı olmadan doğrudan cihazda yapılıyor. TechSpot da modellerin internetsiz telefonda çalışabildiğini özellikle vurguluyor.
Masaüstü ve iş istasyonlarına yönelik 26B MoE ve 31B Dense, kuantize edilmemiş bfloat16 ağırlıklarla tek bir 80 GB NVIDIA H100’te çalışacak şekilde ayarlanmış. Kuantize sürümler tüketici GPU’larında yerel çalıştırılabiliyor; IDE’ler, kod yardımcıları ve ajan iş akışları için hedefleniyor.
Google’a göre 31B model, Arena AI metin liderlik tablosunda açık modeller arasında şu anda 3., 26B ise 6. sırada. Aile genelinde görüntü ve video işleme, E2B/E4B’de 128K, büyük modellerde 256K bağlam penceresi ve 140+ dil desteği öne çıkıyor.
Modelleri Hugging Face, Kaggle ve Ollama üzerinden indirebilir; AI Studio üzerinden de hızla deneyebilirsiniz.
Kaynak: www.techspot.com