Google ve DeepMind, yapay zeka alanında yeni bir çığır açan Gemini 1.5 isimli modeli tanıttı. Gemini 1.5, metin, ses, görüntü, video ve kod gibi farklı veri türlerini işleyebilen çok modlu bir yapay zeka modeli. Model, verilen bir girdideki bilgi miktarını artırabilen uzun bağlam penceresi özelliğine sahip. Bu sayede, model daha tutarlı, ilgili ve yararlı çıktılar üretebiliyor.
Gemini 1.5, Google ve DeepMind'ın önceki modeli Gemini 1.0'un üzerine inşa edilmiş. Gemini 1.0, geçen ay Google ürünlerinde kullanılmaya başlanmıştı. Gemini 1.5, Gemini 1.0'dan daha verimli, daha hızlı ve daha güvenli bir model. Modelin mimarisi, uzmanlık alanlarına göre ayrılmış küçük sinir ağlarından oluşan Mixture-of-Experts (MoE) tekniğine dayanıyor. Bu teknik, modelin sadece en alakalı uzman yollarını aktive etmesini sağlayarak modelin verimliliğini artırıyor.
Gemini 1.5, bu uzun bağlam penceresi sayesinde çok karmaşık görevleri yerine getirebiliyor. Örneğin, model, Apollo 11'in ay görevinin 402 sayfalık transkriptini analiz edip, konuşmalar, olaylar ve detaylar hakkında akıl yürütebiliyor. Ya da, sessiz bir Buster Keaton filmi olan 44 dakikalık “The General” filmini izleyip, filmdeki çeşitli olay noktalarını ve küçük detayları tespit edebiliyor. Ayrıca, model, 100 bin satırlık kod içeren bir girdi verildiğinde, kodun nasıl çalıştığını açıklayabiliyor, sorunları çözebiliyor ve iyileştirmeler öneriyor.
Gemini 1.5, Google ve DeepMind'ın yapay zeka ilkeleri ve güvenlik politikaları doğrultusunda geliştirilmiş. Model, etik ve güvenlik testlerinden geçirilmiş ve olası zararları önlemek için kırmızı takım teknikleri kullanılmış. Model, bugünden itibaren sınırlı bir ön izleme ile geliştiriciler ve kurumsal müşteriler için AI Studio ve Vertex AI üzerinden erişilebilir olacak. Modelin fiyatlandırması, standart 128 bin Token bağlam penceresinden başlayıp, 1 milyon Token'e kadar ölçeklenecek şekilde belirlenecek. Modelin tam sürümü ise hazır olduğunda geniş bir kullanıma sunulacak.
Gemini 1.5'in yetenekleri ve nasıl çalıştığı hakkında daha fazla bilgi edinmek için buraya tıklayın.
Kendi yorumum:
Abi bu manyak bir şey! Her ne kadar 1 milyon token özelliğini kullanamayacak olsam da heyecanlıyım! Google, Bard'ı piyasaya sürdüğünde bayağı tepki görmüştü. Ama cidden büyük atılımlar atıyor. Gemini, cidden AI olayında büyük bir adım! Senaristlerin işine de göz koymuş durumda yani.
Son düzenleyen: Moderatör: