Today, we’re announcing Gemini 2.0, our most capable AI model yet.
Gemini 2.0'ın Temel Özellikleri:
- Çok Modalite (Multimodalite): Metin, kod, görüntü ve sesi aynı anda anlayabilme ve işleyebilme yeteneği.
- Yerel Görüntü ve Ses Üretimi: Metinden görüntüye (text-to-image) ve metinden sese (text-to-speech) dönüştürme gibi işlemleri yerel olarak gerçekleştirebilme. Bu, modelin daha yaratıcı ve etkileyici içerikler oluşturmasına olanak tanır.
- Tool Kullanımı: API'ler ve diğer tool'lar aracılığıyla dış sistemlerle etkileşim kurabilme. Bu sayede bilgi arama, randevu ayarlama veya e-posta gönderme gibi gerçek dünya görevlerini yerine getirebilir.
- Geliştirilmiş Performans: Önceki Gemini modellerine göre muhakeme, kodlama ve çok dilli anlama gibi alanlarda önemli ölçüde daha yüksek performans.
Tanıtımda Project Astra'dan bahsediliyor. Project Astra, yapay zeka temelli asistan anlayışı konusunda evrensel bir kullanım getirecek.
Astra, telefonunuzun kamerası aracılığıyla gerçek zamanlı olarak nesneleri ve senaryoları tanıyıp etkileşime girebilir. Örneğin, kamerayı bir bitkiye doğrulttuğunuzda, Astra size bitkinin türü ve bakımı hakkında bilgi verebilir.
Astra, ortamdaki değişikliklere dinamik olarak uyum sağlar. Örneğin, bir sahneden nesneler eklendiğinde veya çıkarıldığında, Astra çıktısını buna göre ayarlar.
Project Astra'nın Potansiyel Kullanım Alanları:
- Günlük Yaşamda Yardım: Alışveriş yaparken ürünleri karşılaştırma, seyahat ederken yerleri tanıma, yemek yaparken tariflere erişme gibi konularda yardımcı olabilir.
- Eğitim: Öğrencilere görsel materyallerle etkileşim kurarak öğrenme deneyimlerini zenginleştirebilir.
- Erişilebilirlik: Görme engelli bireylerin çevrelerini daha iyi anlamalarına yardımcı olabilir.
Bunun yanında Project Mariner isimli Chrome uzantısıyla Edge'deki Copilot misali işler yapabileceksiniz ama daha akıllı. Örneğin bir tablo resmi gösterip bunu yapabilmem için hangi eşyalara ihtiyacım var derseniz size tek tek gösterecektir.
Gemini 2.0 Flash Experimental sürüm olarak şu anda ücretsiz kullanıcılara dahi açık. Gemini 2.0 Flash, Google'ın blog yazısına göre Gemini 1.5 Pro'yu bile geride bırakıyor.
Ayrıca livebench.ai sitesine göre OpenAI'ın GPT-4o sürümünü bile geride bırakıyor. (reddit'ten alınma)
Konuya ek olarak AI Studio'da kullanılabilen 1206-exp sürümü ise çok akıllı. Ona da bakabilirsiniz. GPT-o1 sürümüne çok yakın performans veriyor.