Columbia Engineering ekibi, insansı bir robot yüzüne gerçekçi dudak senkronu öğretmeyi başardı. EMO adı verilen yüz, önce aynada kendini izleyerek, ardından YouTube’daki konuşma ve şarkı videolarını seyrederek insanlara yakın dudak hareketleri geliştirdi. Çalışma 14 Ocak 2026’da Science Robotics’te yayımlandı. Bu ilerleme, robot yüzlerinin “tekinsiz vadi” etkisini azaltmayı hedefliyor.
EMO, yumuşak ve esnek bir yüz kaplaması ile 26 bağımsız motoru bir araya getiriyor. Bu sayede dudak, çene ve yanakları ince ayarla hareket ettirebiliyor; konuşmada ve şarkı söylemede gerekli ağız şekillerini üretebiliyor. Proje, yüz animasyonunu sesle aynı anda ve akıcı biçimde yakalamaya odaklanıyor.
EMO nasıl öğrendi?
- Önce ayna karşısında kendi yüzünü keşfetti: Rastgele ifadeler üreterek hangi motorun hangi yüz şekline karşılık geldiğini öğrendi. Ekip bu süreci “vision-to-action language model (VLA)” olarak tanımlıyor.
- Ardından YouTube’da insanların konuşma ve şarkı söylerken dudaklarını nasıl hareket ettirdiğini izledi. Bu gözlemsel veriyi kullanarak, ses dalgasını doğrudan motor komutlarına çevirmeyi öğrendi.
Sonuçta EMO, çeşitli dillerdeki kısa ifadeleri senkron biçimde “ağzıyla” söyleyebildi ve hatta AI ile üretilen “hello world_” adlı ilk albümünden bir parçaya eşlik etti. Araştırmacılar, özellikle “B” gibi sert patlamalı seslerde ve “W” gibi büzülen dudak formlarında hâlâ zorlandığını, ancak insanlarla etkileşim arttıkça performansın iyileştiğini vurguluyor.
Neden önemli?
Yüz yüze konuşurken dikkatin büyük bölümü dudak hareketlerine kayıyor. Robotlarda yürüyüş ve kavrama gibi konularda ciddi ilerleme görülse de, yüzün konuşmayla uyumlu ve canlı görünmesi hâlâ zorlu bir alan. EMO’nun yaklaşımı, hazır kural setleri yerine gözlemle öğrenme ve esnek donanımı birleştirerek bu boşluğu dolduruyor.
Ekip, dudak senkronunun ChatGPT veya Gemini gibi sohbet yapay zekâlarıyla birleştiğinde, insan–robot etkileşimine bambaşka bir derinlik katacağını söylüyor. Eğitim, sağlık ve yaşlı bakımı gibi alanlarda sıcak ve güven veren yüz ifadelerinin kritik olacağı görüşündeler. Bazı ekonomistlerin önümüzdeki on yılda çok sayıda insansı robotun üretime gireceğini öngördüğüne de dikkat çekiliyor.
Kısacası EMO, robotların yürümeyi ve eşyaları tutmayı öğrendiği bir dönemde, “yüz”ün de konuşmayla uyumlu ve ikna edici biçimde çalışabileceğini gösteriyor. Bu da evde, sınıfta veya hastanede yanımızda olacak makinelerin daha doğal görünmesine giden yolu açıyor.
Kaynak: www.techspot.com