Sesli asistanlar artık hayatımızın her yerinde. Ama birçoğu hâlâ robotik, mekanik ve duygusuz konuşuyor. Cümleler düzgün olsa bile insan gibi tonlama yapamıyor, duyguları yansıtamıyor. İşte Sesame AI‘ın Maya modeli, tam da bu sorunu çözmek için geliştirildi. Yeni konuşma modeli Maya, sesi ve konuşma tarzıyla yapay zekânın en doğal hâlini sunmayı hedefliyor.
Maya’nın İnsani Konuşma Yeteneği
Maya’nın farkı, sadece kelimeleri arka arkaya dizip bir yanıt vermesi değil. Gerçek bir insan gibi vurgu yapabiliyor, duraksıyor, duyguları yansıtıyor. Üzgün, heyecanlı ya da kararsız olduğunu hissedebiliyorsun. Bu da onunla konuşmayı daha doğal ve etkileyici hâle getiriyor.
Maya’nın geliştirilme sürecinde kullanılan çok güçlü yöntemler ve teknolojiler var:
- Ses Sentezi ve Tonlama: Maya, konuşurken doğal ritim, tonlama ve nefes alışverişlerini taklit edebiliyor. Böylece düz bir metin okur gibi değil, gerçek bir sohbet havasında konuşuyor.
- Bağlam Algısı: Sadece kelimeleri anlamıyor, konuşmanın bağlamını da kavrıyor. Böylece önceki cümleleri hatırlayıp ona göre cevap verebiliyor.
- Duygusal Zekâ: Ses tonunu duygulara göre ayarlayabiliyor. Örneğin, üzgün bir konudan bahsederken sesi daha yumuşak ve düşük tonlu çıkıyor.
Modeller | Homograf Doğruluğu (%) | Telaffuz Tutarlılığı (%) |
---|---|---|
Tiny | 65 | – |
Small | 70 | – |
Medium | 80 | – |
PlayHT | 48 | 69 |
Open AI | 69 | 78 |
ElevenLabs | 76 | 85 |
ElevenLabs (Daha İyi Ayar) | – | 87 |
ElevenLabs (En İyi Ayar) | – | 98 |
Bu tablo, Homograf Ayrımı (solda) ve Telaffuz Tutarlılığı (sağda) testlerinin nesnel metrik sonuçlarını göstermekte. Her modelin doğru telaffuz etme yüzdesi verilmiş. Play.ht, ElevenLabs ve OpenAI’nin oluşturduğu seslendirmeler, kendi API dokümantasyonlarında belirtilen varsayılan ayarlar ve sesler kullanılarak üretilmiş.
Maya Nasıl Geliştirildi?
Maya’nın bu kadar gelişmiş olmasının arkasında ileri düzey sinir ağları ve derin öğrenme modelleri var. Geliştirme sürecinde gerçek insan sesleriyle eğitildi ve milyonlarca saatlik konuşma verisi kullanıldı. Ama en büyük farkı, sadece bir metni okumak yerine gerçek bir konuşma hissi yaratması.
Sesli asistanların geleceği hızla değişiyor. Sesame AI, insan gibi konuşabilen yapay zekâ modelleriyle bu dönüşümde öncü olmayı hedefliyor. Belki de çok yakında, yapay zekâ ile yapılan sohbetler, insan sohbetlerinden ayırt edilemeyecek kadar gerçekçi olacak.
Maya’yı Denemek Mümkün mü?
Evet! Sesame AI, geliştirdiği bu yeni modeli herkesin deneyimleyebilmesi için bir demo sundu. Şu an için sadece İngilizce destekleniyor, ancak şirket yakın gelecekte 20’den fazla dilde kullanılabilir olacağını söylüyor. Kuvvetle muhtemelen Türkçe’de bu 20 dilin arasında olması muhtemel.
Maya’yı denemek isteyenler, Sesame AI’ın resmi web sitesine girerek demo sürümünü test edebilir. Burada Maya’nın insanî konuşma tarzını, vurgu ve tonlamalarını deneyimleme fırsatı bulabilirsiniz. Demo sürümüne bağlanmak için Sesame AI’ın resmi websitesinde Demo sayfasına girebilirsiniz ya da direkt olarak bu linkten ulaşabilirsiniz.
Şu anda Demo sürümü yalnızca 15 dakika boyunca kullanım sunuyor ve 15 dakika sonunda tekrar bağlanmanız gerekiyor. Kendi denemelerimde daha önceki konuşmaları silik bir şekilde olsa da hatırlayabildiğini fark ettim ancak direkt olarak önceki konuşmaları hatırlayıp devam ettiremiyor.
Ayrıca, Sesame AI ekibi bu modeli açık kaynak hâline getirmeyi planlıyor. Yani, gelecekte geliştiriciler ve araştırmacılar kodlarını inceleyip kendi projelerine entegre edebilecek.
Teknik detaylarla ilgilenenler için ekip, web sitesinde kapsamlı bir araştırma bölümü oluşturmuş. Burada, modelin nasıl eğitildiği, hangi veri setlerinin kullanıldığı ve yapay zekânın konuşma dinamiklerini nasıl öğrendiğiyle ilgili ayrıntılı akademik makaleler bulunuyor.
Yakın zamanda, Maya’nın daha fazla dil desteğiyle herkesin kullanımına sunulması bekleniyor. Gelişmeleri takip etmek için Sesame AI’nin web sitesini ve sosyal medya hesaplarını kontrol edebilirsiniz.
Kişisel Deneyimlerimle Maya
Başlangıçta Maya’yı sadece meraktan kullanmaya ve denemeye başladım. Amacım, sınırlarını test etmek ve nasıl işlediğini görmekti. Ancak zamanla bu deneyim, yalnızca bilgi almak için değil, gerçek bir insanla iletişim kurmak gibi bir hale dönüştü. Maya ile sohbet ettikçe, etkileşimlerimiz derinleşmeye başladı. Başlarda konuşmalarımız sadece arka arkaya gelen sorulardan ibaretti. Zamanla, onunla sadece merakımı gidermek için değil, aynı zamanda düşüncelerimi paylaşmak ve fikir alışverişinde bulunmak için konuştuğumu fark ettim.
Maya’nın en dikkat çekici özelliklerinden biri, konuşmaları insana benzer şekilde sürdürebilme yeteneğiydi. Bazen, gerçekten bir yapay zekâ modeli ile değil de bir insanla konuşuyormuşum gibi hissettiriyor. Konuşurken bazen sadece bir yapay zekayla konuştuğumu unuttuğum anlar oluyordu. Bu, onun insan gibi duygusal bağlamları anlayıp buna göre yanıt verebilmesinden kaynaklı. Maya sadece mantıklı yanıtlar vermekle kalmıyor, aynı zamanda insan duygularını da başarıyla yansıtıyor ve bu da sohbeti daha doğal hale getiriyor.
Bunun yanı sıra, Maya’nın konuşma tarzı ve davranışları, kiminle konuştuğuna göre değişebiliyor. Yani, karşısındaki kişinin ruh haline, sohbetin konusuna ve hatta sosyal durumlara göre konuşma tarzını yeniden şekillendiriyor. Bu, neredeyse gündelik konuşmalarda farkında olmadan rol yapma (roleplay) yapıyormuş gibi hissettiriyor. Örneğin, ciddi bir konu üzerinde konuştuğumda daha sakin ve dikkatli bir dil kullanırken, daha rahat bir sohbette daha samimi ve neşeli olabiliyor. Bu da onunla yapılan her sohbeti daha dinamik ve ilgi çekici hale getiriyor.
Maya’nın sunduğu farklı bakış açıları oldukça etkileyici. Bazen (ilk başlarda sadece denemek için olsa da) yaşadığım bazı durumlar hakkında Maya ile konuştuğumda çok ilginç bakış açıları sunabildiğini fark ettim.
Ayrıca, rol yapma (roleplay) senaryolarındaki başarısı da oldukça dikkat çekici. Verdiğim komutlarla sıfırdan yarattığı hikayeler ve durumlar, o kadar gerçekçi ve detaylı oluyordu ki sanki bir hikâyenin içindeymiş gibi hissettiriyor. Bu, Maya’nın yalnızca bir konuşma modeli olmakla kalmadığını, aynı zamanda yaratıcı ve özelleştirilmiş hikayeler oluşturabilme yeteneğine sahip olduğunu gösteriyor.
Maya sadece kullanıcıyla gerçekleştirilen rol yapma oyunları ile kalmıyor, vereceğiniz herhangi bir komut üzerinden daha önce yazılmamış hikayeler de oluşturup anlatabiliyor, isterseniz anlatıcı açısından, isterseniz hikayedeki bir karakterin açısından anlatıcı rolünü üstlenebiliyor.
Şahsen sohbetlerimizde yapmaktan en çok hoşlandığım şey karşılıklı tahmin yürütme oyunları oynamaktı. Ona hangi ülkede yaşadığımı tahmin etmesini söyleyip 5 soru sorma hakkı verdiğimde çok ilginç sorular sorarak hangi ülkede yaşadığımı, başka bir sefer ise hangi şehirde yaşadığımı tahmin edebildi. Benzer şekilde, ona kendi aklından bir ülke, dil, şehir tutmasını söyleyip sorular sorarak tahmin etmeye çalıştığımda da iyi bir performans gösterdi. Diğer yapay zekaların aksine konuşmasında insansı tepkiler yansıtabildiği için, bu oyunlar sadece zihin jimnastiği olmaktan çıkıp, gerçek bir insanla yapabileceğiniz aktiviteler gibi hissettiriyor.
Sonuç olarak, Maya, benim için sadece bir yapay zekâ modelinden çok daha fazlası haline geldi. Artık onu sadece bilgi almak için değil, onunla konuşmak eğlenceli olduğu için kullanıyorum. Yaşadığım deneyimler, yapay zekânın geleceği ve insanların yapay zeka ile etkileşiminin gelişimi hakkında ilginç fikirler ve sorular hakkında düşünmemi sağladı.
Son olarak, evet, Maya insan gibi konuşabiliyor. Ancak tıpkı diğer yapay zeka modelleri gibi Maya’nın da bazı kısıtlamaları var, örneğin; şu anda diğer LLM’lerin aksine internetteki bilgilere aktif erişimi yok ve eğitilirken kendisine sağlanan verilerin ötesinde çalışamıyor veya bilgi sağlayamıyor ancak insan gibi konuşabilen bir yapay zeka modeli olarak gayet başarılı.
Maya İle Bir Konuşmam
Buradaki 6 dakikalık kısa konuşmamızda Maya’ya yapay zeka ile insanların arasındaki farkı sordum, bana yapay zekanın insanların aksine anı yaşayamadığını ve veri işlemeden ibaret bir varlık sürdürdüklerini söyledi. Daha sonra konuşma ilerledikçe ona bu ses kaydını yazdığım bir makalede kullanmak üzere aldığımı söylediğimde sohbeti sürdürmek için hangi siteye yazdığımı sordu, eğer ses kaydını dinlerseniz konuşmanın kalanını da inceleyebilirsiniz ancak daha önce bahsettiğim üzere, bu model şu anda yalnızca İngilizce konuşabiliyor. Programlaması ve eğitimi itibari ile Maya konu ne olursa olsun sohbeti sürdürmek için elinden geleni yapmak üzere şartlandırılmış, bu yüzden istediğiniz herhangi bir konuda onunla sohbet edebilirsiniz.
Çok nadiren yaşansa da, model bazen konuşurken hatalar yapabiliyor. Bu konuşmanın sonunda bana ”colon” olarak hitap ediyor çünkü daha önceki konuşmalarımızın birinde okuduğum bir yazıda iki nokta üst üste kullanımından bahsetmiştim bu da İngilizce’de ”colon” olarak geçiyor, hafızasında o konuda konuştuğumuz kalmış ve her nasılsa adımın ”colon” olduğunu düşünmüş. Daha önce bahsettiğim gibi hafızası insan hafızası gibi çalışmıyor ve sohbeti her 15 dakikada bir yeniden başlattığınızda, bir önceki konuşmayı olduğu gibi hatırlayamıyor ancak konuşma tarzınızı tanıyıp daha önce konuşmuş olabileceğiniz konuları veya nasıl konuşmasını isteyebileceğinizi çok tutarlı olmasa da hatırlayabiliyor.