OpenAI, Metin Okuyabilen ve Sesleri Taklit Edebilen Yeni Ses Modeli Tanıttı

Techolay’ı Google’da tercih edilen kaynak olarak ekleyin

Teknoloji haberlerimizi Google’da daha sık görmek için Techolay’ı tercih edilen kaynaklarınıza ekleyin.

Yapay zeka alanında öncü şirketlerden biri olan OpenAI, metin okuyabilen ve belirli ses tonlarını birebir taklit edebilen yeni bir ses teknolojisi üzerinde çalıştığını duyurdu. Bu yeni özellik yapay zekanın konuşma sesi üretimi konusundaki sınırlarını zorlayarak, deepfake risklerinin artmasına neden olabilecek bir gelişme olarak değerlendiriliyor.

Şirket “Voice Engine” adı verilen bu ses dönüşüm modelinin ilk test sonuçlarını ve kullanım alanlarını paylaştı. Ancak güvenlik endişeleri nedeniyle bu özellik henüz kullanıma sunulmadı. OpenAI, bu teknolojinin tanıtımını sınırlı bir geliştirici grubuyla paylaşarak geri bildirim toplama yolunu seçti.

We're sharing our learnings from a small-scale preview of Voice Engine, a model which uses text input and a single 15-second audio sample to generate natural-sounding speech that closely resembles the original speaker. https://t.co/yLsfGaVtrZ
— OpenAI (@OpenAI) March 29, 2024

OpenAI tarafından yapılan açıklamada, insan sesinin taklit edilmesinin ciddi riskler taşıdığına dikkat çekildi. Özellikle seçim yılında bu tür teknolojilerin kullanımının oluşturabileceği riskler göz önünde bulundurularak, ABD ve uluslararası ortaklarla iş birliği içinde geliştirme sürecinin yürütüldüğü belirtildi.

Daha önce yapay zeka teknolojileri bazı durumlarda ses taklitlerinin yapılmasında kullanılmıştı. Örneğin, ABD Başkanı Joe Biden’ın sesi gibi duyulan ancak tamamen yapay zeka tarafından üretilmiş sahte bir telefon görüşmesi, New Hampshire’da seçmenleri oy kullanmama konusunda yanıltmaya çalışmıştı.

OpenAI’ın yeni ses motoru, kişinin konuşma biçimini ve entonasyonunu taklit edebiliyor. Model bunun için yalnızca 15 saniyelik bir ses kaydına ihtiyaç duyuyor. Norman Prince Nörobilim Enstitüsü gibi OpenAI’nin geliştirici ortakları, bu teknolojiyi hastaların seslerini geri kazanmalarına yardımcı olmak için kullanıyor. Örneğin bir beyin tümörü nedeniyle konuşma yeteneğini kaybeden genç bir hastanın sesi, daha önceki bir okul projesinde kaydedilen ses kaydı kullanılarak yeniden oluşturuldu.

Ses modelleri, üretilen sesleri farklı dillere çevirebilme özelliğine de sahip, bu da özellikle sesli içerik üreten firmalar için büyük bir avantaj sağlıyor. Spotify gibi şirketler, bu teknolojiyi halihazırda pilot programlarında kullanmakta.

OpenAI, bu teknolojinin geniş çapta yayılması öncesinde farklı tip uzmanlardan geri bildirim toplamaya devam ediyor. Şirket ayrıca ses tabanlı güvenlik doğrulama önlemlerinin kaldırılması ve yapay zeka tarafından üretilen sahte içeriklere karşı toplumsal bilincin artırılması gerektiğini vurguluyor.

Arşiv

OpenAI, Metin Okuyabilen ve Sesleri Taklit Edebilen Yeni Ses Modeli Tanıttı

Alakalı Konular

Burak Birinci

Yanıtı iptal et

Arşiv

Alakalı Konular

Sizin İçin Önerilerimiz