Katılım
6 Aralık 2023
Mesajlar
13.322
Makaleler
5
Çözümler
3
Beğeniler
4.775
microsoft-vibe-voice.png

Microsoft, uzun formlu konuşma tanıma alanında öne çıkan VibeVoice-ASR modelini açık kaynak olarak yayınladı. Model, 60 dakikaya kadar kesintisiz ses kaydını parçalara bölmeden, bağlam kaybı yaşamadan ve kimin ne zaman ne söylediğini tek geçişte çıkarabiliyor. VibeVoice-ASR, Uzun Formdaki Sesleri Analiz Ederek Konuşmacı, Zaman ve İçeriği Tek Çıktıda Sunuyor VibeVoice-ASR’ın en dikkat çekici özelliği, geleneksel ASR…

Devamını Oku: Microsoft, Sesleri Çözümleyen VibeVoice-ASR Modelini Açık Kaynak Yaptı
Kaynak: Techolay