- Katılım
- 6 Aralık 2023
- Mesajlar
- 13.322
- Makaleler
- 5
- Çözümler
- 3
- Beğeniler
- 4.775
Microsoft, uzun formlu konuşma tanıma alanında öne çıkan VibeVoice-ASR modelini açık kaynak olarak yayınladı. Model, 60 dakikaya kadar kesintisiz ses kaydını parçalara bölmeden, bağlam kaybı yaşamadan ve kimin ne zaman ne söylediğini tek geçişte çıkarabiliyor. VibeVoice-ASR, Uzun Formdaki Sesleri Analiz Ederek Konuşmacı, Zaman ve İçeriği Tek Çıktıda Sunuyor VibeVoice-ASR’ın en dikkat çekici özelliği, geleneksel ASR…
Devamını Oku: Microsoft, Sesleri Çözümleyen VibeVoice-ASR Modelini Açık Kaynak Yaptı
Kaynak: Techolay