Microsoft, uzun formlu konuşma tanıma alanında öne çıkan VibeVoice-ASR modelini açık kaynak olarak yayınladı. Model, 60 dakikaya kadar kesintisiz ses kaydını parçalara bölmeden, bağlam kaybı yaşamadan ve kimin ne zaman ne söylediğini tek geçişte çıkarabiliyor. VibeVoice-ASR, Uzun Formdaki Sesleri Analiz Ederek Konuşmacı, Zaman ve İçeriği Tek Çıktıda Sunuyor VibeVoice-ASR’ın en dikkat çekici özelliği, geleneksel ASR…