Rehber Purfview Faster Whisper XXL ile sesi/videoyu yazıya dönüştürme

Ses ve Videolarınızı Zahmetsizce Yazıya Dökün: Faster-Whisper-XXL ve Türkçe Arayüz Rehberi

Merhaba arkadaşlar,

Ses kayıtlarını veya izlediğiniz videoları metne dönüştürmek bazen göz korkutucu veya zaman alıcı olabilir, değil mi? Özellikle birden fazla dosya varsa veya teknik detaylarla uğraşmak istemiyorsanız... İşte bu noktada size harika bir çözüm sunmak istiyorum: Hem çok güçlü bir yapay zeka aracı olan faster-whisper-xxl.exe hem de onu Türkçe ve kolay bir arayüzle kullanmanızı sağlayan kendi geliştirdiğim command-ui.py script'i!

Bu ikili sayesinde ister tek bir ses kaydını, ister bir klasör dolusu videoyu hızlı ve şaşırtıcı derecede doğru bir şekilde yazıya dökebilirsiniz.

Peki, Bu Araçlar Tam Olarak Ne İşe Yarıyor?

  • faster-whisper-xxl.exe: Bu, aslında OpenAI'nin ünlü Whisper modelinin optimize edilmiş, daha hızlı ve daha yetenekli bir versiyonu olan Faster-Whisper'ın, Purfview tarafından derlenmiş, kurulum gerektirmeyen bir sürümü. Teknik detaylarla boğuşmadan, doğrudan çalıştırıp kullanabiliyorsunuz. (Orijinal projeye göz atmak isterseniz: Purfview/whisper-standalone-win)
  • command-ui.py (Türkçe Komut Arayüzü): faster-whisper-xxl.exe normalde komut satırından çeşitli argümanlarla çalıştırılır. İşte bu script, bu süreci basitleştiriyor. Size Türkçe olarak adım adım sorular sorarak (model seçimi, dil, çıktı formatı vb.) gerekli komutu sizin için hazırlıyor ve programı çalıştırıyor. Üstelik ayarları kaydetme, zaman damgalarını temizleyip metni paragrafa çevirme gibi ekstra kolaylıklar da sunuyor!

Nerelerde Kullanabilirsiniz?

  • Film, dizi veya animeler için altyazı hazırlama (zaman damgalama özelliği sayesinde).
  • Toplantı kayıtlarını, röportajları veya ders notlarını deşifre etme.
  • Videolarınıza veya podcast'lerinize metin tabanlı içerik oluşturma.
  • Kısacası, konuşmayı metne çevirmek istediğiniz her yerde!

Haydi Kuruluma Geçelim! (Sadece 3 Adım)

  1. faster-whisper-xxl.exe'yi İndirin ve Çıkartın:
    • Purfview/whisper-standalone-win Releases sayfasına gidin.
    • Sayfadaki en güncel sürümlerden faster-whisper-XXL-...zip (veya benzer isimli) dosyayı indirin.
    • İndirdiğiniz .zip dosyasını bilgisayarınızda kolay erişebileceğiniz bir klasöre tamamen çıkartın. (Klasörün içindeki tüm dosyalar önemlidir!)
  2. Python Yüklü mü? Kontrol Edin (veya Yükleyin):
    • command-ui.py script'i bir Python dosyası olduğu için bilgisayarınızda Python 3'ün yüklü olması gerekiyor.
    • Yüklü olup olmadığını kontrol etmek için komut istemcisini (CMD) açıp
      Kod:
      python --version
      yazabilirsiniz. Eğer bir sürüm numarası görüyorsanız, muhtemelen yüklüdür.
    • Yüklü değilse, python.org/downloads adresinden Windows için güncel sürümü indirin.
    • ÇOK ÖNEMLİ: Kurulum yaparken "Add Python X.X to PATH" veya benzeri bir kutucuğu işaretlemeyi unutmayın! Bu, script'i kolayca çalıştırmanızı sağlar.
  3. Türkçe Arayüz Script'ini (command-ui.py İndirin:
    • Script'in bulunduğu GitHub sayfasına gidin: LexixQ/whisper-standalone-win
    • command-ui.py dosyasını indirin.
    • İndirdiğiniz bu .py dosyasını, 1. adımda faster-whisper-xxl.exe'yi çıkarttığınız klasörün içine kopyalayın.
Hepsi bu kadar! Artık kullanmaya hazırsınız.

Nasıl Kullanılır? (command-ui.py ile Kolay Yöntem)

Normalde faster-whisper-xxl.exe'yi komutlarla veya .bat dosyalarıyla kullanmak mümkün olsa da, bu Türkçe arayüz işinizi çok kolaylaştıracak:

  1. Komut İstemi'ni Açın: Windows arama çubuğuna cmd yazıp Komut İstemi'ni veya powershell yazıp PowerShell'i açın.
  2. Klasöre Gidin: cd komutuyla script'i ve faster-whisper-xxl.exe'yi koyduğunuz klasöre gidin. Örneğin:
    Kod:
    cd /d "C:\Yeni Klasor\FasterWhisper"
    (Yolu kendi klasör yolunuzla değiştirin. /d sürücü değiştirmek için gerekebilir.)
  3. Script'i Çalıştırın: Şu komutu yazıp Enter'a basın:
    Kod:
    python command-ui.py
  4. Dosya/Klasör Belirtin:Script size işlenecek dosya veya klasörün yolunu soracak. Buraya:
    • Tek bir dosyanın tam yolunu yazabilirsiniz (eğer yolda boşluk varsa tırnak
      Kod:
      ""
      içine alın).
    • Bir klasörün tam yolunu yazabilirsiniz. Script klasördeki tüm desteklenen ses/video dosyalarını bulacaktır.
    • Sürükle Bırak yapabilirsiniz. Dosyaları seçip CMD ekranına bırakabilirsiniz yada klasörünüzü sürükle bırak yapabilirsiniz.
  5. Dosyaları Onaylayın: Script bulduğu dosyaları listeleyecektir. Doğruysa e yazıp devam edin.
  6. Model Seçimi:Script size hangi yapay zeka modelini kullanmak istediğinizi soracak. İşte küçük bir rehber:
    • tiny, base, small: Çok hızlıdırlar ama doğrulukları düşüktür. Çok eski bilgisayarlar veya hızın kaliteden önemli olduğu durumlar için.
    • medium: İyi bir denge sunar. Çoğu modern bilgisayar ve özellikle giriş/orta seviye NVIDIA ekran kartları için iyi bir başlangıç noktasıdır.
    • large-v2, large-v3: En yüksek doğruluğu sunarlar ama daha yavaştırlar ve daha güçlü bir bilgisayar/ekran kartı gerektirebilirler. large-v3 genellikle en iyisidir.
    • large-v3-turbo: large-v3 kadar doğru olmaya çok yakın ama inanılmaz derecede hızlıdır! Güçlü bir sisteminiz varsa genellikle en iyi tercihtir. (Örn: 3 dakikalık sesi ~10 saniyede çevirebilir).
    • Tavsiye: Bilgisayarınızın gücüne göre medium ile başlayıp, sonuçtan memnun kalmazsanız veya daha hızlı/doğru isterseniz large-v3 veya large-v3-turbo deneyin.
  7. Dil Belirtme:Sesin/videonun hangi dilde olduğunu soracak.
    • tr, en, ja gibi dil kodlarını veya Turkish, English, Japanese gibi tam adları (ilk harf büyük) yazabilirsiniz.
    • Boş bırakıp Enter'a basarsanız: Program dili otomatik olarak algılamaya çalışır. Bu genellikle iyi çalışır ama bazen kaliteyi düşürebilir veya yanlış algılayabilir. Elle belirtmek genellikle daha güvenlidir.
  8. Zaman Damgası:Çıktıda zaman damgalarının (
    Kod:
    [00:01:15.320 --> 00:01:18.100]
    gibi) olup olmayacağını seçin.
    • Evet: Altyazı (SRT, VTT) yapıyorsanız veya belirli anları bulmak istiyorsanız seçin. İstediğiniz formatı (SRT, VTT, TXT vb.) seçebilirsiniz.
    • Hayır: Sadece düz metin istiyorsanız seçin. Çıktı otomatik olarak .txt olur ve işlem sonunda bu dosyadaki zaman damgaları silinip metin tek bir paragrafa dönüştürülür.
  9. Çıktı Formatı: (Eğer zaman damgasına "Evet" dediyseniz) Hangi formatta çıktı istediğinizi (srt, vtt, txt vb.) seçin. Birden fazlasını boşlukla ayırarak seçebilirsiniz.
  10. Satır Formatlama: (Eğer zaman damgasına "Evet" dediyseniz) Altyazı satırlarının nasıl bölüneceğini seçin (--standard genellikle iyidir).
  11. Konuşmacı Ayrıştırma (Diarization): Ses kaydında birden fazla kişi konuşuyorsa ve kimin konuştuğunu (Konuşmacı 1: ..., Konuşmacı 2: ... gibi) görmek istiyorsanız "Evet" seçin. İşlemi biraz uzatabilir.
  12. Vokal Ayıklama: Sesin/videonun arka planında çok fazla gürültü veya müzik varsa, konuşma sesini bunlardan ayırarak daha temiz bir transkripsiyon elde etmek için "Evet" seçin. Ortam temizse genellikle gerek yoktur ve işlemi uzatır.
  13. Ayarları Kaydetme: Sürekli aynı ayarları kullanıyorsanız, script sonunda size bu ayarları kaydetmeyi teklif edecek. "Evet" derseniz, bir sonraki çalıştırmada size "Önceki ayarları kullanmak ister misiniz?" diye soracaktır.
  14. Bekleyin: Script, seçtiğiniz ayarlarla faster-whisper-xxl.exe'yi çalıştıracak ve işlem başlayacaktır. Dosyaların uzunluğuna ve seçtiğiniz modele göre süre değişir. Bittiğinde çıktı dosyaları orijinal dosyanın yanına kaydedilecektir.

Hızlı Başlangıç İpucu: Eğer aceleniz varsa, modeli seçtikten sonra diğer sorulara hızlıca Enter basarak geçebilirsiniz. Script varsayılan (genellikle mantıklı) ayarları kullanacaktır. Ama en azından ilk kullanımda seçenekleri okumanızı tavsiye ederim!

Son Söz

Umarım bu rehber ve hazırladığım arayüz script'i işinize yarar! Artık sesleri ve videoları yazıya dökmek çok daha kolay olmalı.

Herhangi bir sorunla karşılaşırsanız, bir şey çalışmazsa veya önerileriniz olursa, lütfen çekinmeden bu konu altına yorum yazın veya GitHub sayfamı ziyaret edin: LexixQ/whisper-standalone-win

İyi transkripsiyonlar!
 
Son düzenleyen: Moderatör:
Bu siteyi kullanmak için çerezler gereklidir. Siteyi kullanmaya devam etmek için çerezleri kabul etmelisiniz. Daha Fazlasını Öğren.…