Black Plague

Uzman
Katılım
9 Aralık 2024
Mesajlar
923
Makaleler
11
Çözümler
3
Beğeniler
687
Yer
Inside of Time
Selamlar. Bu rehberde Wikipedia’nın statik HTML dump’larını kullanarak cihazımda nasıl yerel bir Wikipedia kopyası oluşturabilirsiniz bunu anlatacağım. Bu yöntem sadece metin ve temel tasarım içeren hafif bir kurulum içindir. Tam medya (resim/video) içeren kurulumlar için Kiwix kullanabilirsiniz; Kiwix ile boyutlar GB’lar hatta TB’lar seviyesine çıkabiliyor. Ya da manuel olarak resimleri indirebilirsiniz ama bu biraz zahmetli.



Dosyaları indirme​


Wikipedia dump’ları resmi olarak Wikimedia tarafından paylaşılıyor:


Ben genellikle current (güncel) klasöründeki Türkçe statik HTML paketini indiriyorum:

- Current Türkçe statik HTML:
https://dumps.wikimedia.org/other/static_html_dumps/current/tr/

İndirilecek dosyanın adı: wikipedia-tr-html.tar.7z. Bu dosya sıkıştırılmış halde yaklaşık 300 MB, çıkarıldığında ise yaklaşık 6 GB yer kaplıyor ve içinde 100.000+ HTML makale bulunuyor.


Dosyayı çıkartmak​


Windows için 7-Zip veya macOS için The Unarchiver kullanabilirsiniz. Dosya çıkartıldıktan sonra tüm makaleler hazır hale geliyor ve yerel sunucuya taşımaya uygun duruma geliyor.



Dosya yapısı ve içerik​


Çıkartma sonrası klasör içinde her makale ayrı bir .html dosyası olarak yer alır. Genelde bir kök dizin ve içindeki kategori/başlık hiyerarşisi bulunur. index.html veya ana sayfa dosyası ile tarayıcı üzerinden gezinme mümkün oluyor.



Yerel web sunucusuna taşıma​


  • Windows için XAMPP veya WAMP
  • Dosyaları sunucunun htdocs (XAMPP) veya www (WAMP) klasörüne taşıyoruz.
  • Tarayıcıdan http://localhost/wikipedia-tr-html/ adresine giderek makalelere erişebiliyoruz.

Linux veya diğer platformlarda Apache veya Nginx kullanarak benzer şekilde dosyaları sunucunun kök dizinine taşıyabilirsiniz.



Basit arama​


  • Tarayıcı üzerinden arama fonksiyonunu (Ctrl + F) kullanarak makalelerde hızlı arama yapabilirsiniz.
  • Daha gelişmiş kullanım için küçük bir PHP dosyası ile HTML dosyalarında anahtar kelime araması ekleyebilirsiniz.



Güncelleme ve yedekleme​


  • Yeni dump çıktığında eski klasörü yedekleyip yeni klasörle değiştirebilirsiniz.
  • Sıkıştırılmış yedek (tar.gz/7z) ile istediğiniz sürüme geri dönmek mümkün.



İleri seviye notlar​


  • Tam medya içeren kurulumlar için Kiwix tercih ediliyor.
  • Arama ve indeksleme kritikse Elasticsearch veya Meilisearch ile HTML dosyalarından indeks oluşturmak daha hızlı sonuç veriyor.
  • Web arayüzünü kullanıcı dostu yapmak için Lunr.js veya istemci tarafı arama eklenebiliyor.



Kaynaklar ve bağlantılar​


 
Son düzenleme: