Utku92
Üstün
- Katılım
- 8 Şubat 2024
- Mesajlar
- 2.810
- Makaleler
- 1
- Çözümler
- 8
- Beğeniler
- 1.637
Forumda Ollama local LLM kullananlar var mıdır bilmiyorum. Yeni pre-release sürümü geldi. Bununla birlikte huggingface'de hata almadan istediğiniz modeli kullanabileceksiniz. Önceden vision modelleri (mmproj.GGUF) çalıştırmıyor ve tek parça GGUF modelleri çalıştırabiliyordu, hatta ben veya belki başkaları da yapıyordur, 2. satır modelfile dosyasından vision kısmını siler öyle kullanırdık. Artık ister 10 parça olsun model tanıyıp çalıştırabiliyor llama.cpp altyapısından direkt çalıştırıyor. Artık çok daha iyi ve performanslı oldu. Bir tek tensor kısmı kaldı. O da dev modellerde RAM'e taşınca 2 token/s fazla veriyordu. Onu da bekliyoruz bakalım. Durum bu şekilde. Bilgilendirmek istediğim için konu açtım.
Son düzenleyen: Moderatör: