Utku92

Üstün
Katılım
8 Şubat 2024
Mesajlar
2.810
Makaleler
1
Çözümler
8
Beğeniler
1.637
Forumda Ollama local LLM kullananlar var mıdır bilmiyorum. Yeni pre-release sürümü geldi. Bununla birlikte huggingface'de hata almadan istediğiniz modeli kullanabileceksiniz. Önceden vision modelleri (mmproj.GGUF) çalıştırmıyor ve tek parça GGUF modelleri çalıştırabiliyordu, hatta ben veya belki başkaları da yapıyordur, 2. satır modelfile dosyasından vision kısmını siler öyle kullanırdık. Artık ister 10 parça olsun model tanıyıp çalıştırabiliyor llama.cpp altyapısından direkt çalıştırıyor. Artık çok daha iyi ve performanslı oldu. Bir tek tensor kısmı kaldı. O da dev modellerde RAM'e taşınca 2 token/s fazla veriyordu. Onu da bekliyoruz bakalım. Durum bu şekilde. Bilgilendirmek istediğim için konu açtım.

Ekran görüntüsü 2026-05-17 194826.webp
 
Son düzenleyen: Moderatör:
Lm Studio kullandıktan sonra attan inip eşeğe binmek gibi geliyor ollama, bu algıyı değiştirebilecek bir güncelleme mi orası önemli.

Lm Studio en verimsizi ve kötüsü diyebilirim. Bu işin en iyisi llama.cpp dir. Ancak çok ilkel olduğu için kullanmak biraz zor. Ollama da direk o tabana geçirdi. Lm Studio da altyapısı llama.ccp dir bu arada.

Ana kaynak llama. Cppdir. Hepsi buradan alıyor esasında ama bazıları geri kalıyor çünkü en güncel özellikler llama. Ccp de. Hatta tensor Core özelliği var fazladan token alabiliyorsun RAM'e daha iyi dağıtıyor parça modelleri. Örnek kod: (--override-tensor "blk\.[0-9]+\.ffn.exps.=CPU" '.
 
Lm Studio en verimsizi ve kötüsü diyebilirim. Bu işin en iyisi llama.cpp dir. Ancak çok ilkel olduğu için kullanmak biraz zor. Ollama da direk o tabana geçirdi. Lm Studio da altyapısı llama.ccp dir bu arada.

Ana kaynak llama. Cppdir. Hepsi buradan alıyor esasında ama bazıları geri kalıyor çünkü en güncel özellikler llama. Ccp de. Hatta tensor Core özelliği var fazladan token alabiliyorsun RAM'e daha iyi dağıtıyor parça modelleri. Örnek kod: (--override-tensor "blk\.[0-9]+\.ffn.exps.=CPU" '.
Hocam local olarak LLM deneyimlemek istiyorum. Açıkçası sürekli aylık abonelik vermek istemiyorum. Şu an masaüstü olarak 3080 Tİ ve 32 gb Ram'e sahibim ek olarak macbook m3 24 gb ram'e sahip bir cihazım var ne diyorsunuz hangi model kullanılabilir veyahut bu donanımlarda kullanılabilir mi?
 
Hem Ollama hem de LM Studio kurulu bilgisayarımda ama LM Studio'nun yüzüne baktığım yok. Ollama'yı kendi arayüzünden, komut satırından ya da api portundan kullanmak beni rahat hissettiriyor. Ollama + VSC üzerinde Continue kullanarak kendi yerel ajanını kullanmak de çok güzel bir şey.
 
Hem ollama hem de lm Studio kurulu bilgisayarımda ama lm Studio'nun yüzüne baktığım yok. Ollama'yı kendi arayüzünden, komut satırından ya da API portundan kullanmak beni rahat hissettiriyor. Ollama + VSC üzerinde continue kullanarak kendi yerel ajanını kullanmak de çok güzel bir şey.

Llama.cpp direkt vermesi yeni güncelleme ile çok iyi oldu. Hatta en düşük 4 bitte Minimax 2.7 kurdum, fena değil tabii 5 token/s veriyor. :D