Lm Studio en verimsizi ve kötüsü diyebilirim. Bu işin en iyisi llama.cpp dir. Ancak çok ilkel olduğu için kullanmak biraz zor. Ollama da direk o tabana geçirdi. Lm Studio da altyapısı llama.ccp dir bu arada.
Ana kaynak llama. Cppdir. Hepsi buradan alıyor esasında ama bazıları geri kalıyor çünkü en güncel özellikler llama. Ccp de. Hatta tensor Core özelliği var fazladan token alabiliyorsun RAM'e daha iyi dağıtıyor parça modelleri. Örnek kod: (--override-tensor "blk\.[0-9]+\.ffn.exps.=CPU" '.