Sağlam bir sistem gerektirmiyor, düşük model cihazlara da indirilebiliyor.
RTX 3060 ya da 4060, hatta 4070 ile lokalde "DeepSeek R1-Distill-Qwen-32B" çalıştırmayı bir dene bakalım, o zaman ne demek istediğimi anlayacaksın. Üstüne üstlük, bellek problemi var: 8 GB hatta 16 GB RAM'e sahip bir ekran kartı ile çalıştığında bağlam hafızası kısıtlı oluyor, böylece bir süre sonra yapay zeka modeli geçmişi hatırlamıyor, bağlamdan kopuyor bu ekran kartının hafızası ve yapay zekanın desteklediği maksimum token ile alakalı bir durum ancak şuanda lokal'de çok kısıtlı. Bu işi daha da işkence haline getiriyor. (Bu hafıza yitirme olayını güvenlik kameralarındaki döngüsel kayıt gibi düşünebilirsin.)

RTX 5090'ın yoksa ya da AI kit denilen, sadece NPU'dan ibaret sistemler yoksa bu lokalde AI çalıştırma işi tamamen fantaziden ibaret. Düşük sistemlerle saniyede 3-5 token'dan başka bir şey alamazsın ne yazık ki
RTX 4070 Super ile denedim işkenceden farkı yok çok yavaş çalışıyor.
Demek istediğimi anlatan güzel bir video;
 
RTX 3060 ya da 4060, hatta 4070 ile lokalde DeepSeek R1 çalıştırmayı bir dene bakalım, o zaman ne demek istediğimi anlayacaksın. Üstüne üstlük, bellek problemi var: 8 GB hatta 16 GB RAM'e sahip bir ekran kartı ile çalıştığında bağlam hafızası kısıtlı oluyor, böylece bir süre sonra yapay zeka modeli geçmişi hatırlamıyor, bağlamdan kopuyor. Bu işi daha da işkence haline getiriyor. (Bu hafıza yitirme olayını güvenlik kameralarındaki döngüsel kayıt gibi düşünebilirsin.)

RTX 5090'ın yoksa ya da AI kit denilen, sadece NPU'dan ibaret sistemler yoksa bu lokalde AI çalıştırma işi tamamen fantaziden ibaret. Düşük sistemlerle saniyede 3-5 token'dan başka bir şey alamazsın ne yazık ki

Demek istediğimi anlatan güzel bir video;

Gerçek tam modeli denemeni söylemiyorum, zira onu kimse çalıştıramaz. Demek istediğim, daha düşük boyutlu modelleri indirip deneyebilirsiniz.
 
Gerçek tam modeli denemeni söylemiyorum, zira onu kimse çalıştıramaz. Demek istediğim, daha düşük boyutlu modelleri indirip deneyebilirsiniz.
Elbette bu mumkün ama bu da çok kısıtlı kalıyor kodlama konusunda ben çok kullanıyorum ve yeterli olmuyor. İlerde bir projem var DeepSeek'in API'si ile bir şeyler yapmayı planlıyorum. NVIDIA Jetson Orin'i yurtdışından getirtebilirsem eğer lokalde Ai çalıştırmak o zaman çok keyifli olabilir. :)

 
Lokal olarak bazı denemeler yaptım ve bu konuda @barcaxsto arkadaşımıza katılıyorum: Sistemler yerelde gerçekten de beklenen verimlilikte çalışmıyor. Ortalama veya üzeri bir donanımla bir RAG sistemi kursak dahi, web tabanlı platformların sunduğu performansı yakalamak pek mümkün olmuyor. Grok, NotebookLM, Gemini, Deepseek gibi online araçlar benim her türlü işimi fazlasıyla görüyor. Bazen kendime, "Galiba fazla fantazi arıyorsun!" diyorum.