Hocam şüphelenmekte sonuna kadar haklısınız. sektör yapay zeka yapıyorum deyip OpenAI wrapper'ı yazan projelerle dolu olduğu için temkinli yaklaşmanız çok doğal.
Ancak imkanlarla yapılamaz kısmı artık geçerli değil. QLoRA ve PEFT gibi teknolojiler sayesinde, milyar dolarlık donanımlar olmadan da domain spesifik modeller eğitilebiliyor. Bizim güvendiğimiz altyapı da tam olarak bu verimliliğe dayanıyor aslında.

PoC şu an lokalde çalışıyor ve yatırımcı sunumlarında canlı gösteriyoruz. Public demo için sunucu maliyetlerini optimize etmeyi bekliyoruz. İlerleyen süreçte somut çıktılar paylaştığımızda fikirlerinizin değişeceğini umuyorum.
Eleştiri için teşekkürler, selamlar
İnanmasam da umarım sözlerimi bana yedirirsiniz. Başarılar dilerim.
 
Başarılı olacağınıza inanıyor iseniz, yılmayım. 🙏

Bizim millet neden bir şeyler deneyen, başarılı olmaya çalışan insanları hep paçasından tutup indirmek için elinden geleni yapıyor böyle?
Yeşil foruma PiluX veya Hasan Merkit yazmak yasak mesela. Kağıt üstünde değil ama filtrede. Örneğin bir kişinin yazdığı "hasanmerkit" yazısı kaldırıldı.

Ama benim buradaki moderatörlüğüm hakkında olumsuz en ufak şeyde direkt onay.

Öyle değil mi Ali Güngör ve moderasyonu? Zamanı gelince önümüzü kesen herkesin karşısına güzel bir arşiv çıkaracağım.
 
Bi Koray Abiye danışın.
koray.width-400.format-webp.webp
 
Ülkemizde bu tip projelerin daima desteklenmesi gerektiğini düşünüyorum aksi taktirde hiç ilerleyemeyiz. Tabii ki bir anda Top10 model performansı beklemiyoruz ancak böyle böyle gelişecek.

Verdiğiniz bilgilerin bu kadar olmadığını biliyorum ancak genel itibarıyla önemli eksiklikleri olduğunu da görüyorum.
Bazı sorularım olacak ki bunlar bu proje için bayağı kritik.

Lisanslı veri setlerinin uzun vadeli yeniden eğitim haklarını nasıl ele alıyorsunuz? Kendi verilerinizle adaptasyon sırasında catastrophic forgetting riskini nasıl yönetmeyi planlıyorsunuz?
Bir benchmarkınız var mı? Yoksa hali hazırda olan benchmarkları kendinize göre adapte mi edeceksiniz?
Quantizasyon olacak mı?
Eğitim aşamasında inanılmaz bir compute power'a ihtiyac duyacaksınız. Bu esnada çok kücük çaplı bir proje için de sponsor yatırımcı bulmanız oldukça zor olacaktır. Bir planınız var mı?

Bu soruların cevabını bulamaz veya çözüm üretmezseniz işiniz olduğundan çok daha zor hale gelecek.
 
Şöyle bir şey var, çok kötü sonuçlar elde edebilir, amenna. Ancak bu proje özelinde konuşmam gerekirse amaç projeyle uğraşanların yapay zekâ ile ilgili kendi bilgi ve görgülerini geliştirmesine vesile olması. Buna ticari açıdan tam anlamıyla kurak bir proje denebilir. Kaç kişi mesaisinin büyük kısmını buna harcıyor bilmiyorum ancak umarım hedeflediğiniz gerçekçi sonuçları alırsınız. Teknik gelişim amaçlı amatör bir proje olduğu açık, bize kolaylıklar dilemek düşer.
 
Selam arkadaşlar,

Bilgisayar mühendisliği ve veri bilimi kökenli kurucu ekibimizle bir süredir üzerinde ar-ge yürüttüğümüz, teorik mimarisini tamamlayıp teknik altyapısını kurguladığımız geniş dil modeli ve rag projemizdeki gelişmeleri paylaşmak istiyorum sizlerle.

Projemiz; veri gizliliği odaklı, kurum içi çalışabilen ve özellikle teknik/akademik Türkçe literatüre hakim Enterprise-grade bir yapay zeka ekosistemi kurmayı hedefliyor.

Şu an projenin donanım ihtiyaçlarını karşılamak ve ölçeklenmek için pre-seed yatırım turuna çıktık. çeşitli vc ve angel yatırımcı ağlarıyla görüşme sürecimiz devam ederken, teknik detayları forumdaki yetkin arkadaşlarla tartışmak istedim.

🎯 değer önerimiz (Value proposition)​

Global API çözümleri (OpenAI vs.) Veri mahremiyeti ve token maliyetleri açısından her kurum için uygun değil. Biz, şirketlerin kendi sunucularında çalışan, dışarı veri çıkarmayan "Egemen yapay zeka" (sovereign AI) modelleri sunarak bu boşluğu doldurmayı amaçlıyoruz.

🛠️ teknik mimari (technical stack)​

Yatırım sunumlarımızda yer alan, yüksek performans odaklı hibrit mimarimiz şu şekilde:

1. model eğitim stratejisi:
  • base model seçimi: ticari kullanım lisansı (Apache 2.0 / community license) ve Türkçe token verimliliği nedeniyle mistral veya llama-3.1 mimarilerini baz alıyoruz.
  • fine-tuning: şu an qlora (4-bit) teknikleriyle lokal testlerini yaptığımız yapıyı, yatırım sonrası deepspeed Zero-3 ve fsdp teknolojilerini kullanarak multi-GPU ortamına (H100/A100 cluster) taşıyacağız.
  • hedef: genel sohbet botu değil; hukuk, finans veya mühendislik gibi dikey alanlarda uzmanlaşmış modeller.

2. gelişmiş rag mimarisi:
Modelin halüsinasyon riskini minimize eden "Advanced rag" yapımız:
  • Vector Search: milvus veya qdrant üzerinde, hnsw algoritmasıyla milisaniyeler içinde semantik arama.
  • re-ranking: vektör aramadan dönen sonuçları cross-encoder modelleriyle tekrar puanlayarak bağlam doğruluğunu artırıyoruz.

3. veri işleme (data engineering):
Kaliteli veri, modelin yakıtıdır.
  • ETL pipeline: açık kaynaklı ve lisanslı veri setlerini Apache spark ile temizleyip, deduplication (tekilleştirme) işlemlerinden geçiriyoruz.
  • format: veriyi modelin en iyi anlayacağı chatml veya alpaca formatında instruction setlere dönüştürüyoruz.

🚀 süreç ve hedefler​

Proje şu an aktif tasarım ve prototipleme aşamasında, yatırım turumuz devam ediyor.
  • faz 1 (tamamlandı): mimari tasarım, teknik stack seçimi ve ekip kurulumu.
  • faz 2 (şu an): poc (proof of concept) çalışmaları, veri seti hazırlığı ve yatırımcı görüşmeleri.
  • faz 3 (hedef): turun kapanmasıyla birlikte Cloud GPU cluster kiralanması ve ilk ticari modelin eğitimi.

Bu vizyona teknik katkı sunmak isteyen geliştirici aarkadaşlarla tartışmak isterim. Boyumuzdan büyük bir işe kalkıştık vallahi. Ya tarih yazacağız ya tarih olacağız. İyi sosyaller herkse.

Her şey tamam ama veri seti nereden gelecek maalesef şu anlık Türkçede çok büyük bir veriseti açlığı var.