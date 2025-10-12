Türkiye merkezli teknoloji şirketi VNGRS, yapay zekâ ve bulut bilişim alanındaki çalışmalarının bir sonucu olarak tamamen Türkçe eğitilmiş büyük dil modeli Kumru’yu duyurdu. Türkçe için sıfırdan geliştirilen model, doğal dil işleme alanında yerli üretim bir çözüm olarak dikkat çekti.

Kumru, 7,4 milyar parametreye sahip bir mimari üzerine kuruldu. Modelin eğitimi için 500 GB’lık temizlenmiş ve tekilleştirilmiş veri seti kullanıldı. Eğitim sürecinde yaklaşık 300 milyar token işlenirken, 8.192 token’lık bağlam uzunluğu ile metin anlama kapasitesi artırıldı. Kumru, soru-cevap, özetleme, metin yeniden yazma ve içerik sınıflandırma gibi çok sayıda dil işlevinde kullanılabiliyor.

Büyük Modelleri Geride Bıraktı

Yerli model, Türkçe dil performansını ölçen özel bir test dizisinde LLaMA-3.3-70B, QWen-2-72B, Gemma-3-27B ve Aya-32B gibi daha büyük açık kaynak modelleri geride bıraktı. 26 farklı kategoride yapılan testlerde yüksek başarı elde eden Kumru, Türkçe odaklı yapay zekâ projelerinde yeni bir alternatif olarak öne çıktı.

Verimliliğiyle öne çıkan model, 16 GB VRAM kapasitesine sahip GPU’larda ek optimizasyon veya quantization işlemine gerek duymadan çalıştırılabiliyor. Bu özellik, Kumru’yu kurum içi yapay zekâ uygulamaları için erişilebilir hale getiriyor.

Meta ve NVIDIA Desteğiyle Geliştirildi

Kumru’nun geliştirilme süreci Meta’nın LLaMA-3 mimarisinden alınan teknik destek ve NVIDIA’nın H100 ile H200 GPU’ları üzerinde gerçekleştirilen 45 günlük ön eğitim süreciyle tamamlandı. Modelin altyapısı, Mistral-v0.3 üzerine inşa edildi.