Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği ve Yapay Zeka ile Veri Mühendisliği Bölümü'nden Prof. Dr. Mehmet Fatih Amasyalı liderliğindeki ekip, Türkçe düşünen yapay zeka Cosmos T1'i geliştirdi. Model, Türkçe GSM8K veri setinde matematiksel akıl yürütme performansında yüzde 77,41 doğruluk oranına ulaşarak dikkat çekti. Bu model, zincirleme akıl yürütme (chain-of-thought reasoning) yaklaşımı ile Türkçe matematik problemlerini çözebilme yeteneğine sahip.
9 milyar parametreye sahip Turkish-Gemma-9b-T1 modeli, Türkçe GSM8K testinde yüzde 77,41 doğruluk oranı elde ederken, rakipleri olan Gemma-2-9B modeli yüzde 63,10 ve Llama-3.1-70B modeli ise yüzde 66,13 gibi sonuçlar gösterdi. Bu durum, yerli yapay zekanın büyük modellerle rekabet edebildiğini ortaya koyuyor. Parametre sayısı açısından kendisinden daha büyük olan modellerle karşılaştırıldığında önemli bir performans sergiledi.
Cosmos T1, 9 milyar parametre ile Türkçe matematiksel akıl yürütme testlerinde 70 milyar parametreli modellere yakın bir performans sunarak, parametre verimliliği açısından dikkat çekiyor. Model, Hugging Face platformu üzerinden açık ağırlıklı olarak erişime sunuldu ve kullanıcılar, kendi bilgisayarlarına kolayca yükleyerek özgürce kullanabiliyor.
Proje yürütücüsü Prof. Dr. Amasyalı, "Cosmos T1, dil modeli geliştirme çalışmalarımızın bir sonucu. Bu model, diğerlerinden farklı bir düşünme sürecine sahip ve yanıtın nasıl üretildiğini adım adım gösteriyor. İş dünyasında birçok sektör, verilerini belirli firmalarla paylaşmaktan kaçınıyor. Bu nedenle, kendi makinelerinde çözümler üretmeleri gerekiyor. T1 ve diğer modellerimiz açık ağırlıklı olarak yayınlanıyor, böylece kullanıcılar kendi bilgisayarlarında rahatça kullanabiliyorlar" şeklinde açıklamalarda bulundu.
Prof. Dr. Amasyalı, "T1 modelinin 9 milyar parametresi bulunuyor ve büyüklüğüne göre etkileyici işler çıkarıyor. Kullanıcılar, online bir web sayfası üzerinden veya açık ağırlık olarak yayınlanan modeli kendi bilgisayarlarına indirerek rahatça kullanabiliyorlar. Geliştirme maliyetlerini TÜBİTAK projeleri karşılıyor, böylece Türkçesi iyileştirilmiş modeller iş süreçlerinde kullanılabiliyor" dedi.
Cosmos T1, Google'ın yapay zeka modeli Gemma 2'nin üzerine geliştirilmiş bir modeldir. Amasyalı, "Türkçesini iyileştirmeyi hedefledik ve düşünme yetisi olan bir model geliştirdik. Gemma 2, yalnızca sorulara yanıt veren bir modelken, Cosmos T1 düşünme süreci ile yanıt üretmektedir. Bu, performansı artıran önemli bir faktördür" ifadelerini kullandı.
Prof. Dr. Amasyalı, "Eğitim sürecimiz oldukça sağlamdı ve bu sayede düşünmeyen bir modelden düşünen bir model haline getirdik. Bu gelişim, kendisinden üç kat büyük modellerle rekabet edebilmesini sağladı. Bu başarı, sosyal medyada da geniş ilgi gördü. Başarı, iyi bir ekip ve motivasyonla elde edilir. TÜBİTAK'ın desteği en büyük motivasyon kaynağımızdı" diyerek sözlerini tamamladı.