Yerli Yapay Zeka Cosmos T1, İstanbul'da Yıldız Teknik Üniversitesi tarafından geliştirildi ve büyük modellerle rekabet ediyor.
Yıldız Teknik Üniversitesi tarafından geliştirilen Cosmos T1, kendisinden üç kat büyük yapay zeka modelleriyle kıyaslanıyor. Türkçe düşünen bu yapay zeka, performans testlerini başarıyla geçerek dikkat çekti. Cosmos T1, kullanıcıların bilgisayarlarına yükleyip özgürce kullanabileceği bir yapay zeka çözümü sunuyor.
Bilgi: Instagram'da @mersinhaber'i takip ederek anlık gelişmelerden daha hızlı haberdar olabilirsiniz.
Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği ile Yapay Zeka ve Veri Mühendisliği Bölümü Öğretim Üyesi Prof. Dr. Mehmet Fatih Amasyalı önderliğindeki ekip, Türkçe düşünme yeteneğine sahip yapay zeka Cosmos T1’i geliştirdi. Bu model, matematiksel akıl yürütme performansını ölçen Türkçe GSM8K veri setinde yüzde 77,41 doğruluk oranına ulaşmayı başardı. Ayrıca, zincirleme akıl yürütme (chain-of-thought reasoning) yaklaşımını kullanarak Türkçe matematik problemlerini çözebiliyor.
Turkish-Gemma-9b-T1 modeli, Türkçe GSM8K testinde yüzde 77,41 doğruluk oranına ulaştı. Aynı testte Gemma-2-9B modeli yüzde 63,10, Llama-3.1-70B modeli ise yüzde 66,13 performans gösterdi. 9 milyar parametreye sahip olan bu model, 70 milyar parametreli Llama-3.1-70B modelinin üzerinde bir performans sergileyerek dikkat çeken bir başarı elde etti. Böylece, parametre sayısı açısından kendisinden yaklaşık sekiz kat büyük modellerle rekabet edebilir hale geldi.
9 milyar parametreli Turkish-Gemma-9b-T1 modeli, Türkçe matematiksel akıl yürütme testlerinde 70 milyar parametreli modellere yakın veya daha iyi sonuçlar sunarak verimlilik açısından öne çıkıyor. Model, Hugging Face platformu üzerinden açık ağırlıklı olarak kullanıma sunuldu.
Çalışmanın yürütücüsü Prof. Dr. Amasyalı, "Cosmos T1, en son geliştirdiğimiz modellerden biridir. Temel olarak bir dil modeli geliştirmekteyiz ve Chat GPT gibi diğer benzer modellerle karşılaştırıldığında, T1 farklı bir düşünce sürecine dayanıyor ve bu süreci Türkçe olarak ifade ediyor. Kullanıcılar, arka planda yanıtın nasıl üretildiğini adım adım takip edebilir." şeklinde konuştu. Ayrıca, birçok sektör, sağlık ve savunma sanayi gibi verilerini bu tarz firmalarla paylaşmaktan kaçınıyor. Bu nedenle, on-premise çözümler geliştirmek gerekli hale geliyor. Cosmos T1 ile diğer modeller açık ağırlıkla yayınlanmakta ve kullanıcılar, bu modelleri kendi bilgisayarlarına kurup özgürce kullanabilmektedir.
Firmalar, kendi süreçlerine Cosmos T1’i dahil ederek güvenliği artırma imkanı buluyor.
Prof. Amasyalı, T1 modelinin 9 milyar parametreye sahip olduğunu ve bu büyüklüğe rağmen etkileyici sonuçlar ortaya koyduğunu belirtti. İki tür erişim imkanı sunduklarını ifade eden Amasyalı, "İlk olarak, online bir web sayfası üzerinden erişim sağlanabiliyor. İkinci olarak, firmalar, açık ağırlıklı olarak yayımladığımız modeli kendi bilgisayarlarına indirerek, kendi süreçlerinde rahatlıkla kullanıyorlar." dedi. Ayrıca, TÜBİTAK projeleri kapsamında geliştirme ve Türkçenin iyileştirme maliyetinin karşılandığını da sözlerine ekledi.
Cosmos T1, Google’ın yapay zeka modeli Gemma 2 modelinin üzerine geliştirilmiştir. Prof. Amasyalı, "Türkçesini oldukça iyileştirdik ve düşünceye dayanan bir model geliştirdik. Gemma 2 modelinde bu özellik yok. Gemma 2, sorulara yanıt veren bir modelken, Cosmos T1’de bir düşünce süreci ve bunun ardından bir cevap üretme süreci bulunuyor. Bu da modellerin performansını artırıyor." şeklinde değerlendirmelerde bulundu.
Prof. Dr. Amasyalı, "Yaptığımız eğitimle, düşünmeyen bir modelden düşünen bir model haline getirdik ve böylece kendisinden üç kat büyük olan modellerle rekabet edebilir seviyeye ulaştık. Bu başarı, sosyal medyada büyük ilgi gördü. İsteğin ardından, çalışarak başarılı olmak mümkün. Güçlü bir ekip ve motivasyonla bu projeleri hayata geçirdik. TÜBİTAK’ın desteği de en büyük motivasyon kaynağımız oldu." ifadelerini kullanarak sözlerini tamamladı.