Enstitü Sosyal, Türkiye’de bir ilki gerçekleştirerek 6-10 yaş arası çocukların sözcük dünyasını bilimsel olarak ortaya koyan İlkokul Çocuklarının Söz Varlığı Projesi’ni tamamladı. Kasım 2024-Ekim 2025 tarihleri arasında yürütülen proje, 10 milyon sözcüğün analiz edilmesiyle ülkenin ilk kapsamlı çocuk dili derlemini ortaya çıkardı. Proje kapsamında çocukların günlük yaşamda, okulda ve dijital dünyada karşılaştıkları kelimeler sistematik biçimde incelendi. Analiz sonucunda 11.150 sözcük, 130 kavram alanına ayrılarak çocukların dil ve düşünce dünyasına dair kapsamlı bir tablo oluşturuldu.
Projenin tanıtım programı, 18 Ekim’de Boğaziçi Üniversitesi Albert Long Hall’da düzenlendi. Program, İstanbul Üniversitesi Devlet Konservatuvarı Öğretim Üyesi, Etnomüzikolog ve Halk Müziği Sanatçısı Prof. Dr. Mehtap Demir’in “Bebeğimin Beşiği Çamdan”, “Yağmur Yağar Taş Üstüne” ve “Bombili Bom” eserlerinin icrası ile başladı. Ardından Beykoz 75. Yıl Cumhuriyet Ortaokulu Türkçe Öğretmeni Tuncay Çalışkan, Mevlâna İdris’in “Sessizlik Torbası” adlı eserinden esinlenilmiş bir hikâye anlatımı gerçekleştirdi.
Proje, Türkçeye Dair Güvenilir Bir Çocuk Dili Veri Tabanı Oluşturmayı Amaçlıyor
Programın açılış konuşması, Enstitü Sosyal Genel Koordinatörü Dr. İpek Coşkun Armağan tarafından gerçekleştirildi. Armağan, Enstitü Sosyalin yeni nesil bir düşünce kuruluşu olarak hem düşünen hem uygulayan hem de modelleyen bir konumda olduğunu belirtti. Armağan, projenin Türkçeye dair güvenilir bir çocuk dili veri tabanı oluşturmak, eğitim politikaları ve müfredat geliştirme çalışmalarına bilimsel veri sunmak amacıyla yürütüldüğünü vurguladı. Çocukların kendilerini ifade edebilme becerisinin, söz varlıkları ile alakalı olduğunu belirten Armağan, bunun akran zorbalığına kadar varan birçok sorunun temelinde yatan bir unsur olduğuna dikkat çekti ve projenin önemini şöyle dile getirdi: “Bir çocuğun sınırlı bir söz varlığı ile büyümesi onu akademik, sosyal, duygusal pek çok alanda akranlarından geride bırakıyor. Her çocuğumuzun bilişsel gelişimine uygun zenginlikte söz varlığı ile büyümesi en temel hakkı. Çünkü dil gelişimi ve cebindeki kelimelerle geleceğin belirsizliklerine karşı dayanıklılık kazanacak, hayatı anlayacak ve anlamlandıracak, zengin kelime koleksiyonu ile bağ kuracak, bağlarını güçlendirecek ve köklenecek.”
Program, Türk Dil Kurumu Başkanı Osman Mert’in konuşmaları ile devam etti. Mert, söz varlığının eğitimde çok kritik bir rolü olduğuna dikkat çekerek konuşmasına şu şekilde devam etti: “Bir insan veya toplumun kendini ifade edebilme, düşünce üretebilme ve dünyayı anlamlandırabilme kapasitesi, sahip olduğu söz varlığıyla doğrudan ilişkilidir. Kavram dünyası geniş olanın düşünce dünyası da zengindir. Yani bireyin yaşıyla, eğitimiyle sahip olduğu söz varlığı arasında bir paralellik olmalıdır. Aksi hâlde, biyolojik insan nitelikli insana dönüşemez.”
Proje Kapsamında 10 Milyon Kelime Tarandı
Dil bilim uzmanlarından oluşan proje ekibi, proje için özel olarak geliştirdikleri Doğal Dil İşleme (NLP) modelleri yardımıyla on milyondan fazla sözcüğü analiz etti. Bu yönüyle proje, yalnızca eğitim ve kültür değil, aynı zamanda yapay zekâ ve dil teknolojileri alanında da önemli bir veri tabanı oluşturdu.
Projenin Koordinatörü Enstitü Sosyal Araştırmacısı Özlem Turan, projenin bu aşamaya kadar olan kısmının bir sene içerisinde tamamlandığını ve Şubat 2026’ya kadar da kalan kısmının projenin web sitesinde yayınlanarak yine kamuoyuyla paylaşılacağını belirtti. Turan, projenin analiz sürecinde 10 milyon sözcüğün incelendiğini, bunlar içerisinde 11.150 farklı sözcüğün 130 farklı kavram alanında sınıflandırıldığını aktardı.
Proje ekibinden Dil ve Sözlük Bilimci Doç. Dr. Mehmet Gürlek, dil bilimi çalışmalarında sahanın çok kritik bir rolü olduğunu ifade etti. Dildeki kelimelerin sözlükteki anlamlarından farklı olarak derlemlerde birçok ikincil-üçüncül anlamlarının oluşabileceğini vurgulayan Gürlek, özellikle dijitalleşme ile beraber bu durumun daha da arttığını belirtti. Örneğin, “etkileşim” kelimesinin sözlük anlamı ile derlemde rastlanılan yeni anlamlarının arasındaki farka dikkat çekildi. Proje kapsamında “eskimiş” sözcüklerin de incelendiğini belirten Gürlek, aslında bu kelimelerin güncelliği ya da bugün nasıl kullanıldığı üzerine yeniden düşünülmesi gerektiğini şu sözlerle vurguladı: “Bazı sözcüklerin ‘eskimiş’ olarak etiketlenmesi tartışmalı. Örneğin, ‘âlim’ kelimesi. Çocuklar bu kelimeyi hâlâ kullanıyor, ama sistem onu ‘eskimiş’ olarak işaretliyor. Oysa dildeki yaşamsallık, kelimenin ne kadar ‘yeni’ olduğundan çok, ne kadar ‘kullanıldığı’ ile ilgilidir.”
Proje ekibinden Dil Bilimci Dr. Ümit Atlamaz, projede yayınevlerinden incelenmek üzere kitaplar alındığı gibi çocukların izlediği YouTube videolarının alt yazılarına kadar birçok içeriğin incelendiğini ve bu sürecin çocuklarla yapılan sözlü-yazılı mülakatlarla da desteklendiğini ifade etti. Atlamaz, sözcükler incelenirken her milyonda bir, yeni eklenecek kelime çeşitliliğinin azaldığını ve 9 milyondan 10 milyona geçerken hiçbir yeni sözcüğün eklenmediğini belirterek projenin neden 10 milyon sözcüğün incelenmesiyle oluşturulduğunu açıkladı. Atlamaz, projenin 3 temel bulgusunu şu şekilde özetledi: kaynaklara göre lemma (kelimelerin sözlükteki anlamları) dağılımı, MEB’in gelişimsel görünümü ve sözcük çeşitliliği görünümü.
Tanıtım programı soru-cevap ve değerlendirme oturumu ile sona erdi. Projenin ilerleyen aşamaları Enstitü Sosyalin web sitesi üzerinden duyurulacak.