ENES ERYARSOY

Milli Yapay Zekâ Altyapı Modellerinin Üretimi Neden Acil?

Özellikle 2019 yılından itibaren transformer mimarisi üzerine geliştirilen ileri yapay zekâ uygulamaları bir yandan hayatı kolaylaştırırken diğer yandan riskler taşıyor. Peki, uluslararası arenada geri kalmamak için hangi stratejik adımların atılması gerekiyor?

Yapay zekâ (YZ), bilgisayar hesaplama gücünün artışına paralel olarak “YZ kışı” dönemi gibi istisnalar dışında hemen her zaman pozitif ve ivmeli şekilde gelişti. 2010’ların başında Prof. Geoffrey Hinton’un öncülük ettiği derin öğrenme algoritmaları ona önce Google’da “Yapay Zekâ Müdürü” olma imtiyazını, sonrasında 2018 yılındaki Turing ödülünü kazandırdı. Hinton’un, ChatGPT’nin üst yöneticisi Sam Altman ve başmühendis Ilya Sutskever ile Facebook AI’ın üst yöneticisi Yann LeCun gibi birçok önemli kişiye mentörlük yapması sürpriz değil. Sürpriz olan, 2023 yılında Hinton’un “yapay zekânın riskleri hakkında özgürce konuşabilmek” için Google’dan ayrılmasıydı. Sadece Hinton’un değil, YZ modellerinin tehlikesine dikkat çeken “Stokastik Papağanların Tehlikeleri Üzerine” başlıklı makalenin yazarı ve Google’daki “Ethics on AI” takım lideri Timnit Gebru’nun makale sebebiyle Google’den kovulması gibi olaylar, YZ’nın ahlaki boyutunun tartışılmasını ileri seviyelere taşıdı. Hinton’un öğrencilerinden Ruslan Salakhutdinov’un Apple’da “Yapay Zekâ Araştırma Direktörü” pozisyonundayken istifa edip akademik hayata geri dönmesi, Cathy O Neil’in “Weapons of Math Destruction” kitabı gibi örnekler hızla artmakta. Günümüzün en çekici terimlerinden YZ ahlak radarlarına zaten yakalanmış durumda. Ülkeler ve YZ aktörleri, YZ’nın nasıl regüle edileceği konusunda görüş ayrılıklarına sahip, ancak regüle edilmesi konusunda hemfikir. Peki, Türkiye bu konuya nasıl eğilmeli?

Yapay zekâ üretkenliğe uzun vadede katkı yapabilecek bir altyapı teknolojisidir
Öncelikle YZ modellerinin bir altyapı teknolojisi (GPT ) olduğunun farkında olmalıyız. Elektrik, internet gibi modern örnekleri olmakla beraber, dünya tarihinde geliştirilmiş 25 kadar altyapı teknolojisi bulunmaktadır (Lipsey ve Carlaw, 2006). Altyapı teknolojilerinin özelliği, geniş alanlara yayılmaları, genellenebilmeleri, ölçeklenebilmeleri ve başka teknolojiler ile bütünleştirilebilmeleridir.

YZ alanında yatırım yaparken, bir altyapı teknolojisi olarak üretkenliğe katkısının orta ve uzun vadede ortaya çıkacağını kabul etmek gerekmektedir. Kısa dönemdeki beklenen etkilerine bakarak, YZ’nın “üretkenliğimize çok da katkıda bulunmayacağını düşünme” tehlikesinin farkında olmalıyız. Altyapı teknolojilerinin üretkenliğe yapacakları katkı orta ve uzun vadede ortaya çıkmaktadır (Crafts, 2021).

Milli yapay zekânın geliştirilmesinde önemli hususlar
Birinci husus,
 yapay zekâ altyapı modellerinin üretiminde daha fazla gecikilmemesi gerekliliğidir. Yapay zekânın, ülkelerarası rekabette önemli bir unsur olduğuna dair sayısız makale yayınlanmıştır. Öncü aktörler ile Türkiye’nin arasındaki farkın açılmaması bir zarurettir. Rekabeti takip edebilmek için üç temel sebep öne çıkmaktadır. İlki, mevcut yabancı YZ modellerinin Türkçe’ye uyarlanmamış, teknik terimi ile “tune” edilmemiş olmasıdır. Her ne kadar bazıları (Bard ve ChatGPT gibi) Türkçe çıktı üretebilse de, kelime ve deyimlerin birbirleri ile istatistiksel ilişkilerinin öğrenildiği “pre-training corpus”ların büyüklük ve kalitesi model performans ve sonuçları için önemlidir. Örneğin, ChatGPT’nin eğitildiği Common Crawl’un %1’inden daha azı Türkçe dilindedir. Birleşik Arap Emirlikleri (BAE) çıkışlı Falcon’un 180B parametreli modeli hala desteklenmemektedir (ama Falcon’un “Noor” isimli Arapça versiyonu şimdiden mevcut). İkinci sebep, altyapı teknolojisinde yurtdışına bağımlılığın tehlikeli olmasıdır. ChatGPT ve diğer Amerikan türevlerine muadil geliştirilen Haziran 2022 çıkışlı YaLM (Rus), Aralık 2021 çıkışlı Ernie (Çin), Mart 2023 çıkışlı Falcon (BAE) bu sürecin globalde çok hızlı ilerlediğini gösteriyor. Bu tür “çöp içeri çöp dışarı” tehlikesini barındıran “bol halüsinasyonlu” modellerin hangi bilgileri içeren metinlerle eğitildiğinin de milli irade ile belirlenmesi çok önemlidir. Gecikmesi, başka güçlerce regüle edilen modellerle yol alma zorunluluğunu ve zorluğunu getirecektir. Üçüncü sebep ise, KVKK kapsamında “şirket içi” (on-prem) çalışan modellere duyulan ihtiyaçtır. Gerçi YZ altyapı teknolojisinin yerli ve milli hale getirilmesi, sadece KVKK için değil hızla gelişen bu alandaki altyapının ithal değil yerli üretim olarak kalmasını sağlamak için de önemlidir. Ama altyapının devlet destekli ve kontrollü bir hızla oluşturulması elzemdir.

İkinci husus mevcut teknoloji teşviklerinin YZ için farklılaştırılması gerekliliğidir. YZ alanındaki teşviklerin gerçek anlamda teşvik olması, yani aşırı denetimli değil, daha kolay şartlarda verilmesi veya hibe edilmesi. Konu spekülasyona açık. Bu nedenle şunu söylemekle yetinelim: yurt dışı ile rekabet için, yerli YZ projelerinin yerli skalada destek değerlendirmesi ve öncelenmesi değil, yurt dışı muadilleri ile rekabetçi tutulması gereklidir. Bu teşviklerin spesifik YZ uygulama alanlarında daha da agresif yapılması gereklidir.

Üçüncü husus ise regülasyonun nispeten hafif tutulması gerekliliğidir. Nitrat sentezlemesi ile Nobel ödülü alan Yahudi asıllı Fritz Haber aynı reaksiyonda ortaya çıkan zehirli fosgen gazı ile Almanların dünya savaşını derhal bitireceğini umdu. Nobel ödülü adaylığı olan Robert Oppenheimer “tüm savaşları bitirecek silah” düşüncesiyle atom bombasını geliştirme yarışına girdi. Birinin buluşu Japonya’da yüz binlerce masum insanı öldürdü, diğerininki ise Yahudi soykırımı gaz odalarında kullanıldı. Bu tür hikayeler regülasyonun öncelenmesi gerektiğini akla getirebilir. Ancak, milli YZ’da aşırı regülasyonlar ve geri kalmanın yol açacağı pişmanlık, Oppenheimer ya da Fritz Haber gibi mucitlerin vicdan sızlamasından ziyade, bu silahlara yaşamını kaybetme musibetine benzer. Pandora’nın kutusu açıldı. Pakistan’ın Hindistan karşısındaki caydırıcılığı ancak nükleer teknolojiye benzer zamanlarda sahip olması ile mümkün oldu. Kısıtlı kaynaklarımızı, getireceğimiz ağır regülasyonlar ile mücadelede israf etmek doğru olmayacaktır.

Dördüncü husus, YZ olgunluk seviyelerinin ve fırsatlarının sürekli ölçülmesidir. Örneğin, Whittlestone ve Clark (2021) devletlerin aşağıdaki alanlarda sürekli ölçümler yapmalarını önermekte: Aktif YZ sistemlerin düzenlemelere uygunluğunu görmek için test etmek; kullanılan YZ uygulamalarını ölçerek ve sıralayarak başarılı YZ uygulamalarını teşvik etmek; diğer ülkelerin YZ ekosistemlerinin gücüne ilişkin karşılaştırmalı analizler yapmak; kaynak tahsisinde önceliklendirmek ve araştırmayı sürekli teşvik etmek; olası risk veya fırsat kaynaklarına yönelik erken uyarı sistemleri oluşturmak.

Yapay zekâ üretimi için özel bir yapı kurulmalı
Altyapı modellerinin verimliliği yeterince artırmadığını düşünerek, milli YZ teknoloji üreticilerini kısıtlayıcı regülasyonlar, gelişmiş ve “az kısıtlayıcı” regülasyonlara sahip ülkelerin modellerinin kullanımının daha yaygınlaşmasına sebep olur. Bu konuda akademik literatür, kısıtlayıcı ürün ve piyasa düzenlemelerinin, yayılmayı sınırlandırdığını ve yeni teknolojilerin ekonomiye dahil edilmesi süreçlerini yavaşlattığını göstermektedir (Conway ve diğerleri, 2006). Bu yazının hazırlanılması esnasında multimodal LLM’lerin hızla popülerlik kazanması da hem model üretim döngüsünün ne denli hızlı olduğunu hem de zaman kaybedilmemesi gerektiğini göstermektedir.

Birleşik Krallık’ta Kasım 2023’te düzenlenen “YZ Güvenlik Zirvesi” ve G7 ülkelerinin küresel YZ Yönetişim Girişimi gibi çabalar küresel alanda anlamlı olsa da önceliğimiz bu yarışın YZ geliştirme tarafından kopmamak olmalıdır. Dil modellerinin hızla çoklu moda geçtiği, metnin sese, sesin görüntüye çevrilebildiği dönemi en azından hızlı replikalar oluşturarak çok yakından takip etmek, üretmek ve açık kaynak kodlu versiyonlarının Türkçeye “tune” etme altyapılarını oluşturup sürekli güncellemek karar vericilerin önceliği olmalıdır.

Bu üretim için yalın formlu özel bir yapı kurulması uygun olacaktır. Yapı dahilinde örneğin, TÜBİTAK, modelin üretimi ve bilimsel literatürün sürekli ve hızlı takip edilmesinde; bir telekom şirketi, modelin test edilebilmesi için yaygınlaştırılmaya yönelik altyapı ve finans desteği verilmesinde; sivil toplum kuruluşları ve dijitalleşme ofisi ise bu modellerin geliştirilmesi için kullanılacak Türkçe veri tabanlarının tespitinde ve regülasyon kısmında görüş belirtilmesinde aktif rol oynayabilir.

Bender, E. M., Gebru, T., McMillan-Major, A., & Shmitchell, S. (2021, Mart). On the dangers of stochastic parrots: Can language models be too big?. Proceedings of the 2021 ACM Conference on fairness, accountability, and transparency içinde (s. 610-623).

Conway, P., De Rosa, D., Nicoletti, G., & Steiner, F. (2006). Regulation, competition and productivity convergence.

Lipsey, R. G., Carlaw, K. I., & Bekhar, C. T. (2005). Economic transformations: General purpose technologies and long-term economic growth. Oxford University Press. s. 131-218.

Nicholas Crafts, Artificial intelligence as a general-purpose technology: an historical perspective, Oxford Review of Economic Policy, Vol. 37, Cilt 3, Sonbahar 2021, s. 521–536.

Florida Üniversitesinden Yönetim Bilimleri alanında doktorasını alan Prof. Enes Eryarsoy, şu anda Sabancı Üniversitesi İşletme Fakültesinde Öğretim Üyesi olarak görev yapmaktadır.

İki Nokta

Kitap tanıtımı, biyografi, araştırma raporu, değerlendirme ve inceleme yayınları ile bölgesel veya küresel ölçeklerde güncel ya da yapısal sorunlar.