enflasyonemeklilikötvdövizakpchpmhp
SON DAKİKA
07:16 Türkiye’de son günlerde yaşanan orman yangınlarıyla mücadeleye destek vermek isteyen vatandaşlar, CİMER’e başvurdu
06:41 Azerbaycan-Suriye Enerji Koridoru
06:26 Eskişehir’deki orman yangınında şehit olan AKUT gönüllüsü Tekin Enes Sarıyıldız’ın mezun olduğu okuldan alamadığı diploması, ailesine teslim edildi
00:56 İskoçya Başbakanı Gazze’deki durumu “soykırım” olarak nitelendirdi
00:52 Trump’ın konuşlandırma emrinin ardından… Amerikan nükleer denizaltıları hakkında ne biliyoruz?
00:46 Yorum: Paşinyan’ın son açıklamaları ışığında gerçek Ermenistan ve Anayasa Değişikliği
00:38 Gazze ateşkesi: ‘Kapsamlı anlaşma’ konuşmaları, durgunlaşan müzakereleri harekete geçirebilir mi?
00:38 Yıllık izinlerini memleketlerinde geçiren gurbetçilerin yaşadıkları ülkelere dönüş yolculuğu başladı
00:26 İzmir’de, su tüketiminin yoğun olduğu bölgelerde 6 Ağustos’tan itibaren 6 saatlik su kesintisi yapılacak…
00:17 Bakan Kurum: “Yangın bölgelerinde bu ay içinde hak sahipliği çalışmaları biten Bilecik ve İzmir’de konutların temellerini atacağız”
00:12 Washington Fas’ın Batı Sahra üzerindeki egemenliğini desteklediğini açıkladı
10:08 Nevşehir Kültür Yolu Festivali dokuz gün boyunca kültür, sanat ve tarih dolu etkinliklerle adeta bir açık hava sahnesine dönüşüyor
10:02 Orman Genel Müdürlüğü (OGM), “Yangın yönetim uçağı OTAĞ’ı 2025’te 246 saat uçarak 206 orman yangınını haritaladı”
09:33 Belirsizlikler Çağında BRICS+ ve Yeni Küresel Düzen
09:14 AK Parti MKYK Üyesi ve Gaziantep Milletvekili Şamil Tayyar Açıkladı: Piyasalar Altüst Olabilir
00:53 14 ilde DEAŞ operasyonu: 26 gözaltı
00:53 Portekiz kulübünün sportif direktörü Mario Branco, Kerem Aktürkoğlu için ilk etapta 30 milyon Euro istedi.
00:49 İstanbul Büyükşehir Belediyesine (İBB) bağlı İSFALT ve İETT’deki ihaleler soruşturmasında, özaltına alınan 25 şüpheliden 5’i tutuklandı.
00:48 Analist Tuğçe TECİMER: “Barış Sürecinde Tarafsız Diplomasi Adımı: Abu Dabi Görüşmesi” 
00:43 DMM: ‘400 akademisyen usulsüz şekilde atandı’ iddiası doğru değildir
TÜMÜNÜ GÖSTER →

Haftanın odağı: Yapay zekâyı ne besliyor?

Haftanın odağı: Yapay zekâyı ne besliyor?
24 Nisan 2023
888
A+
A-

* Yapay zekâ alanındaki teknolojiler gelişmeye ve yaygınlaşmaya başladıkça teknolojinin arka planına ve teknik boyutlarına yönelik tartışmalar ve araştırmalar da giderek artıyor.

* Bu teknolojiyi pazarlamak isteyenler ve onlara yatırım yapanlar bu tartışmalardan pek memnun olmasa da, bu eleştirel yaklaşım sayesinde teknolojinin daha faydalı ve güvenli bir şekilde gelişmesini sağladığımızı düşünüyorum. 

Son dönemdeki en büyük tartışmalardan birisi de bu yapay zekâ teknolojilerinin kullandıkları veriler ve bunların nereden ve nasıl toplandığı konusu. Geçmiş bültenlerde bahsettiğim gibi bu yapay zekâ teknolojileri büyük veri yığınları ile eğitilmesi gereken araçlar ve bu da ciddi büyüklüklerde verilerin toplanması gerektiği anlamına geliyor.

Midjourney ve Dall-E gibi araçların sanatçılardan büyük tepki görmesinin asıl sebeplerinden birisi de buydu. Bu yapay zekâ sistemlerini geliştirenlerin kimseden izin almadan internette buldukları bütün görselleri sistemlerini eğitmek için toplaması birçok etik ve yasal soru işaretinin ortaya çıkmasına neden oldu. Özellikle rızası alınmadan eserleri çalınan sanatçıların buna tepki göstermesi kaçınılmazdı.

Getty Images görsellerinin sistemde sebep olduğu glitch’ler büyük kurumların yasal mücadeleyi seçmesine sebep olurken, bir grup teknolojist ve sanatçı bu teknolojiyi kendileri için etik ve faydalı hâle getirmenin yollarını arıyor. Bu girişimlerden birisi olan Spawning, yakın zamanda “Have I Been Trained” isimli bir site ile isteyen herkesin kendi eserlerini bu eğitim verileri içerisinde aramasını ve kolayca bu sistemlerden çıkarılmayı talep edebilmesini sağlıyorlar.

Ancak söz konusu yazı temelli yapay zekâlar olduğunda durum daha karışık bir hâl alıyor. Open AI’dan Google’a birçok yapay zekâ teknolojisi geliştiren şirket internetten metin toplamanın kolaylığı sayesinde çok daha büyük veri yığınlarını kimseden izin almadan topluyor ve yapay zekâlarını bunlarla eğitiyor.

Washington Post’un hafta içerisinde yayınladığı büyük araştırma bu rızasız veri toplamanın boyutlarını daha iyi görmemizi sağladı. Google’ın C4 isimli eğitim verisi yığınını inceleyen gazeteciler 15 milyondan fazla websiteden bu amaçla toplam 806 GB boyutuna ulaşan metin toplandığını buldu. Post bu veriyi görselleştirmekle kalmamış aynı zamanda merak ettiğiniz siteleri veritabanında aratıp oradan ne kadar veri çekildiğini görebiliyorsunuz.

Doğal olarak en çok veri toplanan yerler içerisinde büyük haber siteleri, Wikipedia ve büyük blog platformları var. Ancak bunların yanında radikal politik grupların siteleri ve 4chan, kiwifarms gibi internetteki en riskli siteler de veritabanı içerisinde bulunuyor. Ayrıca hem kendi kişisel sitemi hem de NewsLabTurkey’i 15 milyon sitenin arasında görmek çok ilginç bir tecrübeydi.

Tahmin edebileceğiniz gibi bu veriler içerisinde telifli birçok içerik bulunuyor ve bu veri toplama sürecinde kimseden rızası alınmış değil. Bunun ana sebebi ise bu veri toplama sürecinde yeterli kontrollerin ve filtrelemelerin yapılmıyor ya da yapılamıyor olması.

Yapay zekâ teknolojileri gelişmeye ve geliştirilmeye devam ediyor ve edecek. Ancak internetteki verileri bu kadar keyfi ve kontrolsüz bir şekilde kullanıyor olmaları hem etik hem de teknik anlamda birçok soruna kapı aralıyor. Eğer bu konuyu tartışmayı ve çözümler üretmeyi ertelersek, ileride hiç çözemeyeceğimiz bir noktaya gelebilir.

Ahmet A. Sabancı – NewsLabTurkey

Yorumlar

Henüz yorum yapılmamış. İlk yorumu yukarıdaki form aracılığıyla siz yapabilirsiniz.