DERİN KURGU ÇAĞI

Şebnem Özdemir 03 Mayıs 2024, Cuma

Ses ve video üreten yapay zekâların gelişi ile derin kurgu (deepfake) geliştirmek için gerekli olan teknik tecrübe, eskisi kadar elzem değil. Birey, bir toplumu sarsabilecek görüntüleri, prompt (istem-makineye kelimelerle yapılan tarif) ile saniyeler içinde geliştirebilecek güce ulaştı.

Deepfake (derin kurgu) ilk defa bir Hollywood filminde kendini göstermişti. 1995 yılı yapımı Copy Cat (Kopya Cinayetler) filminde, katil öldürmeyi planladığı başrol oyuncusunun yüzünü, bilgisayar teknolojisi kullanarak bir başka resme entegre etmişti. Filmdeki bu ürkütücü sahne, kişinin yüz verisine sahip olabildiğimizde, onun varlığını hiç istemediği bir videoya, bir resme kolaylıkla transfer edebileceğimizi açıkça göstermekteydi.

90'ların başından itibaren derin kurgu-bilim dünyasında, çeşitli araştırmalarda varlığını göstermeye başladı. Ancak en somut örnek 1997 yılında "Video Rewrite Program" (Videoyu Yeniden Kurgulama) projesiyle geldi. Projede bir videonun orijinalindeki konuşma, bir başka konuşma ile değiştirildi. Bu örnek, dijital dünyada bir bireyin konuşmasının manipüle edilebileceğini ortaya koydu. O tarihten sonra çalışmalar devam etse de "derin kurgu" asıl çehresini 2017 yılında kazandı.

Farklı bir sosyal ağ ortamı olan Reddit'de bir kullanıcı "derin kurgu" başlığı ile bir konuşma ortamı açmış ve bu ortama manipüle edilmiş videolar yüklenmişti. İlk yüklenen videolar, başta Hollywood ünlüleri olmak üzere, çeşitli bireylere ait yüzlerin porno içeriklere entegrasyonu şeklindeydi. Bu olay, dijital dünyada bir anda yaygınlaştı, özellikle pornografik içerikler sunan web sitelerine, anında ünlülerin derin kurgu porno videoları yüklendi. Bu siteler arasından en çok ziyaret edilen dördü 134 milyonun üzerinde izlendi.

Derin kurgu (deepfake) kavramsal olarak, yapay zekânın bir alt dalı olan derin öğrenme (deep learning) ve sahte/sahtelik (fake) kelimelerinin birleşiminden oluşur. Ancak geliştiren kişinin/ekibin öncelikle bir kurban seçmesi, bu kurban ile ilgili detaylı bir kurgu yapması gerekiyor. Bu nedenle, bu teknolojinin tam çevirisi derin sahtelik değil, derin kurgudur.

Ülkelerin hassas dönemleri hedef alınıyor

Hollywood'un ünlü kadın yüzlerini hedef alan vakalardan sonra, sıra siyasi isimlere de geldi. 2018 yılında Arjantin Devlet Başkanı'nın yüzü, Adolf Hitler'in yüzüne entegre edildi; dönemin Almanya Devlet Başkanı Angela Merkel'in yüzü, eski ABD Başkanı Trump'ın yüzü ile değiştirildi. Aynı yıl Trump'ın Belçika halkına seslendiği bir başka derin kurgu vakası gerçekleşti. Bu vakada diğerlerinden farklı olarak Trump'ın yüzü değil, sesi manipüle edilerek, küfür ve hakaret dolu konuşmalar yapıyormuş gibi gösterildi. Sonraki yıllarda başta Donald Trump, Barack Obama olmak üzere dünya üzerindeki pek çok siyasi ismin videolardaki yüzü, mimikleri, konuşmaları manipüle edildi.

Derin kurgu vakalarında, özellikle siyasi seçimler, başkanlık değişimi gibi ülkelerin hassas dönemleri hedef alınıyor. 2019 yılında Gabon Cumhurbaşkanı Ali Bongo'nun derin kurgu videosu, halkı birbirine düşürmüş, askeri kuvvet darbe yapmıştı. 2020 yılında Delhi'deki seçimlerde yarışan adaylardan biri hedef alınarak, asla zikretmediği kelimeleri söylüyormuş gibi gösterildi. Aynı yıl Amerika seçimlerinde, Donald Trump'ın oğlu, Trump Junior'ın, kuvvetli adaylardan olan Biden'a ağır hakaretler içeren videosu da sosyal medya platformlarında paylaşıldı.

Derin kurgu üreten karanlık ekiplerin, siyasilerden sonraki hedefleri ise şirketler oldu. 2019 yılında Birleşik Krallık'taki bir enerji firmasının CEO'sunun sesi manipüle edilerek, ticari bir dolandırıcılık için kullanıldı.

Bir derin kurgu videonun gerçekçiliği, kurgusu yapılacak kişinin ne kadar yüz ve ses verisi olduğu ile yakından ilişkilidir. Bu nedenle ilk vakalarda Hollywood ünlüleri ve siyasiler hedef alındı. 2019 yılında çeşitli konsey ve parlamentolarda yüz ve ses verisinin mahrem olduğu, bireyin açık izni olmadan paylaşılamayacağı şiddetli şekilde tartışıldı. Ancak 2020 yılında Covid-19'un yükselmesi, tartışmaları durdurdu.

Saniyeler içinde derin kurgu

Pandemi boyunca bireyler, işlerini, eğitimlerini, sosyal yaşantılarını devam ettirebilmek amacıyla, uzaktan görüşme sistemlerini kullanarak, yüz, mimik ve ses verisini cömertçe paylaştılar. Bu durum pandemi sonrasında herhangi bir bireyin derin kurgu videosunun yapılabilmesine olanak sağladı. Makine (yapay zekâ), artık sadece Amerikalı sarışın bireyin yüz özelliklerini değil, herhangi bir ulustan bir bireyin yüzünü anlayabilir, üretebilir hale geldi. Aynı durum ses verisi için de geçerlidir. Herhangi bir dilin nasıl konuşulduğu, kelimelerin nasıl ağızdan döküldüğü, kolayca taklit ve manipüle edilebilir durumda.

Buraya kadar bahsettiğimiz tüm bu derin kurgu vakalarında, yüksek hacimli veri ve teknik bir beceri sahipliği söz konusu. Yani birey, derin öğrenme (yapay zekânın bir alt dalı) alanında belli bir bilgi ve beceriye sahip olmalıdır. Ancak bu durum 2022 yılında üretici yapay zekâların (generative AI) gelişi ile değişti.

Her ne kadar Kasım 2022'de ChatGPT'nin gelişi ile üretici yapay zekâların dönemi başlamış gibi düşünülse de, bu süreç daha erken yıllarda kendini gösterdi. ChatGPT metin tabanlı olma özelliği ile öne çıkarken, Midjourney, Dall-E, Stable Difusion gibi uygulamalar görüntü üretmeleri ile öne çıkıyor. Bu görüntü üreten makinelere ek olarak, bu görüntüleri gerçek videolara çeviren üretici yapay zekâ uygulamaları da bulunuyor.

Üretici yapay zekâların gelişi ile derin kurgu geliştirmek için gerekli olan teknik tecrübe, eskisi kadar elzem değil. Birey, bir toplumu sarsabilecek görüntüleri, prompt (istem-makineye kelimelerle yapılan tarif) ile saniyeler içinde geliştirebilecek güce ulaştı.

Bir vaka tahlili

2023 yılında üretici yapay zekâlarla üretilen sahte görseller, başta ünlü simalar olmak üzere pek çok kurumu, ülkeyi ve bireyi derinden etkiledi. Örneğin ülkemizde gerçekleşen 6 Şubat depremi sonrasında Avrupa'da "depremin Türkiye-Suriye sınırındaki gizli nükleer santralin patlaması nedeniyle olduğu" haberi sahte görsellerle desteklenerek paylaşıldı. Yine deprem döneminde aşağıdaki görselleri farklı haber servisleri farklı şekillerde sunmuşlardı.

Soldaki görseli paylaşan haber servisi "Uzakdoğulu bireyin depremde Kuran-ı Kerim bularak Müslüman olduğunu" açıklamıştı. Sağdaki görseli paylaşan haber servisi ise, "görselin yapay zekâ ile üretildiğini, böyle bir haberin olmadığını, insanların kandırılmaya çalışıldığını" iddia etmişti.

Bu görsellerden soldaki, çözünürlüğü düşük ancak yapay zekâ ile üretilmemiş bir görsel. Resmin içindeki kişiler, ifadeler, mimikler ve mekân gerçek. Sağdaki resim ise bir üretici yapay zekâ çıktısı. İlk resim kaynak olarak kullanılmış, ikinci resim üretilmiştir. Dikkat edilirse ilk resimde ayakta duran kişinin atkısı, ikinci kurgu resimde sakala dönüşmüş. Sağdaki resimde arkada duran tabeladaki yazılar anlamsız harf yığınları şeklinde duruyor. Bu, resmin yayıldığı o dönemlerde görsel üreten üretici yapay zekâlardaki temel sorunlardan en belirgin olanıdır: Yazıların harf yığınları şeklinde temsiliyeti, anlamlı kelime oluşturamama sorunu. Sağdaki resmin sahteliğine dair son emare ise ellerdir. Kuran-ı Kerim'i tutan eldeki parmakların oranı ve duruşu normal dışıdır. Yine bu da, görsel üreten makinelerdeki tipik sorunlardandır.

2023 yılı bu ve benzeri pek çok kurgu görselin manipülasyon amaçlı kullanıldığı bir yıl oldu. Ancak yılın 3. çeyreğinden sonra bu üretici yapay zekâların resim çıktılarını, videolara dönüştüren üretici yapay zekâlar yükseldi. Runway AI başta olmak üzere bu özelleşmiş makineler (yapay zekâlar) gerçeğine yaklaşan videolar üretebiliyorlar. 2024 yılının başında OpenAI, video üreten bir başka yapay zekâsını duyurdu: Sora.

Ayırt etmek mümkün değil

Sora'nın hemen arkasından Runway AI bir üst versiyonunu piyasaya sürdü. Her iki yapay zekânın da gerçekçiliği gözle ayırt edilemeyecek bir seviyeye ulaştı. Bu makinelerle üretilen videolardaki tek sorun, insanın dudak hareketlerinin herhangi bir şeyi söylüyormuş gibi kurgulamasının yetersiz oluşudur. Ancak Sora'nın çıkışından 10 gün sonra duyurulan bir başka üretici yapay zekâ, Lips SYNC, bu sorunu da ortadan kaldırdı.

Şöyle düşünün, 2023 yılından önce, toplumu manipüle etmek isteyen yapıların, derin kurgu üretmek için güçlü bilgisayarlara, yüksek teknik bilgiye, bol miktarda veriye ihtiyacı varken, şimdi ise sadece biraz hayal gücü ve kelimeler yeterli. Zarar vermek istediğiniz kişinin resmini, görsel üreten bir yapay zekâya yüklüyor, onu asla yapmadığı bir şeyi yaparken, olmadığı bir yerdeymiş gibi gösterebiliyorsunuz. Sonra buradan elde ettiğiniz resmi, video üreten yapay zekâya yüklüyor, ondan resmi bir kamera çekimi haline dönüştürmesini istiyorsunuz. Son hamle o kurgu içinde ne söyleyeceği… Bunu da ses ve dudak hareketleri üreten bir başka yapay zekâ ile oluşturuyorsunuz. Şimdi elinizde gerçek bir resimden, asla gerçekleşmemiş bir olaya dair derin kurgu videosu var, ne yapmak istediğiniz, kimin itibarı ile oynamak istediğiniz sizin seçiminiz.

Mart ayının 3. haftası Joe Biden'ın yeniden seçildiği bir dünyayı anlatan yapay zekâ üretimi video kritik tartışmayı başlattı. Amerikan Federal Seçim Komitesi konuyu, "2023: REG 2023-02 Artificial Intelligence in Campaign Ads" (Kampanya Reklamlarında Yapay Zekâ) başlığı ile konuyu acilen değerlendirmeye aldı. Ancak henüz kesin bir karara varılamadı. Bu arada California, Texas, Michigan, Washington ve Minnesota eyaletleri, yapay zekânın herhangi bir şekilde kullanıldığı her şeyin etiketlenerek servis edilmesine dair yasa çıkarıldı.

Mart ayının 4. haftası, genç bir araştırmacı üretici yapay zekâlarla kendisi gibi konuşan ve düşünebilen bir dijital varlığını üretti. Önemli bir şirketin insan kaynakları mülakatına bu derin kurgu varlığını soktu. Mülakatta soru soranlar gerçek bir insan ile konuştuklarını zannederken, derin kurguyu üreten genç, kahkahalarla onları izledi.

Yeni dünya artık gözümüze, kulağımıza asla inanmamamız gereken bir düzene sahip. Zihin, eğer onu güçlendirmezsek, kötücül yapıların en temel hedefi. Derin kurguları, gerçeklikten ayırt etmek artık mümkün değil. Elimizdeki tek şey şüphecilik, iyi bir araştırma ve güçlü düşünen bir zihin… Çünkü her şey gerçekten düşünen bir toplum için beyan edildi.

Benzer Haberler

Oruç, gücünün ve iştahının kırılmasıyla bedenin ruh üzerindeki etkisini azaltmak amacıyla yapılan ibadettir. İştahın iki göstergesi olan mide ve kan gücünün kırılmasıyla bedenin ruh üzerindeki baskısını azaltmak orucun gayesini teşkil eder.

Yakın gelecek büyük değişimlere gebe… Yapay zekânın hayatın her alanında yer alacağı, tıpkı 90’lı yılların interneti gibi bir devrim olarak görülen Web 3.0 ile bankaların dahi önemini yitireceği, gündelik pratiklerimizin köklü değişimlere uğrayacağı öngörülüyor. Bir yandan arzulanan, öte yandan endişeyle yaklaşılan bu teknolojiler beraberinde bazı riskleri de getirirken önümüzdeki günlerde etik ve güvenlik gibi konular öne çıkacak gibi görünüyor. Neticede herkes bunların ne getirip ne götüreceğinin merakı içinde. Yeni nesil teknolojiler karşısındaki halimizi Prof. Dr. Çetin Kaya Koç’un şu sözleri çok güzel özetliyor: “Pusulasız sulardayız.” Dijital teknolojileri ve yol açacağı değişimi, içinde bulunduğumuz dönüşümü, Web 3.0, robotlar ve yapay zekâ devrimini, bu teknolojilerin faydalarını ve risklerini Çetin Kaya Koç ile konuştuk.