Geçmişte bilginin neye benzediğini düşünelim. 1908 yılında arkeologlar Girit'te bir kil disk buldular. Milattan önce 2000 tarihliydi. Yani kil 4 bin yıllık. Diskin üzerinde yazılar var ama henüz ne olduğunu çözemediler. Bu bir gizem fakat bizim için önemli olan bu değil. Önemli olan bin yıl önce diske ellerindeki bilgiyi kaydetmiş olmaları.
Aradan 4 bin yıl geçti biz gene bilgiyi bir diske kaydediyoruz. Ama aradaki fark; daha çok bilgiyi, daha hızlı kaydediyoruz, arıyoruz ve işliyoruz. Ve bunu oldukça kolay yapıyoruz. Yıllar önce yazılmış bilgiyi yeniden yeniden yazma şansımız yoktu, artık bu işlem çok hızlı gerçekleşiyor.
Bilgiyi depolama imkânımız arttıkça yığınlar halinde veriler oluşmaya başladı. Bunun insanlara, kurumlara sağladığı kolaylık bugün adını sık duyduğumuz Big Data kavramının ortaya çıkmasını sağladı. Kullanım trendi her geçen gün artan Big Data, Türkçeleştirecek olursak Büyük Veri, internet kullanımının artmasıyla biz farkına bile varmadan hayatımızı etkileyen vazgeçilmez bir unsur haline geldi.
Peki, nedir bu Big Data? Big Data, eldeki çok sayıda verinin işlenerek önce veri setleri haline getirilmesi ardından da bu setler üzerinden anlamlı sonuçların çıkartılması işlemidir. Aslında Big Data, tek başına bir ifade, bir sonuç barındırmayan verinin belirli bir amaç doğrultusunda anlamlı halde kullanılabilmesini sağlamaktadır. Kullanışlı hale gelen veri, simülasyonlar oluşturmayı kolaylaştırır, verilecek olan kararları daha net istatistiki sonuçlara yönlendir.
Verilerin oluşum hikâyesi
Big Data verileri nasıl oluşuyor? Hepimiz, her gün yüzlerce yazılı, sesli, görüntülü, sensörlü veri üretiyoruz. Telefonumuzu elimize alıp bir post paylaştığımızda, Google'da bir arama yaptığımızda, navigasyon ile bir yerden bir yere gittiğimizde, kredi kartımızı kullandığımızda, Youtube'dan video izlediğimizde, telefonumuzun mikrofonunu kullandığımızda kişisel verilerimizi servis sağlayıcıları ile paylaşmış oluyoruz ve onlar da bu verileri kullanıyorlar.
Birkaç örnek ile Big Data'nın nasıl kullanılabileceğini açıklayalım. Örneğin bir yerel yönetimde çöp kovalarına koyacağımız bazı sensörler ile çöp kovalarının doluluk oranları, ne zaman doldukları, lokasyonları, adetleri gibi verileri toplayabiliriz. Çöp kamyonları verileri ile de yakıt miktarları ve rotaları gibi tüm verileri toplayabilir ve işleyebiliriz. Ardından anlamlı hale getirilen bilgiler ile hangi mahallede hangi sokağa ne kadar çöp kovası koyacağımızı biliriz. Bunların ne zaman dolduğunu bildiğimizden hangi gün ve hangi saatte onları toplayacağımızı biliriz. Yakıt tasarrufu için hangi yoldan gideceğimizi ve hangi sıra ile toplayacağımızı da bilebiliriz. Bu sayede iş gücünden, zamandan ve enerjiden milyonlarca liralık bir tasarruf elde edebiliriz.
Tüketici verileri sayesinde hangi mağazada, hangi ürünlerin, hangi fiyata, hangi zaman diliminde satılabileceğini belirleyebiliriz.
İlaç sektöründe yıllarca sürecek testlerin simülasyonlarını çok daha kısa sürelerde yapabiliriz.
Mahremiyet, güvenlik ve güç
Big Data ilkeli ve iyi niyetli kullanıldığında kişilere, kurumlara, devletlere çok büyük faydalar sağlamaktadır. Verilerin kullanılması yüzyıllardır olmadığı kadar dünyamızı, alışkanlıklarımızı, davranışlarımızı derinden etkiliyor. Doğru kullanıldığında veriler hem insanlara hem de ticari ve ticari olmayan yapılara fayda sağlamaktadır. İlerleyen yıllarda daha büyük faydaları ve etkileri göreceğimize eminim. Ancak Big Data'nın iyi niyetli kullanıldığındaki faydaları kadar kötü niyetli kullanıldığında zararları da söz konusu. Yaşanan olumsuz örnekler yüzünden artık veri güvenliği, veri mahremiyeti gibi konular da gündemde. Çünkü verilerimizi elinde bulunduran şirketler ve kurumlar gücü de elinde bulunduruyorlar.
2016 yılında gerçekleşen ABD Başkanlık seçimlerine Cambridge Analytica şirketinin Big Data üzerinden gerçekleştirdiği seçim manipülasyonu damga vurdu. İddialar ve davalar halen devam ediyor. Cambridge Analytica tüketici, takipçi, seçmen davranışlarını değiştirmek için iş dünyası ve siyasi partilere hizmet sunmayı amaçladığını ilan ederek 2013 yılında Londra'da kuruldu. 2016 yılına gelindiğinde Facebook kullanıcıların verilerini alarak milyonlarca datayı analiz ettiler. Kişisel verilerden kişilerin en mahrem bilgilerine eriştiler. Seçmenlerin kişisel durumlarını bilerek, onların etnik, siyasi, davranışsal, ekonomik durumlarına göremilyonlarca içerik oluşturdular. Bu manipülasyonu Trump lehine kullandılar. Seçmenler durumu fark etmeden algılarının değişmesini sağladılar.
Şirket benzer yöntemlerle yüzlerce global şirkete hizmet verdiğini olaylar patlak vermeden önce internet sitesinden duyurmuştu. Gene benzer yöntemlerle İngiltere'nin Avrupa Birliği'nden ayrıldığı Brexit referandumunda da etkili olduğu iddia ediliyor. Bizim verilerimizle bizi bizden daha iyi tanıyorlar. Dolayısıyla bizi etkilemeleri, yönlendirmeleri ve manipüle etmeleri oldukça kolaylaşıyor.
Telefon numaramızı nereden biliyorlar?
Her gün şirketlerden, kurumlardan, markalardan onlarca SMS ya da mail alıyoruz. Bunların büyük çoğunluğu Kişisel Verilerin Korunması Kanunu'na aykırı olarak yani bizim açık rızamız olmadan gerçekleşiyor. Bizim telefon numaramızı ya da mail adreslerimizi nereden biliyorlar? Bunun birden çok yolu var. Sitelere üye olurken telefon ve mail ile kayıt oluyor, e-ticaret alışverişleri yaparken telefon ve mail bilgilerimizi veriyoruz, bir site üzerindeki formları doldururken gene bilgilerimizi paylaşıyoruz. Bu yollardan dolayı bilgilerimiz veri halinde elden ele dolaşmaya başlıyor. Kanuna aykırı bir şekilde elde edilen veriler sayesinde birçok pazarlama kampanyası yürütülüyor.
Mart 2021 tarihinde Yemeksepeti'ne siber korsanlar tarafından bir saldırı düzenlendi. Şirketin veri tabanındaki dataları çalındı. 21 milyondan fazla kişinin verisine erişildiği söyleniyor. Peki, hangi bilgileri ele geçirdiler? İsim-soyisim, doğum tarihi, telefon numarası, mail adresi, ev – iş yeri adresi gibi bilgileri ele geçirdiler. Şimdi siber korsanlar bu datayı kime satacak ve satın alanlar hangi amaçlar için kullanacak?
Yakın zamanda 20'li yaş challenge akımı ile sosyal medyanın yeni akımı oldu. Birden çok sosyal medya mecrasında gündem oldu ve Türkiye'de 30 milyondan fazla insan paylaşım yaptı. Akımın görünüşteki amacında kişiler 20 yaşlarındaki fotoğraflarını paylaştılar. Ünlülerin de bu trende katılmasıyla bir anda paylaşımlar tüm topluma yayıldı.
Algoritmalar sayesinde…
Peki, milyonlarca insanın 20 yaşındaki fotoğrafını paylaşmasında ne sakınca var? Tabii ki elimizde kesin kanıt olmadan bu trendin veri toplamak için yapıldığını söyleyemeyiz ama bu veriler kesinlikle kullanılabilir durumda. Daha önce de 10 yaş öncesi "challenge" akımı başlamıştı. O zaman da 10 yıl önceki fotoğraflarımızı paylaşmıştık. Güncel fotoğraflarımızı da devamlı paylaşıyoruz. Artık her yaş dönümlerimiz kayıt altında. Görüntülü veri işlemleri ile bu veriler üzerinden çok fazla çalışma yapılabilir ve bunlar aleyhimizde olabilir.
Algoritmalar sayesinde, kendi ellerimizle paylaştığımız fotoğraflar üzerinden genetik, psikolojik, siyasi ve etnik birçok çalışmaya zemin hazırlamış oluyoruz. Hatta artık bazı sistemlerde yüz tanıma sistemi kullanılıyor. Dolayısıyla bizim yüzümüzle bizim sistemlerimize dahi giriş yapılabilir. O yüzden bu tarz akımlar başladığında biraz daha dikkatli hareket etmemiz ve olabilecekleri öngörmemiz gerekiyor.
Google'da aradığımız her kelime, ziyaret ettiğimiz her site, Youtube'da izlediğimiz her video veri işleme süzgecinden geçerek üçüncü taraflardan yeniden pazarlama kampanyası olarak bizim kaşımıza çıkıyor. Kimiz, neredeyiz, ne yapıyoruz, neyi sevip neyi sevmiyoruz, neye ilgi duyuyoruz. İşte bu bilgilerin tamamını bizim internette geçirdiğimiz süre içerinde ediniyorlar.
Apple örneğin, cep telefonu fabrika yazılımı ile tüm konuşmaları dinliyor ve bulut üstünde yapay zeka ile anlamlı verileri dönüştürüyor, reklam verisi olarak kullanıyor.
Yapay zeka beslendikçe gelişiyor
Son yıllarda en çok duyduğumuz diğer bir kavram da "yapay zeka." Teknolojinin geldiği son dönüm noktasında yapay zeka ile Big Data birbirinden ayrılamaz ve kelimenin anlamı ile birbirini besleyen bir konuma gelmiş durumda. Yapay zeka daha iyi performans göstermek için daha çok veriye ihtiyaç duyuyor. Yani veri ile ne kadar çok beslerseniz o kadar fonksiyonel hale geliyor.
Google her yıl IO denilen bir konferans düzenliyor. Bu etkinlikte duyurulan çalışmalardan biri de yapay zeka destekli rezervasyon uygulaması Google Duplex. Etkinlikte canlı performans ile uygulama gösterisi yapıldı. Hattın bir ucunda insan diğer ucunda yapay zeka var. Ben robot demeyi tercih ediyorum. Google Duplex diyor. Telefonun ucundaki ses o kadar başarılı ki çağrı merkezi görevlisi, karşısında konuşanın bir insan olmadığını anlamıyor. Google Duplex'in en ilginç tarafı bu. Konuşan sesin konuşma kalitesi değil yaptığı hatalar, düşünüyormuş gibi duraksamalar, emmm, ömmm gibi takılmalar, "yes" yerine "yeah" demeler, insansı hareketler…
Sistem iki taraflı işliyor bir veri kısmı bir de yapay zeka kısmı. Telefondaki ajandanızdan boş günleri ve saatlerin verisini alıyor, rezervasyon görevlisi ile konuşma ve randevuyu ayarlama işini de yapay zeka hallediyor. Duplex, ne kadar çok görüşme yaparsa o kadar çok veri topluyor ve hangi durumda ne yapacağını daha iyi öğreniyor. Bir Duplex rezervasyon için karşı tarafı aradığında oradaki de başka bir Duplex olursa olacak? Çifte Duplex! Boston Dynamics tarafından üretilen robotları hatırlıyor musunuz? Bunlardan birinin Sophia gibi bir yüze ve Google Duplex gibi bir sese sahip olduğunu düşünsenize. İşte ilerlediğimiz dünya tam da böyle.
Dijital savaşların sebebi: Veri
Kişisel verilerin yeterli bilgilendirme yapılmadan elde edilmesi, işlenmesi ve ticari olarak karşımıza çıkarılması her ne kadar günümüzün büyük problemi olsa da her birimiz verinin bize sağladığı kolaylıklara her geçen gün daha da alışıyoruz. Özellikle kullandığımız tüm platformların bize kişiselleştirilmiş deneyim sunmasını istiyoruz. Bunu sağlamayanları ise yetersiz görüyoruz.
Big Data'nın şu an bildiğimiz ya da gelecekte öğreneceğimiz pek çok yararı bulunuyor. Bununla birlikte kişisel verilerin mahremiyeti ve güvenliğini gün geçtikçe önemli hale geliyor. Artık veri, yeni çağın petrolü olarak görülüyor. Çünkü veri hangi şirketteyse ya da devletteyse o güçlü pozisyona geçiyor. İlerleyen dönemde savaşların petrol yerine veri için çıkabileceği öngörüsü ütopik görünse de şu an bile gizli ve açık dijital savaşların veri üzerinden geçekleştiği su götürmez bir gerçek. Bu yüzden dünya ülkeleri ve özellikle gelişmiş ülkeler veri savaşlarında başarılı olabilmek için her an çaba gösteriyor.
Ülkemizde KVKK (Kişisel Verilerin Korunması Kanunu) ile veri güvenliğine dair büyük adım atıldı. Bu bir süreç ve devamlı yeni şartlara ayak uyduran bir yapıyı ihtiva etmesi gerekiyor. Bizler de kullanıcılar ve tüketiciler olarak konuyla daha yakından ilgilenmeli ve haklarımızı savunmak için çaba göstermeliyiz. Diğer taraftan veriyi elde etme, işleme ve anlamlandırarak kullanma açısından da önemli adımların atıldığını görüyoruz.
Big Data'dan fayda sağlayabildiğimiz çalışmaları artırarak daha proaktif yapılar kurmamız gerekiyor. Bunun için de mecraları, veri kaynaklarını kullanan değil de kurgulayan, üreten konuma geçmemiz gerekiyor. Umut ediyorum ki petrolden daha hızlı ve daha güçlü bir şekilde ülkemizi kalkındıracak yeni projeleri çok kısa süre içerinde görüyor oluruz.