Bir süredir Big Data hakkında konferanslara workshoplara katılıyorum, ve konuyla ilgilenen data scientistleri de dinliyorum (ya da bilgisayar tarafını). Anladıgım asıl konuştugumuz şey hep Data. Data hep vardı, bu data daha once teknik imkanlar, teknolojinin henuz o noktada olmaması, bu kadar çok daha olmamasından dolayı farklı şekillerde işlenebiliyordu, ancak son 10 yılda ise bu datayı işleyebilmek icin gelişmeler oldu. Yani artık:
- Cok fazda kaynaktan data bir araya getirilip işlenebiliyor (Facebook, sensorler, edevlet kaynakları vs).
- Cok fazla kaynaktan veri akışı var. (Veri akışı hep vardı, artık burada veri akışını aynı hızda işleyebilecek makineler, softwareler cıktı).
- Bunların uzerine bir de machine learning (bilgisayarların kendi kendine ogrenmesi) ve algoritmalar eklendi (karakutular da denebilir, bir noktadan sonra kuranların bile nasıl işledigni anlayamadıgı mekanızmalar).
Simdi sosyal bilimciler acısından bunlar neden onemli:
1) Soyle dusunelim, eskiden butun birimlerin ayrı ayrı bilgisayarlarında bilgiler tutuluyordu. Yani mesela, benim Bilkent Universitesinde kaydım vardı, notlarım burada zaten bilgisayarlara tutuluyordu. Ya da Bups'ta okurken, okulda notlarım toplanıyordu. Ya da daha da kucukken notlarım yukselisin data baselerinde tutuluyordu. Ben bunlara erişmek icin notlarımı gormek icin hepsinin web sayfasına ayrı ayrı girmek zorundaydım. Simdi ne oldu. Simdi bunlar benim T.C. Kimlik numaram altında teoride bir araya gelebilecek. Yani, günümüzün teknik alt yapısı bir ogrencinin ilk okuldan lise sona kadar butun gelişimini tek bir sistem uzerinen izlemeye imkan sağlıyor (Hep zaten var olan database ler birleştiriliyor). Şimdi bir de buna her okulun ve ogretmenlerin seviyelerine gore giriş izni olacak. Yani yukselişteki kaydım (ogretmen notlarıyla birlikte sistemin icinde olacağı için), bupstaki benden sorumlu olan ogretmen ya da okul muduru bunu gorebilecek. Daha once kağıtlarda verdigimiz seyler simdi sistemlerde bulunacak.
Ya da daha once gittiğiniz hastane bilgilerimiz. Birincisi daha once sadece hastanede yazılı olarak tutulan, onların arşivlerinde tutulan bilgiler artık bilgisayar databaselerinde. Ikincisi bu databaseler devletin sistemine bağlı. Ve butun hastaneler, eczaneler bu database'e bağlı. Ozellikle turkiye'de bu bilgiler bizim T.C. Kimlik Numaramıza bağlı. Devlet gerekli yerlere gerekli izinleri vererek bunların bazı kişilere gorunur olmasını, bazı kişilere de gorunmemesini sağlıyor. Ornegin bir arkadaşımın yaptıgı araştırmaya gore, bir hastanede yapılan kan tahlilin sonucu kişinin T.C.Kimlik numarası altındaki sağlık bilgilerine işleniyor. Bu bilgiyi aile hekimleri ve aile hekimliği kliniği gorebiliyor (siz izin verseniz de vermeseniz de). Buradan da kişinin ne tip bir hastalığı oldugu bilgisi çıkıyor. Mesela artık hastaneden çıktıgımızda bize bir recete numarası veriyorlar. Sisteme T.C. Kimlik numaramızın altına bu recete numarasını giriyorlar. Recete numarasında da ilaçlar yazıyor. Eczaneye gittiginizde bu recete numarasını eczacıya veriyorsunuz, o da size yazılmış ilacı size verebiliyor. Simdi eczacıya gittiginizde bir de bazen daha onceki borçlarınızdan dolayı para odemeniz gerekebiliyor. Bu ortaya cıktıgında, eczacıya soruyorsunuz bu nerden diye, o da size (ne kadar geçmise gidebiliyor bilmiyorum), hangi hastaneye ne zaman gittiginizi, daha once aldıgınız ilaçları, ilaçlarınızın suresini vs. soyluyor.
Burada yani daha once kağıt uzerinde olan databaseler bilgisayara aktarılıyor, aynı hizmetlere bakan (hastane, sağlık ocagı, aile hekimleri, eczane) kurumlar hastalarının bilgilerine erişim sahibi oluyor (bunu sağlayan en onemli sey de T.C. Kimlik numaramız oluyor). Burada oncemli nokta bu bilgilere başka kimlerin (şirketler, diğer bireyler, guvenlik birimleri vs) erişim sağladığı ilgili.
Yani mesela universiteler, okullar öğrencilerin sağlık bilgisine erişim sağlayabilir mi? bu toplumda iyi nitelendirilmeyen birr hastalığı olan ogrenci icin dışlanma, okulda farklı muamele gorme gibi sonuçlar dogurabilir.
Ya da mesela sigorta şirketlerinin (ozel sigorta şirketleri) sağlık bilgilerine ek olarak kişilerin sabıka kayıtlarına da şirketten ulaşması. Bu tip bilgiler farklı kurumlara farklı şeyler ifade edebilirler. O yuzden Turkiye de ve birçok ülkede işe girmeden once sabıka kaydı isterler, çünkü firmalar için ayırt edici bir faktordur.
Ya da soyle dusunebilim. Kişilerin daha once geçirdikleri hastalıklarına, başvurdukları şirketlerin erişimleri olması, şirketlerin onceliklerine goru o kişiyi işe almak almamak arasında ayrımcılık yapılmasına sebep olacaktır (mesela daha once ölümcül bir hastalık atlatmış kişileri işe almak istemeyebilirler. Bu çok ciddi ayrımcılık uygulamalarına sebep olacaktır. )
2) Yeni veri sisteminde ikinci bir nokta da farklı platformdaki verilerin birleşebiliyor olması.
Yani, mesela sigorta şirketleri bizim sağlık bilgilerimize ulaşabiliyor bizim verdigimiz yetkiler dahilinde. Ayni sigorta şirketlerini sizin facebook bilgilerine de ulaştıgını farz edelim. [Facebook'daki profilimiz, fotograflarımız, yazdıklarımız, arkadaşlarımız bizim ve bizim çevremiz hakkında çok detaylı bilgiler veriyor. Artık bu tip platformlara insanlar da bakmıyor. Hazırlanmış yazılımlar bu tip sayfaları gozden geçirerek kişilerle ilgili onemli bilgileri ortaya çıkarıyor (Mesela; Sigara içiyor mu? alkol alıyor mu? hangi politik goruşte? Ne tip mekanlara gidiyor? arkadaşları daha çok hangi gruplardan? Unutmayalım arkadaşlarımız, onların grupları bizim hakkımızda çok şey söyluyor. Hangi gruplara uye?). Eger bu bilgiler halka açıksa, o zaman zaten bunlara istedigi gibi erişim sağlayabilir, ama eger bu bilgiler kapalıysa, farklı yollardan bunlara erişim sağlaması gerek.] Ya da sigorta şirketlerinin trafik kayıtlarınıza ulaştıgını varsayalım. Bunlar bizim primlerimizi yükseltecek, ya da düşürecek, ya da özel sigorta yaptırmamıza olanak sağlayacak ya da bunu engelleyecek durumlar olarak karşımıza çıkabilir.
3) Yani, bu datalar hep toplanıyordu, gunumuzde yapılmaya çalışılan ya da yapılan ise bu databaselerin birbiriyle ilişkilendiriliyor olması. Ve hangi database'in hangisiyle ilişkilendiriliyor oldugu ise kişiler icin avantajlar ve dezavantajlar yaratabilir. Hangi kurumların neye göz onunda bulundurdugunu bireyler olarak bilemiyoruz. Kurumların oncelikleri, o toplumların yapısı, ulkedeki politik gelişmeler neleri goz onunde bulunduracaklarını belirliyor. Yani sigorta şirketleri her zaman bizim isim, kimlik, yaşadığımız yer bilgisine sahiplerdi, ama
4) Bu data birlikteliğinde onemli olan farklı şirketlerin kendi bilgilerinin dışında da daha setlerine erişebilme ihtimalleri ve bunlardan çıkacak sonuçlar. Bir de niye bunların bu bilgilere eriştiklerini de anlamıyoruz aslında.
Benim de çalışma alanım telefonlar uzerinden ele alalım. Telefonlarımıza bir çok uygulama yukluyoruz. Specifik bir kac uygulamayı aldıgımız zaman, mesela Whatsapp. Bu uygulama telefonda Camera, Contacts, Location, Microphone, Phone, SMS ve Storage bilgilerine erişiyor. whatsapp butun bu aygıtları verimli olarak kullanıyor desek de, bircok uygulama Whatsapp'ın Termsand Condition'larına sahip, ya da etik bilincine, ya da buyuk firma olmasından dolayı riski minimuma indirme istegine sahip olmayabilir. Yani ornegin telefonumumuza yukledigimiz bir uygulama başka bir uygulamadan haberdar olabilir.
Sonra websitesinde diyorki biz meta data bilgilerinizi aynı zamanda ortak kuruluşlarımızla da paylaşıyoruz. Simdi butun aygıtların birbiriyle bağlantılı oldugu bu ortamda, whatsapp'da saklı olan bilgilerimiz artık bu şirketlerin yan kuruluşlarıyla da paylaşılıyor. Ucuncu gruplarla da paylaşılıyor (Third part companies).
Simdi bu yukardakinden biraz daha farklı. Cunku burada farklı farklı şirketler birbirlerine bir aygıt uzerinden birbirine erişmesine izin veriyor. Butun bilgiler değil ama bazı bilgiler bu şirketler arasında paylaşılabilir. Bu şirketlerin bizim hakkımızda telefonlarımızdan dolayı birçok bizim hakkımızda bilgiye sahip oluyorlar. Mesela nerelere gittik, kimlerle konuştuk, hangi lokantada yemek yedik. Butun bunlar suanda bir onem taşımıyor olabilir ancak, eger bu ucuncu parti kurumlar ya da bu şirketlerin ortakları eger bu bilgileri paraya dondurebilecek kişilerse, bize avantaj yada dez avantaj olarak donebilecek bilgiler olabilir bunlar.
Simdi soyle dusunebilim yani şuandaki paylaşım durumundan dolayı: Facebook ve Whatsapp bir kullanıcının ortak bilgilerine sahipler. Oysa biz bunları ayrı ayrı kullandıgımızı dusunuyoruz.
Simdi tabii bir de anonim yapma ve deanonimized olayı var. Yani şirketler diyorlarki biz sizin bilgilerini anonim yapıp başka kurumlara veriyoruz, yani belli kişiyi ayırt edebilir bilgileri silerek onu başka kurumlarla paylaşıyoruz. Sonra da şoyle bir muhabbet var ama aslında bunlar daha sonradan deannonimized olabilir.
Simdi yukarıdan soyle bir şey cıkıyor. Ilk olarak bunun bir devlet kurumları arasında paylaşılan kısmı var. Yani devlet kurumları işlerini daha verimli hale getirmek, vatandaşlara daha hizmet sağlamak ve tabii ki kendi sistemini daha iyi oturtmak ve vatandaşları daha iyi yönlendirmek (kontrol edebilmek) için bu sistemleri kuruyor. Bunlar bilgi alışverişinde bulunuyorlar. Ve bu şekilde avantajlar sağlandığı gibi, hukuk kuralları henuz bunlara yetişemedigi icin sıkıntılar da ortaya çıkabiliyor. (Tabii burada bunun guvenlik bağlantısına hiç deginmedik bile)
Simdi ikinci konu ise bunun ticari tarafı. Bir de ticari bilgilerimiz var ortalarda dolaşan. Ornegin telefonlarımıza yukledigimiz uygulamalar bizimle ilgili bir çok bilgiye sahip oluyor (fitbit uygulamaları kalp atım hızımızı, biyometrik verilerimizi biliyor). Ya da kredi kartı firmaları alışverişlerimizi tutuyor elinde. Yani sigara paketi alıp almadıgımızı kredi kartı firmaları biliyor. Bankaların ortak çalıştıgı sigorta sirketleri de bu bilgilere sahip oluyor mu o da soru işareti.
(Mesela ortak çalışan bir banka ve sigorta sirket bilgi alışverişinde bulunabilir mi?).
Simdi bu gelinen noktada bir başka nokta da ozel kuruluşlarla, devlet arasındaki bilgi alışverişi. Zaten Snowden olayları da oradan çıktı. Google, yahoo vs gibi bir çok firmanın devlete kişi bilgilerini mass olarak verdigi ortaya çıkmıştı. Bu sirketlerin gonullu katılımıyla da olabilir ya da zaten devlet bu aygıtları kullandıgımız ve alt yapıyı kendisi temin ettigi icin bunlara zaten hali hazırda erişiyor da olabilir. Yada buna erişimi olan şirketlerle birlikte çalışıyor olabilir. Artık o kadar çok katmanlı ki olay tek bir yerden degil farklı noktalardan bakmak gerekiyor. Yani, whatsapp Turkiye'de hiçbir kurumla veri alışverişinde bulunmuyor bile olsa, telefon şirketi uzerinden veri trafigi oldugu icin Turkcell ya da Turk Telekom (Wifi ev bağlantısı ile), whatsapp'a eriştigimi bilebilir. Istendigi takdirde de bu devlet ile paylaşılabilir. Simdi bu bir olay.
Başka bir ozel sirketler ve devlet arasında veri alışverişi ise, insanların hizmete erişimlerini guclendirmek icin yapılıyor. Ornegin E-nabız şirketi, android uzerinden S health ile senkronize olabiliyor. Dolayısıyla bilgiler eşleştirilebiliyor.
Aynı şekide insulun pompaları dusunuldugunde. Bunlar bircok veri tutabiliyor. Bu verileri hastalar doktorlarına gonderebiliyorlar, boylece daha iyi yonlendirme alabiliyorlar. Yalnız, burada da bu pompaları temin eden şirketler de bu bilgilere sahip oluyor ve araştırmaları icin (genelde ilaç şirketleri bunlar) kullanabiliyorlar.
Simde tabii bir de bunun sınıflandırma tarafı var: Ozel sirketler ya da kurumlar bizleri sınıflandırıyor. bizleri sınıflandırmalara koyuyor, zaten sınıflandırdıklarını uzerine yeni sınıflandırmalar ekliyor. Ya da bu sınıflandırmaları kullanarak ilerliyor. Bu da sınıflandırmalardan dogan avantajların ya da dezavantajların tekrarlanması anlamına geliyor.
simdi burada aslında amacım Buyuk Veri hakkında birkaç kelam etmekti. Simdi genel butun bu konferanslara girdigimde aslında Bigdata yada Buyuk veri kelimesinin birazcık olayı cok soyut hale getirdigini, karıştırdıgını aslında biraz da bunun pazarlama tarafı oldugu izlenimine katılıyorum. sonuç olarak hep veri vardı, ancak son donemlerdeki teknolojik gelişmelerden dolayı bu veriyi işleyiş şeklimiz gelişti ve bu verilerin birbirine bağlı olarak çalışma imkanları 10 yıl ya da 15 yıl oncesine gore fazlalaştı. Muhtemelen 20 yıl sonra kişilerin birçok verileri birbirine daha da bağlı olacak ve bunları da da gorebiliyor olacagız. Bu da kişiler hakkında hem ozel de hem de araştırma anlamında araştırma yapılabilme olayını arttırıyor olacak.
Bunda kimlik numaraları bunlara erişimi cok kolaylaştıran şeyler olarak karşımıza çıkacak bizim gibi ulkelerde. Insanların isimleri vs karışmadan banka kartları ile sağlık bilgileri bir platforma bağlı olabilir, ancak bu istenen birşey mi olur o konuda supheliyim. Buradan birçok doğru olmayan yorum yapabilir, ve çıkarımlar ortaya cıkabilir. Biz sirketlerin verilerimizden ne tip çıkarımlar yaptıgını bilmedigimiz icin de bireysel olarak avantajlı ancak kumulatifte dez avantajlı oluyor olabiliriz. Yani soyle dusunun, kredi kartı temin eden bankalardan birinin aynı zamanda bir de sigorta sirketi oldugun var sayalım. Simdi en avantajlı sigorta yapılması istenen grup kimler, sağlıklı insanlar. Simdi bankanın alışverişlerinden sigorta ve alkol kullanmayan organik yiyenleri ayıklayıp, sigorta sirketiyle paylaştıgını var sayalım. Boyle bir noktada, birincisi, obur grup tamamen bu olayın dışında bırakılmış oluyor, kendi sigorta sirketinin kriterlerine uyan kışiler sadece sigortalanmış oluyor. Yani aslında sigorta şirketi icin en avantajlı durum ortaya çıkmış oluyor.
Yazdıkça insanın yazası geliyor :)
Hiç yorum yok:
Yorum Gönder