Big Data konusu son dönemde internet gündemini en çok meşgul eden konuların başında geliyor. Herkesin bu konuda söyleyecek sözü var ama nedir tam olarak bu “Big Data” ya da veriyi büyük yapan etmenler nelerdir?
Facebook, Twitter gibi sosyal ağlarda, kamera, fotoğraf makinesi gibi dijital medya platformlarda ya da akıllı telefonlarda dönen küresel verinin büyüklüğü nedeniyle bugün eriştiğimiz ya da erişemediğimiz tüm bilgi, otoriteler tarafından “Big Data/Büyük Veri” olarak tanımlanıyor.
Dünya nüfusu 7 milyarı geçmiş durumda. 7 milyar kişinin neredeyse yarısı internet bağlantısına sahip. 1.1 milyar Facebook kullanıcısının ve 500 milyon Twitter kullanıcısının her gün web'e milyardan fazla bilgi girişi yaptığı günümüzde, her gün 2.5 zettabayt verinin yaratıldığı düşünülüyor. Bu bilginin %90'ı son iki senede üretilmiş. Hal böyle olunca, internet bilgi erişimini kolaylaştırmıyor, yeni bir bilgi çöplüğü yaratıyor gibi görünüyor.
Hızla artan veri şişkinliği sonucunda bilginin anlamlı hale gelmesi için çeşitli çalışmalar yapılmakta. Bu çalışmaların başında, kulağınıza tanıdık gelecek veri madenciliği yer alıyor. Veri madenciliği sayesinde markalar, işletmelerine ait veri ambarları oluşturabilir, ellerindeki işlenmemiş veriyi bilgiye dönüştürerek müşterilerini daha iyi tanıyabilirler.
Geçtiğimiz günlerde Ad:Tech konferansında konuşan Google'ın ürün yönetiminden sorumlu başkan yardımcısı Susan Wojcicki, artık kullanıcıların birden fazla cihazla bağlantıda olduğu ve bu cihazlarda parçalanmış bir şekilde yaşadıklarını söylemişti. Tabletler, akıllı telefonlar ya da bilgisayarlar arasındaki arasındaki sınırlar kalkıyor. Bilgi her an ulaşılabilir ve üretilebilir bir halde. Dolayısıyla artık pazarlamacılar ya da reklamcılar kullanıcının ürettiği bilgiyi kullanarak müşterinin yaşam tarzının değişip değişmediğini, diyette olup olmadığını ya da mağazaya hangi sıklıkla giriş yaptığını anlamlandırabilmeli. Oysa, markaların çoğu hala ellerindeki veri ile ne yapacağını bilmiyor, değil mi?
Büyük veri'yi anlamak için onun oluşumundaki beş bileşeni incelemek faydalı olacaktır. Bunlar; Variety, Velocity, Volume, Verification ve Value olarak 5V şeklinde adlandırılabilir.
Variety (Çeşitlilik): Bugün internette üretilen bilginin yüzde 80’i yapısal değil, her yeni üretilen teknoloji ile farklı formatlarda üretebiliyor. Telefonlardan, tabletlerden, bütünleşik devrelerden gelen türlü çeşitlilikte veri bulunuyor.
Velocity (Hız): Artık bilginin üretilme hızı çok yüksek. Twitter'da her saniye 5.000'den fazla tweet atılıyor. Daha hızlı üreyen veri, o veriye muhtaç olan işlem sayısının ve çeşitliliğinin de aynı hızda artması sonucunu doğuruyor.
Volume (Veri Büyüklüğü): IDC istatistiklerine göre 2020’de ulaşılacak veri miktarı, 2009’un 44 katı olacak. Şu anda kullanılan, “büyük” diye adlandırdığımız kapasiteleri ve "büyük sistemleri" düşünüp, bunların 44 kat büyüklükte verilerle nasıl başa çıkacağınızı hayal edin. İşletmenizin veri arşivleme, işleme, bütünleştirme, saklama gibi teknolojilerinin bu büyüklükte veri hacmi ile nasıl başa çıkacağının kurgulanması önemli.
Verification (Doğrulama): Bu bilgi yoğunluğu içinde verinin akışı sırasında "güvenli" olması da bir diğer bileşen. Akış sırasında, doğru katmadan, olması gerektiği güvenlik seviyesinde izlenmesi, doğru kişiler tarafından görünebilir veya gizli kalması gerekiyor.
Value (Değer): En önemli bileşen ise değer yaratması. Büyük Veri’nin veri üretim ve işleme katmanlarınızdan sonra kurum için bir artı değer yaratıyor olması gerekmekte. Karar veriş süreçlerinize anlık olarak etki etmesi, doğru kararı vermenizde hemen elinizin altında olması gerekiyor.Sosyal web ve mobil teknolojiler artık müşterilerinizin sadece demografik bilgilerini değil, yemek yeme, tatil yapma alışkanlıklarını dahi izleyebilmenizi sağlıyor. Örneğin tekstil konusunda hizmet veren bir mağazanız varsa kadınların/erkeklerin hangi günlerde alışveriş yaptığını, gece kıyafeti alıyorsa nişan/düğün gibi özel günlerinin yakınlaştığını, hamile kıyafeti alıyorsa hamile olduğunu ya da spor kıyafetleri alıyorsa spora başladığını analiz edebilmeniz gerekmekte.
Kaynaklar: