Herkesin
dilinde, her etkinlikte BIG Data var. Bu sunuların ilk beş-on dakikası, 3V’yi
anlatmakla, dünyadaki verinin saatte kaç kilometre hızla büyüdüğü, yere göğe
sığmadığı ve sığmayacağını aktarmakla başlıyor. Bir kavramı anlamak ve anlatmak
çok önemli. Kavram anlaşıldığında ve gerçekleştirildiğinde, o kavramın üstünden
üretilen teknolojiler, ürünler ve hizmetler doğru şekilde
değerlendirilebiliyor.
Bence,
BIG Data kavramını ve algısını bir çok üretici farklı açıdan anlatsa da, bu
kavram üzerinde bir asgari müşterek oluştu artık. BIG Data’dan “verim” sağlayacak
“tüketici”, yani bu ürün ve hizmetleri alacak müşteriler, kurum içinde uygulama
yapacakları bir alan arıyorlar. Kurumlar dönüp kendi veri işleme envanterlerine
baktıklarında, geçtiğimiz yıllar boyunca Operasyonel/Transactional Sistemlerini
kurduklarını, bunun üstüne de Veri Ambarları inşa ettiklerini görüyorlar.
OLTP’den, Veri Ambarı’nı besleyerek raporlar çekiyorlar, karar süreçlerini daha
doğru verilerle besleyip, daha hızlı karar karar almaya çalışıyorlar. Bu
yapılanların üzerine acaba BIG data bana daha fazla ne katabilir diye herkes
arayış içinde!
Büyük
Veri teknolojisinin kullanılabileceği alanlara bakıldığında beş temel
“Use-Case” görüyoruz.
Büyük Veri Arama: Karar verme sürecini daha etkin
kılmak için tüm büyük veri kaynaklarını aramak, taramak, görselleştirmek. Buradaki
en önemli girdi Sosyal Medya.
360o
Müşteri Görüntüsü:
İç ve Dış bütün veri kaynaklarıyla müşteri analizi. Sosyal Medya, OLTP ve Veri
Ambarını tekmişcesine inceleyebilme beceris.
Güvenlik ve Istihbarat
Yetkinlikleri:
Düşük risk, gerçek zamanlı dolandırıcılık, izleme ve siber güvenlik algısı.
Güvenlikle ilgisi olan herkesin en ilgili olduğu alan.
Operasyon Analizi: Sensor ve Log Analizi yaparak
sonuç geliştirme. Özellikle makine, sensor vb. elektronik herşeyin ürettiği
sinyalleri anlık işleme ve karar destek süreçlerini besleyebilme yetkinliği.
Veri Ambarı Eklentisi: Operasyonel Verimliliği arttırmak
için Büyük Veri ve Veri Ambarı özelliklerini entegre etmek.
Günümüzde,
Veri Ambarı olmayan bir kurum artık kalmadığına göre beşinci seçenek, bence bir
kurumun BIG Data çözümleriyle tanışıp, uygulaması için en hızlı seçenek
olabilir.
Big
Data ve Veri Ambarı Eklentisi
Mevcut
veri ambarlarımız çoğunlukla, çok büyük miktarlarda yapısal verilerin, yüksek
maaliyetli donanımlar üzerinde biriktirildiği ve sürekli gittikçe büyüdüğü,
karmaşık sorguların çalıştığı yapıdadır. Kullanıcı sayıları ve kullanıcı
taleplerindeki çeşitlilik ve sayının artış eğilimi, ambara giren verilerin de
sayısısının artması ile veri ambarlarının motorları klasik veri tabanlarından,
appliance dediğimiz çözümlere doğru evrilmekte. Bu evrilme sırasında BIG Data
bize başka olanaklar sunuyor.
-
Yapısal olan ve olmayan verilerle, akan verilerin büyük resmin içinde olup hep
birlikte değerlendirilebilmesi, analitik sürece dahil edilebilmesi.
-
Daha sorgulanabilir, göreceli olarak daha düşük maaliyetli bir ortam
sağlanması.
-
Soğuk Verilerin taşınabileceği, veri saklama, lisans ve bakım maaliyetlerinin aşağı
çekilebileceği
-
Şimdiye kadar “akan veri analizi”nin mevcut veri ambarlarında hiç yapılmamış
olmasından dolayı, bu tip veri kaynaklarının “işlenerek” veri ambarına
yazılamasıyla, saklama maaliyetlerinden tasarruf edilmesi.
Bunlar
bir çırpıda, göze çarpan hızlı kazançlar.
BIG
data teknolojileri ve Veri Ambarlarını eklemlemenin yukarıdaki kazanım ve
ihtiyaçlar göz önüne alındığında üç yaklaşımla yapıldığını görüyoruz.
-
Ön İşleme
Kurum
mimarisinde, BIG Data veri kaynaklarının ön tarafına eklenecek, “staging” görevini
üstlenen bir Kurumsal Hadoop Sunucusu, Veri Ambarına hangi verilerin girip
girmeyeceğini ve filtrelemesini yapabilir. Bu yaklaşımla, BIG Data
kaynaklarındaki veriler, temizlenerek, filtrelenerek ve anlamlı hale gelerek,
Veri ambarına yerleştirilir. Bu şekilde hem yeni veri kaynaklarından mevcut
ambara, daha önce veri ambarında hiç olmamış verilerin akışı sağlanmış olur,
hem de bu ön filtreleme ve analiz ile veri ambarının daha değerli olan saklama
ve hesaplama maaliyeti, gereksiz veriler yüklenmediği için, korunmuş olur.
-
Sorgulanabilir Arşiv
Bu
yaklaşımda, mevcut veri ambarında daha az erişilen soğuk veriler, daha ucuz
maaliyetli olan bir Kurumsal Hadoop Sunucusu’na veri aktarım araçları ile
taşınabilir. Federation teknolojilerinin yardımı ile son kullanıcılar her iki
kaynaktan, tek kaynakmışcasına sorgulama yapmaya devam edebilirler.
-
Keşifsel Analiz
Bu
yaklaşımda ise, BIG Data kaynakları, akan veri analizi tekniği ile (Stream
Computing) incelenip, analiz edilirken, yapılan bu analizlerin sonuçları hem
anlık olarak değerlendirilebilir hem de mevcut veri ambarına beslenerek oradaki
yapısal sorgulama ortamının bu keşifsel analiz sounçlarından faydalanması
sağlanabilir. BU yaklaşımın bir diğer avantajı, BIG Data’yı tekil (unique)
yapan teknolojilerin başında gelen “Stream Computing”in mevcut veri ambarı
bileşeninin çalışmasını ve çıktılarını etkilemeden, mevcut yapıya en az
müdehale ile entegre edilmesini sağlamasıdır.
Bu
üç seçenekten birisi ile kurumdaki veri ambarının yanına bir BIG Data çözümü
eklemleyerek, bu teknolojiyle tanışıp, kullanmaya başlamak artık an meselesi.