“Petrolün
ham hali, işlenmiş halinden daha az değerlidir ve bir defa işlendimi en önemli
enerji kaynağına dönüşür” Bu nitelemeye koşut olarak “Data is the new Oil”
deniyor!
Bu
benzeştirmede ki dip anlam şöyle: Dünyamızda petrole sahip olmanın sağladığı
ayrıcalık neyse, veri işleme yeteneklerine sahip kurumların ve ülkelerin kazanacakları
ayrıcalık da o olacak. Burada en önemli vurgu, “veri işleme yeteneği”. Yani illa ki sahip olduğunuz, size özel ve
sizin ürettiğiniz verileri işlemeniz ve değer yaratmanız gerekmiyor. Kurumun
sahip olmadığı ama eklemlendiği diğer kurum dışı kaynaklardan beslenerek
üretebildiği değer ölçüsünde, rekabette ve değer yaratmada bir adım önde olabileceği
anlatılıyor. İşte tam bu noktada BIG Data kavramının için dolduran elementler,
kurumun sahip olması gereken yetenekler de karşılığını bulmaya başlıyor.
BIG
Data’nın kurumlara ne sağlayacağının somut uygulamalarını çeşitli sektörlerde
görüyoruz.
Güvenlik
alanında, ses ve görüntü analizleri saatlerden dakikalara geriledi; Sağlık
alanında hasta ve hastalık analizleri çok hızlandı; Finans analizlerinde PB’lık
verilerin analizi saaterden dakikalara düştü; Telco’lar ağ üzerinden akan veri
analizi (Stream Computing) yaparak donanım maaliyetlerini %90 oranında
azaltıyorlar.
Öncelikle,
kurulması hedeflenen BIG Data platformu, yeni bir veri ambarı olmamalı. BIG
Data platformunu, veri ambarından ayıran en önemli özellik, işlenen verinin bir
yerde yüklenmiş olmasının gerekmemesi, verinin kaynağında işlenerek kuruma ham
haliyle değil, karar sürecini etkileyecek bilgiye dönüşmüş veya dönüşmeye hazır
olarak ulaşması. Bir kurumun bu yeteneklere erişmesi için mevcut transaction işleme
ve veri ambarı sistemlerinin yanına neler eklemlemesi gerekliyor veya bir başka
deyişle BIG Data Platformu nelerden oluşmalı
1)
3V’yi yani Volume (Büyüklük), Velocity (Hız) ve Variety (Çeşitlilik),
yönetebilmeli. Temel veri kaynaklarından bazıları, geleneksel transactional sistemler,
makinelerin ürettiği duyarga verileri, sosyal medya verileri, yapısal olmayan
bilgi içeren döküman yönetim sistemleri kaynakları ilk akla geleneler.
2)
Hareket halindeki veriyi analiz edebilmeli (Stream Computing). Ürettiğimiz verinin
%80’inin yapısal olmadığı düşünülürse bu veriyi kaynağında analiz edecek
yetenekleri olmalı.
3)
Hızlı uygulama geliştirme için araçları ve ön yüzleri bulunabilmeli. Hadoop ve
Mapreduce temelli açık kaynak kodlu teknolojileri kesinlikle desteklemeli.
4)
Kurumsal düzeyde güvenlik, yönetişim ve veri entegrasyon arayüzleri olmalı. Mevcut
kurumsal veri kaynakları ile entegre çalışan, veri kalitesini iyileştirici, MDM
(Master Data Management) çözümü ile entegre çalışabilmeli.
Geleneksel
İş Analizi uygulamaları, önceden tasarlanmış sistemlerde, toplanmış ve
yüklenmiş veriler üzerinden, iş analistlerinin belirlediği soruların
cevaplarını arayan sistemlerdir. BIG Data Analiz ortamları ise veri
kaynaklarının ve tiplerinin çeşitliliği, dağınıklığı ve büyüklüğü yüzünden bir
platform olarak kullanıcının hizmetine ve yaratıcılığına sunulur.
Kurulacak
BIG Data platformu işinize ne katabilir?
-
Müşterileriniz hakkında herşeyi, Sosyal Medya hareketlerinden kanallarınız
üzerinden sizinle kurduğu bütün etkileşime kadar, topyekün ve bireysel olarak
bilmenizi sağlar. Ürün promosyonlarının yönetilmesi, karlılık analizi bunlardan
bazıları.
-
Operasyonel verilerle birlikte olmak şartıyla, süreçlerin optimize edilmesinde,
karar verme sistemlerinin sıfır gecikmeyle gerçek zamanlı analiz yapabilmesini
sağlar. Gerçek zamanlı satış raporlama ve analiz uygulamaları, bölgesel
kampanya analizleri, doğal afetlerde etki ölçme uygulamaları sayılabilir.
-
Veri kaynaklarınızı ve kuruma yapılan geri dönüşleri işleyip, “ışık hızında”
yeni ürünler üretmenizi, proaktif kurumsal davranış geliştirebilmenizi sağlayacak
imkanlar sunar. Sosyal Medya, Marka ve Piyasa etkileşim analizleri, RFID izleme
uygulamaları ilk akla gelenlerden bazılarıdır.
-
Kurumla ilgili bütün verileri, kurumda yüklenmemiş olsa bile, akan veri analizi
teknikleri ile işleyerek, hile ve risk analiz modellerini çalıştırabilmeli.
“Hile” algılama ve aksiyon alma, Cyber Güvenlik, Risk Yönetimi bunlardan
bazıları.
-
“Acaba işime yararmı” diye saklanagelen ve çok nadiren erişilen, saklama
maaliyetleri yüksek veri ambarlarını tutmak yerine, veriyi kaynağında işleyerek
veri ambarı işletim maaliyetlerinin düşmesini sağlamalı. Ağ loglarının anlık
analizi, Websitesi erişim, kullanım analizleri düşünülebilir.
BIG
Data yeni bir platform ve veri işleme anlayışı getirmesinin yanında, BT
ortamında yeni ve daha karmaşık beceri kümelerinin oluşmasını şart koşuyor.
“Data Scientist- Veri Bilimci” bu anlamda yeni bir rol. Veri Bilimcisi,
istatistik, bilgisayar bilimleri ve MBA’in birleşiminden oluşacak. Bu rolün en
önemli çalışma prensibi “Gerçek Zamanlı” çözümler üretebilme yeteneklerinin olması.
Bir örnekle açıklamaya çalışırsak; buzdolabınız bozulduğunda, gazeteyi açıp bir
buzdolabı tamircisi ilanından bakarak ustayı çağırdığınızda çoktan geç
kalmışsınız demektir. Ama bozulan buzdolabı ustayı arayıp yardım isteyebiliyor
veya bir problem kaydını sizin adınıza satıcı firmaya açabiliyorsa,
kullandığınız ürün gerçek zamanlı bir çözüm sağlar. “Veri Bilimcisi”, kurumun veri kaynakları ve bunlar arasında ki
etkileşimi bilerek, kurumun iş geliştirme stratejilerine uygun, Big Data platformunun yeteneklerini de
birleştirerek anlık analiz çözümleri üretebilen bir yeni rol olarak hayatımızda
yerini almaya hazırlanıyor. Veri Bilimcisi, uçtan uca, kullanıcının ilk sorularıyla
başlayan “merak” sürecinden, geliştirme ve dağıtıma kadar ki süreci yönetebilmelidir.
İş ile ilgili soruları, kurumun veri kaynakları ile ilişkilendirecek kadar
büyük fotoğrafı kavrayabilmelidir.
Gartner’a
göre 2013’deki BT Harcamaları 3.7 Trilyon ABD Doları olacak ve 2015’e kadar Big
Data ihtiyaçları için 4.4 milyon yeni iş imkanı doğacak.
Big
Data kavramını özümseyerek, bu yolda insana, platforma ve teknolojiye yatırım
yaparak, iş süreçlerini bu kavrama uyarlayan, “büyük düşünen” kurumlar, diğerlerinden
bir adım önde olacak.