Big Data jsou takové soubory dat, jejichž velikost je mimo schopnosti zachycovat, spravovat a zpracovávat data běžně používanými softwarovými prostředky v rozumném čase.
zdroje dat
senzory, kamery, DPZ
mobily, telefony
internet of things
nákupy (real, eshopy)
sociální sítě
meteo stanice, …
charakteristika Bigdat
VOLUME (objem)
VELOCITY (rychlost)
VARIETY (různorodost)
VERACITY (věrohodnost)
problémy Bigdat
sbírání dat jde snadno
ukládání je horší, kde a jak to budu ukládat?
zpracování ještě horší - potřebuju data ideálně zpracovat v reálném čase, proto je často nutná potřeba filtrace a analýzy dat
vyhodnocení v reálném čase, scifi!