Big dáta je pojem pre súbory dát, ktorých rozsah je natoľko veľký, že je ťažké ich spracovávať v rozumnom čase tradičnými databázovými nástrojmi alebo aplikáciami. Typické pre big dáta sú tri veci:
- Veľkosť či objem (volume) dátových sad je o veľkosti desiatok terabajtov (TB) až po petabyty (PB).
- Veľká rozmanitosť (Variety) rôznych typov dát, najmä neštruktúrovaných dát, metadát, geodát
- Veľká rýchlosť (velocity) akú dáta vznikajú
Veľká dáta vznikajú pri náročných vedeckých výpočtoch a meraniach a tiež v dôsledku erupcie digitálneho obsahu v posledných rokoch (najmä zvýšené využívanie webových stránok, aplikácií, sociálnych sietí, mobilných zariadení a ďalších technológií). Dnes totiž vytvárame veľké množstvo dát pri bežných činnostiach, ako sú prehliadanie webových stránok, komunikácia na sociálnych sieťach alebo v diskusných fórach, nákupy na webshop, platby platobnou kartou, pri takmer akomkoľvek využívaní inteligentných telefónov a alebo vytváranie a zdieľanie multimediálneho obsahu ako sú fotky, videá či hudba. Tento trend bude v budúcnosti ešte viac urýchlený nástupom internetu vecí.
Big dáta v praxi: Big dáta dopĺňajú tradičné zdroje dát (pochádzajúce z ERP, CRM či ďalšie podnikových systémov) a rozširujú spektrum dát pre rozhodovanie a riadenie podnikov a organizácií. Pomáhajú získať napríklad dáta o zákazníkovi alebo zákazníckych segmentoch či pomôcť nájsť ich vzorce správania. Pri honbe za veľkými dátami sa však nesmie zabúdať na veľké množstvo užitočných dát, ktoré sú v “tradičných” podnikových aplikáciách. Spracovanie a analýzy veľkých dát nachádzajú uplatnenie najmä v oblastiach s rastúcim objemom dát z prevádzkových systémov. Typickým príkladom sú obchodné reťazce (dáta o správaní zákazníkov, o ich nákupných zvyklostiach), bankovníctva, mobilní operátori, prevádzkovatelia webových stránok, on-line služieb, webových aplikácií alebo napríklad oblasť finančných a kapitálových trhov.
Ďalej sa big data vyskytujú v oblastiach vedy, výskumu alebo napríklad zdravotníctvo, kde vniká obrovské množstvo dát z rôznych meracích prístrojov a kde možno analyzovať aktuálne aj historické dáta a vytvárať súvislosti alebo ich využívať pri simulácii.
Big dáta nie sú obvykle centrálne ukladaná, štruktúrovaná je ich veľké množstvo a rýchlo vnikajú nové a nové. K ich analýze by šlo využiť aj technológie business intelligence, ale s tým obmedzením, že výsledky nebudú hneď a škálovanie BI technológií pre potreby veľkých dáta by bolo drahé. Big data technológie dokážu spracovávať enormné objemy dát bez nutnosti enormného rastu kapacity a výpočtového výkonu serverov.
Komentáre
Do diskusie sa nedá prispievať, pretože je uzamknutá