arrow_drop_up arrow_drop_down

Big Data

Bij Big Data gaat het om het bewerken en analyseren van hoeveelheden gegevens die te groot zijn om op de traditionele manier te bewerken in databases. De term komt voort uit de exponentieel groeiende hoeveelheid gegevens. Denk voor hele grote jongen bijvoorbeeld aan de data die Google verzamelt over alle zoekopdrachten ter wereld, Netflix over alle bekeken programma’s e.d. De definitie van big data is niet altijd duidelijk en de term big data wordt vaak ten onrechte gebruikt.

Volgens Gartner gaat het om drie factoren:

  • de hoeveelheid data;
  • de snelheid waarmee de data binnenkomen en/of opgevraagd worden;
  • de diversiteit van de data. Hiermee wordt met name bedoeld dat de data ongestructureerd zijn en niet in een traditionele database opgeslagen kunnen worden.
Als aan minimaal twee van bovenstaande factoren is voldaan, spreekt men in het algemeen over big data.

Drie andere factoren zijn:

  • de variatie in de data. M.a.w. verschillende bronnen kunnen elkaar tegenspreken en het geheel extra compliceren;
  • de kwaliteit van de data: de ene bron is minder betrouwbaar dan de andere;
  • de complexiteit van de data: de mate waarin ongestructureerde data van verschillende bronnen met elkaar te combineren zijn.