Watching big data, nu ook voor kleine broeders

De Engelse schrijver George Orwell schreef in 1948 het boek ‘1984’. Iedereen was destijds in de veronderstelling dat in dat jaar Big Brother zich zou gaan manifesteren bij het bespieden van individuele mensen. Maar 1984 ging over naar 1985 en naar volgende jaren, zonder dat we iets van de ‘Grote Broer’ hebben vernomen. Inmiddels zijn we dertig jaar verder en is Big Brother bijna realiteit. En dat heeft alles te maken met een andere grootheid: big data.

Terabytes, zettabytes, yottabytes

Big data klinkt eigenlijk net zo onheilspellend als Big Brother. We hebben nauwelijks een idee van de omvang. Om dat te illustreren enkele cijfers op een rijtje:

§  Vijf jaar geleden kende de wereld naar schatting een opslagcapaciteit van in totaal 300 miljard gigabytes, voor zowel analoge als digitale data.

§  In een paar jaar tijd groeide dat uit naar 988 miljard terabytes. Na terabytes volgen de petabytes.

§  Omdat we ook met die veelvoud de grens van het onvoorstelbare naderen, slaan we exabyte over en komen we terecht bij zettabytes, ofwel 10 tot de macht  21. Volgens schattingen van ruim een jaar geleden zou de data een omvang van 1,2 zettabytes hebben bedragen (1 zettabyte is 1 miljard terabyte).

§  Binnen afzienbare tijd groeien we naar yottabytes: 10 tot de macht 24.

Een advies: probeer niet een voorstelling te maken van die omvang; een normaal mens wordt krankzinnig.

Informatiesystemen voeden

Deze cijfers maken één ding wel duidelijk: we hebben big data nodig om onze informatiesystemen te voeden. Die systemen moeten ervoor zorgen dat we overleven in een complexe samenleving met een breed scala aan vraagstukken. Want hoe regelen we ons openbaar bestuur, hoe zorgen we voor voldoende eten, hoe behouden we onze mobiliteit, en hoe zorgen we voor voldoende energiebronnen?

Wie op al die vragen tegelijkertijd antwoord wil geven, loopt ook de kans knettergek te worden. Daarom kunnen we de vraagstukken beter opknippen in stukjes. We moeten proberen er één voor één antwoorden op te vinden, maar wel met enige vorm van samenhang in gedachte. Think big, act small.

Grote ondernemingen profiteren

Big Data wordt gegenereerd door formele IT-systemen met zowel gestructureerde als ongestructureerde data, en social media met uitsluitend ongestructureerde data. Wanneer we alle big data willen registreren, rijzen de kosten voor de infrastructuur de pan uit. Het maakt niet of we zelf virtualiseren of dat in de cloud doen; ergens moet een gigantische opslagruimte voorzien in het lezen, interpreteren en opslaan van de ontelbare hoeveelheid gegevens. Vanuit dit perspectief lijken alleen kapitaalkrachtige, grote ondernemingen profijt te hebben van de tsunami aan data die de wereld inmiddels al overspoelt.

Predictive analysis

Maar er is een oplossing. En die oplossing ligt wederom niet in het groot denken, maar in het stapsgewijs handelen. We moeten niet al die data afzonderlijk lezen. We moeten eerst bepalen welke analyses we gaan loslaten op welk soort gegevens. Met welke informatie denken we ons voordeel te kunnen doen? Het heeft geen zin om na een grootschalige analyse te concluderen dat we iets niet goed hebben gedaan. We moeten juist vooraf voorspellen wat we moeten doen om een bepaald bedrijfsdoel te behalen. Dat noemen we predictive analysis.

Predictive analysis is niet nieuw. Financiële instellingen gebruiken al heel lang wiskundige modellen om patronen zichtbaar te maken die wijzen op een bepaald risico. Zij filteren grote hoeveelheden data via deze voorspellende analysemodellen.

Analyseren op elke schaalgrootte

Een voorspellende analyse kunt u op elke gewenste schaalgrootte uitvoeren. De technologie is ruimschoots voorhanden. Het is een kwestie van:

§  de juiste analyse methodiek selecteren;

§  de methodiek afstemmen op de doelstelling en reikwijdte;

§  het inpassen daarvan binnen de kaders van de aanwezige operationele systemen in organisaties.

Het uiteenrafelen van big data in behapbare informatiebrokken vereist de inzet van IT-tools. Deze tools variëren van databasemanagement systemen, database machines , in-memory appliances, real-time BI-applicaties en tekstuele analyse software. Maar geen enkele tool vormt een universele oplossing voor alle vraagstukken.

U heeft in de eerste plaats kennis nodig om zakelijke doelstellingen te vertalen naar statistische methodieken en wiskundige concepten. Vervolgens weet u hoe u zinvolle antwoorden kunt krijgen op uw analyses. Daarmee is big data beheersbaar en dus ook bereikbaar voor kleine ondernemingen.   

Meer info: www.intersystemsbenelux.com

Bron: Intersystems