'Big Data' en 'Analytics' zijn nog steeds twee belangrijke onderwerpen op het gebied van IT. Er bestaan veel misvattingen over deze disciplines, om te beginnen over hun definities. Big data gaat niet alleen maar over grote hoeveelheden data, zoals de term doet vermoeden, big data omvat ook het gebruik van verschillende soorten data, en soms de snelheid waarmee nieuwe data moet worden verwerkt, om tot relevante inzichten te komen.
De definitie van 'analytics' is momenteel nog dubbelzinnig. Het acroniem BI (business intelligence) raakt geleidelijk in onbruik ten gunste van de term 'analytics'. De term ‘analytics’ omvat zowel BI als nieuwe technologieën die ons helpen toekomstige gebeurtenissen te voorspellen en te bepalen hoe we hierop kunnen inspelen.
In ons vakgebied kunnen we de combinatie van big data en analytics inzetten om te voorspellen wanneer er vergaderruimte beschikbaar is, hoeveel medewerkers morgen naar kantoor komen en wat hun voorkeuren zijn voor de lunch, inclusief kansberekeningen voor dit alles. Op het gebied van asset management kunnen we downtime aanzienlijk verminderen en onnodige kosten vermijden door defecten van bedrijfsmiddelen te voorspellen.
Maar laten we eerst teruggaan naar de basis: Wat is big data, en vooral, wat is het niet? Wat is analytics en hoe passen we dit toe?
Terug naar de basis
Gartner definieert big data als:
“High-volume, high-velocity and high-variety information assets that demand cost-effective, innovative forms of information processing for enhanced insight and decision making.”
Zoals verwacht staat 'big' volgens deze definitie dus voor de grote hoeveelheden (volumes) data. Tegenwoordig worden onvoorstelbare hoeveelheden data opgeslagen. Naar verwachting zullen we in 2020 beschikken over 40 zettabytes aan data, dat is driehonderd keer meer dan in 2006. Volume is echter slechts één onderdeel (een van de V's) van de term 'big' in big data.
De andere onderdelen (of V's) die Gartner noemt, zijn Variety, Velocity en Veracity. 'Variety' staat voor de verschillende beschikbare verschijningsvormen of formats van data, van video tot statische data. 'Velocity' is de enorme snelheid waarmee data beschikbaar komt, en 'Veracity' staat voor de onzekerheid van de data. Omdat er zoveel data is, wordt alles belangrijk en wordt het moeilijker om fouten te ontdekken. Volgens de meeste wetenschappers is dit echter geen probleem, omdat het nog steeds mogelijk is representatieve conclusies te trekken uit de data.
Analytics
Er zijn veel manieren om data te analyseren. Organisaties verzamelen tegenwoordig enorme hoeveelheden data, vooral wanneer IoT-technologieën zijn geïnstalleerd. En er zijn gigantisch veel manieren waarop we die data kunnen analyseren.
De vraag die overblijft is: wat willen we analyseren? In feite is deze vraag niet alleen van fundamenteel belang om een aanpak voor onze analyse te bepalen, maar ook voor het type data dat we moeten verzamelen. Wanneer de capaciteit en bezettingsgraad van beschikbare vergaderruimten moeten worden geanalyseerd om de toekomstige vraag te voorspellen, hebben we een overzicht nodig van het aantal vergaderruimten en reserveringen en (indien beschikbaar) de werkelijke bezettingsgraad van de afgelopen 15 jaar.
Een goede aanpak voor het toepassen van analytics omvat doorgaans de volgende elementen:
- Ten eerste: prioriteer de ‘concrete problemen'
(Nieuwe) initiatieven op het gebied van Analytics brengen investeringen (tijd, tooling) met zich mee. Zorg er dus voor dat uw investering wordt besteed aan zaken die concrete waarde opleveren. - Evalueer aan de hand van beschikbare data
Controleer of er goede datasets beschikbaar zijn voor de analyse van het probleem dat u wilt onderzoeken. Het kan zijn dat er onvoldoende gegevens beschikbaar zijn voor problemen met hoge prioriteit, terwijl andere, minder urgente, zaken wel gemakkelijk kunnen worden geanalyseerd omdat er wel relevante gegevens beschikbaar zijn. U moet een gedegen kosten-batenafweging maken. - Begin klein en itereer
Ga voor 'snelle resultaten' die slechts een deel van de geprojecteerde waarde opleveren. In software engineering wordt deze aanpak ‘minimum viable result’ of ‘minimum viable product’ genoemd. Breid de analyse vervolgens stapsgewijs uit. De ervaring leert dat deze iteratieve aanpak een typisch geval is van 'al doende leert men', zodat u uw aanpak tijdig kunt aanpassen, mocht dat nodig zijn.
U weet niet wat u niet weet: goede analytics-projecten geven antwoorden op vragen die u nog niet hebt gesteld. Als u veel data hebt, kunt u business analytics gebruiken om mogelijke correlaties te zoeken tussen diverse factoren die in uw datasets beschikbaar zijn.
Data-analyse bestaat uit het onderzoeken, verzamelen en analyseren van big data om de hierin 'verborgen' informatie te transformeren in bruikbare informatie. Het doel is om conclusies te trekken en problemen op te lossen. Analytics is niet alleen een hulpmiddel om voorbije gebeurtenissen te analyseren met data uit het verleden, maar kan ook worden gebruikt om toekomstige patronen te beschrijven met de data van vandaag. Gartner deelt analytics daarom op in vier verschillende categorieën:
- Descriptive analytics: wordt gebruikt om de huidige situatie te beschrijven.
- Diagnostic analytics: geeft inzicht in de redenen waarom bepaalde gebeurtenissen en patronen zich voordoen.
- Predictive analytics: wordt gebruikt om voorspellingen te doen over toekomstige patronen op basis van gegevens uit het verleden.
- Prescriptive analytics: combineert toekomstige voorspellingen en huidige gegevens om u te helpen bepalen welke acties u moet ondernemen.
Wat zijn de verschillen?
In het kort: big data verwijst naar ongestructureerde en vrij complexe datasets die alleen kunnen worden verwerkt met specifieke tools. Analytics is het aanbrengen van structuur in deze data zodat die kan worden gebruikt als waardevolle input voor analyse. Met de opkomst van big data is ook de nieuwe rol van Data-analist of Datawetenschapper ontstaan. Deze specialisten weten waar u moet kijken en hoe u waarde kunt ontlenen aan de big data-sets.
Toepassing van big data en analytics
Het is goed om duidelijke definities van big data en analytics te hanteren, maar de volgende vraag is hoe u deze technieken kunt toepassen binnen uw organisatie. Hoe kan uw organisatie profiteren van de inzichten die u met analytics verkrijgt? Welke software of tools moet u gebruiken om waarde te creëren uit uw gegevens? Deze vragen worden beantwoord in een volgende blog. Maar het advies is: begin klein en houd de complexiteit goed beheersbaar, maak het niet te ingewikkeld in het begin.
Wilt u meer informatie over dit onderwerp of wilt u weten welke producten Planon u kan bieden om met data om te gaan? Download onze White paper of ontdek de mogelijkheden van ons nieuwe product 'Planon Connect for Analytics'.