Data is voor veel bedrijven waar wij komen een centraal onderdeel geworden van de strategische bedrijfsvoering. Voor welke producten of diensten kiezen we en in welke markt? Welke projecten ronden we winstgevend af? Waar leggen we wel of geen voorraad neer? Hoe efficiënt is ons productieproces en kunnen we trends herkennen?
Hoe verbeter je de kwaliteit van je data?
Geen nieuws natuurlijk dat de kwaliteit van de data goed moet zijn om dit soort vragen te beantwoorden. Toch speelt het ons nog regelmatig parten. Waarom toch zo weinig aandacht voor een goed proces?
Laksheid? Kennis? Discipline?
Feit blijft: begin bij de bron. Binnen onze Birds datamodellen kunnen we natuurlijk veel recht trekken, maar we kunnen dat niet onbegrensd doen. De betrouwbaarheid komt dan in het geding.
De vraag die we vaak krijgen is of het Business Analytics project al wel gestart kan worden voordat de kwaliteit van de data op orde is. Natuurlijk, doen! Je zal nu denken, ja bij Hillstar preken ze voor eigen parochie. Nee, ons doel is onze klanten het vermogen te geven om betere beslissingen te nemen op basis van data. Forceer een startpunt.
Het proces van gegevensverzameling moet je bij de inrichting van je ERP al goed opzetten. Logisch dat je vanuit de vragen die je straks hebt al nadenkt over de verfijning die je kunt aanbrengen in het invoerproces. Sla er ook weer niet in door.
Birds is een oplossing die we hebben gebouwd om de data uit je Dynamics ERP systeem op te halen en klaar te zetten voor rapportage en analyse doeleinden in Microsoft Power BI. Je ziet direct waar de fouten in de data zitten. Die los je op.
De top 5 van veelvoorkomende data kwaliteitsproblemen (willekeurig)
- Spelling/typefouten
- Dubbele data
- Data ingevoerd in een verkeerd veld of in een opmerkingenveld
- Incompleet
- Verouderde data die niet relevant meer is
Een zesde die ik nog wil noemen is de taal. We komen bij veel internationale bedrijven die op landniveau de eigen taal hanteren en op corporate niveau Engels. Dat geeft in sommige gevallen ook mooie uitdagingen (deze kunnen we dan wel weer vaak rechtzetten met vertaal tabellen)
Waar we ook regelmatig moeten schaven is aan de gemigreerde data. De data blijkt toch nog niet zo goed geschoond voordat we het hebben overgebracht naar het nieuwe systeem. Juist dan kan onze oplossing helpen met het zicht te geven op de foute data.
Bottomline, voordat je kunt analyseren heb je accurate data nodig, maar dat moet je niet weerhouden om je eerste stappen te zetten en eventueel met kleinere datasets te beginnen.