Data Quality First

Data Kwaliteit
(leestijd 4 min.)

Mensen en systemen kunnen alleen betrouwbare en data-gedreven beslissingen nemen als de informatie welke ze gebruiken correct is. Onvoldoende data kwaliteit maakt gegevens praktisch nutteloos en leidt soms tot de verkeerde beslissingen. Maar ondanks het belang ervan, leert de realiteit dat data kwaliteit nog onvoldoende binnen directie en management geagendeerd is.

De top drie uitdagingen voor een optimale data kwaliteit 

1) Slechte of niet beschikbare informatie
De data kwaliteit is simpelweg onvoldoende vanwege slechte data invoer of inefficiënte data integratie met overige systemen. Het is lastig besluiten te nemen op basis van onvolledige of incorrecte data.

2) Onvolledige systeem integratie
Binnen een gemiddelde organisatie kan sprake zijn van het gebruik van 100, 250 tot zelfs 1.000 business applicaties. Waarvan een groot deel met hun eigen data opslag systeem. De problemen zijn evident: niet alle data bronnen worden geraadpleegd, processen wijken af of er is sprake van verschillende data definities.

3) Mismatch met IT
Afdelingen zouden niet van IT of control afhankelijk moeten zijn voor data analyses of rapportages. Zij moeten in staat zijn deze analyses of rapportages zelf op te stellen. Waarom? Control controleert, en IT zorgt ervoor dat het systeem blijft functioneren.

Gelukkig zorgen een solide data management structuur in combinatie met de juiste technologie en IT strategie voor een stijging van het vertrouwen, de prestaties en het imago van uw organisatie.

In dit artikel geeft QbitGovernance haar visie over wat data kwaliteit is en op welke wijze u deze kwaliteit kunt verbeteren. De volgende onderwerpen lichten we nader toe:

  • Wat is Data Kwaliteit? 
  • Waarom is Data Kwaliteit belangrijk? 
  • Aanbevelingen voor verbetering van de data kwaliteit 
  • De organisatie en rollen rondom data kwaliteit
  • Data Quality Cycle  
  • … en een eenvoudige tip: gewoon beginnen!

Wat is Data Kwaliteit?

Data kwaliteit kan op veel verschillende manieren worden gedefinieerd. In de meest algemene zin, goede data kwaliteit bestaat wanneer de gegevens geschikt zijn voor het doel waarvoor ze gebruikt worden.

Dit betekent dat de kwaliteit altijd afhankelijk is van de context waarin het wordt gebruikt. Dit leidt tot de conclusie dat er van een absolute data kwaliteit geen sprake is. Wel zijn er verschillende kwaliteitsdefinities welke in de praktijk gebruikt kunnen worden om
de data kwaliteit te evalueren:

  • Volledigheid                  : zijn de gegevens compleet?
  • Geldigheid                    : komen de gegevens overeen met de regels? 
  • Uniciteit                        : is er sprake van gedupliceerde gegevens? 
  • Consistentie                  : is de data consistent in de verschillende data opslag systemen? 
  • Tijdigheid                     : hoe nauwkeurig (near time/real time) zijn de gegevens? 
  • Nauwkeurigheid            : de mate waarin de gegevens de werkelijkheid vertegenwoordigen

Waarom is data kwaliteit belangrijk?

Data staat binnen elke organisatie aan de basis van de strategische, tactische en operationele besturing. Het hebben van kwalitatief goede data hangt nauw samen met de capaciteit van de organisatie om de juiste beslissingen te nemen. Bovendien voegt het economische en maatschappelijke waarde toe, voor zowel de organisatie zelf als haar omgeving.

Organisaties hebben altijd al geworsteld om een hoog niveau van data kwaliteit te verzekeren. Maar binnen het digitale tijdperk is data een productie factor geworden welke alleen op basis van de hoogste data kwaliteit het verschil maakt tussen een organisatie welke de aansluiting met haar omgeving verliest of een innoverende, lerende en intelligente organisatie.

Ook de organisatie omgeving wordt steeds dynamischer. Nadenken over en effectueren van een goede data kwaliteit en data management strategie zijn daarin relevant, omdat:

  • Organisaties moeten in staat zijn om zo flexibel mogelijk te reageren op de dynamisch veranderende marktvereisten. Zo niet, dan riskeren ze verlies van vertrouwen, imago verlies of er worden waardevolle zakelijke kansen gemist. 
  • Een effectieve data management strategie is een cruciale factor als het gaat om het minimaliseren van integratiekosten. 
  • Medewerkers eisen in plaats van versnipperde gegevens een eenduidige en geïntegreerde toepassing van de verschillende data management systemen. 
  • Data-gedreven organisaties zijn op basis van hun data kwaliteit snel in staat bedrijfsprocessen te optimaliseren en nieuwe (data-gedreven) producten en diensten te ontwikkelen. 
  • Het snel stijgende data volume van zowel interne als externe gegevensbronnen leiden tot een steeds groter wordende gegevensbasis. 
  • Strengere wetgeving en toezicht maken het belangrijker dan ooit om ervoor te zorgen dat de hoogste kwaliteitsnormen voor data worden nageleefd.

Aanbevelingen voor een verbetering van de data kwaliteit

Een succesvolle aanpak rondom data kwaliteit vereist een holistische aanpak. Vanuit uw organisatie inrichting, de processen en de juiste technologie legt u de basis voor een data-gedreven organisatie. De uitgangspunten hierin zijn:

  • De organisatie moeten duidelijke verantwoordelijkheden voor gegevens domeinen omvatten (bijvoorbeeld patiënt, product, financiële cijfers), evenals rollen (data owners of data stewards welke verantwoordelijk zijn voor de operationele data kwaliteit.
  • Processen om de data kwaliteit continue te verbeteren op basis van het leren van elkaar (best practices) en het doorlopen van periodieke kwaliteitstoetsingen in de vorm van een data kwaliteit cyclus. 
  • Technologie ondersteunt mensen in hun processen via software en de benodigde IT-infrastructuur. Het is belangrijk om eerst de acceptabele organisatie standaarden te bepalen en dan pas na te denken over de technologische vereisten.

De organisatie en rollen rondom data kwaliteit

Als het gaat om het verbeteren van de kwaliteit van data, is een data-gedreven bedrijfscultuur essentieel. In de context van data kwaliteit is ook rol verantwoordelijkheid cruciaal. Rollen helpen bij het definiëren en toewijzen van taken en competenties aan bepaalde werknemers. Door bepaalde rollen toe te wijzen, kan een organisatie ervoor zorgen dat de verantwoordelijkheid over de kwaliteit, de nauwkeurigheid en verantwoordelijkheden duurzaam geborgd worden en blijven. 

Er zijn verschillende rollen rondom een data-gedreven organisatie relevant. Elke rol omvat duidelijke taken, welke gericht zijn op bedrijfsspecifieke doelstellingen.

  • Data Owner
    Is de centrale contactpersoon voor bepaalde gegevens domeinen. Zij definieert eisen, zorgt voor de kwaliteit en toegankelijkheid van de gegevens, wijst toegangsrechten toe en machtigt data stewards om gegevens te beheren.
  • Data Steward
    Definieert de organisatie standaarden, bepaalt de vereisten en coördineert de levering van data. Zij is ook verantwoordelijk voor de operationele data kwaliteit, bijvoorbeeld het controleren op dubbele waarden.
  • Data Manager
    Is meestal een lid van de IT-afdeling. Zij implementeert de eisen van de Data Owner, beheert de technologische infrastructuur en beveiligt de toegangsbescherming.
  • Data Users
    Alle gegevensgebruikers van alle afdelingen met functie specifieke toegang tot betrouwbare en begrijpelijke gegevens.

Data Quality Cycle

Het beste praktijk proces voor het verbeteren en verzekeren van een hoge data kwaliteit is het volgen van een zogeheten data kwaliteit cyclus. Uitgangspunt om de data kwaliteit integraal binnen de organisatie te borgen, is dat de hierboven beschreven rollen (Data Owner, Data Steward, Data Manager, Data User) hierin elk een taak uitvoeren.

De cyclus bestaat uit een iteratief proces van organisatie standaarden bepalen, analyseren, opschonen, eventueel verrijken en monitoren van de data kwaliteit. Het concept van een cyclus benadrukt het feit dat een voortdurend proces is gericht op verbeteren, leren en borgen van de data kwaliteit.

De data kwaliteit cyclus bestaat uit fases en kunnen periodiek, planmatig of continue doorlopen worden:

(bron: www.hitachivantara.com) 

  • Profiling : Vaststellen wat u met Data Quality wilt bereiken. In deze fase het systeem landschap in  kaart. En definieert u de zogenaamde baseline en business rules om de juiste checks te kunnen uitvoeren. 
  • Hygiene : Het handmatig of geautomatiseerd (batches) opzoeken en uitzoeken van de datavervuiling.
  • Data Verification : Het meten van de datakwaliteit (syntax, referentiële controles, patroonvalidatie, ontdubbeling).
  • Enrich & Update : Het aan de hand van de data kwaliteitsmeting verrijken en updaten van de data.
  • Matching & Merging : Het samenvoegen van de data tot éénduidige, uniforme en consistente informatie. Ook hier speelt het systeem landschap en de interfacing een belangrijke rol. 
  • Monitoring : Het regelmatig doorlopen van de Data Kwaliteit Cyclus zou het fundamentele probleem van een lage data kwaliteit op moeten lossen. En anders moet u – op basis van een een gezonde kosten/baten analyse – overwegen processen verder te automatiseren, waardoor het risico op fouten verminderd wordt. Indien deze oorzaken worden weggenomen, treedt het probleem niet opnieuw op. Maar de belangrijkste succesfactor is uw medewerkers en stakeholders optimaal hierin te betrekken, zodat u kunt bouwen en groeien naar een data gedreven en intelligente organisatie. 

Gewoon beginnen!

Veel organisaties zien nog belemmeringen voor data-optimalisatie projecten. De organisatorische, procedurele en technologische ingrepen kunnen ingewikkeld en onberekenbaar lijken.

Aan de andere kant, organisaties welke een succesvol data kwaliteit cyclus doorlopen hebben, bereikten hun succes omdat ze gewoon de beslissing en het initiatief hebben genomen om stap voor stap te evolueren tot een data-gedreven organisatie.

Zij hebben erkent dat binnen de huidige context van verregaande digitalisering, data en data kwaliteit van essentieel belang zijn voor het verhogen van het vertrouwen, het verbeteren van de prestaties en het optimaliseren van het imago van uw organisatie.

Bovendien levert het een belangrijke bijdrage aan de medewerkers en klanttevredenheid. Tenslotte geeft het u de ruimte en de rust om uw organisatie en medewerkers naar de volgende fase te begeleiden. Met data kwaliteit legt u een betrouwbare en duurzame pijler onder uw succes.

QbitGovernance & Data kwaliteit is een kwestie van doen!