15 dimensioner af datakvalitet: kravler I på det rigtige bjerg?

15 dimensioner af datakvalitet: kravler I på det rigtige bjerg?

Af
Alle virksomheder har dårlige data! Det er bare ikke alle, der kender omfanget eller kilden, og det kan ofte give forkerte løsninger på problemet.

Garbage in - Garbage out er en gammelkendt læresætning for økonomifolk, som bare ikke kan diskuteres. Mange økonomifolk har gennem deres karriere måtte erfare, at den ledelsesinformation, som de ønskede at levere, var fejlbehæftet, fordi grunddata ikke var gode nok. Ringe data betyder, at rapporteringen fra økonomifunktionen er fejlbehæftet - men ofte er der en langt større omkostning forbundet med at bruge de fejlbehæftede data og rapporter i forretningen. Og det har konsekvenser for omsætning, resultat og kundetilfredshed. Garbage in - Garbage out er dog en lidt forsimplet tilgang til datakvalitet. Eksempelvis kan mistillid til rigtige data give en lang række problemer.

I denne artikel har vi samlet 15 forskellige dimensioner af datakvalitet, som giver virksomheden mulighed for at vurdere sine dataudfordringer mere bredt. Økonomifunktionen er i en unik position til at opdage mange af disse dataproblemer og dermed sætte fokus på den forretningsmæssige konsekvens - på den usikkerhed, der ligger i de rapporteringer, som økonomifunktionen udarbejder, de øvrige finansielle tab og andre konsekvenser, som dårlige data fører med sig. Det er vigtigt, at økonomifunktionen identificerer det reelle problem. Det betyder, at økonomifunktionen skal vurdere flere dimensioner, ellers risikerer virksomheden at kravle på det forkerte bjerg i sin søgen efter bedre data eller business intelligence. Og lad det være sagt med det samme - datakvalitet kommer før nye systemer.

1. Nøjagtighed/fri for fejl

Den mest almindelige kritik vedrørende datakvalitet er, når vi som økonomer erfarer, at der er en unøjagtighed eller en fejlregistrering i de data, vi anvender eller de rapporter, vi modtager. Nøjagtighed kræver, at man kan sammenligne data med en kendt og accepteret standard - hvor der er vished for, at en fejl er en fejl - hvilket er det, vi ofte bedst kan forholde os til. Det er typisk denne form for datakvalitet, der tænkes på, når man taler om Garbage in - Garbage out, men det kan også være en fejlberegning, hvor de data, der indgik i beregningen, har været korrekte, men er behandlet forkert - enten af et system eller en person.

Eksempel:

Efter implementering af et nyt CRM-system stemte postnumre i systemet ikke overens med de officielle postnumre, og samtlige salg blev derfor parret med forkerte salgsdistrikter. Der kunne altså ikke fæstnes lid til omsætningen per region. Endvidere fik mange kunder fakturaer og leverancer, som havde været dage undervejs. Resultatet var lavere kundetilfredshed og aflyste leverancer.

Eksempel:

En del af priserne på en virksomheds fakturaer stemte ikke med prisen på den officielle prisliste, som ledelsen havde godkendt, og mange kunder blev fejlfaktureret. Virksomheden led et tab på grund af manglende omsætning på nogen kunder, men havde til gengæld overfaktureret andre. Resultatet var lav kundetilfredshed og manglende tillid i en periode fremover.

2. Fuldstændighed

Fuldstændighed er ofte en overset risiko. Vi er som økonomer ganske gode til at arbejde med de data, vi har og præsentere dem, så indholdet af data giver mening. Men hvis der mangler data, er risikoen ved at arbejde videre ganske betydelig og kan i bedste fald give ukomplette og forkerte rapporter og i værste fald føre til væsentlige fejlbeslutninger. I mange tilfælde er det nemt at konstatere, at der er problemer med fuldstændigheden, men det kræver, at man har et udgangspunkt, der kan betragtes som sandheden.

Eksempel:

Lagerlisterne i en produktionsvirksomhed indeholdt ikke alle fysiske lokationer, og lageret blev derfor nedskrevet med for stort svind. Det var nemt at bevise, at lokationerne manglede, og derfor var drøftelserne om, hvorvidt der var fuldstændighed eller ej, hurtigt overstået.

Eksempel:

I forbindelse med en koncert kom tusindvis af folk ind gratis. De blev hverken registreret, da de kom, eller da de gik. Virksomheden, som afholdt koncerten, havde på fornemmelsen, at der havde været flere gæster, end tællesystemet viste, men det kunne ikke bevises. Af samme årsag kunne der ikke opkræves provision hos de aftalepartnere, hvor kontrakten afhang af antallet af gæster. I denne situation var fuldstændighedsproblemet svært at løse.

3. Dubletter

Modsætningen til manglende fuldstændighed er dubletter. I datasæt med mange ensartede data er det svært at konsolidere resultater, så resultaterne er anvendelige. Endvidere er der risiko for, at vigtige registreringer sker på baggrund af forskelige versioner af data og dermed hele tiden øger spredningen af information.

Eksempel:

En stor virksomhed med flere ERP-systemer opdagede, at der i kreditorkartoteket var oprettet utallige versioner af nogle af de samme kreditorer. Det var ikke muligt at skabe overblik over indkøbet hos den enkelte leverandør og dermed forhandle med de væsentlige og/eller opnå volumenrabatter. Desuden var det vanskeligt at afstemme mellemværender, og der var en stor grad af dobbeltbetalinger, idet regninger kunne registreres en gang på flere kreditorer.

4. Tid og punktlighed

Data, som ikke opdateres, vedligeholdes eller leveres til tiden, kan være ukorrekte, når de skal bruges; det er åbenlyst. Men faktisk er tidsdimensionen et overset problem, og brugere kan senere i processen give systemet skylden, fordi … alle de rigtige data jo er i systemet. Men hvis data er kommet ind efter, en kritisk proces er blevet sat i gang - så bliver uddata forkerte. Ofte kan timingen skyldes pukler i sagsbehandlingen, eller at systemerne, som behandler data, udveksler information i en forkert rækkefølge.

Eksempel:

Afholdelse af ferie blev tastet ind i virksomhedens lønsystem lang tid efter, at ferien var afholdt. I den måned, hvor medarbejderen - som ikke var berettiget til ferie med løn - holdt ferie, skete der ingen reduktion i lønnen. Lønnen blev først reduceret lang tid efter, og medarbejderen forstod ikke reduktionen, da den endelig blev foretaget

Eksempel:

En medarbejder i en bank havde dokumenter liggende vedrørende sikkerheder for udlån, som skulle registreres i bankens systemer, men på grund af arbejdspres blev det ikke nået før sommerferien. I løbet af ferien valgte banken at foretage en nedskrivning på kunder i restance og uden sikkerheder, ligesom kunderne blev overført til en afdeling for særlige engagementer. En del af kunderne burde ikke have indgået i denne gruppe, da der reelt var sikkerhed for deres tilgodehavender.

5. Autorisation

I miljøer, hvor der ikke er den fornødne governance i forbindelse med kritiske data, oplever man ofte, at det er vanskeligt at vurdere, om de data, der bruges, er behørig godkendte. Det fører en lang række andre udfordringer med sig - jævnfør andre dimensioner - men først og fremmest drives forretningen tilfældigt på de områder, hvor data bruges, og de efterfølgende tab kan vise sig i mange former.

Eksempel:

En sælger ændrede en kunde til at have VIP-status, hvorefter kunden modtog større rabatter og særlige tilbud end ved den normale kundestatus. Virksomheden havde ingen definition af kriterierne for en VIP-kunde; det var alene salgschefen, som kunne godkende ny kundestatus. Denne godkendelse foregik mundtligt og blev ikke gemt. I virksomhedens kundekartotek var der 40 % VIP-kunder, og det var svært at vide, hvor mange af dem, som rent faktisk var godkendt af salgschefen. Da salgschefen gennemgik listen, var der flere hundrede kunder, som han ikke mente, skulle have eller nogensinde have haft VIP-status. Det førte til for store rabatter til for mange kunder, hvorved det at have VIP-status blev udvandet.

6. Relevans

Datarelevans forholder sig til, om brugeren præsenteres for data, som passer ind i den sammenhæng, som han eller hun arbejder i. Ligesom mangel på relevante data er et problem, er det også irriterende at blive præsenteret for en række irrelevante data, som man skal forholde sig til i den tro, at de har betydning for den beslutning, man som bruger skal træffe. Manglende datarelevans er i stigende grad et problem for mange virksomheder. I takt med at mængden af data vokser eksplosivt, og adgangen til data bliver nemmere og nemmere, øges mængden af data, som brugerne bliver præsenteret for.

7. Forståelighed

Hvis brugerne af data ikke forstår de data, de præsenteres for, er det ikke nok, at de er nøjagtige, fuldstændige, relevante etc. Uforståelige data kan føre til fejlbeslutninger - simpelthen fordi data opfattes forkert.

Eksempel:

Finansfunktionen sendte dagligt en beskrivelse af Value at Risk til direktionen og bestyrelsen. I forhold til den klassiske definition af datakvalitet var alt rigtigt - men de data, som blev sendt, var uforståelige for modtagerne og blev enten brugt forkert eller slet ikke brugt.

8. Ensartethed

I store virksomheder oplever man ofte, at data ikke behandles og beskrives ensartet. Det betyder, at de samme data benævnes og/eller anvendes forskelligt gennem flere systemer eller organisatoriske enheder, og at sammenhængen på tværs af virksomheden forsvinder.

Eksempel:

En tøjkoncern havde designet sit ERP-system således, at hvert design var unikt, og at der var plads til at knytte en farvekode til det enkelte design. Farvekoderne var imidlertid ikke aftalt, og hver forretningsenhed opfandt sine egne farvekoder - dermed kunne farver ikke rapporteres på tværs af koncernen.

9. Tillid/troværdighed/opfattelse

Perception is reality. Hvis brugerne tror, data er dårlige, vil de ikke udvise data den fornødne tillid og måske fuldstændig lade være med at bruge dem. Hvis et system eller et datasæt opleves forkert, og der eksempelvis findes faktuelle fejl, kan der gå lang tid, før brugerne har tillid til, at de nu igen kan stole på data. Det kan have en lang række forskellige konsekvenser; lige fra at brugerne ikke gider opdatere og vedligeholde til, at man bruger ressourcer på egne beregninger eller at man er komplet ligeglad.

Eksempel:

Et CRM-system og et ERP-system havde ikke medtaget alle salg (fuldstændighed), og sælgers bonus var i en periode forkert. Årsagen blev rettet, men i en længere periode efter fejlen var blevet rettet, brugte hver enkelt sælger lang tid på selv at opgøre sin omsætning. Fordi rabatmodellen var meget kompleks, var det sjældent, at sælgeren kom frem til det korrekte resultat - på grund af den manglende tillid, troede sælgerne, at der fortsat var problemer med opgørelsen og vendte fokus endnu mere indad end mod markedet og kunderne. Økonomifunktionen måtte udarbejde Excelark til hver sælger, som beviste, at systemet nu var korrekt, men de, som fik lavere tal end deres egne beregninger, mente, at virksomheden havde snydt dem.

10. Objektivitet

Økonomer elsker facts. Men mange data, som anvendes til at træffe beslutninger, stammer fra et subjektivt grundlag. Hvis de, der arbejder med data, ikke anerkender denne subjektivitet, risikere man at gå helt galt ved fortolkningen af de data, der arbejdes med. Et hvert datasæt bør derfor vurderes ud fra, hvor objektive data er.

Eksempel:

Sælgere i en softwarevirksomhed blev hver uge bedt om at vurdere sandsynligheden, timingen og størrelsen af de kundeemner, de arbejdede på. Alle tre forhold er subjektive og behæftet med en personlig bias. Om sælgeren er positiv eller negativ af natur, om han har behov for at vise bedre muligheder eller om der gemmes lidt til dårlige tider.

11. Forringelse

Sandheden om data er, at de ofte langsomt bliver ringere og derfor skal vedligeholdes. Hvis brugere af data ikke kender graden, hvormed data forvaskes og forringes, kan man ikke tilrettelægge processer, som sikrer, at datakvaliteten er god nok.

Eksempel:

En virksomhed med flere end 10.000 varenumre talte lageret op hver den 31.12. På ca. 800 varenumre med høj aktivitet og returnering var differencerne så store, at virksomheden ofte kom i restordre. En controller foreslog at øge optællingen til hvert kvartal på disse varenumre, og på denne måde kom man den naturlige dataforringelse i forkøbet og sikrede, at data altid var frisk nok til at blive anvendt forretningsmæssigt

12. Manglende historik

En lang række controllere og økonomer har oplevet frustrationen over data, som ikke kan spores tilbage i tiden. Det kan skyldes forandringer i forretningen eller manglende registrering og/eller ændret datamodel/definition. Den manglende historik gør det svært at udtale sige om udviklingen inden for et konkret område over en periode.

Eksempel:

Efter et stort opkøb af en konkurrent ønskede en virksomhed at ændre salgsdistrikter, men der blev ikke foretaget en kortlægning af de gamle distrikter i virksomheden eller hos den virksomhed, som var blevet opkøbt. Efter en periode kunne man ikke vurdere, hvilke områder der klarede sig bedre end tidligere og omvendt - kun det totale salg kunne vurderes og så nogle tilnærmede (større) salgsområder.

13. Dataadgang

Manglende adgang til data kan være frustrerende og stammer ofte fra to kilder: hvor det er teknisk besværligt at få fat i data af systemmæssige årsager/data er gemt på papir eller fordi brugerprofilen, som den pågældende medarbejder har, ikke giver adgang til at se de data, som vedkommende skal bruge. Omvendt risikerer nogle virksomheder, at dataadgangen til kritiske data gives til de forkerte personer, hvilket kan være et større problem.

Eksempel:

En større rådgivningsvirksomhed gav kun de øverst placerede medarbejdere adgang til kundelisten. Af samme årsag var der ofte andre fra virksomheden, som prøvede at indhente ordrer hos kunder, som allerede var samarbejdspartnere, og andre som undlod det af frygt for at træde på forbudt græs. Økonomifunktionen blev brugt som informationsindgang af mange ansatte, og det lagde et meget stort pres på de medarbejdere, der rent faktisk kunne svare på, om en konkret virksomhed allerede var kunde eller ej.

14. Anvendelighed

Anvendelighed beskriver i hvilken grad, de data, som virksomheden har, kan bruges af medarbejderen uden væsentlig efterbehandling.

Eksempel:

En transportvirksomhed registrerede alle udstedte fakturaer og indbetalinger på hver debitor. Nettobeløbet stod på den månedlige debitorliste, men det overforfaldne beløb var ikke præsenteret, og det krævede en manuel gennemgang af kontoudtoget for at se, hvilke fakturaer der var tale om. Ressourceindsatsen til at styre debitorer var unødvendig stor.

15. Præsentation

Præsentation ligger tæt op ad anvendelighed og beskriver i hvilken grad, data præsenteres nemt tilgængeligt for modtageren, så informationen let kan absorberes. Overskrifter og farver, grafer og figurer, tal- og tegnstørrelse samt forklaringer til materialet er nogle af de muligheder, som indgår, hvis man ønsker at forbedre sin datapræsentation.

Eksempel:

En dagligvarevirksomhed arbejdede med en omsætningsrapport i Excel, som i fortløbende form oplyste om salg per butik og per region uge for uge i de seneste 53 uger. Mængden af tal var ret stor, og det var vanskeligt for ledelsen at få et hurtigt overblik. Ved at præsentere udviklingen grafisk blev der skabt et hurtigt og godt overblik.

Opsummering

Som det fremgår, kan det være svært at skelne mellem de forskellige dimensioner, men det er vigtig at forholde sig til forskellene for at sætte rigtigt ind:

  • Er de dårlige data et tidsproblem eller manglende fuldstændighed ved registeringen?
  • Har vi rigtige data, men giver ikke de rigtige personer adgang?
  • Forstår modtageren ikke, hvordan data skal tolkes, eller skyldes eventuel misforståelse en dårlig præsentation?
  • Har vi data til at beskrive den historiske udvikling, eller vil en tilnærmet beskrivelse give mistillid til vores tal og/eller fejlkonklusioner?

Det vigtige er at udfordre problemerne og sikre, at man ikke tror, at der kun er ét problem og så prøve at løse dette uden at vurdere, om der kunne være andre og mere væsentlige forhold at løse.


Dialog

Hvis du vil vide mere om, hvordan vi hjælper med at vurdere den eksisterende datakvalitet og gennemfører datakvalitetsprojekter sammen med vores kunder, så kontakt Jacob Poulsen på telefon 3091 7040 eller på e-mail jpoulsen@basico.dk Du er også velkommen til at sende en e-mail til info@basico.dk for at få vores erfaringskort "Masterdata Office" tilsendt.


 

Vil du være et skridt foran dine kollegaer?

Tilmeld dig Basicos nyhedsmail og få inspiration til forandring og udvikling. 

Du modtager samtidig abonnement på online-udgaven af Content, Basicos faglige magasin, hvor vi i en række spændende artikler inspirerer dig og din virksomhed til at skabe et stærkt fundament for vækst og udvikling.

TIlmeld dig her