“En beklagelig fejl har forsinket nogle borgeres invitation til vaccination mod covid-19. Fejlen er opdaget på Aarhus Universitetshospital blandt borgere i målgruppe 5, hvis CPR-nummer begynder med 0. Målgruppe 5 omfatter borgere, der er i særlig risiko for et alvorligt forløb med covid-19.”

Sådan lød det i en pressemeddelelse fra Region Midtjylland den 22. marts. På twitter gættede IT-eksperter hurtigt på, at fejlen skyldtes Excel, fordi det var alle CPR-numre, der startede med 0, der var udeladt. Det er bredt kendt, at Excel automatisk fjerner 0, hvis det er det første ciffer i et tal. 

“Når patienter med et CPR-nummer, der begynder med 0, skulle indlæses, blev CPR-nummeret kendt ugyldigt, hvis der manglede en bindestreg. Så 26 procent af de CPR-numre vi har indmeldt, er ikke indlæst korrekt, så de har ikke fået den invitation i deres e-boks til at blive vaccineret, som de skulle have haft,” sagde Jørgen Schøler Kristensen fra Lægefaglig direktør på Aarhus Universitetshospital til Århus Stiftstidende.

Fejl i Excelark

“Datavalidering er vigtigt”

Fejl som den, der er sket i forbindelse med vaccine-indkaldelserne, er hyppige. De opstår blandt andet, fordi slutbrugerne ikke altid er IT-vante. Det siger Peter Sestoft, der er professor og institutleder på datalogi på IT-Universitetet.

“Excel-ark er jo en pakke af data og formler. De er typisk lavet af folk, der ikke har lært at udvikle software. Man kan enten have en nedladende holdning til det, eller man kan anerkende, at de har brug for et værktøj, hvor de ikke skal have fat i en datalog, hver gang de skal arbejde med data. Man bør være pragmatisk. Men samtidig kan man godt lære folk nogle vaner, der kan hjælpe med at undgå fejl,” siger han.

I tilfældet fra Region Midtjylland er det gået helt galt, siger han:

“Man har udeladt det mest banale,” siger han og uddyber:

“Allerede fra 1960’erne har man tjekket, at antallet af poster er det samme før og efter databehandlingen. Hvis man havde gjort det, så havde man jo opdaget, at der manglede nogen. Alle systemer bør fortælle en, hvor mange poster der er, så man kan se, om der er noget galt.”

Professoren peger på vigtigheden af, at man i en datavalideringsproces ser grundigt på den data, der ikke bliver accepteret.
“Hvis man har en valideringsproces, som skal fjerne forkerte poster, så skal man jo kigge på det output, som er blevet afvist. Hvorfor blev det afvist? Det er en banal ting, også selvom man ikke har lært at programmere,” siger han og uddyber:

“Der mangler respekt for, at man skal tjekke resultaterne, hvis man arbejder med computer. Halvdelen af tiden i softwareudvikling bruger man på at teste for at finde fejl, ikke på at skrive softwaren. Men det ved folk, der ikke arbejder med IT, jo ikke.”

Peter Sestoft håber, at der på samfundsniveau kommer mere opmærksomhed på datavaliditet:

“Man kan ikke forlange et kørekort til Excel, men man kunne godt ønske sig, at folk blev bedre klædt på i uddannelsessystemet til den slags.”

Bred vifte af fejl

Region Midtjylland er hverken det første eller sidste sted, hvor en Excel-fejl får store konsekvenser. Faktisk er problemerne så udbredte, at en gruppe forskere i 1999 stiftede European Spreadsheet Risks Interest Group (EuSpRIG), der indsamler skrækhistorier og udvikler best practice-retningslinjer. Du kan læse nogle af skrækhistorierne her: http://www.eusprig.org/horror-stories.htm

Også det australske YouTube-fænomen, matematiker og stand up-komiker Matt Parker har berørt de mange Excel-fejl i den underholdende video “When spreadsheets attack”, som du kan se her: https://www.youtube.com/watch?v=yb2zkxHDfUE

Hvis du er på jagt efter grundige retningslinjer, er der også råd for det. Allerede i 2005 publicerede Philip L. Bewig teksten “Hvordan ved du, at dit spreadsheet er korrekt?”. Der samler han en lang række konkrete råd til, hvordan dit Excel-ark kan opsættes, så du minimerer risikoen for fejl. Du kan hente hans pdf-fil her: https://arxiv.org/pdf/1301.5878.pdf