Deidentificerede data er oplysninger, hvor direkte kendetegn som navn, adresse, telefonnummer eller CPR-nummer er fjernet, ændret eller skjult. Formålet er at mindske risikoen for, at data kan føres tilbage til en bestemt person. Det er dog ikke det samme som fuldt anonyme data. I mange tilfælde kan en person stadig identificeres, hvis flere oplysninger kombineres.
Hvad betyder deidentificering i praksis?
Deidentificering bruges ofte i forskning, sundhedsvæsen, virksomheder og offentlige myndigheder. Her ønsker man at kunne analysere mønstre og tendenser uden unødigt at afsløre, hvem de registrerede personer er. Det kan ske ved at fjerne direkte identifikatorer eller ved at gøre oplysninger mindre præcise, for eksempel ved kun at angive aldersgruppe i stedet for præcis fødselsdato.
Men selv hvis navn og adresse er væk, kan kombinationer af oplysninger stadig pege på en bestemt person. Det kan for eksempel være data om køn, alder, postnummer og sygdomsforløb. Derfor taler man også om risikoen for genidentifikation, altså at nogen kan koble datasættet sammen med andre tilgængelige oplysninger og dermed finde frem til identiteten.
Forskellen på deidentificerede og anonyme data
Deidentificerede data er typisk mere brugbare til analyse end helt anonyme data, fordi flere detaljer bevares. Til gengæld er beskyttelsen svagere. Anonyme data er bearbejdet så grundigt, at enkeltpersoner ikke længere med rimelighed kan identificeres. Deidentificerede data ligger ofte et sted midt imellem fuldt personhenførbare og fuldt anonyme oplysninger.