L’anonymisation des données est une destruction des indices permettant l’identification du propriétaire d’une donnée personnelle. Cette technique  permet de protéger l’identité d’une personne dans différents contextes. Mais elle est aussi souvent utile pour enlever toutes possibilités de discriminations dans certaines prises de décision. Cette technique est régulièrement confondue avec la pseudonymisation qui consiste à remplacer les clés d’identification d’une donnée par des alias. 

Qu’est-ce que l’anonymisation ? 

L’anonymisation est la destruction des liens d’identification entre une donnée personnelle et son propriétaire (personne physique ou morale). Cette procédure irréversible rend donc anonymes les données concernées.  

Définition 

Les éléments d’identification du propriétaire d’une donnée peuvent être de différentes natures. Ils peuvent en effet donner un renseignement rendant l’identification directement réalisable : nom de famille, prénom, adresse, numéro de téléphone, numéro de sécurité sociale…

Ou bien, prendre la forme d’informations spécifiques donnant des informations sur l’identité d’une personne en étant associée à d’autres types d’informations. On peut par exemple y retrouver : la date de naissance, le sexe, la profession, la taille ou encore la ville de naissance. 

À savoir : l’anonymisation est un procédé irréversible contrairement à la pseudonymisation qui est un remplacement des données personnelles par un alias. 

Comment anonymiser ? 

Il existe deux différentes techniques d’anonymisation : la randomisation et la généralisation. La première consiste à permuter des éléments entre eux pour changer l’ordre des données. Le but ? Rendre les informations d’identification illisibles. La seconde, a pour effet de noyer l’information identifiante au milieu d’autres de même niveau pour créer un ensemble et non une unité. 

Le but de l’anonymisation est de rendre la donnée collective. Elle doit donc s’intégrer parfaitement dans un jeu de données et ne pas apparaître comme individuelle. Si les données ont été séparées en plusieurs listes ou bases, elles doivent toutes être anonymisées. Si l’une des listes rend possible l’identification des données présentes sur les autres bases, alors l’anonymisation s’annule. Enfin, l’anonymisation ne doit pas laisser de place au recoupement d’informations permettant de redonner une identité au propriétaire de la donnée. La nullité de la réidentification des données est donc primordiale pour valider le processus. 

Comment fonctionne l’anonymisation ? 

L’anonymisation des données à caractère personnel n’est pas obligatoire. Cela signifie que le règlement général sur la protection des données (RGPD) n’a pas écrit d’obligations en ce qui concerne ce procédé de mise en anonymat (ce qui n’est pas le cas de la pseudonymisation). 

Lors d’un processus d’anonymisation il faut toutefois faire attention aux éléments concernés par l’effacement. Si l’information perd tout intérêt en devenant anonyme, il ne sert à rien de la conserver. Il devient donc plus pertinent de la supprimer directement et définitivement. 

Généralement, une anonymisation pratiquée par un organisme, s’applique de manière collective. Par exemple, ce procédé intervient souvent lors d’examens officiels ou de recrutements. 

Réglementation sur l’anonymisation des données à caractère personnel 

S’il n’est pas obligatoire de procéder à l’anonymisation d’un jeu de données à caractère personnel, la publication de données dites anonymisées est quant à elle strictement encadrée. En effet, il est interdit de publier des données anonymes si ces dernières ne respectent pas les critères d’anonymat. En cas de non-respect de cette règle, le responsable de traitement des données, peut-être accusé de violation de données en réfèrence à l’article 312-1-2 du Code des relations entre le public et l’administration (CRPA)