Le CAPTCHA est une forme de test requis parfois sur internet. Il sert de mesure de sécurité pour authentifier un internaute, sous forme de question-réponse. Il est désormais très courant de croiser des CAPTCHA sur internet dans de très nombreuses situations.

Un CAPTCHA, qu’est-ce que c’est ?

CAPTCHA est l’acronyme d’un terme anglais : Completely Automated Public Turing test to tell Computers and Humans Apart. En français, on pourrait le traduire par « Test complètement automatisé de Turing pour différencier les ordinateurs et les humains ».

En pratique, il s’agit d’une mesure de sécurité internet sous la forme d’une authentification par « question-réponse ». Le but est de déterminer si la personne qui réalise une action en ligne est un ordinateur ou un vrai internaute. Cela permet d'empêcher ou au moins de limiter les actions robotisées.

Le CAPTCHA a été créé en l’an 2000 par l'union de plusieurs chercheurs américains. Certains venaient de l’université de Carnegie-Mellon et ont travaillé conjointement avec un chercheur en poste chez IBM.

D’où viennent les CAPTCHA ?

Les années 90 et les avancées en matière de technologie et de numérique on conduit à un grand développement des forums. À l’époque, c’est sur les forums que l’on retrouvait de nombreux Spams où des messages y sont postés en très grand nombre...

  • soit pour nuire à des utilisateurs
  • soit pour ramener vers des sites douteux
  • ou encore dans le but de simplement déposer des liens.

Les chercheurs se penchent alors sur une solution qui permettrait de distinguer un robot d’un humain pour éviter la prolifération de ces messages nuisibles.

En 1996, un premier système est trouvé, demandant de recopier des caractères. Seulement les robots évoluent aussi vite que les avancées en matière de protection sur le web et sont rapidement capables de détecter et retaper les caractères.

Le concept évoluera par la suite pour donner les premiers CAPTCHA tels qu’on les a connus : des textes plus difficiles à déchiffrer basés sur différentes variations :

  • Une déformation des lettres,
  • L’utilisation de différentes couleurs en fond et sur les lettres,
  • Une forte alternance de la casse (les majuscules et les minuscules),
  • Du texte reproduisant une écriture manuscrite…

C’est ainsi que sont nés les premiers CAPTCHA, dont la forme est restée celle d’un texte déformé pendant plusieurs années.

Quels sont aujourd’hui les différents types de CAPTCHA ?

Au fil des ans, les piratages informatiques à l’aide de robots n'ont pas cessés d’évoluer. Cela a donc entrainé l'évolution des systèmes de contrôles.

Des questions sont alors apparues, mélangeant images et texte. Dans ce cas, au lieu d’un texte déformé, la case de CAPTCHA pouvait contenir par exemple :

« Il y a 5 [dessin de pomme], 5 [dessin de banane] et  5 [dessin de voiture]. Combien y a-t-il de fruits ? »

Et dans la case de réponse, l’utilisateur devait ainsi entrer un chiffre au lieu de recopier un texte.

Depuis quelques années, la classique boite de dialogue a été remplacée par la mosaïque d’une image découpée, ou de plusieurs images, sur laquelle on demande à l’utilisateur de cliquer s’il voit un élément prédéfini.  

Un autre système a également été mis au point plus récemment par Google : le reCAPTCHA. Via cette méthode, l’utilisateur a seulement une case à cocher. C’est le reCAPTCHA qui analyse le déplacement de la souris et détermine si la personne qui clique est un robot ou non.

En suivant cela, d’autres versions ont été lancées du reCAPTCHA, une v2 et une v3 dites invisibles. Un script est placé sur les sites internet et c’est lui qui identifie via le comportement de visite des pages si le visiteur est un internaute humain ou un visiteur artificiel. Cette solution n’implique plus de case à cocher et solutionne un problème majeur des tests d’authentification : il n’exclut pas les personnes handicapées.

En effet, le CAPTCHA pouvait gêner la navigation et les interactions en ligne de certaines personnes handicapées.