Les chercheurs de l’ETH Zurich, dirigés par Andreas Plesner, ont mis au point un bot capable de résoudre les CAPTCHAs de type reCAPTCHA v2 avec une précision de 100 %. En utilisant une version fine-tunée du modèle de reconnaissance d’images YOLO, le bot peut identifier des objets dans des images de rue avec une efficacité comparable à celle des humains. Ce développement remet en question l’efficacité des CAPTCHAs comme mesure de sécurité en ligne, car même les systèmes de reCAPTCHA v3, qui analysent les interactions des utilisateurs, peuvent parfois revenir à la version v2.
L’utilisation généralisée des CAPTCHAs pour différencier les humains des bots est désormais compromise. Les chercheurs ont démontré que les bots peuvent non seulement résoudre ces défis visuels, mais aussi le faire plus rapidement que les humains dans certains cas.
En entraînant le modèle sur 14’000 images de trafic étiquetées, les chercheurs ont pu créer un système capable d’identifier les objets dans les CAPTCHAs avec une précision impressionnante. En outre, des techniques comme l’utilisation de VPN, de modèles de mouvement de souris et de données de navigation falsifiées ont été employées pour rendre le bot indétectable.
Le bot développé par les chercheurs a montré une précision variable selon les objets, allant de 69 % pour les motos à 100 % pour les bornes d’incendie. En moyenne, le bot a résolu les CAPTCHAs en moins de tentatives que les humains, bien que la différence ne soit pas statistiquement significative. Cette performance marque une avancée significative par rapport aux études précédentes, qui n’avaient atteint qu’un taux de réussite de 68 à 71 %.
Glossaire
- CAPTCHA : « Completely Automated Public Turing test to tell Computers and Humans Apart », un test utilisé pour différencier les humains des bots.
- reCAPTCHA v2 : Version de CAPTCHA développée par Google, utilisant des images de rue pour vérifier l’humanité des utilisateurs.
- reCAPTCHA v3 : Version plus récente de CAPTCHA qui analyse les interactions des utilisateurs plutôt que de poser des défis visuels.
- YOLO : « You Only Look Once », un modèle de reconnaissance d’images en temps réel.
- VPN : « Virtual Private Network », un réseau privé virtuel utilisé pour masquer l’adresse IP d’un utilisateur.