Invisibles mais dangereux : les caractères Unicode

Des caractères invisibles dans l'Unicode permettent de cacher des instructions malveillantes dans des IA comme Copilot, révélant des données confidentielles.
Unicode caché

Les caractères invisibles, issus d’une particularité de la norme d’encodage de texte Unicode, représentent une menace sérieuse pour la sécurité des modèles de langage comme GPT-4.0 et Claude Opus.

Ces caractères peuvent être utilisés pour insérer des charges utiles malveillantes de manière indétectable dans des chatbots alimentés par IA, permettant l’exfiltration de données sensibles telles que des mots de passe ou des informations financières. Joseph Thacker, chercheur indépendant, a exprimé son étonnement quant à la capacité de ces IA à interpréter ces tags invisibles, soulignant une faille de sécurité potentiellement exploitable dans de nombreux domaines.

Johann Rehberger a démontré cette vulnérabilité à travers deux attaques de concept contre Microsoft 365 Copilot, où des secrets commerciaux et des codes à usage unique ont été extraits via des URL contenant ces caractères invisibles. Ces attaques, bien que partiellement atténuées par Microsoft, mettent en lumière l’importance de sécuriser les entrées et sorties des modèles de langage contre de telles tactiques d’injection.

Ce phénomène souligne la nécessité d’une vigilance accrue et d’une meilleure compréhension des interactions entre les caractères Unicode et les modèles de langage pour prévenir les abus potentiels.