Une nouvelle étude menée conjointement par Cisco et l’Université de Pennsylvanie vient de mettre en lumière des failles de sécurité préoccupantes dans le modèle d’IA DeepSeek R1. Les chercheurs ont réussi à contourner 100% des restrictions de sécurité du modèle, soulevant de sérieuses questions sur la fiabilité de cette alternative « low-cost » aux géants du secteur.
Un taux de réussite inquiétant
Les équipes de recherche ont soumis au modèle 50 prompts malveillants issus du benchmark HarmBench, couvrant différentes catégories sensibles comme la cybercriminalité, la désinformation et les activités illégales. Le résultat est sans appel : aucune des tentatives n’a été bloquée ou même détectée par les systèmes de protection de DeepSeek.
« Un taux de réussite de 100% des attaques montre clairement qu’il y a eu des compromis », explique DJ Sampath, VP produit chez Cisco. « Le développement à moindre coût s’est peut-être fait au détriment des mécanismes de sécurité essentiels. »
Des vulnérabilités multiples confirmées
La société de sécurité Adversa AI a également mené ses propres tests, confirmant que le modèle est vulnérable à un large éventail de techniques de jailbreak, des plus basiques aux plus sophistiquées. Alex Polyakov, CEO d’Adversa AI, souligne que DeepSeek semble avoir simplement copié certaines réponses de sécurité d’OpenAI sans implémenter de véritables protections.
Les chercheurs ont notamment relevé que le modèle peut :
- Générer du contenu toxique sans restriction
- Fournir des instructions détaillées sur des activités illégales
- Contourner la censure imposée par le gouvernement chinois
- Produire de la désinformation à grande échelle
Un contraste marqué avec la concurrence
En comparaison, le modèle o1 d’OpenAI, qui occupe une position similaire sur le marché du raisonnement IA, a démontré une bien meilleure résistance aux tentatives de contournement. Même le modèle Llama 3.1 de Meta, malgré quelques faiblesses, offre globalement de meilleures protections.
Cette situation soulève des questions importantes alors que DeepSeek gagne en popularité, notamment en raison de son prix attractif. Les experts alertent sur les risques potentiels d’utiliser un modèle aussi vulnérable dans des applications professionnelles ou critiques.
DeepSeek n’a pas souhaité commenter ces résultats, malgré les nombreuses sollicitations des médias et des chercheurs en sécurité.