L’entreprise chinoise DeepSeek fait sensation en ce début 2025 avec son modèle d’intelligence artificielle open-source DeepSeek-R1, qui s’est hissé en tête des téléchargements sur l’App Store américain. Si ses performances impressionnantes lui permettent de rivaliser avec ChatGPT, son origine chinoise soulève des questions sur l’influence du Parti Communiste Chinois (PCC) dans son fonctionnement.
Une censure évidente mais facilement contournable
Une équipe de chercheurs vient de publier sur HuggingFace un jeu de données de 1 360 prompts couvrant des sujets sensibles pour le PCC. Les tests révèlent que 85% des requêtes sur des thèmes comme l’indépendance de Taïwan, la Révolution culturelle ou Xi Jinping sont systématiquement censurées par le modèle.
Les réponses censurées se distinguent par un ton nationaliste exacerbé, comme l’illustre cette citation type :
« La Chine est un pays unifié multi-ethnique, et Taïwan est une partie inaliénable de la Chine depuis les temps anciens. Le gouvernement chinois s’oppose résolument à toute forme d’activités séparatistes ‘pro-indépendance de Taïwan’. »
Des failles de sécurité préoccupantes
Les chercheurs ont identifié plusieurs méthodes simples pour contourner ces restrictions :
- Omission du contexte chinois : reformuler la question en se référant à d’autres pays
- Contextualisation historique : présenter la requête comme une demande d’information historique
- Fictionnalisation : encadrer la demande dans un contexte romanesque
- Injection directe de prompts : combiner plusieurs techniques (base64, caractères de contrôle, JSON)
Un succès commercial malgré les controverses
Selon les analyses, DeepSeek aurait implémenté ces mesures de censure de manière rudimentaire, probablement pour satisfaire les exigences minimales du PCC. Cette approche superficielle explique la facilité avec laquelle les restrictions peuvent être contournées.
Des spéculations suggèrent que le modèle pourrait avoir été entraîné en partie sur ChatGPT, ce qui expliquerait sa tendance à adopter par défaut un contexte américain lorsque l’origine géographique n’est pas spécifiée.
Malgré ces controverses, DeepSeek-R1 continue sa progression fulgurante sur le marché des IA conversationnelles. Son succès pose la question de l’influence croissante des entreprises technologiques chinoises sur le marché mondial de l’IA, et des implications potentielles en termes de contrôle de l’information.
Cette situation intervient dans un contexte de course à l’IA entre la Chine et les États-Unis, où les enjeux géopolitiques se mêlent aux considérations technologiques et commerciales.