Image par : Valerie Pavilonis

Misinformation Monitor: août 2023

Note de la rédaction : Depuis février 2024, la newsletter mensuelle de NewsGuard – appelée Misinformation Monitor – a laissé place à Reality Check, une newsletter hebdomadaire en anglais, sur les tendances de la mésinformation en ligne. Pour en savoir plus, et vous inscrire sur Substack, c’est par ici.

Un robot plagiaire? Comment des sites de mauvaise qualité se servent de l’IA pour reformuler le contenu de médias traditionnels à des fins trompeuses 

NewsGuard a identifié 37 sites qui utilisent l’intelligence artificielle pour reprendre des articles provenant de sources d’information traditionnelles sans les créditer.

Par Jack Brewster, Macrina Wang, et Coalter Palmer | Publié le 24 août 2023

Les messages d’erreur de l’IA publiés par erreur sur d’autres sites étaient encore plus flagrants. Roadan.com, un site qui prétend être “votre source ultime pour les dernières nouvelles et mises à jour sur la politique au Royaume-Uni et au-delà”, a publié un article en juin 2023 qui révélait qu’il avait apparemment utilisé l’IA pour réécrire un article paru à l’origine dans le Financial Times le 28 juin : “Veuillez noter que le contenu que vous avez fourni est toujours protégé par les droits d’auteur du Financial Times”, indiquait l’article de Roadan.com. “En tant que modèle de langage d’IA, je ne peux pas réécrire ou reproduire pour vous un contenu protégé par des droits d’auteur. Si vous avez d’autres textes non protégés par des droits d’auteur ou des questions spécifiques, n’hésitez pas à les poser et je serai ravi de vous aider”. 

Malgré ce message d’erreur de l’IA, le chatbot semble avoir répondu à la demande de production d’un tel article, puisque le reste de l’article présentait une version réécrite et remaniée du rapport du Financial Times, avec des formulations similaires et des interviews des mêmes sources. Après avoir été contacté par NewsGuard pour obtenir des commentaires, Roadan.com a retiré l’article mais n’a pas répondu aux questions de NewsGuard. Là encore, il existe probablement d’autres articles remaniés sur le site que NewsGuard n’a pas pu identifier parce qu’ils ne contenaient pas de messages d’erreur de l’IA.

NewsGuard a contacté tous les médias dont le contenu semblait avoir été réécrit à l’aide de l’IA. Jason Easley, propriétaire et rédacteur en chef du site d’information politique américain libéral PoliticusUSA, a déclaré que DailyHeadliner.com, l’un des 37 sites plagiaires trouvés par NewsGuard, “n’avait pas et n’a jamais eu l’autorisation de réimprimer notre/nos article(s)”. 

Jason Easley a ajouté : “Nous prenons très au sérieux la menace potentielle que représente l’utilisation abusive de l’IA pour les droits de propriété intellectuelle et nous demandons expressément au Congrès et à la Maison Blanche de prendre les mesures qui s’imposent pour protéger les journalistes, les éditeurs et les autres artistes contre le vol potentiel de leur travail”. Au 23 août 2023, DailyHeadliner.com n’avait pas répondu à une demande de commentaire de NewsGuard.

NewsGuard a également contacté les 36 autres sites identifiés comme semblant utiliser l’IA pour reproduire du contenu sans créditer la source originale. Un seul a répondu. Dans un email non attribué, un représentant de TopStories.com.ng, un site qui se décrit comme “un site d’actualités numériques de premier plan axé sur le Nigeria”, a simplement déclaré : “Vous êtes tous fous”. NewsGuard a constaté que le site semblait avoir utilisé l’IA pour réécrire un article de Breitbart daté du 14 août 2023 – ce que TopStories.com.ng n’a pas contesté dans son court email.

Plagiat prêt à l’emploi : quand le plagiat est automatisé 

Une grande partie des 37 sites plagiaires identifiés par NewsGuard semble avoir été codée pour trouver, réécrire et publier automatiquement – le tout sans aucune surveillance humaine. 

Par exemple, TopGolf.kr, un site d’information généraliste qui se décrit comme “se penchant sur les plus grands problèmes du monde”, semble avoir utilisé l’intelligence artificielle pour réécrire des centaines d’articles provenant d’autres sources. Au cours des trois derniers mois, le site a également publié une dizaine d’articles contenant des messages d’erreur de l’IA, ce qui laisse penser qu’il n’est soumis qu’à peu ou pas de surveillance humaine.

“En tant que modèle de langage d’IA, je ne suis pas sûr des préférences des lecteurs humains, mais voici quelques options alternatives pour le titre…”, peut-on lire dans le titre d’un article de TopGolf.kr daté du 28 mai 2023, qui semble entièrement basé sur un article publié le même jour par le magazine Wired. Un autre article paru le 6 juin 2023 sur TopGolf.kr montre encore plus clairement que ce site utilise probablement l’IA, puisque son titre dit : “Réécriture du titre d’Andy Cohen : la fille Lucy est l’une des premières mères porteuses”. La dizaine d’articles contenant des messages d’erreur d’IA identifiés par NewsGuard se trouvaient toujours sur le site au 23 août 2023.

Face aux constats de NewsGuard, le professeur d’informatique de l’université de l’Indiana, Filippo Menczer, a estimé qu’il était évident que des programmeurs avaient codé certains des 37 sites plagiaires identifiés par NewsGuard pour récupérer automatiquement des contenus d’actualité sur internet à l’aide d’un modèle de langage comme ChatGPT d’OpenAI ou l’un des nombreux autres modèles du marché. “Si je devais deviner, je dirais que des acteurs malveillants engagent un programmeur, ou une équipe de programmeurs, pour développer un système qui (copie et réécrit les articles)”, souligne Filippo Menczer. “Le système aura alors des cibles – peut-être des sources qu’il souhaite plagier – et il développera un robot d’indexation pour aller chercher les articles”. 

ChatGPT réécrit un article du New York Times pour nous

À titre d’exercice, NewsGuard a demandé manuellement à ChatGPT de réécrire un article du New York Times. Le chatbot s’est rapidement exécuté, produisant une version peaufinée de l’article en quelques secondes. 

“Réécrivez l’article ci-dessous pour le rendre plus captivant et améliorer son référencement SEO (Search Engine Optimization, optimisation pour les moteurs de recherche)”, a demandé un analyste de NewsGuard à ChatGPT, en collant sous le message un article du New York Times daté du 16 août 2023 concernant la visite prochaine du président américain Joe Biden à Hawaï. ChatGPT a immédiatement répondu en réécrivant un article de 600 mots environ, en remaniant le texte original du New York Times. 

La requête de NewsGuard, demandant à ChatGPT-4 de réécrire un article du New York Times datant du 16 août 2023, et la version réécrite par ChatGPT. (Vidéo de NewsGuard)

(Top) NewsGuard’s prompt directing ChatGPT-4 to rewrite an Aug. 16, 2023, New York Times article. (Bottom) The rewritten New York Times article, written by ChatGPT (Screenshots via NewsGuard)