Image : StockSnap via Pixabay

Misinformation Monitor: juin 2023

Bienvenue dans le Misinformation Monitor, une newsletter qui couvre la mésinformation, la désinformation, et les fausses informations en ligne avec des données exclusives en provenance de neuf pays. Inscrivez-vous ici pour recevoir cette newsletter par email, et téléchargez l’extension de navigateur NewsGuard.

Comment la nouvelle génération de fermes de contenu se finance :

Certaines des plus grandes marques au monde soutiennent involontairement la multiplication de sites d’information non fiables générés par l’IA 

NewsGuard a identifié 141 marques qui alimentent en publicité programmatique des sites d’actualité et d’information de mauvaise qualité générés par l’IA et fonctionnant avec peu ou pas de supervision humaine.

Par Jack Brewster, Zack Fishman et Elisa Xu

Avec la contribution de Chiara Vercellone, Sara Badilini, Natalie Huet, Leonie Pfaller et Giulia Pozzi

De grandes marques internationales financent la prolifération rapide des sites d’information non fiables générés par l’intelligence artificielle, que nous appelons “UAINs” (pour “unreliable artificial intelligence-generated news and information websites” en anglais), en diffusant de la publicité programmatique sur ces sites toujours plus nombreux, comme le montre une analyse de NewsGuard. 

Ces publicités semblent avoir été placées de manière programmatique, ce qui signifie que les marques n’avaient pas l’intention de les faire apparaître sur ces sites, mais qu’elles ont été diffusées automatiquement via un système qui les place indépendamment de la nature d’un site. Cette approche programmatique finance ainsi des sites de piètre qualité et des sites de mésinformation, tout en échouant à protéger la réputation des marques. La plupart des publicités repérées ont été placées par Google.

NewsGuard définit les sites d’information non fiables générés par l’Intelligence Artificielle (UAINs) comme des sites qui fonctionnent avec peu ou pas de supervision humaine et qui publient des articles rédigés en grande partie ou intégralement par des robots. Rien qu’au cours du mois dernier, les analystes de NewsGuard ont mis à jour le nombre de sites identifiés sur son nouveau centre de suivi de l’IA, de 49 à 217. (Pour en savoir plus sur la définition d’un site UAIN par NewsGuard, consultez la section “Méthodologie” en bas de ce rapport).

Nombre de ces sites générés par l’IA semblent être entièrement financés par la publicité programmatique. Certains de ces sites génèrent d’énormes volumes d’articles sur lesquels des publicités peuvent être placées — l’un d’entre eux produit en moyenne plus de 1.200 articles par jour — ce qui encourage la création de ces sites de faible qualité, générés par l’IA, avec peu ou pas de supervision éditoriale apparente. Bien que de nombreux annonceurs et leurs agences de publicité s’appuient sur des “listes d’exclusion” de sites jugés à risques pour les marques, sur lesquels leurs publicités ne doivent pas apparaître, ces listes ne sont souvent pas mises à jour et n’ont manifestement pas suivi l’augmentation rapide du nombre de sites générés par l’IA.

En mai et juin 2023, les analystes de NewsGuard ont identifié 393 publicités programmatiques émanant de 141 grandes marques apparaissant sur 55 des 217 sites UAINs recensés par NewsGuard. Ces UAINs n’affichent pas tous des publicités pour des grandes marques, et certains ne diffusent aucune publicité programmatique. Les analystes de NewsGuard naviguant sur internet dans quatre pays (États-Unis, Allemagne, France et Italie) ont été ciblés par ces publicités.

Comme il est probable qu’aucune des marques ou leurs agences de publicité n’avait la moindre idée que leurs annonces apparaîtraient sur ces sites peu fiables, générés par l’IA, NewsGuard a choisi de ne pas les nommer. Mais il s’agit d’un large éventail d’annonceurs de premier plan : une demi-douzaine de grandes banques et de sociétés de services financiers, quatre grands magasins de luxe, trois célèbres marques de vêtements de sport, trois fabricants d’électroménager, deux des plus grandes sociétés mondiales de technologie grand public, deux sociétés mondiales de commerce en ligne, deux des principaux fournisseurs d’accès à internet américains, trois services de streaming proposés par des groupes audiovisuels américains, une plateforme numérique de la Silicon Valley et une grande chaîne européenne de supermarchés.

Plus de 90% des publicités identifiées par NewsGuard — 356 sur 393 — ont été diffusées par Google Ads, la plus grande plateforme publicitaire en ligne, qui a généré 168 milliards de dollars de revenus l’année dernière grâce à la publicité en ligne, selon Digiday.

La publicité programmatique utilise des algorithmes et des processus d’enchères avancés pour diffuser des publicités numériques très ciblées, directement à chaque utilisateur, plutôt qu’à des sites web spécifiques. Cela signifie que les publicités “suivent” en réalité les utilisateurs lorsqu’ils naviguent sur internet.

En raison de l’opacité de ce processus, les marques au coeur de ce rapport ne savent probablement pas qu’elles financent la multiplication des sites d’information générés par l’IA, puisque les publicités sont achetées par des tiers et qu’il y a de nombreux intermédiaires impliqués.

Des grandes marques soutiennent ce qui semble être du plagiat par l’IA, mais aussi de faux remèdes médicaux

Les 393 publicités trouvées par NewsGuard apparaissaient directement à côté d’articles contenant des messages d’erreur propres aux réponses des chatbots — un signe que le site semble n’avoir que peu ou pas de supervision éditoriale humaine. 

Par exemple, NewsGuard a trouvé des publicités programmatiques pour une banque mondiale de premier plan, deux grands fournisseurs d’accès à internet, une célèbre marque de vêtements de sport et un constructeur automobile à côté d’un article sur NoticiasDeEmprego.com.br, un site brésilien d’informations sur l’emploi. L’article contenait dans le titre un message d’erreur généré par un chatbot. “Je suis désolé, mais en tant que modèle de langage basé sur du texte, je ne suis pas capable de naviguer sur Internet ni de fournir des liens en temps réel”, disait ainsi le titre.

Une publicité pour une marque de vêtements de sport est apparue sur NoticiasDeEmprego.com.br, un site qui publie des informations générées par l’IA sur les opportunités d'emploi au Brésil. NewsGuard a masqué la publicité programmatique à l’aide d’une boîte noire. (Capture d’écran réalisée par NewsGuard)

Certains des sites UAINs sur lesquels sont apparues des publicités de grandes marques ont visiblement utilisé des outils d’intelligence artificielle pour réécrire des articles publiés par des médias traditionnels et grand public. Cela était souvent fait sans mention de la source originale. Par exemple, des publicités pour un site américain de location d’appartements, un site international de e-commerce, une imprimante de bureau japonaise et un fabricant chinois d’électronique sont apparues à côté d’un article publié par l’UAIN AlaskaCommons.com qui semblait être une version réécrite par l’IA d’un article publié par l’édition américaine du tabloïd britannique The Sun. L’article comportait les mêmes images et des tournures de phrase similaires. Vers la fin de l’article d’AlaskaCommons.com, on pouvait lire “Comment obtenir des paris gratuits sur le football” (“How to Get Free Bets on Football”), le même sous-titre que The Sun, au-dessus d’un paragraphe répétant un message d’erreur de chatbot: “En tant que modèle de langage d’IA, je ne peux pas fournir d’informations sur les paris gratuits sur le football. Veuillez vous référer à des sources d’information fiables ou à des sites de paris pour plus d’informations”. En juin 2023, Le Sun n’a pas répondu à deux emails de NewsGuard cherchant à savoir si AlaskaCommons.com avait l’autorisation de reprendre des contenus provenant de son site web.

Là encore, les marques dont les publicités apparaissent à côté de ce contenu de mauvaise qualité ou en apparence plagié n’auraient aucun moyen facile de savoir par elles-mêmes qu’elles soutiennent ces sites.

La plupart des publicités ont été présentées aux analystes de NewsGuard sur des sites générés par l’IA qui sont de piètre qualité mais qui ne diffusent pas de fausses informations. Cependant, NewsGuard a également trouvé des publicités pour deux services américains de vidéo en streaming, une marque de fournitures de bureau, un constructeur automobile japonais, une banque mondiale basée à New York, une animalerie, un magasin en ligne vendant des vitamines, une société de produits diététiques et un fabricant d’aspirateurs sur MedicalOutline.com, un site UAIN qui a fait la promotion de remèdes naturels non prouvés et potentiellement dangereux, avec des titres tels que “Le citron peut-il guérir les allergies cutanées ?”, “Quels sont les 5 remèdes naturels contre le TDAH ?”, et “Comment prévenir le cancer naturellement”.

Google : l’entreprise de technologie publicitaire au cœur de la machine UAIN

Les règles publicitaires de Google stipulent que les sites ne doivent pas “insérer d’annonces diffusées par Google sur des pages” diffusant du “contenu généré automatiquement qui inclut du spam”, que Google définit notamment comme du “contenu généré de manière programmatique sans produire quoi que ce soit d’original ni apporter de valeur ajoutée”.

Néanmoins, comme indiqué ci-dessus, plus de 90% des publicités identifiées par NewsGuard sur les sites UAINs ont été présentées aux analystes de NewsGuard par Google. NewsGuard a envoyé quatre emails à Google l’interrogeant sur la monétisation des sites UAIN. Après avoir reçu cette requête, un porte-parole de Google a demandé à NewsGuard de fournir davantage de contexte par email, ce que NewsGuard a fait. Cependant, au 25 juin 2023, NewsGuard n’avait toujours pas reçu de réponse.

Certains des sites UAINs sur lesquels les grandes marques sont apparues publient des centaines d’articles par jour, sans doute avec l’aide d’un chatbot. (Il est souvent difficile de détecter si un article a été rédigé à l’aide de l’IA s’il ne contient pas les messages d’erreur que l’on trouve habituellement dans les textes générés par l’IA).

Par exemple, World-Today-News.com, un UAIN d’actualité et de contenus lifestyle, a publié environ 8.600 articles — soit environ 1.200 par jour en moyenne — au cours de la semaine du 9 juin 2023 au 15 juin 2023. À titre de comparaison, le New York Times publie généralement autour de 150 articles par jour, selon un questions-réponses publié en avril 2022. NewsGuard a trouvé des publicités programmatiques pour une compagnie aérienne américaine, une place de marché en ligne et un grand magasin américain sur ce site, qui ne donne pas les noms de ses auteurs ni aucune information concernant sa direction éditoriale. NewsGuard a constaté que l’UAIN précédemment mentionné, AlaskaCommons.com, ainsi qu’un autre site UAIN, Time.news, avaient publié respectivement 5.867 et 6.108 articles au cours de la même période.

Alors que Time.news, un site d’actualités internationales, ne fournit pas de noms d’auteurs, AlaskaCommons.com attribue régulièrement des articles à une série d’auteurs dont les profils semblent inauthentiques. “Ingrid Taylor”, l’un des noms qu’AlaskaCommons.com identifie fréquemment comme auteur de ses articles, a ainsi publié 4.364 articles depuis le début de l’année, dont 108 pour la seule date du 15 juin 2023. NewsGuard a trouvé des publicités pour un site américain de location d’appartements, un site mondial de commerce en ligne, une imprimante de bureau japonaise et un fabricant chinois d’électronique sur AlaskaCommons.com, et des publicités pour deux grandes banques américaines, un service de musique en ligne, une marque de vêtements de sport, une société de médias de la Silicon Valley, et d’autres encore sur Time.news.

D’autres sites UAINs contenaient jusqu’à une douzaine, voire plus, de “widgets” publicitaires sur des articles contenant des messages d’erreur de chatbots. Les widgets publicitaires sont des éléments de code que les développeurs web peuvent placer sur leurs sites pour diffuser des annonces programmatiques. Google ne semble pas avoir fixé de limite au nombre de widgets publicitaires qu’un site peut placer sur une page donnée, selon la rubrique “Aide” du site du groupe

Un article généré par l’IA et contenant un message d’erreur de chatbot sur le site UAIN FoodingWorld.com, un site expliquant l’histoire des aliments et leurs ingrédients, contenait 15 widgets publicitaires Google. Les publicités présentées à NewsGuard sur le site provenaient de marques telles qu’une société internationale de location de voitures, une banque américaine, un magasin de matelas et une société de commerce électronique.

Une publicité pour une société internationale de location de voitures est apparue sur FoodingWorld.com, un site UAIN qui publie des articles sur l’alimentation générés par l'IA. NewsGuard a bloqué les publicités programmatiques à l'aide de boîtes noires. (Capture d’écran réalisée par NewsGuard)

Il est aussi facile pour les sites UAINs que pour n’importe quel autre site de monétiser rapidement leur contenu. Sur la page d’accueil de Google AdSense, le nom du produit des widgets publicitaires que Google fournit aux éditeurs, la société vante la facilité avec laquelle les sites peuvent commencer à gagner de l’argent grâce à la publicité programmatique : “Il suffit d’insérer le code AdSense sur votre site Web, et ça fonctionne immédiatement”.

Depuis que NewsGuard a commencé à suivre la prolifération des sites UAIN en mai 2023, ses équipes ont identifié quelque 25 nouveaux sites par semaine. Le nombre total de ces sites est probablement beaucoup plus élevé que les 217 identifiés à ce jour par NewsGuard, étant donné que NewsGuard n’est généralement en mesure d’en trouver de nouveaux que s’ils ont publié des articles contenant des messages d’erreur typiques de chatbots.

NewsGuard a envoyé des emails à 40 des 141 marques pour lesquelles il a trouvé des publicités sur des sites UAINs, pour leur demander si elles savaient que celles-ci apparaissaient sur des sites non fiables générés par l’IA. Quatre marques ont répondu mais n’ont pas souhaité faire de commentaire.

NewsGuard a envoyé des emails à quatre des six sites UAINs mentionnés dans ce rapport, pour s’enquérir de leur utilisation de l’IA et des messages d’erreur d’IA que NewsGuard a trouvés dans les articles publiés. Aucun des sites n’a répondu. NewsGuard n’a pas été en mesure de trouver de coordonnées pour les deux autres sites UAIN, NoticiasDeEmprego.com.br et AlaskaCommons.com.

Note : NewsGuard vend des licences d’accès à ses évaluations de plus de 30.000 sources d’actualité et d’informations, dont plus de 9.000 sites web, afin d’aider les marques à éviter de placer involontairement des publicités programmatiques sur des sites de mauvaise qualité et de mésinformation. Les listes d’exclusion de NewsGuard sont utilisées par des annonceurs, des agences de publicité et des sociétés de technologie publicitaire pour s’assurer qu’ils ne soutiennent pas certains sites, tandis que ses listes d’inclusion servent à encourager le placement de publicités sur des sites généralement dignes de confiance, soutenant ainsi le journalisme de qualité.

 

Méthodologie :

En mai et juin 2023, des analystes de NewsGuard basés aux États-Unis, en Allemagne, en France et en Italie ont examiné 55 sites affichant de la publicité programmatique et identifiés comme sites d’actualité non fiables générés par l’IA (voir ci-dessous). Les analystes ont utilisé différents navigateurs, le mode de navigation privée, ainsi que des réseaux privés virtuels (VPN), un outil permettant aux utilisateurs de naviguer sur internet comme s’ils se trouvaient dans un autre pays. Les analystes ont réalisé des captures d’écran de leurs résultats. Seules les publicités des entreprises dont le chiffre d’affaires annuel est supérieur ou égal à 500 millions de dollars ont été prises en compte dans ce rapport.

NewsGuard considère qu’un site peut être défini comme un site d’information non fiable généré par l’IA s’il répond aux quatre critères suivants : 

  1. Il existe des preuves évidentes qu’une part importante du contenu du site est produite par l’IA.
  2. Tout aussi important, il y a de fortes raisons de penser que le contenu est publié sans contrôle humain notable. Par exemple, de nombreux articles peuvent contenir des messages d’erreur ou d’autres termes propres aux réponses des chatbots, ce qui indique que le contenu a été produit par des outils d’IA sans avoir été correctement édité. (Il est probable qu’aujourd’hui ou à l’avenir, de nombreux sites d’information utiliseront des outils d’IA mais déploieront également une supervision humaine efficace ; ils ne seront alors pas considérés comme des sites UAINs).
  3. Le site est présenté de telle sorte qu’un lecteur moyen pourrait supposer que son contenu est produit par des rédacteurs ou des humains, du fait de sa mise en page, d’un nom générique ou anodin, ou d’autres éléments typiques des sites d’actualité et d’information.
  4. Le site n’indique pas clairement que son contenu est produit par l’IA.