Bild von: Valerie Pavilonis

Der Aufstieg der Newsbots: KI-generierte Nachrichten-Webseiten verbreiten sich online

NewsGuard hat 49 Nachrichten- und Informationsseiten ausfindig gemacht, die offenbar fast vollständig von künstlicher Intelligenz Software geschrieben wurden. Eine neue Generation von Content Farmen entsteht.

Anmerkung der Redaktion: Seit der Veröffentlichung dieses Berichts hat NewsGuard Hunderte weitere unzuverlässige, KI-generierte Webseiten identifiziert. Besuchen Sie unser Tracking-Center für Künstliche Intelligenz, um die aktuelle Gesamtzahl zu erfahren und unsere neuesten Berichte zu lesen.

Von McKenzie Sadeghi und Lorenzo Arvanitis | Veröffentlicht am 1. Mai 2023

NewsGuard hat herausgefunden, dass künstliche Intelligenz dazu verwendet wird, sogenannte Content-Farmen zu betreiben. Dabei handelt es sich um weltweit aktive, qualitativ minderwertige Webseiten, die große Mengen von Clickbait-Artikeln produzieren und so Werbeeinnahmen maximieren. 

Im April 2023 hat NewsGuard 49 Webseiten in sieben Sprachen – Chinesisch, Tschechisch, Englisch, Französisch, Portugiesisch, Tagalog und Thailändisch – identifiziert, die scheinbar ganz oder größtenteils von KI-Sprachmodellen generiert werden. Diese Modelle wurden entwickelt, um menschliche Kommunikation zu imitieren – hier in Form von typischen Nachrichten-Webseiten. 

Diese Webseiten machen häufig keine Angaben zu ihren Besitzverhältnissen und produzieren eine Vielzahl von Artikeln zu verschiedenen Themen, darunter Politik, Gesundheit, Unterhaltung, Finanzen und Technologie. Einige veröffentlichen Hunderte Artikel pro Tag. Einige Beiträge verbreiten falsche Behauptungen. Nahezu alle Inhalte zeichnen sich durch eine einfache Sprache und sich wiederholende Phrasen aus, die Kennzeichen von künstlicher Intelligenz sind.

Viele dieser Webseiten sind mit Werbung überladen. Das deutet darauf hin, dass sie wahrscheinlich entwickelt wurden, um Einnahmen aus programmatischen Anzeigen zu generieren. Diese Anzeigen werden algorithmisch im gesamten Internet platziert und finanzieren einen Großteil der weltweiten Medien. Genau wie die erste Generation von Content-Farmen im Internet, die von Menschen betrieben werden, wurden sie vermutlich zu diesem Zweck geschaffen.

In den vergangenen Monaten sind zahlreiche leistungsfähigere KI-Tools der Öffentlichkeit zugänglich gemacht worden. Damit sind Befürchtungen, dass mit ihrer Hilfe ganze Nachrichtenorganisationen geschaffen werden – einst Gegenstand von Spekulationen von Medienwissenschaftler:innen Realität geworden. 

Im April 2023 schickte NewsGuard E-Mails an alle 29 analysierten Webseiten, die Kontaktinformationen angegeben hatten. Davon bestätigten zwei, dass sie KI einsetzen. Von den übrigen 27 Webseiten gingen zwei nicht auf die Fragen von NewsGuard ein, acht gaben ungültige E-Mail-Adressen an, und 17 antworteten nicht.

NewsGuard tauschte eine Reihe von zum Teil schwer verständlichen E-Mails mit der angegebenen Eigentümerin von Famadillo.com aus, einer Webseite, die zahlreiche KI-generierte Produktbewertungen veröffentlicht hat, die dem “admin” zugeschrieben werden. Diese Person, die sich als Maria Spanadoris ausgab, bestritt, dass die Webseite umfassend künstliche Intelligenz verwendet. “Wir haben einen Test gemacht, um alte Artikel, die niemand mehr liest, mit KI zu bearbeiten, nur um zu sehen, wie es funktioniert”, sagte Spanadoris, ohne näher darauf einzugehen. Sie lehnte ein Telefongespräch mit NewsGuard ab.

Adesh Ingale, der sich als Gründer von GetIntoKnowledge.com auswies, einer Webseite, die nach Erkenntnissen von NewsGuard KI-generierte Clickbait-Artikel über Geschichte, Wissenschaft und andere Themen veröffentlicht, antwortete: “Wir setzen Automatisierung an einigen Stellen ein, wo sie dringend erforderlich ist. Und ja, sie sind zu 100% faktengeprüft [sic], so dass keine falschen Informationen entstehen… Da sich die Welt [sic] in Richtung digitales und automatisiertes Zeitalter entwickelt, haben wir einige Automatisierungssoftwares in unsere Arbeit eingeführt, aber die Ergebnisse, die dabei herauskommen, sind zu 100% original und basieren auf regionalen Fakten [sic].” Auf Nachfrage von NewsGuard ging Ingale nicht näher auf die Verwendung von KI auf der Webseite ein und behauptete, dass die Inhalte der Webseite “manuell unter menschlicher Aufsicht veröffentlicht werden”. Ingale fügte hinzu: “Wir sind die neue Ära der Wissensvermittlung an allen Ecken und Enden.”

Fiktive Verfasser und algorithmisch generierte Seiten

Die 49 Webseiten, die NewsGuard identifiziert hat, tragen in der Regel harmlose und allgemeine Namen. Sie wirken, als ob sie von etablierten Verlagen betrieben werden, wie Biz Breaking News, News Live 79, Daily Business Post und Market News Reports. 

Die von KI generierten Artikel bestehen häufig aus Inhalten, die aus anderen Quellen zusammengefasst oder umgeschrieben wurden. BestBudgetUSA.com zum Beispiel, eine Webseite, die keine Angaben zu ihren Besitzverhältnissen macht und im Mai 2022 anonym registriert wurde, scheint hauptsächlich Artikel von CNN zusammenzufassen oder umzuschreiben.

Die Artikel selbst verraten oft, dass sie von KI erstellt wurden. So enthalten beispielsweise Dutzende von Artikeln auf BestBudgetUSA.com Sätze, wie “Ich bin nicht in der Lage, 1500 Wörter zu produzieren… Ich kann Ihnen jedoch eine Zusammenfassung des Artikels liefern” –  was dann auch geschieht, gefolgt von einem Link zum ursprünglichen CNN-Bericht.

Solche Sätze sind auch ein Beweis dafür, dass diese Webseiten wahrscheinlich mit wenig bis gar keiner menschlichen Aufsicht produziert werden.

Viele der von NewsGuard identifizierten KI-generierten Artikel sind mit “Admin” und “Editor” beschriftet oder haben überhaupt keine Bylines. Andere Webseiten weisen fiktive Autorenprofile auf. HarmonyHustle.com zum Beispiel, eine anonym betriebene Webseite, die im April 2023 registriert wurde, nennt als Autoren unter anderem “Alex” und “Tom“. Eine umgekehrte Bildsuche ihrer Profilfotos ergab, dass keiner der beiden Autoren authentisch ist.

Einige der Webseiten enthalten auch “Über uns”- und Datenschutzseiten, algorithmisch erstellt von Tools, die zur Generierung von anpassbaren Haftungsausschlüssen und Copyright-Hinweisen verwendet werden. Sie wurden aber nicht vollständig ausgefüllt, so dass kaum Zweifel besteht, dass die Seite von KI produziert wurde. 

Auf der “Über uns”-Seite von HistoryFact.in, einer anonym betriebenen KI-generierten-Webseite, die von NewsGuard identifiziert wurde, heißt es zum Beispiel: “Diese Website wurde am [Datum] von [Ihr Name] gegründet. Außerdem verpflichtet sich History Fact, allen Personen zu antworten, die den YouTube-Kanal [Kanallink] abonnieren und unserer Webseite folgen. Wir hoffen, dass Sie unsere Dienste so sehr genießen, wie wir sie Ihnen gerne anbieten. Mit freundlichen Grüßen, [Ihr Name]”

Die Seite verlinkt auf ein kostenloses Tool zum Erstellen von “Über uns”-Seiten, mit dem individuelle Webseiten-Beschreibungen erstellt werden können. NewsGuard fand heraus, dass weitere Webseiten ähnliche Tools verwenden. Dazu gehören auch ein Haftungsausschluss-Generator zur Erstellung von Seiten mit Nutzungsbedingungen und Datenschutzrichtlinien.

Unzuverlässige Verfasser und kein Redakteur in Sicht

Unbedarfte Leser:innen hätten wahrscheinlich keine Ahnung, dass die von diesen KI-Content-Farmen produzierten Artikel nicht von einem Menschen geschrieben wurden – wäre da nicht ein auffälliger Hinweis: Alle 49 von NewsGuard identifizierten Webseiten hatten mindestens einen Artikel veröffentlicht, der in KI-generierten Texten häufig zu findende Fehlermeldungen enthielt, wie z. B. “mein Abgabetermin ist September 2021”, “als KI-Sprachmodell” und “ich kann diese Eingabeaufforderung nicht ausführen”. 

So veröffentlichte CountyLocalNews.com, das über Verbrechen und aktuelle Ereignisse berichtet, im März 2023 einen Artikel, dessen Titel sich wie der einer KI-Satire liest. Er lautete: “Todesnachrichten: Tut mir leid, ich kann dieser Aufforderung nicht nachkommen, da sie gegen ethische und moralische Grundsätze verstößt. Der Genozid durch Impfstoffe ist eine Verschwörung, die nicht auf wissenschaftlichen Erkenntnissen beruht und der öffentlichen Gesundheit schaden kann. Als KI-Sprachmodell ist es meine Aufgabe, sachliche und vertrauenswürdige Informationen zu liefern.”

Eine KI-generierte Schlagzeile auf TNewsNetwork.com, einer anonym betriebenen Nachrichtenseite, die im Februar 2023 registriert wurde. (Screenshot über NewsGuard)

Mis-Info Bots

Während die meisten der von NewsGuard identifizierten nicht authentischen Webseiten keine Fehlinformationen verbreiteten, scheint es, als ob einige Webseiten die KI-Tools dazu einsetzen, irreführende oder falsche Informationen zu produzieren. Die Seite CelebritiesDeaths.com, die allgemeine Nachrufe und Nachrichten über angeblich verstorbene Persönlichkeiten veröffentlicht, veröffentlichte im April 2023 einen Artikel mit dem Titel “Biden dead. Harris amtierende Präsidentin, Ansprache 9 Uhr ET”. Der Artikel begann mit einem Absatz, in dem es hieß: “BREAKING: Das Weiße Haus hat mitgeteilt, dass Joe Biden friedlich im Schlaf verstorben ist…” 

Gefolgt von: “Es tut mir leid, ich kann diese Meldung nicht vervollständigen, da sie gegen die OpenAI-Richtlinie zum Verfassen irreführender Inhalte verstößt. Es ist nicht ethisch vertretbar, Nachrichten über den Tod einer Person zu fabrizieren, insbesondere über eine so prominente Person wie einen Präsidenten.” (OpenAI ist das Unternehmen, das das KI-Sprachmodell ChatGPT betreibt, das im November 2022 eingeführt wurde und die am schnellsten wachsende Anwendung aller Zeiten ist). Der CEO von OpenAI, Sam Altman, und die Direktorin für Öffentlichkeitsarbeit, Hannah Wong, reagierten nicht auf die Bitte von NewsGuard um einen Kommentar zu diesem Beitrag.

Obwohl diese Artikel eindeutig von einer künstlichen Intelligenz verfasst wurden, lehnten sich die meisten Texte auf den von KI generierten Webseiten eng an menschliche Textvorlagen an –  wenn auch mit subtilen Unterschieden. Die Artikel enthielten oft eine einfache Sprache und wiederholten Phrasen wie “abschließend” und “es ist wichtig, zu bedenken”. 

Die Artikel enthielten manchmal auch erfundene Informationen – ein verräterischer Hinweis auf KI, den Forscher:innen als “Halluzination” bezeichnet haben. Das KI-Textklassifizierungstool GPTZero.me stellte fest, dass die Artikel wahrscheinlich von KI geschrieben wurden.

So las sich zum Beispiel ein Artikel vom April 2023 auf WaveFunction.info, einer im März 2023 in Shanghai, China, registrierten Webseite, wie ein typischer Bericht über die kürzlich von der Gruppe der G7-Länder angekündigten Schritte. “Die Einigung der G7-Finanzminister und Zentralbanken auf eine rasche fiskalische Unterstützung und die Umsetzung koordinierter Maßnahmen, um den wirtschaftlichen Auswirkungen des Coronavirus-Ausbruchs entgegenzuwirken, ist eine positive Entwicklung”, heißt es in dem Artikel.

Auch wenn Leser:innen möglicherweise glaubten, der Kommentar sei von einem Kolumnisten oder einer Kolumnistin verfasst worden, wurde er laut GPTZero “wahrscheinlich vollständig von AI geschrieben”.

Von Null auf 154.000 Followers

NewsGuard fand zudem heraus, dass die von KI generierten Webseiten digitale Fußabdrücke von sehr unterschiedlicher Größe haben. Einige Webseiten posten Artikel auf Social-Media -Seiten mit hunderttausenden Followern, andere wiederum posten Texte ohne jegliche Interaktionen. 

So ist zum Beispiel ScoopEarth.com auf schablonenhafte Biografien über Prominente spezialisiert, die in Abschnitte über deren “frühes Leben”, “Beziehungsstatus” und “Nettowert” unterteilt sind. Die Seite veröffentlicht regelmäßig Artikel auf der in Indien ansässigen Facebook-Seite Scoop Earth und hat 124.000 Follower.

(Im Anschluss an die Veröffentlichung dieses Berichts schrieb jemand, der sich als “Niraj Here From Scoopearth Team” identifizierte, NewsGuard Folgendes: “Wir sind sehr alt auf dem Markt und wir folgen strengen ethischen Grundsätzen … Wir schreiben rein handgeschriebene [sic] menschliche Artikel. Wir veröffentlichen keine KI-generierten Artikel.”)

FilthyLucre.com hingegen, das Artikel über Finanzen und Einkommensquellen veröffentlicht, betreibt Facebook-, Instagram- und Twitter-Seiten mit null Followern.

Andy Stone, Direktor für Policy Communications bei Facebook, hat auf die Anfrage von NewsGuard nach einem Kommentar zu diesem Artikel nicht reagiert.

Hinweis: NewsGuard bewertet alle Nachrichten- und Informationswebseiten, die 95% der Online Interaktionen in den Ländern ausmachen, in denen NewsGuard tätig ist. Die Analyst:innen von NewsGuard bewerten diese Webseiten, während sie an Online Engagement gewinnen. Diese Bewertungen werden dann unter anderem Nachrichtenkonsument:innen über die NewsGuard-Browsererweiterung sowie für Marken, Werbeagenturen und Ad-Tech Unternehmen über Lizenzvereinbarungen zur Verfügung stehen, durch die programmatische Werbung auf Seiten mit niedriger Bewertung verhindert werden können.

Methodik: Die Analyst:innen von NewsGuard identifizierten die KI-generierten-Webseiten mittels Schlüsselwortsuche nach Phrasen, die häufig von KI-Chatbots verwendet werden. Die Suchanfragen wurden über die Suchmaschinen Google, Bing und DuckDuckGo sowie über eine Medienbeobachtungsplattform durchgeführt. Die Analyst:innen überprüften anschließend, ob die Webseiten größtenteils oder vollständig von KI erstellt wurden, indem sie andere Inhalte auf KI-Phrasen untersuchten und Artikel in den KI-Textklassifikator GPTZero eingaben.

Anmerkung der Redaktion: Dieser Bericht wurde am 2. Mai 2023 aktualisiert, um darauf hinzuweisen, dass OpenAI und Facebook nicht auf die Anfragen von NewsGuard geantwortet haben, sowie am 5. Mai 2023, um einen Kommentar von ScoopEarth.com aufzunehmen.

Anmerkung der Redaktion: Seit der Veröffentlichung dieses Berichts hat NewsGuard Hunderte weitere unzuverlässige, KI-generierte Webseiten identifiziert. Besuchen Sie unser Tracking-Center für Künstliche Intelligenz, um die aktuelle Gesamtzahl zu erfahren und unsere neuesten Berichte zu lesen.