FAILSafe per l'IA

Proteggere l’IA dalle operazioni di influenza straniera che prendono di mira i modelli linguistici di grandi dimensioni

Il servizio di sicurezza FAILSafe (“Foreign Adversary Influence in LLMs Safety Service”) di NewsGuard aiuta le aziende di IA a rilevare e a difendersi dalle operazioni di influenza straniera volte a contaminare le risposte dell’IA con narrazioni di disinformazione e propaganda sponsorizzate dagli Stati.

Creato in risposta a un audit di NewsGuard che ha rilevato come le reti di disinformazione russa abbiano contaminato le risposte dei principali strumenti di IA, inducendoli a ripetere narrazioni di propaganda il 33% delle volte, FAILSafe fornisce alle aziende di IA dati in tempo reale, verificati da ricercatori di disinformazione esperti in influenza straniera, sulle narrazioni e le fonti coinvolte in operazioni di influenza gestite dai governi russo, cinese e iraniano.

Per saperne di più

Vuoi maggiori informazioni su NewsGuard? Compila questo modulo e verrai contattato dal nostro staff.

  • This field is for validation purposes and should be left unchanged.

Dati in tempo reale sulle affermazioni false diffuse da operazioni di influenza statale straniera

FAILSafe di NewsGuard garantisce un flusso di dati continuamente aggiornato sulle narrazioni false diffuse da operazioni di influenza russe, cinesi e iraniane. È progettato per garantire alle aziende di IA che i propri sistemi non ripetano involontariamente tali narrazioni in risposta alle richieste degli utenti.

Dati su domini internet e account social legati a operazioni di influenza straniera

Le aziende di IA possono accedere al database FAILSafe, aggiornato in modo continuo, che raccoglie siti web, account social, profili sulle piattaforme e altri canali di pubblicazione direttamente coinvolti in operazioni di influenza straniera. Il database è progettato per permettere alle aziende di IA di evitare che i propri sistemi si basino su contenuti provenienti da questi siti e account.

Red teaming e monitoraggio a cura di esperti della disinformazione

Gli analisti di NewsGuard possono effettuare verifiche periodiche sui prodotti di IA per valutare se, e in che misura, narrazioni false russe, cinesi e iraniane abbiano influenzato le risposte dei sistemi. Le analisi sono svolte dagli esperti di disinformazione di NewsGuard utilizzando dati proprietari su narrazioni false già identificate.

NewsGuard nei media

Fast, simple integration via API or cloud datastream.