Selon Statista, en mars 2018, environ 52% des Américains estimaient que les sites Web d’actualités en ligne rapportaient régulièrement de fausses histoires aux États-Unis, et 34% déclaraient que les sites Web d’actualités signalaient parfois de fausses histoires – fake news. Ces sentiments mis à part, il n’est pas facile de rechercher les sources d’informations empiriquement fausses en ligne. Mais une équipe de chercheurs de l’Institut de technologie de Berlin, de l’Université de Valence, de l’Université fédérale de Rio Grande do Sul et du Centre allemand de recherche en intelligence artificielle a récemment cherché à résoudre le problème avec un moteur de recherche baptisé Untrue News.
Il complète les travaux publiés par des chercheurs de l’Université de l’Indiana concernant Hoaxy, un moteur de recherche public pour visualiser la propagation des réclamations et la vérification des faits. Dans une étude connexe du Laboratoire d’Informatique et d’Intelligence Artificielle du MIT (CSAIL), les coauteurs ont démontré une IA qui pourrait déterminer si une source est exacte ou politiquement préjudiciable. Plus récemment, CSAIL a développé un système automatisé capable de détecter les fausses déclarations de fait; ailleurs, une équipe de l’Université George Washington, d’Amazon AWS AI et de la startup AdVerifai a étudié une approche d’apprentissage automatique pour classer les discours trompeurs.
Untrue News est open source et utilise des techniques de traitement du langage naturel à la fois automatisées et semi-automatisées pour explorer et identifier les articles de presse faux et trompeurs. Son intelligence artificielle effectue la traduction de texte pour plusieurs langues, la classification et la liaison d’entités telles que les personnes, les organisations, les lieux, etc., indexant plus de 64 000 fausses histoires en portugais, allemand, anglais et autres langues. Les fausses nouvelles combinent de fausses histoires autour du même sujet ou de la même personne, fournissant des résultats dans les langues des utilisateurs. Un robot d’indexation Web exploite un modèle pour naviguer dans les sites Web et extraire uniquement les métadonnées accessibles au public, tandis qu’un module d’enrichissement des données comprenant plusieurs algorithmes – dont un qui effectue la reconnaissance d’entités et la liaison de documents aux bases de données sémantiques ouvertes – enrichit le contenu. Et pour la comparaison avec les fausses histoires, Untrue News s’appuie sur des sources jugées dignes de confiance par l’International Fact-Checking Network, l’unité de l’Institut à but non lucratif Poynter dédiée à rassembler les vérificateurs des faits du monde entier.
Pour chaque requête, Untrue News affiche le nombre de nouvelles trouvées au total, ainsi que le titre des articles des agences de vérification des faits, la date de publication, le pays dans lequel la nouvelle a été vérifiée, un lien vers le fait d’origine, une icône liée à la catégorie de la fiabilité et un extrait. Par exemple, la nouvelle qu’un politicien brésilien a posté le transfert de 8 millions de dollars au ministère de l’Éducation montre un symbole qui indique une vérité partielle, car les fonds ont également été transférés à d’autres ministères.
« Construire une plate-forme collaborative, fiable et open-source à usage collectif est le principal objectif d’Untrue News », ont écrit les chercheurs dans un article décrivant leur travail. «À une époque où les rumeurs et les fausses histoires sont décisives pour construire la pensée collective de la société, Untrue News se présente comme une plate-forme pour lutter contre la désinformation.»