Crossover Podcast

Fact checking numérique - Algorithmes de prédiction et désinformation

Avec : Amaury Lesplingart et Nelly Pailleux (Check First), Divina Frau-Meigs (Savoir Devenir)

Ce podcast traite de la façon dont de nouveaux outils informatiques, comme le tableau de bord de CrossOver, participent à éclairer le rôle et l’impact des algorithmes sur l’information mais aussi sur la désinformation.

Il donne ainsi la parole à ceux qui œuvrent chez CrossOver au niveau technique comme au niveau pédagogique pour mettre en lumière l’impact des algorithmes sur l’information et la désinformation, en particulier à travers son tableau de bord. Ce rôle est illustré à travers une enquête sur le rôle des algorithmes de prédiction dans la recherche dite “avec auto-complétion” de Google. 

Comment les développeurs travaillent-ils avec les journalistes, fact-checkers et experts en EMI ? Quels sont les avantages et défis de cette approche complexe?  En quoi des outils techniques comme celui qui a été développé au sein de ce projet peuvent-ils être utiles à tous les citoyens – professionnels de l'information comme simples citoyens - pour ne pas tomber dans la désinformation ?  

Production : Savoir Devenir et l'INA
Conception : Sophia Hamadi et Pascale Garreau
Réalisation technique et montage : Gabriel Fadavi 
A l'aide à l'écriture : Jean-François Gervais et Sébastien Gaillard

What is Crossover Podcast?

Crossover tracks and measures the influence of content recommendation algorithms on social media in Belgium, exposing how they can lead to mis- and disinformation. We monitor, investigate, expose and respond to the spread of dubious and nefarious content in both French and Dutch on Youtube, Twitter, and more. This project is supported by the European Union and unites EU DisinfoLab, Apache, Savoir Devenir and Check First.

00:00:05:17 - 00:00:07:17
Sébastien
Vous écoutez le podcast Crossover.

00:00:07:17 - 00:00:24:13
Sébastien
Crossover est un projet européen qui explore les coulisses étonnantes des algorithmes grâce à son dashboard, un outil de veille des algorithmes utilisés dans les médias sociaux, les moteurs de recherche et sur certaines plateformes.

00:00:29:03 - 00:00:47:00
Sébastien
Les algorithmes influencent nos relations, notre consommation, notre culture et tout particulièrement la façon dont nous nous informons et percevons le monde. Mais sait-on vraiment ce qu'ils sont? Comment ils fonctionnent? Quelle logique économique ou idéologique les sous-tendent?

00:00:47:11 - 00:01:06:07
Sébastien
Et comment tenter de les maîtriser plutôt que de les subir? Comprendre les algorithmes, être capables de les analyser de manière critique, s'en saisir et apprendre à s'en prémunir, tels sont les objectifs de l'algo-littératie, domaine exploré par le projet Crossover dans sa dimension informationnelle.

00:01:06:23 - 00:01:26:08
Sébastien
Pour cet épisode intitulé Les Veilleurs d'algorithme, nous parlons de tous ceux qui oeuvrent chez Crossover au niveau technique pour mettre en lumière l'impact des algorithmes sur l'information et la désinformation. Comment ces développeurs travaillent-t-il avec les journalistes, fact-checkers et experts en éducation aux médias et à l'information?

00:01:27:00 - 00:01:50:09
Sébastien
Quels sont les avantages et défis de cette approche complexe? En quoi peut-elle être utile à la presse, aux fact-checkers, aux enseignants, aux citoyens? C'est ce que nous allons voir avec nos trois complices, et veilleurs d'algorithmes : Nelly PAILLEUX et Amaury LESPLINGART de Check First, et Divina FRAU MEIGS de Savoir Devenir.

00:01:50:09 - 00:02:06:11
Divina
Le projet Crossover est mené tambour battant depuis sa création en décembre 2021. Il a misé sur un outil innovant, le Dashboard, ou tableau de bord qui observe et analyse les algorithmes pour lutter contre la désinformation, faciliter le fact-checking et former les citoyens.

00:02:06:11 - 00:02:30:02
Divina
En faisant travailler ensemble des développeurs, des journalistes, des experts en éducation aux médias et l'information, il a montré concrètement l'influence des algorithmes sur notre consommation d'actualités et en particulier sur les médias sociaux. Des enquêtes et études ont été réalisées, des journalistes formés et un kit de ressources pour que les éducateurs se saisissent du sujet de l'algo-littératie a été produit.

00:02:30:20 - 00:02:43:03
Divina
Tout ça grâce au Dashboard, bien sûr. Amaury LESPLINGART, qui a travaillé sur la création et le développement de cet outil est avec nous pour répondre à nos questions concernant ce nouveau moyen de veille algorithmique.

00:02:43:03 - 00:02:43:21
Divina
Bonjour Amaury.

00:02:43:21 - 00:02:44:16
Amaury
Bonjour Divina.

00:02:45:00 - 00:02:52:07
Divina
Vous êtes co-fondateur de Check First qui développe des outils pour lutter contre la désinformation. Pourriez-vous nous dire deux mots de votre métier?

00:02:52:07 - 00:02:55:19
Amaury
Je suis développeur depuis 20 ans. J'ai des expériences diverses et variées dans pas mal de domaines.

00:02:56:06 - 00:03:07:00
Amaury
Depuis très jeune, je cherche à comprendre comment les choses fonctionnent spécialement tout ce qui touche au champ à Internet, au sens large du terme. Je définirais mon métier comme quelqu'un qui essaye d'appréhender techniquement le monde d'aujourd'hui et de demain.

00:03:07:00 - 00:03:11:04
Divina
Très bien. Et comment vous est venue l'idée de créer cet outil un peu particulier tout de même?

00:03:11:04 - 00:03:19:16
Amaury
Les algorithmes sont ancrés dans la vie de tous les jours de tout le monde et on s'en rend même plus compte. Plus personne ne pense qu'il y a un algorithme qui prédit en fait la question qu'il va poser à Google.

00:03:20:06 - 00:03:33:15
Amaury
Il y a beaucoup d'initiatives qui visent à ouvrir les algorithmes, les black box comme on les appelle, mais on trouvait qu'il y avait peu d'initiatives qui s'intéressent aux utilisateurs finaux. On a conçu Crossover comme un projet qui veut analyser l'impact des algorithmes sur la vie de Monsieur et Madame Tout le monde.

00:03:33:21 - 00:03:35:06
Divina
Alors l'idée de base, c'est quoi?

00:03:35:06 - 00:03:46:00
Amaury
L'idée de base est simple : si je fais ça, il se passe quoi? On a créé des systèmes qui permettent de répliquer exactement ça. Si je tape "Donbass" sur Google, il se passe quoi? Si je tape "Russie" sur YouTube, il se passe quoi?

00:03:46:12 - 00:03:51:07
Amaury
Ensuite, ces informations sont compilées au sein d'un dashboard public et analysées par nos partenaires journalistes.

00:03:51:07 - 00:03:58:13
Divina
Alors, il me semble qu'il y a d'autres tableaux de bord qui permettent de visualiser les tendances en ligne. En quoi celui de Crossover est-il différent?

00:03:58:22 - 00:04:07:07
Amaury
Alors en effet, il existe de nombreuses façons d'analyser les algorithmes et les tendances en ligne. On a essayé d'apporter une touche d'originalité au projet Crossover avec une double approche.

00:04:07:07 - 00:04:23:23
Amaury
D'abord, on utilise des outils qui sont mis à disposition par les plateformes, leurs API. C'est à dire qu'on a développé un système qui va aller interroger les plateformes pour récupérer les données. De l'autre côté, on a développé un système autonome qui a été placé chez l'habitant, c'est à dire chez des gens comme toi Divina, ou comme chez moi ou comme chez Nelly.

00:04:24:17 - 00:04:39:04
Amaury
C'est une sorte de robot qui va aller effectuer les requêtes sur les plateformes pour les interroger. Cette double approche nous permet à la fois de ne pas être dépendants des plateformes pour nous fournir les données, mais également de comparer les données qu'elles nous fournissent officiellement à l'expérience concrète des utilisateurs.

00:04:39:16 - 00:04:46:12
Amaury
Les tableaux de bord de Crossover ne sont pas des outils de mesure de buzz sur Internet. Ils analysent sur le long terme le comportement des algorithmes des plateformes.

00:04:46:12 - 00:04:55:03
Divina
Et voilà. Qu'on se le dise. Considérez-vous que le tableau de bord de Crossover est un outil de fact-checking, un outil pour le fact-checking?

00:04:55:08 - 00:05:05:14
Amaury
C'est plutôt des outils pour le fact-checking. On n'a jamais eu la prétention de prendre la place des fact-checkers, qui sont probablement les meilleurs outils de fact-checking, mais on peut probablement les aider un peu dans leur travail.

00:05:06:04 - 00:05:14:17
Amaury
Grâce aux tableaux de bord de Crossover, il est possible de comprendre ce à quoi les utilisateurs font face. Ici, en l'occurrence des utilisateurs belges. C'est important pour les fact-checkers de comprendre ça.

00:05:14:17 - 00:05:16:02
Divina
En quoi c'est important?

00:05:16:02 - 00:05:22:15
Amaury
On l'a démontré avec notre enquête sur la recherche de Google, qui propose systématiquement aux utilisateurs de la recommandation Insider lorsqu'il tape Donbass.

00:05:23:00 - 00:05:34:15
Amaury
Donbass Insider, c'est un média qui relaie la communication russe. Il est donc important de prévenir les utilisateurs que la direction dans laquelle elle les pousse des algorithmes est en fait risquée. C'est un travail quasiment de pré-bunk qui rentre tout à fait dans le rôle des fact-checking.

00:05:34:22 - 00:05:41:18
Divina
Et alors ce tableau de bord, il a été compliqué à développer? Comment est-ce qu'il a évolué avec le temps?

00:05:41:18 - 00:05:47:11
Amaury
C'est un peu comme demander à un boulanger si faire du pain, c'est compliqué. Il vous dira que non, pourtant je suis incapable de faire mon pain.

00:05:48:16 - 00:06:09:23
Amaury
Plus sérieusement, on a fait face à des défis lors du développement, mais rien d'insurmontable. La plus grande difficulté, je dirais ça, a été les contraintes qu'on s'est nous-mêmes imposées avec la double collection de l'information. On a dû imaginer des systèmes qui collectent à la fois les données à travers les API des plateformes, mais à la fois les données à travers nos robots qu'on a mis chez des gens.

00:06:09:23 - 00:06:24:12
Amaury
Ça n'a pas été simple. Au fil du temps, on a fait évoluer les tableaux de bord, on a ajouté de nouvelles plateformes. Aujourd'hui, Crossover surveille huit plateformes différentes, contre seulement trois au début du projet. On espère continuer à ajouter d'autres algorithmes dans le futur et assurer que ceci ne cause pas de mal à la société.

00:06:24:23 - 00:06:25:16
Divina
Bonjour Nelly.

00:06:25:16 - 00:06:26:14
Nelly
Bonjour Divina.

00:06:26:14 - 00:06:40:23
Divina
Nelly PAILLEUX. Vous êtes journaliste de formation et également cofondatrice de Check First. Qu'avez-vous appris au cours de ce projet en allant regarder sous le capot des algorithmes de recommandation de YouTube, Google, etc? Pensez-vous vraiment qu'il joue un rôle important dans la désinformation?

00:06:41:09 - 00:07:09:22
Nelly
Alors, les enquêtes menées par Check First, EU DisinfoLab et Apache dans le cadre du projet Crossover donnent des éléments de réponse à cette question. On a vu par exemple dans l'enquête "Les algorithmes de YouTube sont-ils accros aux médias d'Etat?" que pendant une période, YouTube avait recommandé des vidéos de Russia Today France, la branche francophone du média d'Etat, Russia Today, aux utilisateurs belges qui tapaient le mot "Russie" dans la barre de recherche de YouTube.

00:07:09:22 - 00:07:26:13
Nelly
Le phénomène qui est intéressant, c'est qu'après le bann de Russia Today sur décision européenne, un nouvel acteur qui est un autre média d'Etat, semble avoir comblé le vide laissé par son homologue russe et cet autre acteur c'est CGTN, la chaîne d'État du Parti communiste chinois.

00:07:26:24 - 00:07:59:04
Nelly
Dans une autre enquête, on s'est rendu compte que les utilisateurs belges de Google, Google qui représente tout de même 86 % des recherches effectuées sur un ordinateur de bureau en 2021 ; ces utilisateurs qui tapaient le mot clé Donbass dans la barre de recherche verraient leur requête complétée par le mot insider. L'expression Donbass Insider renvoie vers un média pro-Kremlin qui a été créé en 2016 par Christelle Néant et qui est notamment accusé de propager des mensonges au sujet de la guerre en Ukraine.

00:08:00:03 - 00:08:03:12
Divina
Nelly, il y a donc parfois un écart entre ce qui se passe en ligne et en vrai.

00:08:03:24 - 00:08:23:06
Nelly
On soupçonnait que le virtuel ne reflétait pas toujours le réel, et ici vous faites référence, Divina, à l'épisode 1 du podcast de Crossover sur les clicktivistes et le Convoi de la liberté. En fait, ce que le tableau de bord ou le dashboard nous a permis de faire, c'est de comparer d'autres métriques.

00:08:23:16 - 00:08:45:17
Nelly
Lorsqu'on a commencé le projet Crossover il a s'agit tout d'abord de collecter des données pour les mettre dans ce tableau de bord. Amaury l'a expliqué tout à l'heure, nous avons commencé par récolter des données à partir des API officielles des plateformes. Les API étant des applications permettant d'interroger des bases de données via une interface programmatique mise à disposition par les plateformes.

00:08:45:21 - 00:08:46:23
Divina
Merci de cette précision.

00:08:47:07 - 00:09:07:09
Nelly
Le problème c'est que certaines plateformes n'ont pas d'API. De plus, l'API est donnée directement par les plateformes. Et comme on a un projet dans lequel on est beaucoup de journalistes, ce qu'on a voulu faire, c'est qu'on a voulu croiser nos sources pour être sûrs que les informations renvoyées par l'API des plateformes soient correctes.

00:09:07:09 - 00:09:27:19
Nelly
Pour observer les algorithmes de plateformes qui n'avaient pas d'API et croiser nos sources, on a monté un réseau de mini ordinateurs sur lesquels, l'a expliqué Amaury, tourner un système qui simule le comportement d'un utilisateur sur ces huit plateformes, et ces mini ordinateurs sont chacun répartis dans une province de Belgique branchés chez des bénévoles.

00:09:28:14 - 00:09:44:15
Nelly
De cette manière, ça nous permet trois choses. La première, c'est de visualiser ce que voient réellement les utilisateurs belges devant leur écran. La deuxième, c'est de voir s'il y avait des différences dans les tendances entre les différentes provinces de Belgique.

00:09:45:04 - 00:10:01:16
Nelly
Et la troisième, c'est d'avoir un moyen de comparaison entre eux. Ce que les utilisateurs voient et les données officielles de l'API. C'est une façon de voir l'écart entre ce que la plateforme nous dit qu'il se passe et ce qu'il se passe réellement devant les yeux des utilisateurs.

00:10:01:21 - 00:10:23:01
Divina
Eh bien, c'est très clair. Merci de cette clarification qui montre à quel point c'est complexe. Le tableau de bord peut aussi permettre de tester la température de l'opinion publique, me semble-t-il. Avec ses différentes plateformes et ses différents ordinateurs installés chez l'habitant, c'est important pour l'information?

00:10:23:05 - 00:11:02:23
Nelly
C'est important pour l'information, comme l'a expliqué Amaury, ça permet aussi d'avoir une vision sur le long terme des tendances qui ont traversées l'actualité pendant l'année 2022 puisque le projet Crossover court de décembre 2021 jusqu'à février 2023. Le tableau de bord permet aussi à des journalistes d'avoir un endroit ou la veille est condensée, un outil ou la veille est condensée au même endroit sans avoir besoin de compétences techniques particulières, ou d'aller fouiller dans toutes les plateformes pour voir les différentes tendances qui se dégagent, entre autres. A priori, c'est un gain de temps et d'efficacité qu'ils apprécient.

00:11:05:21 - 00:11:24:07
Sébastien
On voit bien maintenant l'intérêt du tableau de bord pour les professionnels. Il permet d'analyser et de montrer ce que les algorithmes de recommandation font à l'information. Mais en quoi ces outils techniques peuvent-ils être utiles à vous, à moi, à tout le monde, pour ne pas tomber dans la désinformation?

00:11:24:21 - 00:11:34:15
Sébastien
Nous allons en discuter avec Divina FRAU MEIGS, spécialiste en éducation, aux médias et à l'information au sein de Savoir Devenir.

00:11:34:15 - 00:11:35:15
Sébastien
Bonjour Divina.

00:11:35:15 - 00:11:36:14
Divina
Bonjour Sébastien.

00:11:36:14 - 00:11:41:23
Sébastien
Alors cette histoire d'algorithme, elle n'est pas évidente pour tout le monde. Et donc comment les apprivoiser?

00:11:42:06 - 00:11:59:09
Divina
Alors c'est vrai, la culture de la data et des algorithmes reste très flou pour beaucoup de gens. Tout le projet de l'algo-littératie et que nous défendons dans Crossover est de faire en sorte que cela change. On ne peut évidemment pas réduire l'éducation aux médias, à l'information, à la question des algorithmes. Mais on ne peut pas non plus passer à côté.

00:11:59:09 - 00:12:06:24
Divina
L'algo-littératie est une partie de plus en plus importante de l'EMI qui permet à chacun de maîtriser plutôt que de subir la technologie.

00:12:06:24 - 00:12:13:23
Sébastien
Mais alors, comment travaillez-vous sur ce type de sujet? Et somme toute, comment passer cet obstacle du fait qu'il est assez technique?

00:12:13:23 - 00:12:37:16
Divina
Alors, ce qui est passionnant, c'est que nous travaillons avec d'autres acteurs comme les journalistes, les développeurs, les fact-checkers. Cela donne de l'épaisseur à l'EMI, cela valorise la démarche multi-acteurs, multi-partenaires qui est fondamentale pour nous, pour décloisonner les enseignants, introduire les élèves à d'autres métiers, les former, des apprentissages actifs en prise avec la réalité en lien avec d'autres personnes.

00:12:37:16 - 00:12:47:23
Sébastien
Mais en même temps, il y a un autre point, c'est que c'est une chose de comprendre ce que les algorithmes font à l'information. Mais c'en est tout de même une autre que d'utiliser des outils comme le fameux Dashboard.

00:12:47:23 - 00:13:02:22
Divina
C'est vrai. Mais en EMI, nous avons rarement une approche outil. Nous sommes du côté des usages. Si nous employons l'outil, il faut qu'il soit embarqué dans une démarche plus large de maîtrise de l'information, de lutte contre la désinformation.

00:13:03:11 - 00:13:20:00
Divina
Ceci étant, des outils comme le tableau de bord sont très utiles pour comprendre ce qui se passe sans forcément avoir à les utiliser soi-même. Dans ce projet d'ailleurs, nous l'utilisons d'abord comme un révélateur. Après, il y a aussi toute une partie de la population de tous les âges, qui est tout à fait capable de s'en saisir.

00:13:20:19 - 00:13:31:23
Divina
Et puis il y a d'autres pratiques toutes simples qu'on peut faire du côté outils. Par exemple, quand on a compris le rôle des algorithmes d'auto-complétion sur Google, c'est vraiment facile de désactiver cette fonctionnalité si elle ne nous plaît pas.

00:13:32:07 - 00:13:42:17
Sébastien
En ce qui concerne les algorithmes multiples de recommandation, de tri, de prédiction, est ce qu'ils sont toujours à l'œuvre avec l'une de ses variantes, dès qu'il y a désinformation?

00:13:42:17 - 00:13:52:08
Divina
Non, non, bien sûr. L'une de nos missions est de couvrir les différents types de désinformation et de montrer sur quels mécanismes ils reposent pour trouver les bonnes solutions pour les combattre.

00:13:52:08 - 00:14:12:18
Divina
Mais prenez par exemple une infox qui repose sur un sophisme du style les feignants ne travaillent pas, les chômeurs non plus. Donc les chômeurs sont des feignants. Dans ce cas, oui, bien que nous allons travailler sur les arguments fallacieux et pas sur les algorithmes. Donc il y a différents mécanismes, des informations qui appellent différentes actions de l'EMI.

00:14:12:18 - 00:14:20:02
Sébastien
Et alors? Pour conclure, qu'est-ce que vous diriez à ceux qui voudraient se lancer dans cette fameuse algo-littératie?

00:14:20:02 - 00:14:42:23
Divina
Bah d'abord, bravo allez-y ! Il n'y a pas encore beaucoup de ressources en EMI mais cela commence à venir et nous apportons notre pierre avec les kits EMI Crossover qui permettent à la fois de mieux comprendre ce qui se passe et de mener facilement des ateliers auprès des lycéens et des adultes. Chaque kit s'articule autour d'un podcast comme celui-ci et puis s'appuie sur une situation concrète des enquêtes, des études.

00:14:43:09 - 00:14:57:16
Divina
Il met à disposition, autour de la thématique traitée, un quiz qui permet de s'approprier des connaissances clés. Et puis, il y a aussi un document d'accompagnement proposant à la fois un bref exposé des notions clés traitées dans la thématique et une proposition concrète d'ateliers.

00:14:58:07 - 00:15:02:08
Sébastien
Merci Divina! Et puis on laisse le mot de la fin à Nelly.

00:15:02:08 - 00:15:02:24
Divina
Bien sûr.

00:15:02:24 - 00:15:09:16
Sébastien
Nelly. Le projet Crossover se termine donc. Alors, est-ce fini? Ou bien allez-vous continuer à travailler sur ce sujet?

00:15:09:16 - 00:15:31:03
Nelly
Alors, le projet Crossover se décline sous différents formats. Les kits d'éducation aux médias et à l'information en français et en néerlandais resteront disponibles gratuitement sur le site de Savoir Devenir. Les enquêtes publiées par Apache et publiées par Check First et l'EU DisinfoLab resteront également disponibles en ligne.

00:15:31:19 - 00:15:56:15
Nelly
Le projet Crossover continuera d'exister, notamment au travers de Com Presse avec Apache et Check First, et s'intéressera notamment aux images manipulées sur les réseaux sociaux. Les résultats seront disponibles et publics à l'intérieur du Dashboard. Et à noter que le projet Crossover s'est focalisé pendant quinze mois sur la Belgique dans différentes provinces de Belgique, mais a vocation à s'étendre potentiellement dans d'autres territoires.

00:15:57:03 - 00:16:04:02
Divina
Eh bien, on vous remercie et on va se retrouver sur les plateformes et sur le dashboard.
A bientôt.

00:16:04:02 - 00:16:19:06
Sébastien
Ce podcast a été réalisé par Savoir Devenir et l'INA dans le cadre du projet Crossover financé par l'Union européenne. À la conception Sophia HAMADI et Pascale GARREAU.

00:16:19:06 - 00:16:29:12
Sébastien
A la réalisation technique et au montage, Gabriel FADAVI, à l'aide à l'écriture, Jean-François GERVAIS et Sébastien GAILLARD.

00:16:29:12 - 00:16:35:13
Sébastien
Retrouvez les informations sur le projet sur le site Crossover.social.