Crossover Podcast

Si l'on en croyait les réseaux sociaux, ils devaient envahir le Parlement de Bruxelles. En réalité, en bons "clicktivistes", ils se sont contentés de batailler sur Internet. A la croisée entre enquête algorithmique et reportage terrain, nos invités illustrent à travers l'histoire du Convoi de la Liberté, le grand décalage qui peut se produire entre mondes virtuel et réel...

Show Notes

Pour cette première traversée des algorithmes, venez rencontrer Hind Fraihi, reporter à Apache (Belgique), et Guillaume Kuster, expert en algorithmes et directeur de Check First (Finlande). En leur compagnie et celle de Divina Frau-Meigs de l'association Savoir Devenir (France), vous entrerez dans les coulisses étonnantes de la nouvelle fabrication de l'information aux mains de l'Intelligence artificielle. En mêlant data journalisme et reportage terrain, et en s'appuyant sur l'outil de veille des principaux moteurs de recherche et médias sociaux développés dans le cadre du projet européen Crossover, ces intervenants lèvent pour vous les voiles très opaques des algorithmes de recommandation qui modifient l'agenda médiatique et notre vision de l'actualité. Comment marchent-ils ? Quels sont leurs objectifs ? Comment les maîtriser ? C'est aussi ce dont il est question dans ce podcast.  

Un projet soutenu par l'Union européenne. 
Une co-production Savoir Devenir et INA.
Grant Agreement n° LC-01682253 «CrossOver»

What is Crossover Podcast?

Crossover tracks and measures the influence of content recommendation algorithms on social media in Belgium, exposing how they can lead to mis- and disinformation. We monitor, investigate, expose and respond to the spread of dubious and nefarious content in both French and Dutch on Youtube, Twitter, and more. This project is supported by the European Union and unites EU DisinfoLab, Apache, Savoir Devenir and Check First.

00:00:00:17 - 00:00:31:12
Sebastien

Vous écoutez le podcast du projet Crossover. Crossover est un projet européen qui explore les coulisses étonnantes des algorithmes qui font tourner le monde. C'est un projet d'information citoyen. Dans cet épisode, “Les combattants du clavier”, nous allons parler algorithmes de tri, algorithmes de recommandation et convoi de la liberté. Vous souvenez-vous, début 2022, du Convoi de la liberté, ces camions qui bloquaient les routes au Canada pour protester contre les mesures Covid à Bruxelles ?

00:00:31:13 - 00:00:54:15
Sebastien

A lire les réseaux sociaux, on allait faire pareil. Ça devait être un événement majeur. Le blocage du Parlement européen de l'action, le chaos. Mais pschitt ! Rien. Plus de bruit que de mal. Les véhicules étaient rares et surtout français. Les Belges sont restés derrière leurs écrans. Alors, que s'est-il passé ? Et si c'était encore un coup des algorithmes ? Commençons par rejoindre Divina Frau-Meigs pour l'enquête.

00:00:55:23 - 00:01:32:21
Divina

Bonjour, je suis Divina Frau-Meigs et je préside l'association Savoir Devenir, une association spécialisée dans l'Education aux Médias et à l'Information. Avec nous, deux de nos partenaires du projet Crossover, Hind Fraihi et Guillaume Kuster. Bonjour, Hind.

00:01:21:55 - 00:01:32:21
Hind

Bonjour Divina, je suis Hind. Je travaille pour Apache, un média d'investigation en Flandre et je suis la coordinatrice de Crossover.

00:01:33:12 - 00:01:38:04
Divina

Et vous avez mené l'enquête sur le Convoi de la liberté que vous allez nous raconter.
Guillaume, et vous, du côté de la spécialisation dans les algorithmes ?

00:01:38:15 - 00:01:51:19
Guillaume

Bonjour Divina, moi c'est Guillaume Kuster, je suis le président de CheckFirst qui est une entreprise de méthodologies et de logiciels. On a construit des outils de veille pour surveiller des grandes plateformes comme YouTube et Facebook pour ce projet Crossover que nous menons avec vous.
Le Dashboard, le tableau de bord en français, c'est la partie publique des outils de veille que l'on fait sur les algorithmes de recommandation de contenus. Ce qu'il faut comprendre, c'est que Crossover, c'est un projet qui va surveiller les grandes plateformes.

00:01:52:04 - 00:02:18:06
Divina

Ensemble, nous allons essayer de comprendre l'énorme décalage qui peut se produire entre ce que les réseaux sociaux nous font miroiter et la réalité. Comment s'est créée la rumeur autour du Convoi de la liberté ? Pourquoi des centaines de policiers, des dizaines de journalistes ont-ils été mobilisés dans l'attente de violences ?

00:02:18:06 - 00:02:45:18
Hind

Il y avait en fait plus de journalistes et de policiers présents que de manifestants.
Surtout, des voitures avec des plaques d'immatriculation françaises et néerlandaises. Mais je dois quand même dire que, en ligne, il y avait beaucoup plus de mouvements de ce qu'on a vu en réalité.

00:02:49:06 - 00:02:59:00
Divina

Sur le terrain et pas sur les médias sociaux. Comment ça s'est passé ? Quelle était l'atmosphère ? Est ce que c'était organisé ? Est ce que c'était au contraire déjanté ?

00:02:59:01 - 00:03:52:15
Hind

La mobilisation en ligne était top, très vivante. Mais la manifestation dans la vraie vie était un flop. Donc, il n’y avait pas beaucoup de gens et les gens qui étaient là, les manifestants, on peut dire que ce sont des manifestants nomades qui voyagent de manifs à manifs et qui ont un esprit très complotiste, je dois dire. Ils se méfient du gouvernement, des médias, de l’école aussi. Parce que j'ai vu aussi des manifestants avec des enfants qui voyagent avec ces petits enfants de manifs à manifs pour protester contre les mesures de Covid dans des écoles aussi.

00:03:53:15 - 00:04:02:07
Divina

Et alors en ligne en plus il y avait cette rumeur qu'il allait y avoir des grosses violences, un peu sur le modèle de ce qui s'était passé au Canada. Est ce que tu as retrouvé cela sur le terrain ?

00:04:03:16 - 00:04:23:17
Hind

Non, cet esprit combatif, on ne l'a pas trouvé sur le terrain. Sur le terrain, c'était plutôt un esprit solidaire, un esprit, comme j'ai dit, méfiant, mais plutôt passif aussi parce qu'il n'y avait pas beaucoup de participants.

00:04:25:20 - 00:04:30:44
Divina

Donc ça n'est pas toujours un succès. Ces appels à mobilisations en ligne ne donnent pas toujours des retombées dans la vie réelle, semble-t-il.

00:04:31:02 - 00:05:11:21
Hind

Ce sont des combattants…en flamand on dit “klavier vechter” combattant du clavier de l'ordinateur, donc la plupart est très passif et donc, ils appartiennent plutôt au mouvement de “clicktivisme”. Donc c'est seulement cliquer, cliquer et être solidaire en ligne et très combatif en ligne. Mais, vraiment, pas des combattants hors ligne. Donc on voit un décalage entre la mobilisation en ligne et hors ligne.

00:05:11:23 - 00:05:22:59
Divina

C'était la première enquête. Et alors, si j'ai bien compris, vous êtes entrée par des hashtags, vous avez fait le hashtag #Convoidelaliberte. Est ce qu'il y avait d'autres hashtags ?

00:05:23:16 - 00:06:18:11
Hind

Oui, il y avait d’autres hashtags. #nietmijnregering, ça veut dire “pas mon gouvernement”, ou #anticor).

00:04:39:23 - 00:04:50:00
Divina

Et donc vous avez eu cette idée d'enquêter sur le convoi ? A l'annonce de cette mobilisation massive qu'on attendait tous et vous avez utilisé un outil qui s'appelle le Dashboard.

00:06:50:01 - 00:07:25:01
Guillaume

C’est l’originalité du projet c’est-à-dire qu’on va avoir des ordinateurs qui simulent des utilisateurs qui sont dans les maisons des gens, contrairement à la plupart des projets de recherche qu’on peut voir où ça va se trouver dans des data centers ou des endroits qui pourraient être reconnaissables par Google et consorts. Là, on est chez les gens et on joue à simuler les gens. On le fait plusieurs fois par jour, une fois par heure pour Twitter par exemple, ou deux fois par jour pour YouTube.

On va aller rechercher une trentaine de termes prédéfinis, on en a évoqué quelques-uns avec Hind tout à l'heure, et régulièrement on va aller conserver toutes ces données et voir dans quel ordre sont présentés les résultats et quels sont ces résultats. Vous savez, la partie qui est complétée automatiquement par Google ne sera pas toujours la même en fonction de qui vous êtes, de votre historique de navigation, de votre position géographique, du type d'ordinateur au téléphone que vous utilisez. Et notre rôle à Crossover, c'est d'abord de collecter tout ça pour permettre à des gens comme Hind ensuite ou Disinfo Lab d'analyser les résultats et de tirer des conclusions.

Pour essayer de voir si, selon qu'on habite à Namur ou à Bruxelles, puisque je vous rappelle que Crossover, c'est sur le terrain géographique de la Belgique que ça se passe, un pays très intéressant parce qu'il est relativement petit, mais qu’on y parle plusieurs langues, il y a de fortes influences étrangères à la fois du côté des Pays-Bas et du côté de la France. Et on va aller observer tout ça et voir si on voit des mouvements qui vont nous faire penser qu'à Anvers, on reçoit un type de résultat différent des résultats qu'on aura eu à Bruxelles ou à Hainaut par exemple, qui est en Wallonie, donc en Belgique francophone.

00:07:25:03 - 00:07:20:01
Divina

Oui alors Guillaume, en plus, le Dashboard a cette particularité qu'il couvre plusieurs médias sociaux, moteurs de recherche, etc. Combien en ce moment ?

00:07:35:03 - 00:08:17:51
Guillaume

Sur le tableau de bord on a YouTube, Twitter, Facebook, Reddit qui est utilisé en Belgique, Odyssey qui est cette espèce de YouTube sans aucun filtre, sur lequel on trouve pas mal de théories du complot, de conspirationnistes, d'amateurs de la théorie de la terre plate, etc etc
Et du côté de Google, on fait deux choses : on va aller suivre ce qu'on appelle l'auto-complétion, c’est-à-dire que quand vous cherchez un terme de recherche vous tapez “le coronavirus est…” et vous laissez Google finir la phrase, vous avez des suggestions de recherche, on va aller récolter ces suggestions de recherche. Et d'autre part, on suit l'ordre dans lequel les articles sont présentés dans Google Actualités ou Google News, quand on va chercher “vaccin”, quels sont les articles qu'on nous montre et dans quel ordre.

00:08:18:05 - 00:08:39:00
Divina

Hind, vous avez décidé donc d'écrire à partir de ces hypothèses sur le convoi, l'envahissement de la capitale, etc vous avez écrit que le mouvement était passablement parano, assez mal organisé et qu'il semblait émaner de l'étranger. Qu'est ce qui vous a fait dire cela ?

00:08:39:05 - 00:10:11:55
Hind

On a tiré des conclusions sur le terrain de ce qu'on a vu, et pris en charge les données du dashboard de Crossover. Et une des premières conclusions est que le combat belge pour la liberté est un produit d'importation.

L'enquête Crossover montre que le convoi vivait plus en Belgique, en Belgique francophone qu'en Belgique néerlandophone. Et selon notre analyse, le contenu partagé au préalable de la manifestation à Bruxelles a été alimenté par des médias français. Par exemple, une chaîne fortement recommandée sur YouTube était Russia Today France (RT France), contrôlée par la Russie, suivie par France 24.

Et parmi les vidéos recommandées, les contenus liés aux oppositions anti-vaccin sont surtout sortis du lot. C'était la même conclusion pour la partie néerlandophone pour les Flamands. Donc le contenu recommandé sur d'autres plateformes a également des influences étrangères pour les Flamands, en particulier des Pays-Bas.

00:10:12:00 - 00:10:21:00
Divina

Lorsque vous avez fait votre enquête et que vous avez suivi vos hypothèses, vous n’êtes quand même pas allée sur tous les médias sociaux, sur tous les groupes ? Quels ont été ceux sur lesquels vous vous êtes concentrée ?

00:10:21:03 - 00:11:25:00
Hind

On a suivi beaucoup de plateformes, mais on a on a concentré notre enquête sur Twitter, sur YouTube et les groupes de Facebook. Donc on a vu beaucoup d’influences étrangères pour les francophones, mais aussi pour les Flamands, en particulier des Pays-Bas, avec des recommandations du journal De Telegraaf par exemple, mais aussi des recommandations des vlogueurs, qui sont sceptiques pour le vaccin ou les vaccins.

Et je dois encore ajouter que notre conclusion a été aussi confirmée par la police bruxelloise qui a enregistré 130 véhicules venant de France et des Pays-Bas. Donc pas vraiment une grande participation des Belges.

00:11:26:08 - 00:11:38:55
Divina

Très bien et donc clairement les algorithmes sont au cœur du sujet. Qu'est ce qui se passe dans les coulisses de ces réseaux sociaux et de ces algorithmes ? Est ce que vous êtes allés fouiller sous le capot ?

00:11:39:05 - 00:14:16:00
Guillaume

Alors fouiller sous le capot, c'est très clairement pas possible. Alors comment savoir comment marche un algorithme ? Pourquoi spécifiquement un contenu est mis en avant par rapport à un autre, ça c'est couvert par le secret de l'industrie. Ce sont des secrets bien cachés par les plateformes, quelles qu'elles soient d'ailleurs, que ce soit YouTube, que ce soit Facebook ou les autres et les algorithmes de recommandation, ce qu'il faut comprendre, c'est qu'ils ont un rôle, c'est de garder les utilisateurs le plus longtemps sur le site.

Dans le cas de YouTube par exemple, ou de Facebook, les programmeurs, ce qu'ils vont faire, c'est qu'ils vont dire à une machine, à une intelligence artificielle : ben nous, on veut que les gens voient le plus de pubs possible et pour ça, il faut qu'ils voient le plus de vidéos possibles qu’ils voient le plus de contenus possibles. Donc il faut les faire rester, leur montrer des trucs qui les intéressent.

Comment c'est fait ? Il y a tellement de contenus disponibles sur YouTube ou sur Facebook que ça ne peut pas être manuel. C'est une intelligence artificielle qui va aller faire des profils des utilisateurs et en fonction de ce qu'elle comprend du comportement de cet utilisateur, elle va aller lui montrer certains contenus par rapport à d'autres. Ce qui veut dire qu’aujourd'hui même au sein de ces entreprises-là, que sont Meta ou YouTube, on n'a personne qui sait vraiment nous décrire précisément pourquoi telle vidéo a été montrée à tel utilisateur.

Là, on saura nous décrire des grandes tendances, “oui mais on montre des contenus engageants, on va aller privilégier des contenus qui proviennent de chaînes que les utilisateurs ont déjà consultées, etc etc”. Mais il y une grande partie de mystère et il y a d'ailleurs des documents qui sont sortis de ces entreprises-là (documents internes qui n'auraient pas dû sortir, notamment du côté de Facebook), où on voit des ingénieurs tirer la sonnette d'alarme auprès du management et dire “si on doit répondre à l'Union européenne sur ces questions d'algorithmes, on ne saura pas vraiment dire où sont les données et comment est ce qu'on en arrive à ces conclusions. Donc on est un peu embêtés pour répondre”. C'est un grand mystère.

Mais pour revenir très rapidement sur l'intentionnalité de la diffusion de la désinformation, je ne sais pas si on peut affirmer qu'il y ait une intentionnalité de la part des plateformes. Ce qu'on disait tout à l'heure sur le fait que ce sont des intelligences artificielles qui vont être à l'origine des recommandations de contenu, elles font ce qu'on leur demande ces intelligences artificielles, elles détectent qu’il y a un intérêt pour un contenu clairement putassier ou conspirationniste, etc. Et si on voit que Jean-Michel à Namur, il aime bien regarder des vidéos de CGTN parce qu'elles changent un peu de ce qu'il voit d'habitude, l'intelligence artificielle va lui en servir un peu plus. Donc toute la question, c'est de savoir comment faire en sorte que ces contenus problématiques soient moins présentés, plutôt qu'amplifiés par les algorithmes. C’est pour ça qu’on essaye d’ouvrir un dialogue avec les plateformes comme YouTube et Meta.

00:14:16:02 - 00:14:31:02
Divina

Hind, alors du coup, pour conclure sur cette première partie de notre podcast Crossover, comment un journaliste se défend-il et gère-t-il ces révélations qui sont faites par le
Dashboard ?

00:14:31:04 - 00:14:49:59
Hind

Le dashboard de Crossover est un bon instrument pour mesurer les tensions en ligne, mais il ne peut pas être utilisé tout seul, évidemment. Il doit y avoir un travail journalistique pour la suite.

00:14:50:00 - 00:14:55:00
Divina

Et vous avez une opportunité du coup de dialoguer avec Guillaume et son équipe pour affiner ?

00:14:55:01 - 00:14:56:40
Hind

Ah oui !

00:14:56:45 - 00:14:59:55
Guillaume

On se parle quand même, évidemment ! (rires)

00:15:00:00 - 00:15:10:58
Divina

Voilà, je crois que cette notion de dialogue est peut être celle que nous allons garder pour la fin de ce premier épisode de notre podcast Crossover.

======

00:15:11:23 - 00:15:29:58
Sebastien

Maintenant que l'enquête nous a éclairés sur “Comment ça marche”, voyons comment ne pas se faire trop mener en bateau par les algorithmes. Divina Frau-Meigs, le premier point déjà, c'est que quand on entend ce genre d'histoires, on se dit que tout le monde devrait savoir comment fonctionnent les algorithmes.

00:15:30:01 - 00:15:56:05
Divina

C'est indispensable en effet, pas de comprendre les formules mathématiques, rassurez-vous, mais de savoir comment marche les algorithmes, ça oui. Leurs missions sont de prédire, de recommander, de faire du marketing aussi. Et il est très important, pour reprendre la main sur notre vie numérique, de comprendre leurs effets, la façon dont ils influencent notre information, notre consommation, nos relations.

00:15:56:50 - 00:16:03:00
Sebastien

Alors le deuxième point, c'est tout de même la notion de manipulation, parce qu'on a l'impression que les réseaux sociaux sont là pour nous manipuler.

00:16:03:05 - 00:17:09:05
Divina

Oui, mais attention à ne pas tomber dans la paranoïa. Il faut être clair là-dessus, la manipulation, ce n'est pas le fonds de commerce des plateformes et des réseaux sociaux. Leur raison d'être, c'est de nous faire rester en ligne pour leur faire gagner de l'argent. Et là, tous les moyens sont bons. Les algorithmes poussent les contenus qui font de l'audience et nous scotchent le plus longtemps possible devant notre écran. C'est aussi simple que cela. Au risque d'ailleurs de mettre en cause la qualité ou la pertinence de l'information.

Mais là où on retrouve la paranoïa, c'est que les algorithmes sont aussi utilisés par les Etats et toutes sortes “d'acteurs voyous”, à l'insu des réseaux sociaux et des usagers que nous sommes. C'est ce qu'on appelle la cyberguerre, avec de l'ingérence qui vient souvent de l'étranger. Et là, la désinformation, les théories du complot activent les peurs, les inquiétudes des gens. Et cela peut créer un véritable décalage entre la réalité et la virtualité en boostant les théories du complot, comme dans le cas du Convoi de la liberté qui a été gonflé en ligne mais a fait flop en vrai.

00:17:10:10 - 00:17:17:02
Sebastien

Il y a tout de même des comptes qui diffusent exprès du contenu sensationnaliste pour faire le buzz, et donc c'est compliqué de ne pas mordre à l'hameçon.

00:17:17:07 - 00:18:50:05
Divina

C'est vrai, ce n'est pas simple et personne n'aime être le poisson qui se fait piéger. Mais ça ne veut justement pas dire que nous ne pouvons rien faire, seuls ou ensemble.

En éducation aux médias et à l'information, nous nous battons pour retrouver le contrôle, reprendre le contrôle sur l'information, sur les moteurs de recherche, on peut considérablement freiner les algorithmes de recommandation. Par exemple, on peut effacer son historique de navigation, ou alors naviguer en mode privé par VPN.

Sur les médias sociaux, c'est un peu plus compliqué. Mais si on ouvre sa communauté à des gens qui ont des opinions diverses, si l'on se force un peu à aller lire des sources différentes, alors on aura accès à une information beaucoup moins orientée.

L’algorithme cherche à nous anesthésier et il faut donc se sortir de la zone de confort qu’il nous procure. Le pire ennemi des algorithmes en fait, c'est la curiosité. A nous d'aller voir les résultats en troisième ou quatrième page de nos écrans pour découvrir des richesses. À nous de fouiner, de partager des résultats moins tendances, à nous de résister aux sirènes du “puisque vous avez aimé ceci, alors vous aimerez cela”, le plus célèbre des algorithmes.

La réponse, elle est aussi politique. La Commission européenne y travaille. Nos gouvernements aussi. Mais pour que cela aboutisse rapidement, les citoyens que nous sommes doivent exiger la transparence des algorithmes. Notamment les revenus qu'ils permettent aux plateformes de récolter avec la publicité en ligne. A nous de rester vigilants.

00:18:50:30 - 00:23:18:12
Sebastien

Ce podcast a été réalisé par Savoir Devenir et l'INA dans le cadre du projet Crossover financé par l'Union européenne.
A la conception, Sophia Hamadi et Pascale Garreau, à la réalisation technique et au montage, Gabriel Fadavi. A l'aide à l'écriture, Jean-François Gervais et Sébastien Gaillard.

Retrouvez les notes de ce podcast, Le Dashboard et tous les épisodes sur le site Crossover.social