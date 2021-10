DUBAÏ, Émirats arabes unis — Alors que la guerre de Gaza faisait rage et que les tensions montaient en flèche au Moyen-Orient en mai dernier, Instagram a brièvement interdit le mot-clic #AlAqsa, une référence à la mosquée Al-Aqsa dans la vieille ville de Jérusalem, un point chaud du conflit.

Facebook, propriétaire d’Instagram, s’est ensuite excusé, expliquant que ses algorithmes avaient confondu le troisième site le plus saint de l’Islam avec le groupe militant des Brigades des martyrs d’Al-Aqsa, une branche armée du parti laïc Fatah.

Pour de nombreux utilisateurs arabophones, ce n’était que le dernier exemple de la façon dont le géant des médias sociaux muselait le discours politique dans la région. L’arabe est l’une des langues les plus courantes sur les plateformes de Facebook, et l’entreprise présente des excuses publiques fréquentes après des suppressions de contenu similaires.

Des documents internes à l’entreprise coulés par l’ancienne ingénieure de Facebook devenue dénonciatrice Frances Haugen indiquent que les problèmes sont bien plus systémiques que quelques erreurs innocentes, et que Facebook a compris la profondeur de ces échecs pendant des années tout en faisant peu pour y remédier.

De telles erreurs ne se limitent pas à l’arabe. Un examen des dossiers révèle que dans certaines des régions les plus volatiles du monde, le contenu terroriste et les discours de haine prolifèrent parce que l’entreprise manque de modérateurs qui parlent les langues locales et comprennent les contextes culturels. Et ses plateformes n’ont pas réussi à développer des solutions d’intelligence artificielle capables de détecter des contenus préjudiciables dans différentes langues.

Dans des pays comme l’Afghanistan et le Myanmar, ces failles ont permis à un langage incendiaire de prospérer sur la plateforme, tandis qu’en Syrie et dans les territoires palestiniens, Facebook supprime le discours ordinaire, imposant des interdictions générales sur des mots courants.

«Le problème fondamental est que la plateforme n’a jamais été construite dans l’intention de servir un jour de médiateur du discours politique de tout le monde sur la planète», a expliqué Eliza Campbell, directrice du Cyber Program du Middle East Institute. «Mais avec l’importance politique et les ressources dont dispose Facebook, la modération est vraiment sous-financée.»

Cette histoire, ainsi que d’autres publiées lundi, s’appuie sur les divulgations de Mme Haugen à la Securities and Exchange Commission, qui ont également été fournies au Congrès en versions caviardées par son équipe juridique. Les versions caviardées reçues par le Congrès ont été examinées par un consortium d’agences de presse, dont l’Associated Press (AP).

Dans une déclaration à l’AP, un porte-parole de Facebook a déclaré qu’au cours des deux dernières années, la société a investi dans le recrutement de plus de personnel possédant une expertise en dialectes et sujets locaux afin de renforcer sa capacité d’examen à travers le monde.

Mais en ce qui concerne la modération de contenu en arabe, la société a déclaré : «Nous avons encore du travail à faire. (…) Nous menons des recherches pour mieux comprendre cette complexité et identifier comment nous pouvons nous améliorer.»

Au Myanmar, où la désinformation sur Facebook a été liée à plusieurs reprises à la violence ethnique et religieuse, la société a reconnu dans ses rapports internes qu’elle n’avait pas réussi à arrêter la propagation des discours de haine ciblant la minorité musulmane Rohingya.

La persécution des Rohingyas a conduit Facebook à s’engager publiquement en 2018 à recruter 100 locuteurs natifs du Myanmar pour surveiller ses plateformes. Mais la société n’a jamais révélé le nombre de modérateurs de contenu qu’elle a finalement embauchés ni révélé lequel des nombreux dialectes du pays ils couvraient.

En Inde, les documents montrent des employés de Facebook débattant en mars dernier pour savoir s’ils pourraient réprimer les «récits alarmistes et antimusulmans» que le groupe nationaliste hindou d’extrême droite du premier ministre Narendra Modi, Rashtriya Swayamsevak Sangh, diffuse sur sa plateforme.

Dans un document, la société note que des utilisateurs liés au parti de M. Modi ont créé plusieurs comptes pour amplifier la diffusion de contenu islamophobe. Une grande partie de ce contenu n’a «jamais été signalée ou traitée», a révélé la recherche, car Facebook manquait de modérateurs et de filtres automatisés connaissant l’hindi et le bengali.

L’arabe pose des défis particuliers aux systèmes automatisés et aux modérateurs humains de Facebook, qui ont du mal à comprendre les dialectes parlés propres à chaque pays et région, leurs vocabulaires parsemés de différentes influences historiques et contextes culturels.

L’arabe familier marocain, par exemple, comprend des mots français et berbères, et est parlé avec des voyelles courtes. L’arabe égyptien comprend du turc de la conquête ottomane. D’autres dialectes sont plus proches de la version «officielle» trouvée dans le Coran. Dans certains cas, ces dialectes ne sont pas mutuellement compréhensibles et il n’y a pas de moyen standard de transcrire l’arabe parlé.

En Afghanistan, de nombreux utilisateurs ne peuvent littéralement pas comprendre les règles de Facebook. Selon un rapport interne publié en janvier, Facebook n’a pas traduit les pages liées aux discours haineux et à la désinformation du site en dari et en pachto, les deux langues les plus courantes en Afghanistan, où l’anglais n’est pas largement compris.

Lorsque les utilisateurs afghans tentent de signaler des messages comme discours haineux, les menus déroulants n’apparaissent qu’en anglais. Il en va de même pour la page des normes communautaires. Le site ne dispose pas non plus d’une banque de termes de discours haineux, d’insultes et de mots de code en Afghanistan utilisés pour modérer le contenu en dari et en pachto, comme c’est généralement le cas ailleurs. Sans cette banque de mots locale, Facebook ne peut pas créer les filtres automatisés qui détectent les pires violations du pays.

L’Irak se classe au premier rang de sa région pour son volume signalé de discours de haine sur Facebook. Mais parmi les critiques, la connaissance du dialecte irakien est «presque inexistante», selon un document.

«Les journalistes essaient de dénoncer les violations des droits de la personne, mais nous sommes simplement interdits», a déclaré un militant de la liberté de la presse basé à Bagdad, qui a requis l’anonymat par crainte de représailles. «Nous comprenons que Facebook essaie de limiter l’influence des milices, mais cela ne fonctionne pas.»

Des linguistes ont décrit le système de Facebook comme défectueux pour une région avec une grande diversité de dialectes familiers que les arabophones transcrivent de différentes manières.

«Le stéréotype selon lequel l’arabe est une entité est un problème majeur», a déclaré Enam al-Wer, professeur de linguistique arabe à l’Université d’Essex, citant les «énormes variations» de la langue non seulement entre les pays, mais aussi entre les classes, les sexes, les religions et les origines ethniques.

Malgré ces problèmes, les modérateurs sont en première ligne de ce qui fait de Facebook un puissant arbitre d’expression politique dans une région tumultueuse.

Bien que les documents de Mme Haugen soient antérieurs à la guerre de Gaza de cette année, des épisodes de ce conflit de 11 jours montrent à quel point peu a été fait pour résoudre les problèmes signalés dans les propres rapports internes de Facebook.

Des militants de Gaza et de Cisjordanie ont perdu leur capacité à diffuser en direct. Des archives entières du conflit ont disparu des fils d’actualité, principal portail d’information pour de nombreux utilisateurs. Des influenceurs habitués à des dizaines de milliers de mentions «J’aime» sur leurs publications ont vu leur portée s’effondrer lorsqu’ils ont publié des articles sur les Palestiniens.

Pendant la guerre, des défenseurs palestiniens ont soumis des centaines de plaintes à Facebook, conduisant souvent l’entreprise à reconnaître ses erreurs et à rétablir des publications et des comptes.

Dans les documents internes, Facebook a signalé qu’il avait commis une erreur dans près de la moitié de toutes les demandes de retrait en langue arabe soumises en appel.

En annonçant l’annulation d’une telle suppression de publication palestinienne le mois dernier, le conseil de surveillance semi-indépendant de Facebook a demandé une enquête impartiale sur la modération du contenu en arabe et en hébreu de l’entreprise.

Les documents internes de Facebook ont également souligné la nécessité d’«améliorer» les algorithmes, d’enrôler davantage de modérateurs arabes de pays moins représentés et de les assigner là où ils ont une expertise dialectale appropriée.

«Avec la taille de la base d’utilisateurs arabes et la gravité potentielle des dommages hors ligne (…), il est certainement de la plus haute importance de consacrer plus de ressources à la tâche d’améliorer les systèmes arabes», a déclaré le rapport.

Mais la société a également déploré qu’«il n’y ait pas une stratégie d’atténuation claire».

Pendant ce temps, de nombreuses personnes au Moyen-Orient craignent que les enjeux liés aux échecs de Facebook ne soient exceptionnellement élevés, avec le potentiel d’élargir les inégalités de longue date, de refroidir l’activisme civique et d’attiser la violence dans la région.