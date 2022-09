Quand on considère la place du français dans le cyberespace, il y a de quoi se consoler… et se désoler. Selon l’étude La langue française dans le monde 2019-2022, publiée par l’Observatoire de la langue française (OLF), à Paris, le français y occupe la quatrième place, derrière l’anglais, le mandarin et l’espagnol, à égalité avec l’hindi. Son taux de présence serait de 3,5 % de l’ensemble. Cela paraît peu, mais nettement mieux quand on sait que les mêmes calculs placent l’anglais à 25 %.

« Ceux qui prétendent que l’anglais représente 80 %, 60 % ou 50 % du cyberespace sont des charlatans », dit Daniel Pimienta, responsable de l’Observatoire de la diversité linguistique et culturelle dans l’Internet, qui compile depuis 2017 les données sur les langues du Web pour l’OLF. « Il faut arrêter de penser que c’est un espace anglophone. Ça ne l’a jamais été. La langue du cyberespace, c’est le multilinguisme. »

Depuis quelques années, l’enjeu de la découvrabilité des contenus (leur capacité à être repérés parmi l’ensemble) et celui de la visibilité sont au cœur de nombreux projets de loi tant au Canada qu’au Québec et en France. Or, une évaluation réaliste du paysage linguistique sur Internet est une condition essentielle pour établir des politiques capables d’infléchir le modèle d’affaires des géants du Web, qui favorise énormément la culture anglophone.

Le responsable de l’Observatoire ne se range pas dans le camp jovialiste pour ce qui concerne le français. « L’hindi monte fort, il dépasse le français et il va certainement dépasser l’espagnol. L’arabe et le russe montent aussi très vite. » Il estime que le français pourrait reculer à la cinquième place, puis à la sixième d’ici 10 ans.

Daniel Pimienta ne voit aucun problème à ce que l’hindi, le russe ou l’arabe s’étendent. Son point : le français ne réalise pas son plein potentiel et n’occupe pas dans le cyberespace une position qui correspond à son importance comme langue internationale. De grands pans de la francophonie ne sont pas visibles sur le Web et, à une époque où tout est jugé selon ce critère, il croit que les francophones doivent s’organiser pour prendre leur place — en commençant par combler le retard des pays africains en matière d’accès à Internet. « Pour ce qui est de la présence dans le cyberespace, le paramètre le plus important ne sera pas l’évolution de la démographie, dit-il, mais le taux de connectivité. » Soit le pourcentage de locuteurs qui ont accès à Internet.

Alors que le taux de connectivité au Canada avoisine les 97 %, il dépasse rarement les 50 % dans les 31 pays de l’Afrique francophone, qui regroupe la moitié des francophones de la planète. Et l’écart est encore plus grand quand on considère l’accès à Internet à haute vitesse, qui frôle les 90 % au Canada, mais n’excède pratiquement jamais 1 % en Afrique subsaharienne.

La bonne nouvelle pour le français, c’est que le taux de branchement peut évoluer très vite en fonction des investissements. C’est justement ce qui se passe avec l’Inde et les pays arabes et qui influence fortement les indices. Les pays hispaniques ont d’ailleurs su relever ce défi dans les années 2000.

Daniel Pimienta, ancien architecte de système pour IBM, s’est intéressé à la question du poids des langues sur Internet dès les années 1990, du temps où il dirigeait l’Association réseaux et développement (FUNREDES), une ONG qui a notamment œuvré pour la connectivité de la République dominicaine, d’Haïti et du Pérou. À l’époque, le mathématicien était vexé des premières mesures, qui évaluaient la place de l’anglais à plus de 80 % d’Internet. « Il suffisait que le robot détecte le mot “welcome” sur une page d’accueil pour conclure que tout le site était en anglais. La plupart des indices fonctionnent encore ainsi », souligne-t-il. Dans cette logique, Wikipédia sort comme un site anglophone, alors que cette encyclopédie ouverte publie en 327 langues. « Ça n’a aucun bon sens de croire que deux groupes comme les Chinois ou les Indiens, qui comptent pour le quart des internautes, ne produiraient que 1 % de contenus dans leur langue. »

Daniel Pimienta estime que les pays francophones sont en mesure d’accroître leur poids sur l’autoroute de l’information s’ils investissent de manière intelligente.

À la fin des années 1990, Daniel Pimienta monte un premier indice basé sur l’échantillonnage de quelque 3 000 mots sur le moteur de recherche Google. Par exemple, « université », « university », « universidad » (espagnol), « universidade » (portugais), « universität » (allemand), etc. Et ainsi de suite pour des concepts variés comme « jaune » ou « recherche ». Ces premiers résultats — qui seront repris par l’UNESCO dans les années 2000 — accordent 52 % à l’anglais. À l’époque, l’auteur lui-même considérait ces chiffres comme surévalués, du fait qu’ils ne tenaient nullement compte des langues non européennes.

En 2007, Daniel Pimienta interrompt ce travail, car Google ne donne plus de résultats fiables : la même question posée à partir d’un ordinateur aux États-Unis, en France, au Brésil ou au Canada produit des résultats divergents.

De 2007 à 2017, il cherche une méthode qui permettrait de brosser un portrait réel de la situation. Pour les taux de branchement, d’utilisation et de fabrication de contenus par pays, ça va, les données existent. On sait par exemple que le taux de connexion est de 26 % au Mali. Mais combien de Maliens parlent le français ? L’Observatoire de la langue française produit certes des données très fiables concernant le nombre de francophones — actuellement estimé à 321 millions de locuteurs. Cependant, les francophones sont les seuls à faire ce genre de décompte, ce qui rend impossible toute tentative de comparer les langues dans le cyberespace.

Tout change en 2017, lorsque la banque de données Ethnologue, qui recense 7 000 langues, modifie sa méthode pour inclure non seulement les locuteurs de langue maternelle, mais aussi ceux de langue seconde, ce qui va créer une meilleure base de comparaison pour une analyse multilingue du Web. En 2017, Daniel Pimienta reprend son travail en tenant compte du nombre de locuteurs des différentes langues dans le monde. La place de l’anglais fond à vue d’œil : 35 % en 2017 contre 25 % en 2021.

Daniel Pimienta estime que les pays francophones sont en mesure d’accroître leur poids sur l’autoroute de l’information s’ils investissent de manière intelligente, en s’appuyant sur les trois pays africains francophones qui réussissent le mieux — Gabon, Maroc et île Maurice, dont les taux de connexion dépassent les 60 %. « Je pense que ces pays sont les mieux placés pour diriger cet effort. »

Il croit que les pays francophones devraient par ailleurs investir dans le développement d’un moteur de recherche en français, comme l’ont fait les Chinois (Baidu), les Russes (Yandex), les Sud-Coréens (Naver) et les lusophones (el portal) — et évidemment les anglophones, qui ont été les premiers (Google). « Si vous n’êtes pas indexé dans un moteur de recherche, vous n’existez pas. Or, Google n’est ni complet ni neutre linguistiquement. »

Toujours actif à 71 ans, Daniel Pimienta travaille sur un nouveau modèle mathématique, qui corrige un certain nombre de biais qu’il décrivait dans son dernier rapport. « Je raffine constamment mes indicateurs et, cette année, j’arrive à 20 % pour l’anglais », dit-il. Il est convaincu que le français comporte de nombreux atouts comme langue du cyberespace, à commencer par celui d’avoir une forte présence dans beaucoup plus de pays que le mandarin ou l’hindi. « Ce n’est pas un prix de consolation pour la francophonie. Ça donne la potentialité réelle et une cible réelle. Mais il faut qu’on règle maintenant le problème de connectivité en Afrique. »

Cet article a été publié dans le numéro d’octobre 2022 de L’actualité, sous le titre « « La langue du cyberespace, c’est le multilinguisme » ».