Si vous voulez savoir pourquoi les ordinateurs ne pourront jamais réellement converser avec les humains, il faut lire le livre de David Shariatmadari, Don’t Believe a Word : The Surprising Truth About Language [N’en croyez pas un mot : les étonnantes découvertes sur le langage ; le livre est non traduit].

Remarquez que ce n’est pas le seul mythe que son auteur déboulonne. David Shariatmadari, journaliste au célèbre quotidien britannique The Guardian, s’est donné pour mission de vulgariser les grandes avancées de la linguistique, son sujet d’étude pendant ses années à l’Université de Cambridge.

Son livre, en neuf chapitres, s’organise autour des contre-vérités courantes, du genre « le langage fout le camp », « l’étymologie nous dit le sens d’un mot », « ça ne se traduit pas », « la langue est un instinct » ou « on dit toujours ce qu’on veut dire » (c’est ici qu’il parle de l’intelligence artificielle).

Alors que les linguistes adoptent habituellement une prose plutôt indigeste et aride, David Shariatmadari relève le défi dans un style très vivant et bien illustré. En fait, j’ai tellement aimé l’ouvrage que j’ai appelé son auteur chez lui à Londres pour en discuter.

C’est un livre essentiel, à mon avis, mais qui ne sera malheureusement pas traduit, du fait qu’il exigerait trop de transpositions. Mais outre que l’on y trouve plusieurs perles francophones sur l’origine de la négation en « pas » et comment les Anglais ont déformé « grammaire » en « glamour », le lecteur québécois y trouvera son compte parce que les avancées de la linguistique sont universelles. Outre un excellent glossaire, l’annexe contient une bibliographie par chapitre qui permet de vous y retrouver aisément et de creuser les détails qui vous intéressent.

Prenez une notion élémentaire : le mot. L’école nous a tous entraînés à penser qu’un mot, c’est sa définition. Or, les linguistes sont ailleurs depuis longtemps. Par exemple, le mot « bloc », qui revêt divers sens en maçonnerie, en ingénierie, en politique, en papeterie, en informatique. En maçonnerie, la définition du bloc décrit une « masse compacte d’une seule pièce ». Mais si le maçon dans son échafaudage crie « Bloc ! », l’apprenti est censé comprendre : « Apporte-moi le bon bloc, selon la manière dont on a convenu. » Autrement dit, un mot peut décrire une réalité, mais il peut représenter un processus. « C’est l’opposition classique entre Saint-Augustin, pour qui le mot est un sens qu’on peut pointer, et Wittgenstein, pour qui le sens du mot est la manière dont on l’utilise », dit David Shariatmadari.

Cette idée contredit plusieurs idées folkloriques, comme celle qui veut que le dictionnaire soit la langue ou celle qui prétend que les glissements de sens découlent de l’ignorance. L’auteur illustre ce phénomène de glissement avec un exemple amusant basé sur le mot anglais « toilet ». Le mot vient du français « toilette », qui désignait un petit morceau de toile. Vers le XVIe siècle, le mot a pris le sens du tissu couvrant un meuble dans une chambre à coucher, ensuite du meuble comme tel, puis de l’acte de se vêtir et de se coiffer (faire sa toilette) et de s’apprêter (eau de toilette), pour glisser par la suite vers la manière élégante de s’habiller (porter une toilette). En parallèle, le mot pour le meuble en est venu à décrire la pièce où il se trouvait, avant d’être réduit au cabinet d’aisances où se trouve le sanitaire.

Tout son chapitre 7 est une attaque en règle contre l’idée que l’intelligence artificielle puisse reproduire la conversation humaine. Celle-ci fera de grandes réalisations, mais sans doute jamais la conversation. La chose serait possible si les humains disaient toujours ce qu’ils veulent dire. Or, notre conversation est parsemée de moments où l’on dit le contraire de ce que l’on veut dire ou de ce qu’il faudrait dire, tout en étant correctement interprétée.

Il donne pour exemple quatre ou cinq conversations qu’il a eues avec un logiciel ultrasophistiqué. Il a suffi d’une métaphore, d’un sarcasme ou d’un commentaire sans rapport pour rendre le logiciel confus, alors qu’un enfant de six ans se serait tiré d’affaire. « La conversation humaine va au-delà du code, justement. Elle opère dans un espace social en suspension que l’on met des années à acquérir et qui change constamment. » Cet espace met en jeu tout un bagage historique et anthropologique qui peut même inclure la volonté de bafouer les règles.

C’est d’ailleurs ce qui explique pourquoi il peut être si déstabilisant de converser avec des gens avec qui on partage la même langue, mais pas la même culture — étrangers, personnes d’une autre classe sociale. La clé pour comprendre le sens du mot « dîner », c’est l’accent ou le lieu où la conversation se produit. Même si l’on maîtrise parfaitement la conversation dans sa culture, il faut parfois des années pour se « reprogrammer » dans une autre. C’est ce que j’ai démontré dans ma chronique du 14 juillet sur la conversation française.

J’ai souvent écrit ici que la langue est mal enseignée, à commencer par le fait qu’il n’y a aucun effort véritable pour transmettre aux enfants de réelles notions de linguistique, alors que cette science a fait des pas de géants depuis un siècle. Oui, la linguistique, c’est compliqué, mais pas vraiment plus que l’écologie. Combien de malentendus dissiperait-on si on montrait aux enfants les richesses de langues indigènes ? Ou encore l’évolution du sens des mots de manière amusante ? Ou les formes anciennes de sa propre langue et la manière dont elle a évolué ? Ou les mécanismes d’emprunts entre les langues ?

« Les notions de linguistique se rendent beaucoup moins jusqu’à nous que celle des découvertes fondamentales en chimie, en physique ou en biologie, convient David Shariatmadari. Un microbe peut nous tuer, mais on peut très bien parler une langue sans en comprendre les rouages. Une pédagogie de la linguistique serait néanmoins essentielle parce que trop de gens utilisent le langage comme une arme, pour produire de la distinction sociale qui fait finalement beaucoup de dommage. La linguistique démonte cela. Je ne dis pas que tout se vaut. L’école est importante. Un enfant doit apprendre à maîtriser les registres de sa langue. » Autrement dit, on sera beaucoup moins sensibles à la vieille rengaine sur le déclin de la langue française si l’on sait comment la langue française a évolué, comment elle a toujours emprunté des mots aux autres langues.

Le livre est aussi une remise en cause de l’éminent linguiste Noam Chomsky, ce monstre sacré dont les théories ont influencé profondément les travaux de toutes les facultés de linguistique anglophones depuis les années 1960. Chomsky, ayant observé que tous les enfants de toutes les cultures acquièrent très vite leur langue, a émis pour hypothèse que le langage était un instinct. Autrement dit, le langage serait une faculté du cerveau, au même titre que les cinq sens. Selon la théorie chomskienne, il existerait donc une sorte de « grammaire universelle » implantée dans le cerveau humain dès la naissance.

« Depuis, tout le monde cherche la grammaire universelle. C’est le Saint-Graal. À mon avis, c’est peut-être une simplification excessive. C’est séduisant comme théorie, mais il n’y aura pas d’explication simple. » La linguistique actuelle fait grand usage des mégadonnées à travers de très larges corpus qui affaiblissent plusieurs prémisses de Chomsky.

« Une personne vivant seule sur une île déserte ne développera pas de langage. Il émerge à travers les relations entre les gens, un contrat, une négociation. C’est un artéfact social et culturel déterminé par la biologie, mais qui évolue tout le temps parce qu’il est comme en suspension. » D’ailleurs, on ne sait même pas où commence et où finit une langue. On ne peut même pas dire au juste ce qu’est une langue, comme le français ou l’anglais — autre grand mythe que démonte l’auteur.

Don’t Believe a Word: The Surprising Truth About Language, de David Shariatmadari, W. W. Norton (2020), 324 p.

