Les morphèmes et la mécanique du français

Notre langue est un collage de petits blocs appelés morphèmes. Tour d’horizon de ces vestiges anciens toujours bien présents.

Freepik / montage : L’actualité

Même si je m’intéresse à la langue, je ne suis pas linguiste et je découvre parfois des évidences, un peu comme Monsieur Jourdain dans Le bourgeois gentilhomme de Molière, personnage qui apprend avec fascination qu’il fait de la prose sans le savoir depuis 40 ans.

C’est ce qui m’arrive en ce moment avec les morphèmes. Je suis tombé sur cette notion en lisant le livre L’instinct du sens, de Philippe Barbaud, un essai sur la préhistoire de la parole qui m’a inspiré un autre article. Et depuis, je vois des morphèmes dans ma soupe (à l’alphabet).

Quand on la regarde « sous le capot », notre langue est un système de collage dont les plus petites unités de sens sont les morphèmes. Le linguiste retraité de l’UQAM en donne un bel exemple avec « désinstitutionnalisations », qui est un collage de huit morphèmes : dé(s)-, in-, -stitu, -tion, -al, -is, -ation, -s. Tous ces petits morceaux construisent un sens qui n’a aucun rapport avec les parties constituantes. Par exemple, dé- signifie priver, -stitut désigne la chose publique, -ation concerne l’action.

« Désinstitutionnalisations » regroupe diverses sortes de particules : des préfixes, des suffixes, la racine du mot (-stitu), et même une marque grammaticale (-s). En suivant le même principe, on comprend que « planteurs » est l’addition de trois morphèmes (plant-, -eur, -s) et que « marcheraient » en contient quatre (march-, -er, -ai, -ent).

Les morphèmes ne sont pas forcément courts. Pour les emprunts, ils peuvent même être plutôt longs. Le mot « malgache » (langue de Madagascar) n’est qu’un seul morphème en français, alors que « malgachisation » en contient trois (malgach-, -is, -ation).

Il existe aussi de nombreux morphèmes discontinus en deux morceaux. Le plus bel exemple est la négation « ne… pas », mais il y en a d’autres, très courants. Le passé composé « il a mangé », c’est le verbe « manger » auquel on plaque le morphème grammatical « a… -é ».

L’étymologie est utile pour distinguer les faux morphèmes. Par exemple, la syllabe « ré » en début de mot marque souvent la répétition, comme dans « réécrire, rééditer ». Mais pas pour « répéter » du latin « repetere », puisqu’il ne s’agit pas de péter à nouveau.

L’usure du temps a produit des morphèmes identiques qui ont des sens différents, comme -ier, qui peut vouloir dire arbre, receptacle ou agent, d’où « peuplier, mûrier », et encore « herbier, compotier », mais aussi « plombier, cordonnier, cantonnier ». Inversement, certains vieux suffixes distincts ont le même sens, comme -ien, -ais, -ois, qui signifient « qui habite » : Estrien, Montréalais, Québécois.

D’où ça vient ?

Les morphèmes viennent souvent du grec (comme anti-), du latin (la marque de l’infinitif -er) ou même du germanique (-ing). Ce dernier suffixe est typique des anglicismes, comme « parking, lobbying, jogging, lifting », mais il sert aussi à la construction de pseudo-anglicismes comme « le walking, le footing, le zapping », qui n’existent pas ou ne veulent pas dire la même chose en anglais. 

La langue française a recyclé bien des tournures du latin : le -eur moderne de « chanteur » est une dérivation du vieux -or du latin (chanteur, cantor), qui nous sert maintenant à former des mots qui n’existaient pas en latin, comme « aviateur ». Certains morphèmes sont modernes : « pomme de terre », par exemple, composé des trois morphèmes « pomme, de, terre », a un sens très différent de ses parties — ce n’est ni une pomme ni de la terre.

Certains morphèmes résultent d’erreurs. Par exemple, j’ai déjà expliqué que les pluriels en x de certains mots proviennent d’une mauvaise lecture des textes anciens. Vers le XIIe siècle, le pluriel de « cheval » était bien « chevaus », sauf que les lettrés, qui étaient tous latinistes, abrégeaient la terminaison -us en χ grec : on écrivait donc le pluriel de cheval « chevaχ ». Ceux qui les ont suivis ont lu « chevaux ». Le mal était fait. (Pourquoi fait-on un pluriel en -s pour des mots en -al comme « festival » ? Tout simplement parce que ces mots sont des créations plus récentes — « festival » est un emprunt du XIXe siècle à l’anglais.)

Dans son livre, Philippe Barbaud cite l’exemple des adverbes français avec le suffixe -ment. « À l’origine, écrit-il, ce suffixe français était en latin le nom commun autonome “mente” signifiant d’abord “esprit” puis “manière”. Il était courant dans cette langue qu’il suive un adjectif au féminin comme dans l’expression lenta mente (lentement, d’une manière lente). La soudure s’est opérée avec l’usage en gallo-roman, au point que l’ancien mot est devenu plus tard un morphème suffixal dépourvu de toute autonomie dans un énoncé. »

Les langues partagent toutes un même squelette en cinq parties : une phonologie (les sons), un lexique (les mots), une morphologie (la manière de former les mots), une syntaxe (la manière d’agencer les mots) et une sémantique (la signification). Même des langues qui ont des phonologies très semblables vont diverger pour le reste. De plus, chaque langue utilise chacune des parties du squelette de manière très différente.

Par exemple, le français, avec ses conjugaisons et ses accords en genre et en nombre, joue fortement avec la morphologie, alors que l’anglais le fait beaucoup moins. De même, l’anglais et l’allemand sont deux langues germaniques, mais l’allemand fait un usage des morphèmes encore plus étendu que le français.

Nos morphèmes grammaticaux

Je cite encore ici Philippe Barbaud, qui l’explique très bien en se servant du futur du verbe « partir », « je partirai ». Alors que le latin classique dirait « partiam », le latin parlé du IIIe siècle (aussi appelé bas latin ou latin tardif) a plutôt adopté la tournure populaire « partire habeo » — littéralement : « partir-j’ai à » (au sens de « j’ai à partir »). C’est ensuite devenu « partir(e) áyo » autour du XIIe siècle, puis en français « partirai ».

Jusqu’à présent, j’ai surtout parlé des morphèmes dits lexicaux (qui permettent de former les mots), mais il y a également les morphèmes grammaticaux, qui interviennent dans la manière dont un mot fonctionne dans une phrase.

On pourrait refaire le même tableau pour le conditionnel en latin, qui reprenait le même truc, mais avec l’imparfait du verbe avoir.

Cette tournure vient du fait que le peuple romain parlait un latin de cuisine, dit « latin vulgaire » au sens de populaire (aussi appelé bas latin ou latin tardif), qui n’avait rien à voir avec le latin classique des grands écrits. Largement analphabètes, les gens avaient beaucoup de mal avec les subtilités de prononciation des voyelles longues du latin classique (marquées par une barre horizontale dans le tableau ci-dessus). Pour se comprendre, ils ont donc pris l’habitude de coller des auxiliaires après le verbe pour marquer son temps. Un peu comme en anglais, où l’on utilise « will, shall » pour indiquer le futur, « to » pour l’infinitif, « would, should, could » pour le conditionnel.

Pourquoi après le verbe en latin ? Par analogie, tout simplement. Le latin est une langue à déclinaisons, c’est-à-dire que la fonction du terme est marquée par sa terminaison — « rose » se dit « rosa » comme sujet, mais « rosam » comme complément d’objet direct, ou « rosae » comme complément du nom. Il était donc normal de décliner le verbe selon la même logique. Et c’est pourquoi on dit « je partirai » de nos jours.

On utilise en français moderne un procédé très semblable pour remplacer le passé simple par le passé composé : au lieu de s’embêter avec des « nous partîmes », on se borne à l’auxiliaire (ici, être) devant le participe — « nous sommes partis ».

Les francophones le font aussi, de plus en plus, avec le futur dit périphrastique (je vais marcher) qui tend à se substituer au futur simple (je marcherai). Dans le futur périphrastique, le morphème qui marque le futur est placé devant le verbe. En français québécois, on fait d’ailleurs plus fort puisqu’à l’oral, les phrases affirmatives suivent le modèle périphrastique, mais les phrases négatives ont tendance à suivre le futur simple. À la question « Tu vas partir ? », on répond « Je partirai pas ». 

On assiste donc à une intéressante bataille des morphèmes au futur entre l’écrit et l’oral, et on verra dans quelques siècles lequel aura pris le dessus.

Laisser un commentaire

Les commentaires sont modérés par l’équipe de L’actualité et approuvés seulement s’ils respectent les règles de la nétiquette en vigueur. Veuillez nous allouer du temps pour vérifier la validité de votre commentaire.

Que disaient les linguistes du latin « classique » du bas latin? Probablement que c’était du nivellement par le bas? Le français évolue lui aussi et devrait ressembler de plus en plus à une version simplifiée, donc utile, de lui même. Dans mon domaine d’expertise (ingénierie des processus), on vise à simplifier. Ce devrait être la mission de nos linguistes également. Tout parent qui fait étudier le vocabulaire ou les verbes se dit probablement la même chose… Tu verras mon enfant, les mathématiques (qui sont aussi un langage) sont beaucoup plus simples!

Répondre

Simplifier le complexe n’est pas niveller par le bas. Celui-là est rationnel, celui-ci est subjectif. Les maths doivent étre apprises à l’école mais une langue est naturellement acquise à la maison. Simplifier l’acquis n’est pas dans le pouvoir d’un linguiste, pas plus que l’ingénieur peut modifier le théorème de Thalès une fois appris.

Comme le dit mon collègue Philippe B, que je salue en passant, un linguiste ne peut pas simplifier la langue qui évolue naturellement via ses locuteurs. Toutefois, connaissant bien le système scolaire, je soupçonne que lorsque vous parlez de faire apprendre le «vocabulaire» à votre enfant, vous parlez en fait de l’orthographe des mots et non de leur sens, tout comme vous parlez pour les verbes de la conjugaison écrite et non orale. Les élèves du primaire font très peu d’erreurs de conjugaison lorsqu’ils parlent et ils connaissent généralement bien le sens des mots dont ils apprennent l’orthographe. La confusion entre langue et orthographe est en effet courante. Monsieur Jean F., si ce que vous souhaitez est une simplification du code orthographique pour le rendre plus transparent, c’est-à -dire plus régulier et proche de la langue française actuelle, alors vous avez raison! Les linguistes peuvent tout à fait proposer une simplification du système orthographique. C’est même ce que plusieurs font! Malheureusement, la moindre réforme a du mal à être acceptée et adoptée dans nos sociétés francophones… Le problème ne vient pas des linguistes!

Le propos est extrêmement intéressant. Il décrit fort bien l’énorme difficulté à laquelle se heurtent les apprenants des dialectes autochtones – algonquins à tout le moins – dont le défi est d’en arriver à comprendre le sens des mots, le concept qui les sous-tend et la façon de former comme en allemand les « trains » qui en définissent le message. Bref, ils ne sont pas sortis du bois. Tout un charabia d’ailleurs accentué par les dérives d’une oralité propre à chaque tribu et individu. Quant à l’origine de ces dialectes, il est étonnant de constater à quel point leur langage peut avoir de commun avec ce qui leur semble de prime abord totalement étranger. Ainsi, y a-t-il vraiment un lien de parenté entre « yamaska » et « yamaha », le premier signifiant « cours d’eau aux joncs » ?… Bravo de nous éclairer de pareille façon !

Répondre

En effet, les langues autochtones sont généralement agglutinantes, un peu comme l’allemand, mais avec leurs racines propres. J’ai travaillé dans le domaine du droit avec une linguiste en inuktitut et c’est fascinant ce qu’on peut apprendre. Quelques exemples:
Loi se dit maligaq: mali = suivre une personne, une idée, un animal, voyager avec quelqu’un qui est le leader; -ga = marqueur passif; -q = singulier; donc la traduction littérale est «ce que l’on suit habituellement».
Juge se dit Iqqaqtuiji: iqqaqtui = se souvenir d’événements passés; -ji = une personne qui accomplit une action de manière habituelle; donc la traduction littérale est «la personne qui fait se souvenir d’événements passés» avec une notion péjorative (mauvaises actions) en inuktitut.
Coupable se dit pasijaksaq: pasi = soupçonner quelqu’un sans en parler et décider d’en parler, être à peu près certain de l’opinion de quelqu’un, blâmer; -ja = marqueur passif, moins permanent; -ksa = quelqu’un ou quelque chose destiné à; -q = singulier; traduction littérale «quelqu’un qui est censé être soupçonné, blâmé (par quelqu’un d’autre)». Coupable est un fait pour ‘une personne alors qu’en inuktitut c’est plutôt l’opinion de quelqu’un d’autre. Dans ce cas, c’est un bon exemple où il y a confusion entre deux cultures car dans le cas du français, c’est la qualité de la personne, on peut être coupable d’avoir commis un crime ou pas, alors qu’en inuktitut c’est l’opinion d’une autre personne. Si on le demande à un Inuk, il comprend qu’on lui demande si le juge est d’opinion qu’Il est coupable et l’accusé va souvent répondre oui car il croit que c’est l’opinion du juge qui compte et non pas ce qui lui croit avoir fait ni s’il avait une intention criminelle.

Dans chaque langue il y a ces écueils et si on comprend les morphèmes on peut mieux faire le pont entre cultures, sinon on s’expose à des malentendus qui peuvent avoir des conséquences très sérieuses.