Sur ce site, où les diverses listes de fréquence sont à l'honneur (en particulier la première, celle d'Henmon), il est équitable de donner la parole à une sévère critique, argumentée, du principe même des listes. Elle est due à la plume d'un professeur de langues, d'anglais vraisemblablement.
Il y est fait référence à des travaux en cours à l'époque de la rédaction de l'article, travaux officiels en vue de la constitution d'un Français fondamental, travaux qui furent mis en route à la suite d'une suggestion (1947) de l'Unesco. Sur les querelles qui ont accompagné cette constitution, on consultera avec fruit l'article de Daniel Coste, "Français élémentaire, débats publics et représentations de la langue".
Enfin, l'auteur fait allusion à la Commission du vocabulaire (chargée par le Ministère de piloter les travaux préparant une liste des mots fondamentaux de notre langue) et à l'un de ses membres, Fernand Mossé (1892-1956), philologue agrégé d'anglais.

 

 

On peut à bon droit se féliciter de ce que la vogue des vocabulaires de base ait enfin gagné la France. Mais si l'on cherche les raisons de notre retard, on ne sait trop s'il faut plutôt accuser notre inertie et notre traditionalisme, ou bien tout simplement notre bon sens et un vieux cartésianisme qui ose aller plus loin que l'arithmétique élémentaire. Avant de céder à l'entraînement et de nous engager dans une voie qui risque de nous mener à l'imitation servile et à la puérilité, il est grand temps de nous poser la question première de toute méthode : "De quoi s'agit-il ?" Cela nous mènera peut-être à attaquer le problème à la française au lieu de suivre aveuglément des travaux étrangers dont il n'est pas question de diminuer les très grands mérites, certes, mais qu'il serait regrettable de copier sans leur apporter notre contribution bien spécifique.

S'agit-il de rationaliser l'étude de la sténographie, de déterminer la progression d'un cours d'orthographe ? Les principes actuels sont alors excellents et le travail est assez bien fait pour qu'on n'ait plus à le refaire. S'agit-il de faciliter la tâche de ceux qui apprennent une langue ? Alors tout est à reprendre, les tables actuelles étant un danger plutôt qu'une aide. Loin de résoudre les difficultés du problème, elles les escamotent complaisamment et réservent à ceux qu'elles endorment des réveils désagréables. Nous allons, en effet, leur reprocher de ne pas tenir compte et de ne pas pouvoir tenir compte des véritables unités de langage qui sont, tantôt moins que le mot (acception de mot), et tantôt plus (idiotisme de base). Nous allons leur reprocher de ne pouvoir tenir compte de la vie. Nous irons même jusqu'à leur reprocher de créer l'illusion qu'on peut limiter pratiquement l'apprentissage du vocabulaire aux premières tranches de fréquence. Et nous n'épuiserons pas dans cet article la somme de nos griefs, préférant y tenter, bien gauchement, certes, de dégager quelques-uns des principes qui pourraient nous guider, nous Français, dans la recherche d'une méthode pour l'enseignement des vocabulaires étrangers à nos compatriotes.

Les tables actuelles ne distinguent pas le bon de bon de caisse et bon de pain de celui de bon à manger, et de celui, bien indépendant, de allons, bon !, qui n'a rien de bon du tout mais n'a pas droit à la considération des enquêteurs parce qu'il n'a pas de graphie spéciale. Cependant, un étranger l'entendra avant giroflée et ipéca qui, eux, ont droit de classement dans les enquêtes actuelles grâce à leur individualité orthographique. Mais si l'on tient compte des acceptions de mot, les recherches seront ralenties et compliquées, l'analyse du sens des mots s'ajoutant au travail déjà écrasant du simple dépouillement numérique. Et malgré ses avantages, ce classement plus nuancé ne serait pas suffisant car, loin de faire défiler des formes lexicographiques, un enseignement éclairé doit chercher à présenter les complexes vivants qui transcendent les règles conscientes d'association des mots pour faire utiliser la langue avec correction et même élégance. Dès les débuts, il doit donc se préoccuper de l'usage, de ces subtiles affinités que les mots ont entre eux, affinités qui varient avec chaque langue. Les nouveaux modes d'association d'idées, les nouveaux moules de pensée sont pour l'élève une source de culture véritable, c'est-à-dire d'assouplissement des facultés intellectuelles. C'est ce côté éducatif, cette recherche du mécanisme en plus, de l'âme en plus, qui fait la différence entre une école digne de ce nom et le guide de conversation du commerce. Or, là encore, il faut établir un ordre d'urgence, procéder au classement gradué des mécanismes d'usage réduits à leurs éléments les plus simples, les "unités de langage". Ainsi, en français, on tiendra compte des unités de langage que sont les expressions bon-point, bon mot, de bonne heure, pour la bonne bouche, bonne-maman, etc., qui se disperseront à des milliers de rangs de distance dans une table de fréquence correspondant intelligemment à la réalité du langage. Il ne suffit pas, comme le laissent croire les avocats des langues basiques, d'une grammaire et de la connaissance des mots de, heure et bonne pour qu'un étranger recrée à coup sûr l'expression de bonne heure. La liste de mots, assaisonnée à une sauce grammaticale plus ou moins réussie, ne peut donner que le "petit nègre" que nous trouvons dans les copies d'élèves. L'Allemand qui connaît prendre et place et vous invite à prendre place dans son salon vide, ne se doute pas qu'il peuple ses fauteuils d'un bon nombre de créatures imaginaires. Gardons-nous toutefois d'exagérer dans l'autre sens : une liste intelligente d'unités de langage, seule capable de suppléer à la pauvreté de la grammaire, ne saurait pour autant la remplacer. Dans la phrase "le thé que j'ai bu était trop fort" toutes les unités sont des mots ou acceptions de mots solidement liés par la logique grammaticale, qui suffit ici à guider le sujet parlant. Il n'en reste pas moins vrai que la langue la plus courante, donc la plus urgente à enseigner, compte un très grand nombre de complexes de mots allant de l'idiotisme de base (nous disons en feu, les Anglais, sur feu), à la locution proverbiale (nous disons trop beau pour être vrai, il n'est jamais trop tard pour bien faire, et les Anglais, trop bon pour être vrai, jamais trop tard pour réparer). Si nous abandonnons toutes ces fantaisies d'une langue pour nous cantonner dans les listes du Basic English, cette langue monstrueuse dans sa logique simpliste, nous dessécherons l'esprit de nos enfants, sans grand profit pour leurs facultés purement logiques, qui trouveront leur vraie formation dans les sciences. Mais si nous tenons compte, dès le début, des vraies unités du langage, nous leur apporterons un surplus d'expérience vivante et humaine, un assouplissement de leur psittacisme de langue maternelle. La connaissance "pratique (!)" cherchée par les compilateurs des listes de base actuelles sera alors atteinte sans déchéance pour la langue enseignée, sans déchéance pour la personnalité de l'élève.

Comment établir une liste de fréquence descendant jusqu'à l'acception de mot et montant jusqu'à l'idiotisme de base ? Plus encore que tout à l'heure, ce serait une œuvre surhumaine. Combien de pages de textes faudrait-il dépouiller, briser en unités de langage ? Quelle dépense d'énergie et d'argent ! Et ces dépouillements, pas plus que les dépouillements actuels, ne tiendraient compte harmonieusement des trois points de vue essentiels : parler, - lire et écrire - vivre dans le pays dont on étudie la langue.

Voyons à ce point de vue ce que devient un modèle d'ouvrage conçu suivant les méthodes actuelles quand on le confronte avec la vie. Les auteurs du "Children's Picture Dictionary" (par Watters & Courtis, chez Grosset & Dunlap, New-York) ont si bien calculé leurs 2 154 mots de base que leur compilation ne comprend, à quelques exceptions près, que des termes inclus dans les listes les plus connues (Gates, Horn-Packer, Thorndike) et qu'elle couvre 91,4 % du vocabulaire de 46 livres de morceaux choisis pour enfants. Le livre, qui prétend tenir compte de la conversation orale, s'est, paraît-il, révélé supérieur pour enseigner l'américain aux immigrants adultes. Certes, le débutant étranger amateur de littérature enfantine y trouvera des termes fort utiles tels que wigwam, nasturtium et pétunia. Je me permettrai cependant, s'il doit vivre en Amérique, de lui apprendre, bien avant ces mots-là, des mots tels que passport, Hamburger et subway et quelques centaines d'autres qui ne figurent pas dans le précieux dictionnaire, probablement parce qu'ils sont rares dans les livres d'enfants et les conversations des amateurs de floriculture. Pour qui veut vivre 24 heures la vie américaine, ces mots ont un rang d'urgence bien en avance sur leur rang de fréquence. À qui part pour Londres sans savoir un mot d'anglais, j'enseignerai, parmi les premières centaines, ce mot rare et pédant, ce mot qu'il n'entendra jamais, ne prononcera jamais, ne lira jamais dans son journal mais dont l'ignorance risquerait de le ... dérouter dix fois par jour : EXIT.

Le principe même de la réduction du vocabulaire est-il moins critiquable que sa réalisation suivant les principes actuels ? Supposons que je connaisse mes 3 000 mots de base couvrant 95 % d'un texte normal. Cela signifie que, si je veux lire des textes variés pour personne de culture moyenne, par exemple un bon journal avec ses nouvelles politiques, ses faits divers, sa rubrique littéraire, ses annonces, etc., 95 mots sur cent seront de vieilles connaissances (- ou plus exactement des mots "déjà vus" ; sur les 95, combien se présenteront avec une acception ou dans un complexe inconnus ou mal connus ?). Mais cela signifie également que tous les vingt mots, j'en rencontrerai UN qui me fera achopper. Un mot inconnu toutes les deux lignes ! et, bien entendu, ce sera souvent le mot-clé de tout un paragraphe ! C'est proprement insupportable et je vais essayer d'améliorer mon vocabulaire "passif" pour n'être arrêté que toutes les dix lignes en moyenne, puis toutes les pages, etc. Or, maintenant que je suis sorti des 3 000 mots pour lesquels j'ai été guidé avec une grande sollicitude, me voici dans le noir ! Même dans cette zone supérieure, je voudrais bien savoir par où commencer et comment parer au plus pressé ! Alors, je serais très heureux d'avoir une liste qui prolongerait les bienfaits de la progressivité et me rapprocherait lentement mais sûrement de ce but très lointain : lire une colonne de journal sans être arrêté.

Peut-on concevoir un système moins décevant que le système actuel ? Nous allons tenter de le montrer. Les méthodes actuelles, qui se veulent pratiques, visent, au prix de travaux considérables, une perfection qu'elles n'atteignent pas et une précision dont elles ne s'approchent qu'en limitant absurdement leur champ d'action. Pourquoi ne pas leur substituer des méthodes qui paraîtraient imparfaites et imprécises à des statisticiens gagnés par la maladie moderne des décimales mais qui suffiraient amplement aux besoins de la pédagogie et de la pratique ? Posons encore la question, mais constructivement cette fois : de quoi s'agit-il ? Est-il nécessaire pour les enseignants de savoir que, par exemple, par cœur viendrait au 3 586e rang, soit 489 rangs après tout de suite ? Ne peut-on admettre qu'une quinzaine de modestes "tranches" soient suffisantes pour classer pratiquement les unités de langage d'une langue, dix environ étant utiles pour l'enseignement ? Or, il est possible de faire un tel classement rapidement avec un risque d'erreur moyen inférieur à deux tranches, ce qui est pratiquement plus que suffisant. Voici les expériences que nous avons faites à ce sujet.

 figure 1

 

 

 

Première expérience

 

Nous avons pris douze mots français s'étageant irrégulièrement depuis les mots les plus courants jusqu'aux zones déjà trop élevées pour l'enseignement de la langue courante. Nous les avons fait classer par 80 sujets sans entraînement spécial et sans culture poussée (des élèves, de la 5e (!) à la 1e). En notant les rangs attribués à chaque mot par les divers sujets, nous devions obtenir les "courbes en cloche", bien connues de ceux qui s'intéressent aux sondages d'opinion. Là où il y a grande diversité d'opinion, la cloche est aplatie. Plus on se rapproche de l'unanimité, plus la courbe est en chandelle. La courbe est irrégulière quand les esprits sont désorientés(1).

Instructions données aux sujets de l'expérience. - "Certains mots se rencontrent à chaque phrase (il, faire), d'autres se rencontrent rarement (métatarse). Vous allez avoir à classer ainsi une douzaine de mots d'après l'impression que vous avez de leur fréquence, de leur utilité ou, si vous voulez, de l'ordre d'urgence suivant lequel vous voudriez les voir enseigner à des étrangers. Il faudra vous placer à trois points de vue : parler - lire et écrire - vivre.

Parler : parlez-vous plus souvent d'argent que de monnaie (qu'on rend) ?

Lire et écrire : en parlant vous employez peut-être le nom frite plus souvent que le nom or (métal). Mais dans vos lectures ne rencontrez-vous pas plus souvent le mot or que le mot frite ?

Vivre : vous utilisez le mot table plus souvent que le mot sortie. Mais quand vous sortez ou voyagez, parmi les écriteaux que vous rencontrez, ne voyez-vous pas plus souvent le mot sortie que le mot table ?

Ne confondez pas le plus fréquent et le plus utile avec le plus élémentaire. Quatre paraît plus élémentaire et plus urgent que jour. Cependant, celui-ci (un beau jour, un de ces jours, ces jours-ci, nuit et jour) revient-il, moins souvent que quatre, qui peut être remplacé par un, deux, etc., dans, "nous étions quatre, quatre fois, etc." ?

Il ne s'agit pas non plus du plus facile à apprendre. Affrontable est plus facile que métaphore. Métaphore est plus fréquent.

En vous plaçant à ces points de vue et d'après votre "impression moyenne", mettez chaque mot à sa place dans une liste allant du plus fréquent (n° 1) au plus rare (n° 12). Avant d'arrêter votre liste, comparez bien chaque mot au précédent et au suivant.

Liste proposée. - Collyre, - il y a, - troène, - argent, - narcisse, - cuivre, - remorque, - coaxial, - (une) frite, - monnaie, - (il, elle) est, - faciès.

Résultats de l'expérience. - 1) La fiche donnée par chaque élève a été écrite de sa main même et porte son nom. Toutes les fiches ont été remises à M. Mossé, à l'intention de la Commission du vocabulaire.

2) Les élèves ont établi leurs listes par manipulation de fléchettes portant chacune un mot pour faciliter les interversions.

3) Pour éliminer les farceurs et les esprits anormaux, on a négligé pour l'établissement des courbes les rangs accordés à un mot donné par 1, 2 ou 3 sujets seulement sur 80. Ceci a amené à écarter 34 résultats sur 960, soit 3,5 %.

4) Figure 1. - Exemples de courbes en cloche théoriques. (A), cloche aplatie, (diversité d'opinions). Mot placé au 1er rang par 5 % des sujets, au 2e par 7 %, au 3e par 8 %, au 4e par 9 %, etc. (B). Courbe en chandelle (tendance à l'unanimité). Mot au 4e rang pour 5 % des sujets, au 5e pour 10 %, au 6e pour 70 %, au 7e pour 10 %, au 8e pour 5 %. (C). Cloche déformée (esprits désorientés).

5) Figure 2. - Les courbes résultant de l'expérience ont été réparties sur plusieurs graphiques pour être plus lisibles. Apprécier l'étroitesse relative de la base de chaque cloche comparée au segment de droite MN, courbe théorique de dispersion maxima.

 

 Figure 2

 

Conclusions de l'expérience

 

Elles sont très encourageantes ; les sujets étaient d'âge varié, sans grande expérience ni culture, ne s'étaient jamais posé le problème de la fréquence, n'avaient aucun entraînement. Cependant, les courbes décèlent une surprenante homogénéité : "chandelles" pour les quatre premiers et les deux derniers mots. Les sujets ont été gênés par l'ordre relatif à donner à frite et cuivre (écart moyen 0,3) ; par troène et faciès (écart 0,4) ; faciès et collyre (écart 0,4). Or, on n'a pas besoin d'une telle précision pour les besoins pédagogiques.

On peut donc conclure de cette expérience qu'en prenant la moyenne de l'impression de fréquence de trois ou quatre professeurs (habitués à sélectionner plus ou moins le vocabulaire à expliquer ou à annoter dans les textes ; ayant une culture beaucoup plus grande), on doit pouvoir classer les unités de langage en une dizaine de tranches avec une précision suffisante pour l'enseignement. Avant d'indiquer quel guide on pourra leur fournir pour rendre leur jugement plus facile et plus sûr, notons encore, au sujet de l'expérience précédente, les choses suivantes :

- Le classement moyen par 80 personnes inexpérimentées a correspondu sans aucune interversion au classement que nous avions personnellement fait "au sentiment".

- Le plus grand écart moyen (2, ce qui est énorme) est entre remorque et narcisse, l'un étant senti comme le dernier mot d'emploi courant, l'autre comme le premier des mots relativement rares. De fait, les mots présentés pouvaient facilement se séparer en deux blocs.

- Comme prévu, le mot troène a désorienté les sujets. Certains élèves de 12 ans le considèrent comme fréquent, certains de 20 ans l'ignorent complètement ! C'est la seule courbe vraiment irrégulière. Elle n'en a pas moins abouti à un classement moyen satisfaisant pour l'esprit.

- Il se peut que l'ordre obtenu "au sentiment" diffère de celui qu'on déduirait d'une liste de statisticiens (une liste qui tiendrait compte de la conversation et de la vie, ce qui ne semble pas avoir été le cas jusqu'ici !) et que pour certains mots il y ait une illusion collective. Est-ce si grave ? La pédagogie reflétera alors, non pas les faits, mais l'image mentale que les sujets parlants se font d'une langue. On peut prétendre que cette réalité humaine est plus intéressante que l'autre, qui restera cependant, bien entendu, la seule valable pour le savant.

Pourquoi ne s'est-on encore pas risqué à un tel classement sommaire "au sentiment" ? C'est parce qu'on a oublié la nécessité de points de référence. L'expérience qui suit va montrer que si l'on en donne à des gens inexpérimentés, ils deviennent capables d'établir avec un peu de réflexion un classement déjà fort satisfaisant. Ne peut-on donc pas attendre d'enseignants expérimentés et munis d'une échelle-type soigneusement composée (ce qui n'était pas le cas pour mon expérience !), qu'ils donnent rapidement et sans grande fatigue un jugement très suffisant pour nos besoins ?

 

 

 

Deuxième expérience

 

33 élèves de 4e (12 à 14 ans, exceptionnellement 15) ont eu au tableau la liste-type suivante :

1. (il) a - 2. merci - 3. argent - 4. monnaie . - 5. gâteau - 6. panne - 7. libellule - 8. hectométrique - 9. cadastral - 10. galaxie - 11. rhapsode - 12. payol,

définissant (très arbitrairement) 12 tranches de fréquence. On leur a demandé, en comparant de proche en proche aux mots de cette liste-type, de placer les mots ou expressions : brunir ; avilissement ; sapajou ; manger ; pêle-mêle ; à peu près ; partir.

Lorsqu'un mot semblait s'insérer entre deux numéros, il devait porter le numéro supérieur. On appréciera l'homogénéité des résultats en comparant le renflement des courbes et l'étroitesse de leurs bases au niveau de la droite MN, limite de la diversité d'opinions. Les résultats moyens ont été :

(1. a - 2. merci) - 2, 9 MANGER - (3. argent) - 3, 5 PARTIR - 3. 9 À PEU PRÈS - (4. monnaie - 5. gâteau - 6. panne) - 6, 2 PÊLE-MÊLE - 6. 5 BRUNIR - (7, libellule - 8. hectométrique) - 8, 8 AVILISSEMENT - (9. cadastral) - 9, 4 sapajou - (10. galaxie, etc.).

Étant données les constatations précédentes, comment pourrait-on procéder pratiquement ?

1° Établir en commission trois échelles-types pour chaque langue, une de mots concrets, une de mots abstraits, une d'idiotismes de base, divisant les unités de langage en 15 tranches dont 10 utiles, les 5 tranches plus rares servant uniquement à mieux situer les autres dans l'esprit des étalonneurs.

2° Donner à chaque étalonneur une dizaine de pages d'un dictionnaire ayant déjà plus ou moins fait le tri (ainsi, pour l'anglais, le Dict. Petit anglais-français, édition scolaire réduite). En effet, pourquoi recommencer entièrement un travail déjà dégrossi ?

3° A) L'étalonneur cherchera à compléter pour tous les mots qui lui semblent entrer dans les 10 premières tranches, la liste des idiotismes de base de son Dictionnaire. Ce sont les plus urgents qui ont été oubliés. Ainsi, on fire n'est pas dans le Petit.

B) En se plaçant au triple point de vue : parler, - lire et écrire, - vivre, et à la lumière de son expérience (MANUELS EXCEPTÉS), il comparera chaque unité de langage à l'échelle-type en allant de proche en proche. En cas d'hésitation entre deux tranches, il notera le numéro supérieur.

C) Les mots tels que all. Elefant, Etektrizität ; angl, elephant, electricity, d'assimilation facile et sans danger pourraient bénéficier d'une bonification d'un petit nombre (à débattre) de tranches. Il semble, en effet, que les tendances actuelles minimisent exagérément le rôle du vocabulaire passif. Cette bonification serait raisonnablement limitée pour que l'élève ne soit pas entraîné à se contenter d'un travesti de langue française (the sympathetic hero perished before the termination of the conflict).

D) La liste des unités de langage retenues sera dressée par ordre alphabétique (à la place du mot principal pour les locutions).

4° Chaque tranche de dictionnaire passera par 3 étalonneurs différents. Une liste définitive sera alors dressée où les mots porteront l'indice moyen avec une décimale. Ce résultat sera retenu purement et simplement. Les unités de langage citées par 1 ou 2 étalonneurs seulement seront passées à un 3e étalonneur. On saura ainsi approximativement (et que demandons-nous de plus pour les besoins pédagogiques ?) ce qui doit être enseigné en 1e, 2e, 3e, etc., urgence.

5° La Commission étudiera alors jusqu'en quelle tranche il est souhaitable d'aller dans les classes de 6e, 5e, 4e-3e, 2e, etc. Lorsqu'une tranche se révélera trop riche, on pourra, grâce à la décimale, diviser cette tranche en 2 ou 3 sous-sections.

6° On obtiendra ainsi une liste alphabétique de plusieurs DIZAINES DE MILLIERS d'unités de langage affectées d'un indice. Cette liste pourrait être imprimée et vendue par l'Imprimerie Nationale. Le professeur, l'examinateur évaluant la difficulté d'un texte, auraient ainsi un moyen de référence alphabétique rapide.

7° Il sera demandé à chaque étalonneur d'aiguiser son sens de la fréquence relative en faisant quelques exercices (livrés avec clés) basés sur les listes de statisticiens existantes.

 

 

 

En conclusion, bien que sans valeur scientifique, le classement "au sentiment" établi contradictoirement par trois enseignants expérimentés au moyen d'un étalonnage-type doit être pédagogiquement très suffisant. Comme il ne demande ni grands calculs, ni tabulations, on peut le pousser sans engager des sommes astronomiques de travail et d'argent jusqu'à des zones où le dépouillement scientifique serait impraticable mais où l'utilité encore très grande d'une progression fera oublier les imperfections éventuelles, réduites dans l'ensemble à une proportion négligeable. Enfin, ce sera une des nombreuses revanches que le bon sens et le sens pratique devront prendre bientôt, dans de nombreux domaines, sur l'esprit de statistique qu'il convient de dominer, tout en admettant de bonne grâce sa réelle utilité là où il est possible d'isoler et simplifier les phénomènes à comptabiliser sans déformation et sans absurdité.

 

Note

 

(1) Certains instituts de sondage d'opinion se sont quelque peu discrédités récemment. Cela tient à l'imperfection de leur technique d'échantillonnage, car ils doivent rendre compte de l'opinion d'un immense groupe donné en ne consultant qu'une fraction infinitésimale, mais scientifiquement choisie, de ce groupe. Ce délicat problème ne se pose pas dans les expériences qui suivent.

 

 

Pierre Henrion, in Les langues modernes, Paris n° 43, 1949, pp. 238-245

 


 

 

Texte soumis aux droits d'auteur - Réservé à un usage privé ou éducatif.