L'enrichissement du vocabulaire : fréquence lexicale

Détails: Écrit par : SH; Publication : 15 juin 2022; Création : 15 octobre 1996; Affichages : 2719

L'enrichissement du vocabulaire : suite 2 de la mise en ligne

C. Autour du French Word Book d'Henmon : autres listes de fréquence

1. Par extension du corpus

a) Le French Word Book de George E. Vander Beke

Vander Beke poursuit la tâche commencée par Henmon et ses collaborateurs, mais en lui donnant de l'ampleur^[1]. De plus, il introduit la notion de range (répartition), c'est-à-dire qu'il tempère la fréquence absolue d'un mot par le nombre de sources différentes où il a été rencontré. Vander Beke obtient ainsi 19 253 mots différents, et il retient les 6 067 premiers^[2]. Son index hiérarchique est d'ailleurs listé non par fréquences décroissantes, mais selon le range obtenu ; soit de quelque rencontré dans 85 unités (sur 88), à zéro rencontré dans 5 unités seulement. En réalité, il semble y avoir un rapport très étroit entre fréquence absolue et range, au moins pour ce qui concerne son corpus. Vander Beke a en effet calculé, pour les mille premiers mots de sa liste, un indice de corrélation de .77 entre ces deux paramètres^[3].

Son corpus est sans doute mieux choisi que celui d'Henmon, et pris dans des textes moins dispersés dans le temps. Ce qui entraîne qu'un certain nombre de mots d'Henmon, 123 très exactement, n'ont pas été retenus dans la recherche de 1926^[4]. Pour l'essentiel, il s'agit de mots que le sens commun considérera, en parcourant la liste Henmon, comme trop spécialisés ou vieillis (ammophile, bailli, baobab, bourriquet, somnambulisme, turban...). Henmon fut d'ailleurs le premier à reconnaître le mérite de son successeur. Comparant les deux listes, il écrit en effet, à propos de la sienne : "My less adequate Word Book". L'ouvrage de Vander Beke, non pas impossible mais très difficile à trouver^[5], a servi de point de départ à nombre de travaux rappelés ici. Il mériterait amplement d'être réédité selon le principe bien connu des reprints.

b) Le Trésor de la langue française

C'est enfin une recherche extensive française, d'une ampleur inégalée, tant au plan du volume de textes dépouillés (près de 71.000.000 d'occurrences) que sur l'étendue des dates de parution (de 1789 à 1960, soit "de Siéyès à Sartre"). Elle a été effectuée (essentiellement à partir de documents ‘littéraires’) avec les moyens modernes de l'informatique dans les années 1970. On sait que ce travail est doublé d'une édition, en cours, d'un dictionnaire^[6] d'une richesse inouïe, malheureusement peu connu^[7].

2. Par resserrement du corpus

a) Dans les dates de parution : A. Juilland

La parution du Dictionary of French Words répond à de nombreux vœux, comme par exemple ceux exprimés il y a fort longtemps par S. Roller, qui souhaitait un effort de rationalisation de l'enseignement orthographique prenant en particulier en compte le travail sur les vocabulaires fondamentaux et l'orthographe grammaticale^[8]. Cette enquête intensive a bénéficié elle aussi des moyens modernes aujourd'hui à notre disposition. Son immense intérêt, pour le pédagogue de terrain, est, entre autres, d'avoir recensé les formes verbales les plus usitées^[9]. Cet aspect de la fréquence linguistique constitue, à notre avis, un outil qui devrait être davantage connu, et utilisé.

Juilland, nous l'avons déjà écrit, ne retient pas comme argument, contre le travail d'Henmon, le petit nombre d'occurrences recensées. Il lui reproche davantage la mauvaise représentation des différents types d'écrits^[10], l'absence de distinction entre les homographes^[11], mais encore les erreurs de regroupement des formes rencontrées^[12]. Il donne en particulier l'exemple de passe. Est-ce un substantif, comme dans mot de passe ? Est-ce un verbe, mais alors que de nuances entre :

- il passe par ici
- je passe mes vacances
- passe-moi le sel
- elle passe une robe
- je me passe de ton aide^[13]

Il resserre donc les dates de parution (1920-1940), sélectionne dans un premier temps 3 078 ouvrages, ou publications (dont une cinquantaine d'extraits des domaines scientifique et technique) relevant de 543 auteurs, puis effectue un tirage au sort au terme duquel 300 ouvrages, environ, sont retenus. Ensuite, par nouveau tirage au sort, il procède à l'extraction aléatoire de phrases du corpus. À la suite de ses relevés, il conserve tous les mots de fréquence absolue supérieure ou égale à trois, soit 5 082. Pour rendre plus aisées les comparaisons auxquelles il se livre par la suite (dix classes de cinq cents mots), il néglige les 82 derniers mots, et travaille en définitive sur un ensemble de 5 000 mots, représentant 464 134 occurrences (ce qui équivaut à peu près, on le voit, au corpus d'Henmon).

C’est pourquoi on trouve plusieurs entrées, pour un même mot. De plus, A. Juilland donne pour chaque verbe la fréquence des flexions rencontrées. Signalons au passage que le travail de N. Catach, Les listes orthographiques de base du français (LOB)^[14] s'appuie essentiellement sur le Frequency Dictionary of French Words de Juilland^[15].

b) Dans le choix du corpus

(1) B. Wood

Ben D. Wood^[16] analyse le vocabulaire de seize livres de français. Il recense ainsi 6 000 mots différents, dont 134 seulement sont communs aux seize ouvrages^[17], mais 500 à plus de douze d'entre eux. À l'aide des 2 683 mots communs à quatre ouvrages, au moins, il constitue une ‘Wood List’, et la compare à celle d'Henmon : 80 % de sa liste se retrouve chez Henmon ; et un calcul de corrélation effectué sur les fréquences respectives des 2 159 mots communs atteint .70. Wood tire deux conclusions : il est certes utile d'établir des vocabulaires ‘standards’, mais le jugement des auteurs de manuels, sans soutien d'une liste de fréquence quelconque (et pour cause), est tout de même solide.

(2) M. Blackburn

Margaret Blackburn^[18] quant à elle, compare le vocabulaire de deux grammaires éditées avant la parution de l'ouvrage de Vander Beke^[19] (en 1925 et 1927), au regard des 6 000 premiers mots de son index. Elle obtient :

- Grammaire Cardon, 2 388 mots différents pour 49 350 occurrences relevées (dont 464 hapax^[20], et 1360 mots apparaissant moins de cinq fois).
- Grammaire Béziat, 2 051 mots différents pour 58 140 occurrences relevées (dont 246 hapax, et 984 mots apparaissant moins de cinq fois). Première conclusion : meilleur ratio pour l’ouvrage de Béziat (higher rating).

Elle en vient à rapprocher les mots apparaissant cinq fois et plus dans chaque grammaire. Il s'agit à peu près, dans les faits, des mille premiers mots de chacune. Blackburn liste ensuite des mots "choisis subjectivement" qui apparaissent dans Béziat ou Cardon, et ne figurent pas dans Vander Beke. Elle les nomme "belonging particularly to conversational style" (p. 437), et aussi "frequently employed in ordinary speech" (p. 439), mais encore "words highly useful for every day purposes" (id.), soit 92 (sur 432 hors VdB) pour Cardon, et 49 (sur 342 hors VdB) pour Béziat^[21].

Cependant, comme pour la liste de B. Wood, si 80 % des mots utilisés dans l'une et l'autre grammaires figurent chez Vander Beke, nombre d'entre eux n'appartiennent pas aux trois sources à la fois : 44 % des mots de Cardon ne figurent pas dans Béziat, et à l'inverse 35 % des mots de Béziat n'appartiennent pas à Cardon.

Dès lors, M. Blackburn estime qu'on peut difficilement penser que les mots utilisés pour la confection de manuels à l'usage des débutants feront partie du vocabulaire actif des élèves en fin de première année d'études. C'est pourquoi elle engage les auteurs de manuels à mieux respecter les listes de fréquence, au moins s'agissant des mille mots les plus fréquents.

(3) J. Fotos

John T. Fotos^[22], enfin, reprend et amplifie le travail précédent, tout en engageant une discussion autour de l'utilité des listes de fréquence, à partir des travaux de Vander Beke et Cheydleur^[23]. Beaucoup plus sévère, pour sa part, que dans l'étude précédente^[24], Fotos a comptabilisé les mots employés dans les neuf grammaires (à l'usage des étudiants américains débutants en français) les plus utilisées dans les années 1930 aux États Unis. Il recense ainsi 3 951 mots, dont plus de la moitié sont des hapax (2 139, soit 54,13 %) et dont près du quart apparaissent deux ou trois fois seulement (936 mots, soit 23, 7 %). Reste un cinquième des mots utilisés quatre fois et plus (876, soit 22, 2 %). Il constate donc que la plupart des ouvrages scolaires pour débutants utilisent un vocabulaire trop extensif^[25]. Comme il l'écrit, "the result of this count shows how arbitrarily each grammar introduced words which are seldom met either in the written or spoken langage"^[26]. Il estime difficile d’envisager qu'ils sont appelés à faire partie du vocabulaire actif d'élèves en première année d'étude du français. Sa conclusion est qu’il convient de mieux respecter les acquis des listes de fréquence, au moins pour les mille mots les plus fréquents de la liste d'Henmon^[27], qu'il enrichit d'ailleurs de termes qu'on qualifierait aujourd'hui de disponibles ("words of the home and the school").

(4) D. Prescott

Tandis que les trois auteurs précédents s'appuient sur des manuels scolaires, Prescott^[28] dépouille un corpus de mots connus des enfants. Il souhaite par là :

- établir expérimentalement quels sont les mots couramment en usage parmi les écoliers (genevois) de sept à treize ans
- étudier le développement progressif du vocabulaire d'année en année ;
- noter les différences entre les sexes ;
- évaluer ce vocabulaire par rapport à celui qu'exige une lecture d'adulte ;
- comparer ce vocabulaire à celui des livres de classe.

Prescott travaille sur une population d'environ sept cents élèves, répartis en sept groupes d'âge. Il la soumet à un "test de libre association" (écrire le maximum de mots en quinze minutes)^[29]. Plus de 77 000 mots ont ainsi été recueillis (dont 352 écrits par 50 enfants au moins). Prescott nomme mots connus ceux qui sont donnés par deux enfants, au moins. Il obtient ainsi un ensemble de 3 482 mots différents, qu'il confronte à la liste d'Henmon.

D'une part, il remarque que le pourcentage du vocabulaire connu de ces écoliers, et ne figurant pas chez Henmon, croît avec leur âge, passant de 36 % (sept ans) à 53 % (13 ans). Par ailleurs, le contenu même de la liste, qui n'est connu qu'à 7 % à sept ans, l'est à 41 % à 13 ans.

Du premier fait, il tire la conclusion que l'accroissement du vocabulaire de l'enfant s'effectue largement à l'aide de vocables "qui ne sont pas d'usage courant dans les écrits académiques : ... les enfants développent un vocabulaire indépendant des exigences de l'école, qui est de plus en plus riche".

Le second révèle, selon lui, l'incontestable croissance de la maîtrise du vocabulaire permettant de "comprendre la prose et la poésie des adultes" ; mais, pour autant, ce vocabulaire n'est peut-être "pas assez riche pour permettre la pleine appréciation littéraire des œuvres des maîtres"^[30]. Avec beaucoup de modestie, Prescott pense que son travail peut seulement être utile à l’enseignant désireux de faire progresser ses élèves, et aux auteurs de manuels^[31].

(5) S. Ehrlich

Stéphane Ehrlich et ses deux collaboratrices entreprennent de rassembler des informations sur les compétences lexicales des enfants en scolarité élémentaire^[32]. On ne peut répondre de façon pertinente aux questions ‘que faut-il ?’ et ‘que peut-on apprendre aux enfants ?’, écrivent-ils, que si l'on possède des renseignements sur ce qu'ils savent déjà^[33]. Car leur visée est "le problème de l'inégalité des chances de l'enfant"^[34].

Les auteurs partent d'un échantillon de référence de 13 500 entrées tirées du Dictionnaire du Français Contemporain^[35]. Ils font classer ces mots par des adultes 'cultivés' (des étudiants en première année d'Université) dans une échelle de connaissance à cinq échelons^[36]. Par tirage au sort, ils en extraient une échelle-test ( comprenant 2 700 entrées), en respectant le pourcentage des différentes classes grammaticales^[37], et en sur-représentant les mots les mieux connus des adultes^[38]. Ces mots ont alors été présentés à des enfants d'âge scolaire élémentaire^[39]. Les jugements de connaissance exprimés par les écoliers sur l'échelle-test ont alors été projetés sur l'échantillon de référence (de 13 500 mots). Et les auteurs appellent mots connus des enfants, ceux "dont les significations peuvent être explicitées dans une production verbale"^[40].

Les enseignements de cette enquête nous paraissent d'une importance capitale. Retenons quelques-uns d'entre eux :

- "Le vocabulaire fréquemment utilisé varie assez peu au cours de la scolarité primaire, mais [...] les enfants apprennent beaucoup de mots nouveaux dont la plupart ne sont pas utilisés très souvent"^[41]. L'enrichissement lexical est d'environ 3 000 mots, du CE1 au CM2^[42] : l'enfant apprend à connaître durant cette période presque autant de mots que durant les six ou sept années précédentes^[43].
- Cette période scolaire est davantage marquée par une extension du lexique que par un approfondissement intensif de celui-ci : les enfants sont mis au contact et familiarisés superficiellement avec un grand nombre de mots qu'ils ne connaissaient pas auparavant ; en revanche, le nombre de mots vraiment bien connus et susceptibles d'être définis augmente beaucoup moins rapidement^[44].
- "Les différences entraînées par l'origine socio-économique des enfants se maintiennent au cours de la période scolaire considérée"^[45] : c'est sans doute un entraînement moins extensif qu'intensif qui pourrait contribuer à réduire l'écart^[46].
- Le niveau atteint étant encore loin de celui de l'adulte, il y aurait "nécessité de prolonger jusqu'à quinze ans et au-delà les activités linguistiques capables d'entraîner un enrichissement de la langue"^[47].

Enfin, les auteurs dressent un Dictionnaire génétique des significations de 1 670 entrées^[48], malheureusement complètement inconnu dans le monde pédagogique.

Ce qu’il nous paraît nécessaire de retenir de l’ouvrage d’Ehrlich, c’est que l’école se doit d’aider l’enfant, mieux qu’elle ne le fait actuellement, à structurer la langue dont il a besoin pour s’exprimer, et ce en particulier autour de l’expérience qu’il reçoit du dehors. Nous n’entrerons pas dans une discussion sur le développement cognitif de l’enfant, qui serait d’ailleurs hors de propos ici. Nous ferons toutefois remarquer que la fonction langagière est une composante capitale de ce développement, et qu’elle nécessite apprentissage (dans la sphère familiale, tout d’abord) puis perfectionnement, dont il est question ici. L’interaction monde extérieur/enfant fait naître la motivation, et ainsi suscite le besoin de s’exprimer et de comprendre. L’une des missions de l’école est d’accompagner ce développement, de le favoriser en apportant le pouvoir de structuration dont l’expérience immédiate a besoin pour être intégrée. Cette structuration, dont les pages extraites du Plan Rouchette^[49] indiquent quelques lignes de force, s’effectue donc à l’occasion d’une interaction enfant/maître. Les exemples que nous développons infra, à partir de la page 132, sont tous consacrés à cette phase, nécessaire au développement optimal des aptitudes langagières de chacun.

3. Par la prise en compte des expressions idiomatiques

L'ouvrage de F. Cheydleur^[50] apporte un complément bien intéressant à ceux d'Henmon et de Vander Beke. Discutant, au départ, les erreurs de regroupement commises par Henmon^[51], Cheydleur estime nécessaire de recenser les locutions propres au français, ce que nous appelons des gallicismes. A partir de 87 sources différentes^[52] ayant produit 1 183 149 occurrences, Frédéric Cheydleur propose, dans sa French Idiom List, 1 724 idiotismes, en fonction du range (ceux rencontrés dans trois unités de texte, au moins). Un exemple suffira à montrer la richesse de cette étude : pour le seul verbe avoir, pas moins de 65 expressions idiomatiques sont listées^[53] :

il y a (du pain sur la planche)	il a besoin de	il a peur de
il a raison	il y a trois jours	il a lieu aujourd'hui
il a l’air de penser	il a cinquante ans	il a beau crier
il a tort	il a envie de	il a quelque chose
il a l’air (fier)	il a l’air d’un enfant	il y a (cinq ans) que
il a peine à	quel âge a-t-il ?	il a l'intention de
il a pitié de	il a soif	il a froid
il y a quelque chose	il a de la chance	il a mal à la tête
il a honte de	il a lieu de	il a chaud
il a soin de	il a l'habitude de	il a tort de
il a affaire à	il y a de quoi	il a plaisir à
il a affaire avec vous	il a hâte de	il a de la peine (à comprendre)
il a connaissance de	il a l'occasion de	il a le temps
il a raison de (quelqu'un)	il a sommeil	il a trois mètres de haut
il a bonne mine	il a conscience de	il a de l'esprit
il a de quoi (vivre)	il a l'obligeance de	il a du cœur
il a les yeux bleus	il a recours aux larmes	il y a beau temps (long ago)
il a à cœur de	il a coutume de	il a la prétention de
il a un rendez-vous	il y a un peu de fraîcheur	il n'y a pas de quoi
il y a lieu de	il a la bonté de	il a soin de
il n'y a qu'à	il a conscience que	il a des égards pour
il a le vin gai	il a moyen d'(accomplir cela)

Tableau 4. Les idiotismes formés à partir du verbe avoir (F. Cheydleur).

Nous ajouterons aussi la liste des négations relevées par Cheydleur^[54].

LIST F NEGATIVES
Gallicismes	Équivalents anglais	Range	Fréquence
ne...que	"only", "nothing but"	82	1 426
ne...plus	"no more, "no longer"	81	1 121
ne...rien	"not anything", "nothing"	77	1 111
ne...jamais	"never"	71	689
ne...pas	"not"	68	7 267
ne...personne	"no one"	61	225
ne...aucun	"no", "none", "not any"	59	283
ne...plus que	"only"	46	118
ne...guère	"scarcely"	42	98
ne...point	"not at all"	41	454
ne...ni...ni	"neither...nor"	30	113
ne...guère que	"scarcely but"	26	53
ne...jamais que	"never but"	18	114
ne...rien que	"nothing but"	16	16
ne...nul	"no", "none"	13	17
ne...nullement	"not at all", "none"	8	12
ne... plus du tout	"not at all"	8	9
ne... plus rien	"nothing more"	6	9
ne...nulle part	"nowhere"	6	6
ne... pas que	"not only"	5	12

Tableau 5. Les négations (d'après F. Cheydleur).

4. Par l'analyse de la langue orale

a). F. Baker

Dans un article publié en 1928^[55], Florence Baker recherche l'efficacité du premier contact, dans les high schools and colleges américains, avec notre langue. Soulevant de nombreuses difficultés que présente, selon elle, le travail d'Henmon, elle introduit aussi, bien avant les promoteurs du Français Fondamental^[56], la notion de disponibilité pour compléter celle de fréquence. Comme d’autres, elle souhaite qu'on cesse de faire étudier les mots "that are not greatly in demand", pour mettre l'accent sur le vocabulaire de tous les jours ; car elle constate que l'étude des très nombreux mots "choisis arbitrairement" par les auteurs de manuels, ne sont pas en fin d'année scolaire connus, mais seulement familiers aux élèves ; et elle nomme vocabulaire passif (passive vocabulary), ou encore "bois mort", tous les mots que les étudiants ont "on the tip of the tongue", sans jamais pouvoir les utiliser. Aussi pense-t-elle que la connaissance forte de quatre centaines de mots suffit pour la première année d'étude, en plus de ceux qui ont quasiment la même forme dans les deux langues^[57]. Le critère de choix lui paraît être la notion de fréquence^[58], tempérée par la notion de disponibilité, qu'elle retient près de trente années avant la redécouverte de ce concept par les auteurs du FF ; elle la nomme association: jours de la semaine, mois, nombres, lexique de la classe, de la nourriture... Elle l'introduit d'une part après avoir dépouillé des rédactions (en anglais et français) de jeunes élèves, mais aussi après avoir noté les mots apparaissant le plus souvent dans les conversations libres ayant lieu pendant les cours de français^[59].

b). Le Français élémentaire

On aura peine à imaginer, guère plus de quarante années après les faits, l'extraordinaire polémique qui accompagna l'élaboration du français fondamental^[60], et la qualification de ‘démolisseurs de la langue française’ opposée à ceux qui poursuivirent cette tâche, et la menèrent à bien. Il s'agissait pourtant d'une commande ministérielle, répondant à un vœu émis par l'Unesco : diffuser rapidement, dans les pays les moins ‘évolués’, les notions les plus simples d'hygiène, de justice, de morale et de culture ; permettre un dialogue, même rudimentaire, avec tous, "car les études américaines sur la fréquence des formes françaises sont calculées sur l'écrit, et ne sont donc guère utilisables pour la conversation banale"^[61]. La raison de la prise en compte du parler oral, comme base d'étude, l'article du Monde nous la rappelle, comme tout ce qui a été rapporté jusqu'ici dans cet opuscule : jusqu'au milieu des années cinquante, les seules études concernant la fréquence lexicale de notre langue avaient été entreprises outre-Atlantique, et le matériau était le livre.

On dépouilla donc une centaine de sources orales^[62], recueillant ainsi 312 135 occurrences, dont 7 995 mots différents. Il fut décidé d'arrêter la liste à la fréquence 29 (et à la répartition 5, ce qui donnait environ 800 mots), d'en éliminer un certain nombre d'interjections ou de synonymes proches^[63], puis de l'enrichir de mots usuels ayant de très basses fréquences. Ce fut l'introduction de la notion de disponibilité, effectuée à l'aide de seize centres d'intérêt (parties du corps, aliments, jeux et distractions...), qui permit d'augmenter, de moitié environ, la liste obtenue primitivement grâce à la notion stricte de fréquence dans la langue parlée. Ainsi prit naissance le Français fondamental 1er Degré, comprenant 1 475 mots^[64].

5. La notion de fréquence : oppositions et critiques

Le principe même de l’établissement d'une hiérarchie dans les mots utilisés, et donc de la nécessité d'instaurer un ordre d'acquisition, a été sévèrement critiqué, et ce dès la parution de l'opuscule d'Henmon : nous avons jusqu'ici, chemin faisant, noté telle ou telle objection provenant de tel ou tel chercheur désireux d'améliorer le principe de constitution des listes. Il convient de nous arrêter d'abord sur les vives oppositions que rencontra Henmon, au sein même de son Université.

a). L. Gay

Lucy Gay^[65], une collègue d'Henmon à l'Université du Wisconsin, exprime en 1928 la critique la plus violente et la plus radicale du French Word Book et, par avance, de toute entreprise de ce type (le comptage des occurrences, et la constitution d'un index hiérarchique), qu'elle qualifie de "stupide (fatuous) perte de temps". Elle commence par se gausser des suggestions de Wood^[66] au sujet du remplacement de termes obscurs (recondite) utilisés dans les manuels, et ne figurant pas dans la liste d'Henmon, par des mots plus fréquents. Faudra-t-il donc remplacer, s'écrie-t-elle, jeudi, automne, mai, retard, trouvés dans le corpus de Wood, mais non inclus dans la liste Henmon, par des mots comme appétition, ammophile, conduction, graticule, boabab, qui en font partie ? Elle ajoute sarcastiquement : "Nous pensions que la bataille pour l'enseignement d'une langue d'aujourd'hui comme une langue vivante avait été gagnée depuis fort longtemps"^[67].

Elle met également en cause les ouvrages dépouillés par Henmon : doit-on donner deux fois plus d'importance à nain (66 occurrences) qu'à pain (33 occurrences) ? Faut-il préférer nain à pain ? Dans tous les cas, c'est le sens commun qui doit décider, et non le recours à une liste de fréquence. À ses yeux, il serait très triste pour l'éducation que la standardisation l'emportât sur l'acte d'enseigner : la première question que l'on doit se poser à propos d'un texte, n'est pas celle de la fréquence des termes qu'on y trouve, mais bien si son contenu est propre à enrichir celui qui est destiné à le lire.

L. Gay cite enfin de nombreux exemples d'erreurs typographiques^[68] et de lemmatisation^[69], et conclut en affirmant qu'un auteur de manuel a beaucoup mieux à faire qu'utiliser les listes de fréquence : simplement, il lui suffit de consulter Le Petit Larousse. Curieusement, c'est l'opinion qui sera exprimée un quart de siècle plus tard, à propos de l'élaboration du Français Fondamental, par un éditorialiste du Figaro^[70].

Dans un article publié en février 1930^[71], V.A.C. Henmon rappelle quels sont les objectifs de la constitution des listes, ainsi que trois de leurs usages. Il se livre à un tour d'horizon concernant la notion même de fréquence, dont il fixe sans détours les limites en remettant d'entrée les choses à leur vraie place : "A frequency list is not a canonical list, nor has anyone seriously proposed that it should be so regarded"^[72]. Il s'essaie ensuite à un mea culpa concernant son propre travail, qu'il critique en soulignant l’intérêt du range, introduit par son continuateur Vander Beke, et la valeur du travail accompli par ce dernier, comme de celui de F. Cheydleur. S'élevant au passage contre le caractère prégnant de l'enseignement de la grammaire, qui trouve son utilité en soi, il note que les débutants ne peuvent acquérir les 250 000 mots d'une langue moderne, et que l'hétérogénéité des vocabulaires utilisés par de récents manuels a été amplement démontrée : il convient de mettre de l'ordre dans cette ‘Tour de Babel’. Citant les conclusions auxquelles parvient Ben D. Wood^[73], il indique s'être personnellement livré à un comptage portant sur douze ouvrages très répandus s'adressant aux débutants : 4 500 mots différents recensés, dont seulement 448 appartenant à toutes les sources.

Il indique, en faisant allusion à la recherche de Prescott, qu'il y a sans doute nécessité d'ajouter, au comptage de mots du discours écrit, des termes "de la maison et de l'école". Mais, selon lui, le travail de base des relevés doit rester la langue écrite, qui nous donne les "really important words".

b). G. Duhamel

Cet écrivain, injustement oublié de nos jours, oppose des réserves modérées au projet du Français fondamental, tout en admettant son caractère de première base. Dans un article du Monde^[74], intitulé Le choix de la difficulté, il se propose de "lever quelques ambiguïtés après une conversation avec [son] ami Marcel Abraham"». Il s'agit au principal, écrit-il, "d'établir un manuel bien fait, à destination de populations peu évoluées, et aussi une méthode permettant à ces populations d'apprendre le rudiment sans trop de faux-pas et d'expériences inutiles". Donc, "si je laisse de côté les élèves du premier Degré et les populations encore incultes, si je m'adresse à des sujets qui ont pour ambition non pas de se dépasser [Duhamel vient de faire une comparaison avec le sport], mais au moins de se connaître et de cultiver leurs vertus, je dirai donc aux autres : «Apprenez la langue française, justement à raison de l'effort intelligent qu'elle exigera de vous [...]. Travaillez donc. Vous aurez l'esprit plus agile, le jugement plus ferme, le regard plus assuré...»".

c). P. Gaxotte

L'éditorialiste du Figaro partit en guerre, avec un humour féroce, contre l'enquête conduisant au Français fondamental. Nous n'hésiterons donc pas à reproduire un de ses articles. Le lecteur fera la part de l'indignation réelle et de la plus évidente mauvaise foi, tout en saluant le talent de l'ardent polémiste.

UNE GROSSE FARCE^[75]

"Enfin ! Le français comprimé de MM. Abraham, Benveniste, Sauvageot et Gougenheim est né sous la forme d'un vocabulaire de 1 138 mots, précédé d'une préface assez pompeuse de M. le Ministre André Marie.

Ces 1 138 mots ont donné bien de la peine à nos messieurs. Au commencement fut une commission de trente et un membres composés de quatre Inspecteurs Généraux [...], de divers autres sous-Directeurs, professeurs et Inspecteurs moins importants. Cette commission a donné naissance à un centre d'étude qui s'est installé à l'école Normale de Saint-Cloud ; [Une vingtaine de professeurs] ont mis en batterie un certain nombre de magnétophones qui ont enregistré (on ne dit pas où) cent soixante-trois conversations d'une durée non précisée.

Ces cent soixante-trois conversations ont nécessité l'emploi de huit mille mots différents, dont les enquêteurs ont établi la liste et la fréquence. Il ne restait plus qu'à retenir les 1 138 premiers, les plus employés, pour posséder le vocabulaire parfait du français parlé.

Hélas ! Avec une inquiétude qu'elle ne cherche pas à dissimuler, la haute Commission s'est alors aperçue que les magnétophones avaient enregistré certains vocables d'un emploi fréquent mais peu recommandables (hors les occasions héroïques, au soir d'une défaite) mais, qu'en revanche, les cobayes officiels n'avaient pas prononcé, du moins avec la fréquence convenable, un certain nombre de mots très importants et très utiles, tels veston, épicerie, timbre et autobus. La méthode statistique était par terre et le coup eût été mortel si M. Michéa, professeur d'allemand au Lycée de Périgueux, n'avait été visité par le génie. Il imagina la théorie profonde de la disponibilité venant au secours de la fréquence : le mot disponible étant celui qu'on n'emploie pas très souvent, mais qu'on garde en réserve pour le cas où l'on en aurait besoin.

La disponibilité s'est aussitôt concrétisée en seize ‘centres d'intérêt’, lesquels..., judicieusement orientés, ont permis de boucher les vides dûment constatés... Après quoi, les quatre Inspecteurs Généraux, le Ministre plénipotentiaire, les Directeurs, les professeurs et sous-Directeurs ont écrit : nuit, jour, blanc, noir,..., cœur, ventre, jambe, pied. Ils ont écrit aussi : chemise, robe, ..., chaussette, bouton, en renvoyant au cours supérieur : caleçon, lacet et soulier.

M. Marie rappelle dans sa présentation que le vocabulaire de Racine ne comporte que mille deux-cents mots. Cette remarque est hors de propos, parce que le vocabulaire de Racine est celui du sentiment, et qu'avec onze cents mots il est infiniment nuancé. Le français de ces messieurs embrasse tous les domaines, c'est-à-dire qu'il est insuffisant dans tous. Pourquoi ont-ils admis : caoutchouc, et pas pneu ? ... Vendre, et pas propriété ? Pourquoi ont-ils omis les noms des quatre opérations ? Pourquoi ont-ils écarté : bonheur, joie, charité, honneur, obéissance, prière, volonté, peuple, nation, patrie ? En revanche, ils n'ont pas oublié : police et juge. Est-ce l'amorce d'une sociologie ?

Ce vocabulaire, n'importe quel maître d'école enfantine, en feuilletant un dictionnaire et en notant au passage les mots usuels, les mots d'initiation, aurait pu le faire et l'aurait fait mieux^[76]. C'est pourquoi j'incline à croire que le français [de ces messieurs] ... est une farce qu'ils ont montée à leur ministre, une farce énorme, un canular géant, dans la bonne tradition de l'humour universitaire, c'est-à-dire solennel et scientifique. Ce qui me confirme dans cette idée, c'est que le vocabulaire qui doit arracher quelques millions d'hommes à leur isolement spirituel ne permet pas de lire la propre prose de M. Marie. J'ai essayé : il n'en surnage que quelques mots. Et même pas République !".

d). M. Cohen

Le linguiste français Marcel Cohen écrivit, avec quelques collaborateurs, un brûlot d'une violence inouïe contre l'entreprise du Français Fondamental^[77]. Sans doute ce libelle n’est-il pas vraiment adossé à des arguments strictement linguistiques^[78] ; mais il constitue pourtant un solide examen critique (en particulier s'agissant de la partie ‘grammaire’ du français élémentaire), non dénué de pointes d'humour. L'auteur, d'habitude mieux inspiré^[79], met sa science linguistique au service de sa passion politique.

Songeant d'emblée "aux usages militaires vraisemblables du français élémentaire" (!), il entreprend de "décortiquer sous la loupe l'objet offert" [la brochure FF, publiée en juillet 1954], au nom des linguistes "restés en dehors de toute responsabilité ou compromission dans cette affaire, soucieux du meilleur usage comme du meilleur apprentissage de la langue française, comme instrument de communication et de culture"^[80]. Doutant fortement que le Français Fondamental soit véritablement "une loyale et honnête base de départ pour des développements ultérieurs" [selon les termes du ministre André Marie], Cohen objecte, à propos de la disponibilité, que le choix des seize centres d'intérêt n'a pas été expérimental ("la méthode [...] est en grande partie du trompe-l'œil"). Il donne des exemples de mots ou de tournures qu'il ne trouve pas dans le FF, mais que l'évocation d'autres centres d'intérêt (il cite jour de fête, récréation, jour de deuil) aurait, pense-t-il, fournis^[81].

Il reconnaît pourtant un mérite - "tout négatif, d'utile garde-fou" - à cette liste de mots "usuels ou assez usuels", celle de prévenir les fautes pédagogiques des auteurs de manuels, de leur éviter la production ‘d'insanités’. Il n'en reste pas moins, selon lui, que "même pour des besoins très restreints, elle est tout à fait insuffisante"^[82]. C'est pourquoi il conclut en estimant que cette "entreprise destinée en partie aux jeunes nègres [est un] monstre [...], une opération de mauvaise politique sociale"^[83].

Quant à G. Serbat (l'auteur de la seconde partie de l'ouvrage), il a raison de souligner que le procédé de constitution de la liste n'est pas neuf ; mais c'est au moins à F. Baker, qu'il faut remonter, non à Prescott, comme il le fait. En tout état de cause, Serbat pose deux questions capitales :

- peut-on fonder l'enseignement d'une langue sur sa seule expression orale ?^[84]
- pourquoi avoir éliminé les mots abstraits ?^[85]

Et il se livre, par ailleurs (pp. 54-56), à un examen critique solide des notions de disponibilité et de fréquence.

En définitive, il estime que trois éléments expliquent la confection de cette liste :

- la rivalité franco-anglaise
- le réflexe colonialiste
- l'usage militaire

Pour terminer cette présentation, nous rappellerons que Marcel Cohen, par ailleurs, souhaitait que le français devînt la langue de la "population laborieuse du pays"^[86]. Ce souhait, c'est précisément, selon nous, le même que celui qui habitait les chercheurs se préoccupant de fréquence lexicale. Il faut savoir raison garder : ils n'ont jamais été à la solde de "politiciens qui se soucient de la culture française comme de leur premier bulletin de vote"^[87].

e). P. Henrion

Apparemment plus mesuré que les contradicteurs précédents, Pierre Henrion, dans un article dont le titre ("Un mariage malheureux : statistique et vocabulaire") donne cependant le ton^[88], se demande si le retard avec lequel la vogue des vocabulaires de base touche notre pays est dû à notre inertie, ou plus simplement à notre bon sens. Il admet en effet que la langue la plus courante est "la plus urgente à enseigner", mais il ajoute aussitôt qu'à son avis, le système des listes de fréquence est ‘décevant’. Il nous engage donc à "aller plus loin que l'arithmétique élémentaire", et à ne pas "suivre aveuglément des travaux étrangers dont il n'est pas question de diminuer les très grands mérites [...], mais qu'il serait regrettable de copier sans leur apporter notre contribution bien spécifique". Ainsi, le premier reproche qu’il oppose aux listes de fréquence est "de ne pas tenir compte et de ne pas pouvoir tenir compte des véritables unités de langage qui sont, tantôt moins que le mot (acception de mot), et tantôt plus (idiotisme de base)"^[89].

À l'appui de sa thèse, il fournit l'exemple de bon, qui n'est pas distingué, si l'on s'appuie sur les listes, dans bon de caisse, et bon de pain^[90], de bon à manger, non plus que de allons, bon !, "qui n'a rien de bon du tout". Et il estime que des professeurs, mettant en commun leurs connaissances, pourraient sans autre aide élaborer un ordre d'acquisition lexicale satisfaisant.

Nous parvenons ainsi au terme d'un survol des critiques opposées à la notion de fréquence. Certaines d’entre elles peuvent être retenues, comme celles visant le choix des corpus dépouillés, ou ce fait que les dépouillements sur lesquels s’appuient les listes de fréquence sont relativement anciens. Mais il faut bien dire que si l’on peut appeler de ses vœux une actualisation, un renouvellement de ces travaux préliminaires, ils demeurent à être entrepris : l’on est donc contraint de s’appuyer sur ce qui existe. En revanche, la notion de fréquence lexicale n’est pas une religion, ce n’est qu’un utile garde-fou, pour reprendre l’expression de M. Cohen. Une liste de fréquence n’a aucun caractère canonique, écrivit Henmon, et personne n’a proposé qu’elle soit envisagée sous cet angle. Encore moins, nous semble-t-il, d’en faire un usage militaire...

Si la langue la plus courante est la plus urgente à enseigner, comme le concède P. Henrion, alors il nous paraît que les objections opposées au principe de la recherche d'un noyau dur de la langue, forment davantage des résistances idéologiques que des réfutations scientifiques^[91]. La notion de fréquence lexicale (écrite et orale), nous allons essayer de le montrer, doit être présente à l'esprit de tout enseignant désireux de conduire ses élèves sur la voie de la maîtrise langagière.

Notes

^[1]. Le dépouillement concernant, on vient de le voir, 1 147 748 occurrences. Cf. : "The usefulness of the Henmon list gave [...] confidence that a successful task could be undertaken on a larger scale" [2], p. V.
^[2]. Ceux rencontrés dans au moins cinq sources différentes, soit environ le tiers de la liste initiale.
^[3]. [2], p. 14. La corrélation est un moyen mathématique (statistique) d'apprécier le degré de liaison entre deux variables, ce degré allant de l'indépendance (0) à la liaison fonctionnelle (1). Nous sommes ici en présence d’une très forte liaison.
^[4]. Car ils n'atteignaient pas le range minimal (ibid. pp. 185-188).
^[5]. Cf. TLF, [25], Préface, VII : "... La liste de Vander Beke, au demeurant épuisée et pratiquement introuvable sur le marché de l'occasion".
^[6]. Le Trésor de la langue française, tome 1, 1971, tome 16 et dernier, 1994. Cf. aussi [25]. On peut trouver sur le réseau Internet (à l’adresse http://www.ciril.fr/~mastina/TLF) le ‘TLF informatisé’, pour l’instant limité à quatre lettres, de ptère à salaud. À titre d’exemple nous donnons, page 176, l’article consacré à quadragénaire.[Renseignement désormais erroné : cf. http://www.atilf.fr/tlfi ]
^[7] . On trouvera à la fin de ce travail, en Annexe II, pp. 273 sq., le début (300 mots) de l’index hiérarchique du TLF.
^[8]. La conjugaison française, Delachaux et Niestlé, 1954, pp. 27 sq.
^[9]. Et dont la connaissance se doit d'être imperturbable. Soit les exemples suivants, pour les trois verbes les plus fréquents de notre langue :
1. être (est était sont été étaient fut êtes serait)
je suis/tu es tu es/il est il était/ils étaient
il est/ils sont c'est/c'était.
2. avoir (a ai avait ont avons avez as eut)
il a/il avait/il aura ils ont/ils sont
il est/il a/il va.
3. faire (fait faisait fais faites fera ferez fit font)

[On pourrait également ajouter des oppositions paronymiques, dont la maîtrise est importante :
je fais/je vais - ils font/ils vont - tu fais/vous faites - il fait/il sait.
Chacun sait en effet combien la confusion :
il vaut mieux/il faut mieux
est entretenue, et pas seulement sur les bancs scolaires].
^[10]. Pas assez de pièces de théâtre, choix de l'ouvrage Tartarin de Tarascon, unités scientifiques (sept) tirées d'un seul ouvrage (de Philosophie...).
^[11]. [15], Introduction, p. XLV.
^[12]. Ainsi, je me moi sont distingués par Henmon, et pas il le lui, par exemple. (Id., p. XLII).
^[13]. Id., p. XLIII.
^[14]. Bibliogr., [20]. Ce travail remarquable de N. Catach, indispensable à tout pédagogue en français (orthographe et vocabulaire, pour le moins : il comprend 1 600 mots très fréquents, listés sous 4 000 formes) est malheureusement très peu connu, et encore moins utilisé.
^[15]. On trouvera en Annexe III (pp. 275 sq.) les cinq cent cinquante premiers mots de la liste de Juilland.
^[16]. [21], 1927.
^[17]. Comme on pouvait s'y attendre, on y retrouve la plupart des mots-outils d'Henmon.
^[18]. [22], 1930.
^[19]. Cardon, Première année moderne, 1925. Béziat and Dey, French Grammar, 1927.
^[20]. Mot (ou expression) trouvé une seule fois dans un corpus donné.
^[21]. On peut essayer de rechercher les mots communs à ces deux corpus (de 92 et 49 mots). Ils sont au nombre de 21 : boulangerie, brosser (se), carotte, chambre à coucher, chaussette, droite (à), environ, épicier, épicerie, haricot, infériorité, narration, orange, peigner, poivre, potage, salle de bains, tarte, téléphoner, thé, timbre-poste. Ce sont en effet, à quelques termes vieillis près, des mots "highly useful for every day purposes".
^[22]. [23], 1931.
^[23]. Qui a travaillé sur les expressions idiomatiques. Cf. infra, pp. 44 sq.
^[24]. À son avis, d'autre part, le corpus de Wood ne s'est pas limité à des ouvrages scolaires pour débutants.
^[25]. "Our present grammars contain altogether too many words" [23], p. 352.
^[26]. [23], p. 347.
^[27]. Dont il ne manque pas, au passage, de critiquer les sources. Nombre de mots de cette recherche, selon lui, "savour of the material from which they are extracted" (ibid., p. 351).
^[28]. Bibliogr., [24]. On pourra consulter des extraits de travail de Prescott dans l'annexe IV, pp. 279 sq. Contrairement à nombre de travaux mentionnés ici, l'étude de Daniel Prescott a connu un assez grand retentissement. Elle est citée dès 1930 par Henmon lui-même (cf. supra, p. 51), et en 1955 par G. Serbat (cf. supra, p. 54).
^[29]. Ce qui permet, selon lui, d'obtenir des mots "empruntés à le vie quotidienne des enfants en général" (ibid., p. 231).
^[30]. Ibid., p. 238.
^[31]. Prescott donne d'ailleurs aussitôt l'exemple en examinant, à partir des acquis de sa recherche, sept manuels de lecture alors utilisés dans les écoles primaires genevoises et en France. Il s'agit d'un travail pénétrant et plein d'enseignements ("Le vocabulaire des enfants et des manuels de lecture", Archives de Psychologie, tome XXI, 1929, n° 83-84, pp. 225-261). Il préfigure largement les études modernes sur la lisibilité.
^[32]. Bibliogr., [27]. Recherche conduite à Poitiers entre 1971 et 1977. Elle a touché 115 classes élémentaires, et 2 800 élèves du CE1 au CM2. Cette démarche avait déjà été utilisée par H. E. Palmer (Thousand Word English, 1937) : établir empiriquement une liste, et la soumettre a posteriori à une vérification méthodique d'après le pourcentage de compréhension obtenu.
^[33]. Ibid., p. 21.
^[34]. Id.
^[35]. Larousse, éditeur. Ce dictionnaire en comprend 25 000.
^[36]. Échelon 1 : je ne l'ai jamais entendu ; échelon 5 : je le connais très bien, et je l'utilise très souvent.
^[37]. Tel qu'il a été établi, selon les auteurs, par P. Guiraud : substantifs, 62 % ; verbes, 15 % ; adjectifs, 19 % ; autres, 4 %. En réalité, on trouve chez Guiraud la proportion suivante (Cf. [13], p. 36) : substantifs, 20 % ; verbes, 17 % ; adjectifs, 7,5 % ; adverbes, 5,5 %, mots-outils, 50 %.
^[38]. Les échelons 4 et 5.
^[39]. Les deux tâches proposées étaient :
Connais-tu très bien, bien, pas du tout ce mot ? (vocabulaire quantitatif).
Dis tout ce que tu sais de ce mot (vocabulaire qualitatif, ou degré de connaissance du mot). Chaque enfant ‘jugeait’ ainsi 450 mots, et devait en définir 90.
^[40]. Ouvr. cit., p. 93.
^[41]. Ibid., p. 65.
^[42]. Ibid., p. 85. Selon D. Prescott, dont l'étude a fait l'objet du paragraphe précédent, cet accroissement est d'environ 4 200 mots (cf. Tableau Annexe IV, p. 279).
^[43]. Ibid., p. 94. Mais est-ce le fait de l'école primaire, comme le croient Ehrlich et ses collaboratrices (p. 95) ? N'est-ce pas plutôt une conséquence de l'élargissement progressif de l'horizon de l'enfant, qui reçoit de tous les milieux fréquentés par lui une extension considérable de ses possibilités lexicales ? La différence significative due à l'origine sociale des enfants semble corroborer cette interprétation.
^[44]. Ibid., pp. 96 et 175. Ce fait paraît être la caractéristique de l'action des media de masse.
^[45]. Ibid., pp. 68 et 135. Statistiquement parlant, ces différences sont très significatives. Pour ne prendre qu'un seul exemple (CE1) alors que la moyenne des mots non connus se situe à 8 081, elle oscille entre 7 875 et 8 241 (les deux classes sociales extrêmes). S'agissant des mots très bien connus, la moyenne est à 2 398 mots, et elle passe dans les mêmes conditions, de 2 361 à 2 559 mots.
^[46]. Ibid., pp. 97 et 175.
^[47]. Ibid., p. 70.
^[48]. Différence de méthodologie, par rapport à d'autres enquêtes du type L'échelle Dubois-Buyse, Le Français fondamental, etc. : ici, on a cherché à déterminer les termes fondamentaux d'une langue (en vue de leur apprentissage systématique). Chez Ehrlich, au contraire, on s'efforce de déterminer le nombre et la nature des connaissances déjà acquises (Ibid., p. 48). Cela se révèle si l'on compare la liste des 26 verbes les plus fréquents du "français fondamental" : être, avoir, faire, dire, aller, voir, savoir, pouvoir, falloir, vouloir, venir, prendre, arriver, croire, mettre, passer, devoir, trouver, donner, comprendre, connaître, partir, demander, tenir, aimer, penser, à celle des 26 verbes les plus familiers, extraite du Dictionnaire génétique : réviser, partager, acheter, siffler, découper, s'évader, chercher, plonger, saigner, écraser, corriger, recevoir, s'envoler, grimper, se coucher, habiter, terminer, miauler, éclabousser, décorer, pincer, lire, observer, démarrer, essuyer, obéir.
Malgré tout, on peut noter un large recoupement avec le Vocabulaire orthographique de base, et le Dictionnaire génétique.
^[49]. Et qu’on pourra lire ci-dessous, pp. 97 sq. [En fait : D. Propositions, 1. Le plan Rouchette et le vocabulaire]
^[50]. [29]. Il s'agit du volume XV des Publications of the American and Canadian Committees... L'ouvrage de Vander Beke constituait le volume XIV.
^[51]. On trouve pas, chez Henmon, et non ne...pas ; jamais, mais pas ne... jamais ; après, mais pas après que, etc.
^[52]. Dont cinq appartenant aux 23 unités d'Henmon.
^[53]. De "il y a" (they are pens on the table), dont le range est 84, jusqu’à "il a moyen" (he has a way to [accomplish] that) , de range 3.
^[54]. Ouvr. cit., p. 105. On trouvera également, parmi nos propositions d'exercices, des utilisations du travail de F. Cheydleur (cf. par exemple, à propos du verbe passer, infra, p. 220 sq.). [Il s'agit de "Elle avait préféré la mort à la honte"]
^[55]. Bibliogr., [30].
^[56]. Désormais FF. Cf. page suivante.
^[57]. Elle en cite une vingtaine, et ajoute de façon générique les noms en -ty, qui donnent -té en français (liberté, nationalité, obscurité), et les noms en -age, "which are often identical" [dans les deux langues].
^[58]. C'est pourquoi elle s'appuie sur le travail d'Henmon, qu'elle complète avec celui de Thorndike (ouvr. cit., p. 372).
^[59]. Nous donnons ci-après, en Annexe V (pp. 281 sq.) la liste proposée par Florence Baker, après l'avoir très légèrement modifiée. Le ‘rendement’ de cette liste est important : seuls 29 mots (soit 6, 85 %) ne sont pas présents dans le FF 1er Degré.
^[60]. Bibliogr., [18]. Le premier opuscule (1954) était intitulé Le français élémentaire. Ce "français élémentaire" est devenu, à partir d'octobre 1959, le français fondamental.
^[61]. Cité d'après Le Monde du jeudi 1er novembre 1951, p. 5. L'article est intitulé : "Pour rendre notre langue assimilable par tous, DES LINGUISTES ÉLABORENT UN 'FRANÇAIS DE BASE' EN MILLE MOTS".
^[62]. Essentiellement : enregistrements phonographiques empruntés au Musée de la parole, et enregistrements effectués à l'insu de témoins, "avec des échantillons criants de vérité du parler spontané du peuple de Paris" [18], p. 64. L'idée de recenser les mots de corpus oraux semble appartenir à M. Sauvageot. Cf. G. Gougenheim, [18], p. 14. Les échantillons recueillis et analysés furent au nombre de 163.
^[63]. Bouquin au profit de livre ; gosse au profit d'enfant, etc.
^[64]. L’ensemble comprend en réalité deux sous-listes, le Français élémentaire premier degré (devenu Français fondamental, en 1964) et le Français élémentaire deuxième degré, de 2 089 mots. On trouvera la première liste à l’Annexe VI, pp. 285 sq.
^[65]. Bibliogr., [31].
^[66]. Cf. supra, p. 36.
^[67]. [31], p. 365.
^[68]. Act, dévoter, effronte, audessus, etc.
^[69]. [31], p. 386 : Baiser (30 occ.) est-il verbe, ou nom ? Voler (34 occ.), est-ce dérober, ou planer dans les airs ? Vague (31 occ.) est-il nom, ou adjectif ? Si les flexions verbales sont regroupées sous la forme infinitive, que vient faire consacres (6 occ.) ? Si pour (1 279 occ.) est donné avec pour que (16 occ.), pourquoi ne trouve-t-on pas bien que avec bien (1 104 occ.), afin que et afin de avec afin (49 occ.) ? Etc.
^[70]. Cf. infra, p. 51.
^[71]. Bibliogr., [3].
^[72]. Ibid., p. 38.
^[73]. 6 000 mots recensés, dont 134 seulement communs à toutes les sources dépouillées. Cf. supra, p. 36.
^[74]. 16-17 novembre 1951, p. 1.
^[75]. Chronique de Pierre Gaxotte, de l'Académie Française, in Le Figaro du mardi 21 septembre 1954, page 1.
^[76]. "Si le problème avait été si facile, il y a longtemps qu’il aurait été résolu", objecta avec raison G. Gougenheim ([18], p. 14).
^[77]. Bibliogr., [32]. On trouvera, à la fin de cet ouvrage, une bibliographie commentée sur les listes de fréquence en général, et sur le français élémentaire en particulier (pp. 97-112).
^[78]. On ne manquera pas de se remémorer, pour comprendre la violence du militant Marcel Cohen (1884-1974), le contexte historique dans lequel fut publié son ouvrage (et conduite l'enquête du Français fondamental) : celui de la guerre d'Indochine. L'extrait suivant permettra de mieux situer ce contexte (Journal Officiel, fin décembre 1951, discussion à propos du budget de l’Éducation nationale) :
Monsieur Grovoni (P. C.) demande la suppression du crédit destiné à l'enquête concernant le Français fondamental "par respect pour la langue de Racine, de Balzac et d'Anatole France". L'amendement est repoussé après l'intervention du Ministre André Marie : la décision visée n'est que l'application des recommandations de la Commission nationale française pour l'Unesco [M. Cohen la qualifie d'institution paternaliste], élaborées par le sous-Comité d'éducation de base, présidé par M. Senghor, et approuvées par le Comité d’Éducation, présidé par M. Henri Wallon.
^[79]. Cf. en particulier sa série de chroniques de linguistique dans l'Humanité, ou encore son bel ouvrage, La grande aventure de l'écriture et son évolution (Librairie Klincksieck, 1968).
[80]. [32], p. 15.
^[81]. [32], p. 24. Mais il semble faire fi, ici, du caractère forcément limité du FF ; et, par ailleurs, les dix mots qu'il cite (joie, se réjouir, douleur, douloureusement, larme, regret, se repentir, accepter, refuser, refus) se trouvent chez Henmon, à l'exception de se repentir (et on a douloureux à la place de douloureusement).
^[82]. [32], p. 33.
^[83]. [32], p. 50. À mettre en parallèle, en souriant, avec l'opinion de la propre fille de M. Cohen, Laurence Lentin, qui s'exprime en ces termes : "Il faudra bien un jour ou l'autre déterminer un 'français fondamental de l'acquisition du langage' ; nous pensons ici au 'français fondamental' qui a été établi par des linguistes à la suite de nombreuses enquêtes et recherches et sert en particulier de base à l'enseignement du français, langue étrangère. Ce français fondamental de l'acquisition ne serait pas limitatif, mais minimal (on peut apercevoir les avantages inestimables que représenterait par la suite ce vocabulaire bien maîtrisé comme base unique et obligatoire du premier apprentissage de la lecture et de l'écriture)". [1, p. 138]. Cf aussi supra, p. 13.
^[84]. Id., p. 52 : "Écarter tout apport de son [la langue] expression écrite, n'est-ce pas se priver des éléments les plus élaborés, les plus rationnels ?". Cf. aussi pp. 68 et 70. On a vu supra qu'Henmon avait formulé, pour sa part, un avis analogue.
^[85]. Id., p. 53 : "Il est très significatif qu'aient été éliminés justement des mots abstraits, alors que ce 'français élémentaire' n'est pas destiné à des enfants, mais à des adultes".
^[86]. Cf. aussi [32], p. 78 : "La bourgeoisie française juge inutile, et même dangereuse pour la survie de son pouvoir, l'étude approfondie de notre langue nationale".
^[87]. [32], p. 81.
^[88]. Bibliogr., [34].
^[89] Ibid., p. 238. Henrion semble ne pas avoir eu connaissance du travail de F. Cheydleur.
^[90]. L'emploi de cette expression suffit à trahir l'époque à laquelle l'article a été rédigé !
^[91]. Le souci d’être complet nous conduit à signaler au lecteur érudit une très solide mise en cause de la notion de fréquence - trop complexe pour être détaillée ici. Elle a été rédigée en 1949 par William Bull, et s’intitule "Natural frequency and word counts : the fallacy of frequencies". [Bull, W., "Natural frequency and word count ; the fallacy of frequenties", The Classical Journal (Menaska, Wisconsin), 1949, n° 44, pp. 469-484].

Texte soumis aux droits d'auteur - Réservé à un usage privé ou éducatif.

Accéder à la suite de ce texte

[Haut de page]

Menu principal

Articles les plus lus

Autres mises en ligne récentes

L'enrichissement du vocabulaire : fréquence lexicale_2