Contenu de l'article

Titre D'où viennent les fréquences de vocabulaire ? La lexicométrie et ses modèles
Auteur Maurice Tournier
Mir@bel Revue Mots. Les langages du politique
Numéro no 1, octobre 1980 Saussure, Zipf, Lagado, des méthodes, des calculs, des doutes et le vocabulaire de quelques textes politiques
Rubrique / Thématique
II. Lexicométrie
Page 189-209
Résumé D'OÙ VIENNENT LES FRÉQUENCES DE VOCABULAIRE ? LA LEXICOMÉTRIE ET SES MODÈLES Etant donné un inventaire de fréquences dans un corpus et ses partitions, peut-on en inférer des interprétations « en langue » ? Selon l'auteur, après avoir dit oui, les statisticiens du vocabulaire sont aujourd'hui plus réservés. Du structuralisme la lexicométrie glisse vers la socio-linguistique. Et les modèles mathématiques supposés par les méthodes de traitement se trouvent remis en question. L'assimilation posée par Herdan entre Langue et population, Parole et échantillon ne tient plus devant des codes ou des compétences jugés inéchantillonnables. La pratique du calcul des espérances pour les mots des fragments à partir de leur fréquence relative de corpus ne satisfait plus aux exigences d'une étude des variables socio-textuelles. On propose de situer désormais les dénombrements opérés pour chaque problème dans l'univers de toutes les combinaisons mathématiquement possibles. A une statistique des écarts testés succéderait ainsi une lecture en probabilités des données textuelles. WHERE DO VOCABULARY FREQUENCIES COME FROM ? LEXICOMETRICS AND ITS MODELS Given a list of frequencies from a corpus and its subdivisions, is it possible to make certain inferences about the language ? According to the author, statisticians working on vocabulary, having acknowledged the possibility, are today more reserved. Lexicometrics is sliding from structuralism towards sociolinguistics. And mathematical models implied by methods of processing information are now being questionned. The analogy drawn by Herdan between « langue » and population, « parole » and sample no longer holds when faced with codes or competence, considered to be unacceptable for sampling. The calculation of expectancies for words within the subdivisions, from their relative frequency within the corpus, no longer satisfies the demands of a study of socio-textual variables. It is suggested that in future the counting should be placed within the universe of all the combinations which are mathematically possible. A perusal of the probabilities of textual data would therefore follow the acquisition of statistics tested deviations.
Source : Éditeur (via Persée)
Article en ligne http://www.persee.fr/web/revues/home/prescript/article/mots_0243-6450_1980_num_1_1_1010