Contenu de l'article

Titre L'inventaire des segments répétés d'un texte
Auteur Pierre Lafon, André Salem
Mir@bel Revue Mots. Les langages du politique
Numéro no 6, mars 1983 L'oeuvre de Robert-Léon Wagner. Vocabulaire et idéologie. Analyses automatiques
Rubrique / Thématique
II. Lexicométrie
Page 161-177
Résumé L'INVENTAIRE DES SEGMENTS RÉPÉTÉS D'UN TEXTE L'une des limites de la lexicométrie telle qu'on la pratique actuellement est qu'elle fonde ses analyses sur des dépouillements de formes isolées de leur environnement syntagmatique. Définissant un segment comme une séquence de formes connexes, P.L. et A.S. proposent de faire le recensement exhaustif de tous les segments répétés du texte. L'inventaire des segments répétés (ISR) qu'ils présentent, comporte une partie où les segments sont classés par ordre alphabétique et une autre dans laquelle ils sont classés par ordre de fréquence décroissante. Des analyses statistiques sur des tableaux de biformes et de informes (segments composés respectivement de deux et trois formes) montrent l'intérêt lexicométrique de ces nouvelles unités dans les problèmes de caractériologie et de parentage des textes. Enfin, P.L. et A.S. montrent comment l'ISR permet de résoudre certains problèmes pour aboutir à une segmentation automatique moins arbitraire des textes.
Source : Éditeur (via Persée)
Résumé anglais AN INVENTORY OF THE REPEATED SEGMENTS IN A TEXT One of the limitations of lexicometry as it is used today is that it bases its analysis on the casting aside of isolated forms from their syntagmatic environment. By defining a segment as a sequence of connected forms, P.L. and A.S. are proposing to take an exhaustive census of all the repeated segments in the text. The Inventory of repeated segments (1RS) which they submit is made up of one part in which the segments are classed in alphabetical order, and another in which they are classed in order of decreasing frequency. Statistical analysis on tables of biforms and triforms (segments composed of two and three forms respectively) show the lexicometric interest of these new unities in problems of the characteriology and the parentage of the texts. Finally, PL and AS show how the IRS allows us to solve certain problems leading to a less arbitrary automatic segmentation of the texts.
Source : Éditeur (via Persée)
Article en ligne http://www.persee.fr/web/revues/home/prescript/article/mots_0243-6450_1983_num_6_1_1101