Contenu du sommaire : Traitement automatique des textes versifiés : problématiques et pratiques
Revue | Langages |
---|---|
Numéro | no 199, septembre 2015 |
Titre du numéro | Traitement automatique des textes versifiés : problématiques et pratiques |
Texte intégral en ligne | Accessible sur l'internet |
- Outils et métrique : un tour d'horizon - Éliane Delente, Richard Renault p. 5-22
- Élaboration et utilisation des relevés métriques. Réflexions théoriques sur un cas pratique : le relevé Clément Marot - Nathalie Hervé p. 23-40 De nouvelles perspectives sont apparues dans l'analyse des textes poétiques avec le développement de l'outil informatique. Il est devenu envisageable de traiter automatiquement des corpus de grande ampleur et d'exploiter de manière plus cohérente les relevés déjà existants contenant des informations sur les données poétiques. Un programme baptisé Anamètre est en phase de développement pour répondre aux besoins des métriciens dans ce domaine. Nous nous interrogerons sur les avancées et les limites de ce projet à partir d'un relevé, élaboré manuellement, conçu à l'origine pour une étude des structures strophiques des poèmes de Clément Marot (1496-1544). Mots-clés : poésie, versification, strophe, mètre, automatisation, encodage, relevé, tableThe development of information technology tools opens up new possibilities for analyzing poetry. Such technologies help to more consistently collect, store and automatically process large quantities of new and already existing poetical data. A computer programme, designed to meet the needs of poetry researchers, called Anamètre, is at the development stage. We will explore the project's progress and its limits, comparing it with manually collected data, originally gathered to study the verses of Clément Marot. Keywords: poetry, versification, verses, metre, automation, encoding, data, table
- A Multilanguage, Modular Framework for Metrical Analysis: It Patterns and Theorical Issues - Daniele Fusi p. 41-66 Chiron est un système d'analyse de la tradition poétique, du mètre et du texte, s'appliquant virtuellement à n'importe quelle langue ; son architecture modulaire fournit un processus d'analyse en deux étapes, au cours desquelles la collecte des données est séparée de l'interprétation. La première étape consiste à enchaîner un nombre quelconque de couches d'analyse, exécutant chacune une tâche spécialisée. Dans la métrique grecque et latine, une couche syntaxique est nécessaire entre la couche phonologique et la couche métrique pour détecter les appositives et les clitiques. Les données analysées sont enregistrées dans un dépôt en vue de leur interprétation ; à leur tour, les observations sont stockées dans un corpus de métrique, qui peut être interrogé avec une expression complexe. Cela fournit une sorte de laboratoire des métriques attestées, particulièrement utile pour l'étude de l'interaction entre les phénomènes complexes sous-jacents à la métrique. Mots-clés : métrique, appositive, systèmes experts, humanités numériques, histoire de la langue, corpus métriques, Grec, Latin, ItalienChiron is a system for the analysis of virtually any language, poetical tradition, metre and text; its modular architecture provides a 2-step analysis process, where data collection is separated from interpretation. The first step happens by chaining any number of analysis layers, each performing a specialized task. In Greek and Latin metrics, a syntax layer is required between the phonological and metrical one for detecting appositives and clitics. Analysis data are saved into a repository for data interpretation; in turn, the observations are stored into a metrics corpus, which can be queried with any complex expression. This provides a sort of live metrics laboratory, especially useful for studying interaction among the complex phenomena underlying metrics. Keywords: metrics, appositives, expert systems, digital humanities, history of language, metrical corpora, Greek, Latin, Italian
- Métrique littéraire, métrique linguistique et métrique algorithmique de l'allemand mises en jeu dans le programme Metricalizer2 - Klemens Bobenhausen, Benjamin Hammerich p. 67-88 Concevoir un programme qui analyse automatiquement la métrique de poèmes en langue allemande signifie se familiariser avec les traditions des deux pans de la métrique : la métrique « littéraire » et la métrique « linguistique ». Qu'est-ce qui distingue ces deux conceptions et qu'avons-nous à en apprendre ? Comment intégrer ces conceptions dans un projet de programme automatique ? Quels sont les aspects nécessaires à la réalisation d'un tel programme et qui ne sont absolument pas traités dans ces deux cadres ? Cet article est consacré à l'histoire de cette discipline et transfère les conceptions et les théories qui en découlent dans le développement d'un programme capable de reconnaître de façon autonome la typologie métrique d'un texte imprimé et d'en indiquer la complexité métrique. Les capacités actuelles du programme Metricalizer2 seront montrées à travers des exemples d'analyse effectués par ce dernier. Mots-clés : métrique littéraire, métrique linguistique, métrique algorithmique, métrique allemandeTo design a software able to analyze automatically the metrics of German poems, it is necessary to get used to two different parts of the field: literary metrics, and linguistic metrics. What is different between these two traditions, and what can we learn from them? How to integrate them in an automatic software project? What is necessary for the making of this software which is not brought by these traditions? This paper is dedicated first to the History of the field and secondly translates the concepts and theories of metrics in the development of a software able to recognize autonomously the metrical type of a printed text and to indicate its metrical complexity. The current software abilities are exemplified by some of its analyzes. Keywords: litterary metrics, linguistic metrics, algorithmic metrics, German metrics
- Reconnaissance automatique des mètres des vers russes : une approche statistique sur corpus - Igor Pilshchikov, Anatoli Starostin p. 89-106 Le but de cet article est de discuter les fondements théoriques de l'analyse rythmico-métrique et morphologico-accentuelle automatique de textes poétiques russes ainsi que les problèmes que pose ce type d'analyse et les solutions proposées. L'analyse métrique des textes poétiques écrits dans une langue à accent libre (comme le russe) devrait pouvoir s'appuyer sur l'analyse morphologique, à partir de laquelle on peut procéder soit à une désambiguïsation manuelle, soit à l'application d'éléments de l'analyse syntaxique avec désambiguïsation automatique, soit au développement d'une approche probabiliste. La dernière partie de cet article décrit une approche statistique sur corpus pour la description des mètres classiques (« explicites ») et non-classiques (« implicites ») russes. Mots-clés : métrique russe, reconnaissance automatique des mètres, approche probabiliste, approche statistique, approche basée sur corpusThe aim of this paper is to discuss the theoretical grounds of, the arising problems in, and practical solutions for automated rhythmic-metrical and morphological-accentual analysis of Russian poetic texts. The metrical analysis of poetic texts written in a language with variable stress (such as Russian) should be based on the morphological analysis, from which we may proceed either using manual disambiguation, or applying the elements of syntactic analysis with automated disambiguation, or developing a probabilistic approach. The concluding section of the paper describes a statistical and corpus-based approach to the description of Russian classical (“explicit”) and non-classical (“implicit”) meters. Keywords: Russian metrics, automated meter recognition, probabilistic, statistical and corpus-based approach
- Des vers et des mesures : détection des noyaux vocaliques - Benoît Brard, Stéphane Ferrari p. 107-124 Cet article présente un dispositif de calcul de la longueur des vers dans les textes versifiés en langue française. Pour compter les syllabes, il néglige leurs frontières et ne prend en considération que leur noyau vocalique, qu'il projette directement sur la graphie selon un processus en deux temps. Un système expert de moins de 50 règles, fondées linguistiquement sur la notion de graphème, segmente chaque séquence de voyelles graphiques et se prononce sur sa participation dans le décompte de la longueur, à l'exception des cas difficiles dont l'ambiguïté est conservée. Une heuristique tire alors parti des longueurs décrites par l'étape précédente comme des intervalles et des régularités contextuelles des textes versifiés pour établir la bonne mesure de chaque vers. Mots-clés : versification, mètre, syllabisme, décompte syllabique, noyau vocaliqueThis paper describes a device for computing the length of lines in French versified texts. Being a syllable counter, it does not take the syllabic boundaries into account but considers their vocalic nucleus, which is mapped onto the orthographic string in two steps. By using grapheme features, a rule-based expert system of less than 50 items breaks up sequences of graphic vowels and states how the resulting pieces should be counted, except for ambivalent exceptions which are left unresolved. Then a heuristic chooses the best length for each line based on the intervals produced by the previous process and the regular nature of metrical patterns. Keywords: versification, meter, syllabism, syllable count, vocalic nucleus
- Projet Anamètre : le calcul du mètre des vers complexes - Éliane Delente, Richard Renault p. 125-148 L'objectif de cet article est de présenter un programme de calcul automatique des mètres composés (6.6, 4.6, 5.5...) développé dans le cadre du projet Anamètre. Nous adoptons une approche déterministe en nous appuyant sur la méthode métricométrique de B. de Cornulier. Le repérage automatique, dans le vers, de certaines unités prosodiques et morpho-syntaxiques, et l'évaluation de leur statut rythmique conclusif ou non, permettent de déterminer un profil métrique pour le poème, puis de lancer une procédure de calcul interprétatif du mètre des vers relativement à ce profil contextuel. Cette procédure traite parfaitement les mètres de la tradition, mais également les mètres d'accompagnement et de substitution qui apparaissent dans la seconde moitié du XIXe siècle. On montrera enfin les limites de cette procédure pour des cas problématiques aux yeux des métriciens eux-mêmes. Mots-clés : métrique française, traitement automatique, calcul du mètre, rythme, corpus poétique, relevé métrique, base de donnéesThe purpose of this paper is to present a calculation program of complex meters (6.6, 4.6, 5.5…) developped by the project Anamètre, using a deterministic approach relying on the “metricométric” method of B. de Cornulier. The automatic identification of some prosodic and morpho-syntactic units as well as assessment of their rhythmic status (if they conclude or not a metric constituent) determines a metric profile for the poem and leads to the contextual interpretation of the meter. This procedure processes exhaustively the traditional as well as the new meters. Concerning the limits of the procedure, we will evoke some cases that also remain problematic for current metrical analysis. Keywords: French metrics, automatic processing, calculation of meter, rhythm, metrical repertory, poetic corpus, database