Contenu du sommaire : Écrire de l'école à l'université : corpus, traitements, analyses outillées

Revue	Langue française
Numéro	no 211, septembre 2021
Titre du numéro	Écrire de l'école à l'université : corpus, traitements, analyses outillées
Texte intégral en ligne	Accès réservé

Éditorial - Jacques Bres, Céline Vaguer p. 7-9
Écrire de l'école à l'université : corpus, traitements, analyses outillées. Présentation - Claire Doquet, Claude Ponton p. 11-20
Écriture et forme scolaire : spécificités de transcription et de traitement - Claire Doquet, Luisa Revelli, Arnaud Moysan p. 21-36
Cet article examine les manières de donner à voir les écrits scolaires en respectant leur sémiotique propre, fondée à la fois sur la spatialisation et sur la stratigraphie de l'écriture. À partir des travaux de sémiotique et de génétique textuelle, il explicite les choix de transcription et de traitement opérés dans deux bases d'écrits d'élèves existantes, l'une française et l'autre italienne, pour étudier les transformations que les spécificités et les conventions de l'écriture scolaire imposent aux méthodes forgées sur d'autres écrits.
This article deals with ways of showing school writings while respecting their own semiotics, based both on the spatialization and on the stratigraphy of writing. From the work of semiotics and textual genetics studies, it explains the choices of transcription and processing that occurred in two existing student writing databases, one French and the other Italian, in order to study the transformations that the specificities and the conventions of school writing impose on the methods forged on other writings.
SCOLINTER : un corpus trilingue. L'exemple de la segmentation en mots - Claude Ponton, Rafaela Gutiérrez-Cáceres, Lilia Teruggi, Elisa Farina, Catherine Brissaud, Claire Wolfarth p. 37-50
Cet article décrit la conception d'un corpus d'écrits scolaires longitudinal et trilingue (français, espagnol, italien). L'objectif est d'établir une comparaison de l'évolution des compétences en littéracie entre ces trois langues à l'école primaire. Pour le moment, seul le CP (grade 1) a été entièrement traité mais les mêmes élèves seront suivis jusqu'au CM2 (grade 5). L'exploitation de ce corpus propose une approche reposant sur des comparaisons entre la version des textes produits par les élèves et une version dite ‹normalisée›. Cette approche permet d'assister la description linguistique des réussites et des difficultés dans l'apprentissage de l'écrit. En particulier, l'article s'intéressera à la segmentation entre les mots, en mettant en évidence à la fois la fréquence du phénomène et les catégories de mots dans lesquelles il se produit. L'analyse comparative révèle la présence de caractéristiques similaires dans le corpus trilingue.
This article presents a longitudinal, trilingual (French, Spanish and Italian) school writing corpus. Its aim is to compare the evolution of literacy skills between these three languages in primary school. Actually, only CP (grade 1) has been entirely treated but the same pupils will be followed up to CM2 (grade 5). The exploitation of this corpus proposes a tool-based approach based on comparisons between the version of the texts produced by the pupils and a so-called ‹standardised› version. This approach makes it possible to produce a linguistic description of the achievements and problems that pupils face in their texts. In particular, this article focus on segmentation between words, highlighting both the frequency of the phenomenon and the categories of words in which it occurs. The comparative analysis reveals the presence of similar characteristics in the trilingual corpus.
Cartographie des usages et des erreurs orthographiques sur les verbes dans des récits écrits par des élèves de 6 à 15 ans - Belinda Lavieu-Gwozdz, Élise Vinel, Vannina Goossens, Catherine Brissaud p. 51-65
Cette étude cherche à donner une vue panoramique des performances orthographiques des élèves en production de texte dans le domaine de la morphographie du verbe, du CP à la classe de 3e du collège, et à comprendre si la disponibilité des marques verbales dans des tests standardisés se retrouve en situation de production de texte. Nous nous intéressons plus particulièrement aux tiroirs verbaux les plus utilisés par les élèves dans des textes narratifs : présent, imparfait, passé simple et infinitif. Nous décrivons les formes produites par les élèves en distinguant celles qui portent sur les bases verbales de celles qui portent sur les désinences. Nous cherchons à identifier d'éventuels phénomènes récurrents mais aussi des spécificités qui pourraient caractériser certains niveaux scolaires. Des pistes didactiques sont enfin suggérées.
This study seeks to provide a panoramic view of students' spelling in the area of verb morphography from grade 1 (age 6) to grade 9 (age 15) and to understand whether the relative and progressive availability of marks in standardized tests is reflected in writing situations, data that we lack to date. We focus on the verbal tenses most used by the students: present tense, infinitive, imperfect and past simple. We describe the verbal forms produced by the students distinguishing between those concerning the verbal bases and those concerning the inflections. Particular attention is paid to the latter, which are generally a hurdle for the students. We try to identify possible recurrent phenomena but also specificities which could characterize certain educational levels. Finally, we make some didactic suggestions.
Orthographier les formes verbales du français : quelle persistance des erreurs chez les étudiants ? - Jacques David, Fanny Rinck p. 67-81
Les écrits d'étudiants en français comportent un nombre important d'erreurs orthographiques. Leur persistance à un niveau avancé est systématiquement analysée aux plans linguistique et psycholinguistique, en ce qui concerne la morphographie verbale aux temps-modes personnels. L'étude s'appuie sur deux corpus d'écrits d'étudiants : 276 textes narratifs recueillis en première année de licence ; 165 textes argumentatifs en première année de master. Elle montre que les erreurs orthographiques concernent : (i) les bases verbo-lexicales ; (ii) les flexions temporo-modales ; (iii) les accords de personne.
The writings of postgraduate students in French contain a large number of spelling errors. Their persistence at an advanced level is systematically analyzed at the linguistic and psycholinguistic levels, focusing on the verbal morphography through personal modes. The study is based on two corpora of students' writings: 276 narrative texts collected in the first grade of university; 165 argumentative texts in the first master's level. It shows how these errors concern: (i) verbo-lexical bases; (ii) tenses and modes endings of verbs; (iii) morphosyntactic person markers.
« Vous pouvait croire que la guerre ne finiras pas » : les graphies des désinences des formes verbales dans la correspondance des Poilus du Corpus14 - Christian Surcouf p. 83-98
Fondée sur l'analyse manuelle des 1 892 formes verbales recensées dans soixante lettres de soldats ordinaires français de la Première Guerre mondiale, cette étude se propose d'interroger l'efficacité de leur orthographe en examinant les principales zones de vulnérabilité de la morphographie verbale et, par la suite, élaborer le calcul du taux de lisibilité pour fournir une estimation quantitative de cette efficacité.
Based on the study of the 1 892 verb forms from sixty letters written by twelve World War I ordinary French soldiers, this study proposes an analysis of the efficiency of their spelling. After highlighting the main weaknesses in their spelling of verbs, a “readability rate” will be calculated to evaluate this efficiency.
La continuité référentielle dans le corpus RÉSOLCO : méthode d'annotation et premières analyses - Claudine Garcia-Debanc, Josette Rebeyrolle, Lydia-Mai Ho-Dac p. 99-114
Le corpus RésolCo est constitué de 400 textes rédigés par des élèves français âgés de 9 à 15 ans en réponse à une consigne d'écriture conçue comme une tâche impliquant la résolution de problèmes de cohésion. Cette contribution expose une méthode d'annotation de la continuité référentielle dans la désignation des personnages principaux d'un texte narratif et l'illustre avec l'analyse de trois textes d'élèves. Les configurations de marques linguistiques observées sont interprétées comme indices de la stratégie des rédacteurs. Sont présentés les premiers résultats de l'analyse d'une centaine de textes de trois niveaux contrastés (CE2, 6e et 3e).
The Résol
Co Corpus is composed of 400 texts written by French students aged 9-15 in response to a task related to “Resolving Cohesion problems”. This paper proposes a method for describing the strategies used by writers for creating cohesive ties and more specifically referential continuity ties. This method involves systematic annotation of the linguistic expressions referring to the main characters that must occur in all texts given the instruction. An analysis of a first set of annotations across three education levels outlines two prototypical and opposite strategies: a step by step strategy vs. a planning strategy.
Vers un corpus de textes d'élèves annoté en relations de discours - Myriam Bras, Laure Vieu, Maëlle Joret, Audrey Pépin-Boutin, Clamença Poujade, Charlotte Roze p. 115-129
Cet article présente le processus d'annotation en Relations de Discours (RD) de textes d'élèves du corpus RésolCo (Garcia-Debanc et al. 2017) produits selon une même consigne d'écriture. Nous procédons à une segmentation en Unités de Discours Élémentaires qui sont ensuite reliées entre elles par des RD lors de l'annotation. Le jeu de RD choisi est proche de celui de la Segmented Discourse Representation Theory (Asher & Lascarides 2003) qui offre une méthode opératoire de construction de représentations de discours cohérents. Elle est mise ici à l'épreuve pour la première fois sur des textes d'apprenants et étendue pour l'annotation de l'incohérence.
This paper presents the process of annotating with discourse relations (DRs) student texts from the RésolCo corpus (Garcia-Debanc et al. 2017), produced according to the same writing instruction. We first perform a segmentation into Elementary Discourse Units and then link them together with DRs during the annotation process. The set of DRs is similar to that of Segmented Discourse Representation Theory (Asher & Lascarides 2003), which offers an operational method for building representations of coherent texts. This theory is tested here for the first time on learner texts and extended to annotate incoherence.
Gérer la cohérence textuelle sur le plan structurel : analyse d'écrits d'étudiants en L1 - Marie-Paule Jacques, Luca Pallanti p. 131-143
Nous prenons appui sur un corpus de textes de scripteurs peu experts, des étudiants primo-entrants à l'université, titulaires de bacs professionnels du secteur industriel, pour analyser la contribution des marqueurs de structuration et d'organisation textuelle à la cohérence du texte. Nous faisons l'hypothèse que ce qui crée de la cohérence est plus la convergence des marques que leur stricte présence. Dans notre corpus, 43 % des textes ne parviennent pas à faire coopérer ces marques. Les quelques scripteurs qui détournent la consigne d'écriture font globalement converger les marques et produisent des textes plus aboutis.
We use a corpus of texts produced by non-expert writers, first-time university students with vocational baccalaureate degrees in the industrial sector, to analyse the contribution of structuring and textual organisation markers to text coherence. We hypothesize that what creates coherence is more the convergence of markers than their mere presence. In our corpus, 43% of the texts do not manage to make these marks cooperate. The few writers who deviate from the writing instructions generally make the marks converge and produce more accomplished texts.