Titre | Annotation syntaxique du français parlé : les choix d'ORFÉO | |
---|---|---|
Auteur | Sylvain Kahane, Kim Gerdes | |
Revue | Langages | |
Numéro | no 219, septembre 2020 Orféo : un corpus et une plateforme pour l'étude du français contemporain | |
Page | 69-86 | |
Résumé |
Cet article présente les choix d'annotation syntaxique dans le cadre du projet orféo. Un corpus de français parlé de plus de 180 000 mots a été annoté en syntaxe de dépendance à la main, puis un corpus de 3 millions de mots a été analysé automatiquement. Les choix d'annotation sont comparés avec ceux du projet rhapsodie, qui a précédé orféo, avec universal dependencies (ud), qui a démarré un peu après orféo, et avec surface-syntacticud (sud), qui est une synthèse des choix d'orféo et d'ud. orféo se caractérise par une prise en compte de la macrosyntaxe et des phénomènes de listes, ainsi que par un ‹tag set› restreint qui a permis une annotation rapide et plus facilement reproductible. Source : Éditeur (via Cairn.info) |
|
Résumé anglais |
Syntactic annotation of Spoken French: orféo's choices This article presents the syntactic annotation choices for the orféo project. A corpus of Spoken French of more than 180 000 words was manually annotated in dependency syntax, then a 3 M word corpus was automatically parsed. The annotation choices are compared with those of the rhapsodie project, which preceded orféo, with universal dependencies (ud), which started shortly after orféo, and with surface-syntacticud (sud), which synthesizes orféo and ud's choices. orféo is characterized by a consideration of macrosyntax and list phenomena, as well as a restricted tag set that allowed a quick and more easily reproducible annotation. Source : Éditeur (via Cairn.info) |
|
Article en ligne | http://www.cairn.info/article.php?ID_ARTICLE=LANG_219_0069 |