Contenu de l'article

Titre Lexique et classement en parties du discours dans ORFÉO
Auteur José Deulofeu, André Valli
Mir@bel Revue Langages
Numéro no 219, septembre 2020 Orféo : un corpus et une plateforme pour l'étude du français contemporain
Page 53-68
Résumé L'article présente les principes et les critères qui ont présidé à l'élaboration de la table des parties du discours et à l'organisation du lexique correspondante, mis en œuvre dans l'analyse syntaxique automatique du corpus orféo. La comparaison est établie avec le Lexique des Formes Fléchies du Français (lefff) utilisé dans d'autres outils de traitement automatique du langage. Les enjeux linguistiques et informatiques sont abordés. Un développement particulier est consacré au traitement des locutions ou expressions multi-mots. Des perspectives d'amélioration sont envisagées.
Source : Éditeur (via Cairn.info)
Résumé anglais The paper discusses the principles and criteria used in elaborating the POS tagset and the structure of the corresponding lexicon at use for the automatic parsing of the orféo corpus. This architecture is compared with the current Lexique des Formes Fléchies du Français (lefff) dictionary, available under open source license. The linguistic and natural language processing challenges are dwelled on. A specific attention is devoted to the processing of multiword expressions. Some ways of improvement of the system are provided.
Source : Éditeur (via Cairn.info)
Article en ligne http://www.cairn.info/article.php?ID_ARTICLE=LANG_219_0053