Titre | Classification automatisée : rêve ou réalité ? Analyse critique de l'usage du text mining pour la conception de vocabulaires contrôlés | |
---|---|---|
Auteur | Raphaël Hubain, Seth van Hooland, Ruben Verborgh | |
Revue |
I2D - Information, données & documents (anciennement : Documentaliste - Sciences de l'information) Titre à cette date : i2D : information, données et documents : pratiques & recherche |
|
Numéro | vol. 53, no 2, juin 2016 Web de données et création de valeurs : le champ des possibles | |
Rubrique / Thématique | Recherche en sciences de l'information |
|
Page | 70-79 | |
Résumé |
[étude] L'usage du traitement automatique des langues pour la classification et l'annotation documentaire reste aujourd'hui un rêve plus qu'une réalité. Pourtant, plus que jamais, les organisations font face à de grandes difficultés dans la gestion de leurs documents. Les vocabulaires contrôlés permettent certes d'organiser les contenus, mais toutes les organisations ne disposent pas de ressources suffisantes pour en implémenter. Au travers d'une étude de cas dans le secteur pharmaceutique, les auteurs de cet article, Raphaël HUBAIN, Seth van HOOLAND et Ruben VERBORGH, démontrent comment un établissement de taille réduite peut concevoir un vocabulaire contrôlé et indexer sémantiquement ses contenus et ce, sans dépendance vis-à-vis d'un fournisseur de logiciel grâce à des outils open source. Les données d'évaluation sont mises à disposition afin d'appliquer la méthodologie à d'autres domaines d'application. Source : Éditeur (via Cairn.info) |
|
Résumé anglais |
Automatic classification, dream or reality? A critical analysis of how text mining is used to design controlled vocabularies
Using automatic language processing for classifying and annotating is today still more a dream than reality. Nevertheless, more than ever, organizations have to deal with the great difficulty of document management. Controlled vocabularies may help with organizing content, but not all organizations have sufficient resources to implement these. In a case study in the pharmaceutical sector, our authors Raphaël Hubain, Seth van Hooland and Ruben Verborgh, show how a relatively small company can design a controlled vocabulary and semantically index its contents. With open source tools, there is little need to depend on a software provider. Assessment data are available for applying the methodology to other sectors of activity. Source : Éditeur (via Cairn.info) |
|
Article en ligne | http://www.cairn.info/article.php?ID_ARTICLE=I2D_162_0070 |