Contenu de l'article

Titre Vers une caractérisation automatique de critères pour l'opinion-mining
Auteur Benjamin Duthil, François Trousset, Gérard Dray, Jacky Montmain, Pascal Poncelet
Mir@bel Revue Cahiers du numérique
Numéro vol. 7, no 2, 2011 Analyse d'opinions sur internet
Page 41-62
Résumé Les technologies de l'information et le succès des services associés (e.g. blogs, forums…) ont ouvert la voie à un mode d'expression massive d'opinions sur les sujets les plus variés (sites de e-commerces, films, etc.). Récemment, de nouvelles techniques de détection automatique d'opinion (opinion-mining) proposent des analyses statistiques des avis exprimés afin de dégager une tendance globale des opinions recueillies sur une entité évaluée. Néanmoins, une analyse plus fine montre que les arguments des internautes relèvent de critères de jugement distincts. Les approches d'opinion-mining traitent peu de cet aspect multicritère pourtant riche en informations. Dans cet article, nous proposons de caractériser automatiquement les segments de textes relevant d'un critère donné sur un corpus de critiques. À partir d'un ensemble restreint de mots-clés associés à un critère, notre approche construit automatiquement une base d'apprentissage. Des expériences menées sur des jeux de données réelles illustrent l'efficacité du processus.
Source : Éditeur (via Cairn.info)
Résumé anglais The development of new services (e.g. blogs, forums…) provides facilities to express opinion on different topics. Recently new techniques known as opinion mining have emerged. They often provide statistical analyses of available opinions as an overall trend on different topics. Nevertheless, whereas it is rather easy to get such an overall trend, a more detailed analysis would highlight that cybernauts' appraisals are related to multiple criteria. For example, a film can be classified as enthusiastic because of its great scenario, disappointing because of its poor soundtrack, etc. Our objective in this paper is to automatically extract any textual segment related to a criterion (or a subset of criteria) from a critics database. Then, for any criterion, opinion-mining techniques allow computing a partial assessment with regard to the criterion from the textual segments related to it. From a short list of key words characteristic of a criterion, our approach provides the required learning database for critics classification without further human intervention. Experiments have been carried out to illustrate and validate the efficiency of our approach.
Source : Éditeur (via Cairn.info)
Article en ligne http://www.cairn.info/article.php?ID_ARTICLE=LCN_072_0041