Contenu du sommaire : Analyse d'opinions sur internet

Revue	Cahiers du numérique
Numéro	vol. 7, no 2, 2011
Titre du numéro	Analyse d'opinions sur internet
Texte intégral en ligne	Accessible sur l'internet

Introduction - Luc Grivel p. 9-14
Le développement de nouveaux espaces d'expression sur internet (les réseaux sociaux, les blogs personnels, les forums, etc.) génère de nouvelles pratiques sociales et donc de nouveaux champs d'études socio-économiques, politiques, scientifiques. L'enjeu est de détecter le plus tôt possible les changements de perception relatifs à un produit, un service, des faits sociétaux concernant la famille, l'éducation, la religion, le travail, la santé, la politique, etc. Dans ce cadre, une opinion peut se définir comme un sentiment, un jugement, un avis (une évaluation) émis par une source (un individu ou un groupe social) à propos d'un objet (une cible). Pour caractériser une opinion, il faudrait donc identifier ces trois éléments principaux : le sentiment, le jugement ou l'avis exprimé, la source de l'opinion, la cible de l'opinion.
De la fouille de données à la fabrique de l'opinion : Enjeux épistémologiques et propositions - Egle Eensoo-Ramdani, Evelyne Bourion, Monique Slodzian, Mathieu Valette p. 15-40
Dans cet article nous proposons une réflexion sur les enjeux épistémologiques et l'histoire de la fouille d'opinion. À l'aide d'exemples pris dans des recherches en cours, nous illustrons la situation de cette pratique dans le cadre du schéma de la communication hérité de la théorie de l'information. Nous nous intéressons particulièrement à la question de l'identification et de la restitution de l'émetteur porteur d'opinion, de ses valeurs et de son mode d'expression à partir de l'analyse des textes. Des pistes issues de théories énonciatives et textuelles sont proposées pour une amélioration des performances de l'analyse de la subjectivité.
In this paper we offer our views on the epistemological background and the history of opinion mining. Using examples taken from current research, we show the situation of the practice in the context of information theory. We focus on the issue of identification and restitution of the opinion sender and his/her values based on text analysis. Enunciative and text theories offer some clues to enhance performance of subjectivity analysis efficiency.
Vers une caractérisation automatique de critères pour l'opinion-mining - Benjamin Duthil, François Trousset, Gérard Dray, Jacky Montmain, Pascal Poncelet p. 41-62
Les technologies de l'information et le succès des services associés (e.g. blogs, forums…) ont ouvert la voie à un mode d'expression massive d'opinions sur les sujets les plus variés (sites de e-commerces, films, etc.). Récemment, de nouvelles techniques de détection automatique d'opinion (opinion-mining) proposent des analyses statistiques des avis exprimés afin de dégager une tendance globale des opinions recueillies sur une entité évaluée. Néanmoins, une analyse plus fine montre que les arguments des internautes relèvent de critères de jugement distincts. Les approches d'opinion-mining traitent peu de cet aspect multicritère pourtant riche en informations. Dans cet article, nous proposons de caractériser automatiquement les segments de textes relevant d'un critère donné sur un corpus de critiques. À partir d'un ensemble restreint de mots-clés associés à un critère, notre approche construit automatiquement une base d'apprentissage. Des expériences menées sur des jeux de données réelles illustrent l'efficacité du processus.
The development of new services (e.g. blogs, forums…) provides facilities to express opinion on different topics. Recently new techniques known as opinion mining have emerged. They often provide statistical analyses of available opinions as an overall trend on different topics. Nevertheless, whereas it is rather easy to get such an overall trend, a more detailed analysis would highlight that cybernauts' appraisals are related to multiple criteria. For example, a film can be classified as enthusiastic because of its great scenario, disappointing because of its poor soundtrack, etc. Our objective in this paper is to automatically extract any textual segment related to a criterion (or a subset of criteria) from a critics database. Then, for any criterion, opinion-mining techniques allow computing a partial assessment with regard to the criterion from the textual segments related to it. From a short list of key words characteristic of a criterion, our approach provides the required learning database for critics classification without further human intervention. Experiments have been carried out to illustrate and validate the efficiency of our approach.
Pénalisation des mots fréquents pour la classification de sentiments - Abdelhalim Rafrafi, Vincent Guigue, Patrick Gallinari p. 63-84
Nous abordons dans cet article le problème de la classification de sentiments en utilisant des techniques d'apprentissage statistique supervisé. Nous étudions différentes combinaisons de fonctions coûts et de régularisations. Le principal problème de la classification de sentiments par rapport à la classification thématique se trouve au niveau de l'extraction de caractéristiques discriminantes. Nous montrons dans cet article que la régularisation classique (L1 ou L2) sélectionne des caractéristiques qui ne sont pas adaptées aux sentiments. Nous présentons une nouvelle méthode de régularisation en pénalisant les mots fréquents : cette méthode nous a permis d'obtenir de très bons résultats en détection de sentiment ainsi qu'en classification multidomaine sur plusieurs jeux de données de référence. Nous fournissons des analyses détaillées des résultats et des interprétations des modèles appris.
We study in this paper the sentiment classification problem using supervised classifiers corresponding to different combinations of loss and regularization functions. A key difficulty of sentiment classification compared to thematic classification is the definition and selection of relevant features. We show that classical regularization approaches fail to weight or select relevant terms for this task. We introduce a new method based on a term dependent regularization for penalizing specific families of terms. This new regularization framework enables us to obtain very good performance on a classical sentiment recognition task as well as for multi-domain sentiment classification on classical benchmarks. We provide an in depth analysis of the results and an interpretation of the model behavior. It shows that the proposed regularization method is an effective selection tool for discriminative terms in the context of sentiment classification.
Littérature et sentiments : Assumer ses choix de lectures sur le web - Magali Bigey p. 85-102
Les choix sont parfois difficiles à assumer, surtout en ce qui concerne certaines pratiques de lecture, principalement celles ayant trait à la lecture sérielle, la romance, les mangas… Le public lecteur de ces divers genres populaires est en permanence victime d'un déclassement, allant même parfois jusqu'à une stigmatisation dérangeante. Nous avons recensé sur le web des forums et des blogs évoquant le sujet, des internautes défendant des choix de lectures, tout en dévoilant leurs sentiments quant à une accusation de mauvais choix qui pour certains de leurs détracteurs confine au mauvais goût. Nous verrons de quelle manière nous pouvons analyser ces données, et particulièrement l'expression des sentiments, par le biais des méthodes de l'analyse automatique de textes.
Choices are often difficult to assume, especially concerning reading practices of serial literature, romances, mangas… Readership of this kind of popular romances is always depreciate, often stigmatized. We identified web forums and blogs mentioning the subject of readers defending their choice of readings, and thus revealing their feelings about their possible bad choices and bad taste. We'll see how we can analyze the data, particularly the expression of feelings with tools through methods of automatic analysis of texts.
Les réseaux sociaux de santé : Communauté et co-construction de savoirs profanes - Sébastien Broca, Raphaël Koster p. 103-116
Les réseaux sociaux de santé sur internet se développent dans le cadre d'un processus de prise en compte de la parole et de l'expérience du malade par l'institution médicale. Du fait de leurs dynamiques d'échanges et de la volonté commune à leurs usagers de lutter contre l'isolement de la maladie, ils sont souvent présentés comme « communautaires ». Mais ce terme recouvre en fait une diversité d'opinions, de représentations et de sentiments d'appartenance. Il existe cependant des réseaux, où la conscience de buts et de valeurs partagés conduit à la constitution de savoirs profanes. Nous étudions les apports et les limites de ce phénomène sur l'exemple de Yahoo autisme.
The development of health-based social networks is part of a historical process leading to a stronger regognition of the patient's feeelings and opinions by the medical institution. These networks are often referred to as “communities”, because they host the intense socialities of users trying to overcome the loneliness caused by their diseases. But behind the word “community” lies a diversity of opinions, ideas, and feelings of belonging. Nonetheless some social networks, where users are driven by common goals and shared values, help to construct lay knowledge. We study the benefits and the drawbacks of this phenomenon, on the example of Yahoo autisme.
Une expérience d'utilisation d'e-portfolio en formation continue - Hédia Mhiri Sellami p. 117-134
Ce travail présente l'opinion d'étudiants concernant une expérience d'utilisation d'e-portfolio dans le cadre d'un module de master en formation continue. Cet article présente le déroulement de l'expérience ainsi que le concept d'e-portfolio. À la fin du module d'enseignement les étudiants ont répondu à un questionnaire composé de questions fermées et ouvertes. Le premier groupe de questions a permis d'extraire des résultats formels (modes, corrélations, etc.) puisqu'il a été analysé par des méthodes statistiques. Les questions ouvertes ont certes été traitées « manuellement » mais ont contribué à donner plus d'éclaircissements. Ce traitement individuel des questions ouvertes a été réalisé grâce à leur nombre réduit ainsi qu'à la petite taille de l'échantillon.
This paper presents the students' opinion about an experience of using the e
Portfolio as a tool reinforcing a course in a continuous training. A questionnaire is submitted to students to evaluate the students' appreciation of the ePortfolio. Once the context of this experience is presented, the questionnaire and its results are detailed.
Reconnaissance des émotions dans la musique - Jean Debaecker p. 135-156
La reconnaissance des émotions dans la musique est un challenge industriel et académique. À l'heure de l'explosion des contenus multimédias, il devient nécessaire de concevoir des ensembles structurés de termes et concepts facilitant l'organisation et l'accès aux connaissances. Dans les bibliothèques musicales, l'analyse des sentiments et la classification par émotion sont très émergentes et demeurent un objet de recherche ambitieux. Dans cet article, nous donnons un aperçu de l'existant et du contexte applicatif sur l'évaluation quantitative et qualitative des sentiments à travers le prisme de l'intersubjectivité du sujet. Puis nous présentons le protocole expérimental mis en place, permettant d'évaluer l'intersubjectivité du sujet ainsi que les premiers résultats obtenus.
Music emotion recognition is an industrial and academic challenge. While we observe an explosion of multimedia content, it becomes crucial to build structured sets of terms and concepts so as to help knowledge organization. In music libraries, sentiment analysis and emotion classification are emerging and remain a subject of ambitious research. In this chapter, we will do an overview of the state-of-the-art over the application context and the quantitative and qualitative assessment of feelings through the intersubjectivity of the subject. Then we will present our experimental protocol for evaluating the intersubjectivity of the subject and the first results obtained so far.