Identifier la cible des sentiments dans les forums de santé S. BRINGAY, E. KERGOSIEN, P. POMPIDOR, P. PONCELET



Documents pareils
Cette Leçon va remplir ces attentes spécifiques du curriculum :

ANGULAR JS AVEC GDE GOOGLE

Tex: The book of which I'm the author is an historical novel.

Deadline(s): Assignment: in week 8 of block C Exam: in week 7 (oral exam) and in the exam week (written exam) of block D

Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA

SparkInData. Place de Marché des applications Spatiales

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Recherche bibliographique

Present Tense (1) masc = masculine fem = feminine sing = singular pl = plural

Parcours DIWEB : (Données, Interaction et Web)

Exemple PLS avec SAS

Le verbe avoir (to have) infinitif = avoir. j ai nous avons tu as vous avez. Exemples: J ai une copine à Montréal.

Classification Automatique de messages : une approche hybride

1.The pronouns me, te, nous, and vous are object pronouns.

Le passé composé. C'est le passé! Tout ça c'est du passé! That's the past! All that's in the past!

I. Présentation générale des épreuves écrites

Ingénierie et gestion des connaissances

Attestation de maîtrise des connaissances et compétences au cours moyen deuxième année

Rodney King's trial. Tâche finale : réouverture du procès des policiers dans l'affaire Rodney King. (Production orale en interaction/jeu de rôle)

Diapo 1. Objet de l atelier. Classe visée. Travail en co-disciplinarité (identité et origine académique des IEN)

Apprentissage Automatique

Compte-rendu de Hamma B., La préposition en français

Lesson Plan Physical Descriptions. belle vieille grande petite grosse laide mignonne jolie. beau vieux grand petit gros laid mignon

JSIam Introduction talk. Philippe Gradt. Grenoble, March 6th 2015

COMPTE DE RESULTAT PAR DESTINATION ET INFORMATION SECTORIELLE. Presentation de Mr. Christian MULLIEZ

VALIDATION DES FORMATIONS DOCTORALES FICHE DE SUIVI. Année universitaire

Notes de lecture : Dan SPERBER & Deirdre WILSON, La pertinence

ACTIVITÉS DE COMMUNICATION LANGAGIÈRE ET STRATÉGIES

NOM : Prénom : Date de naissance : Ecole : CM2 Palier 2

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

Cours de didactique du français langue étrangère (*) French as a foreign language (*)

4. SERVICES WEB REST 46

Attachée Temporaire d Enseignement et de Recherche Institut d Administration des Entreprises Université de Toulouse 1 Capitole.

OPITER : Fouille de données d opinionpour les territoires

XML par la pratique Bases indispensables, concepts et cas pratiques (3ième édition)

De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues

majuscu lettres accent voyelles paragraphe L orthographe verbe >>>, mémoire préfixe et son enseignement singulier usage écrire temps copier mot

Tammy: Something exceptional happened today. I met somebody legendary. Tex: Qui as-tu rencontré? Tex: Who did you meet?

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 25/12/2006 Stéphane Tufféry - Data Mining -

Dis où ces gens vont d après les images / Tell where these people are going based on the pictures.

Eléments de statistique

Interférences lexicales entre deux langues étrangères: anglais et français

Instructions pour mettre à jour un HFFv2 v1.x.yy v2.0.00

QUESTIONNAIRE DESTINE AUX VETERINAIRES ET AUX RESPONSABLES DE CLINIQUE VETERINAIRES

Confirmation du titulaire de la carte en cas de contestation de transaction(s) Cardholder s Certification of Disputed Transactions

BAP E Gestionnaire de parc informatique et télécommunications MI2 / MI3 Ouverts au titre de 2010 Arrêté du 7/04/10 - J.

A l'avenir, chacun aura son quart d'heure de célébrité.. Andy WAHROL

PRESENT SIMPLE PRESENT PROGRESSIF

COMPTABILITÉ. PCG : provisions pour grosses réparations vs amortissements par composants. Cette étude a pour objet. reflexion. Résumé de l article

English Q&A #1 Braille Services Requirement PPTC Q1. Would you like our proposal to be shipped or do you prefer an electronic submission?

Français langue étrangère Savoir-faire - Actes de paroles - Supports d apprentissage -Tâches

LA PRODUCTION ÉCRITE SEPTIÈME ANNÉE

PLAN DE COMMUNICATION TACTIQUE COMM Faculté des lettres : Département d'information et de communication PLAN DE COURS

Programme GESTION DU TRAVAIL DE BUREAU No de programme

fiche D AUTOCORRECTION Frimousse, une petite chienne qu'on a adoptée le mois dernier, est intelligente et docile.

Module Title: French 4

Un dictionnaire électronique pour apprenant de l'arabe (langue seconde) basé sur corpus

TRAVAUX DE RECHERCHE DANS LE

Dans une agence de location immobilière...

Ce que vaut un sourire

Bigdata et Web sémantique. les données + l intelligence= la solution

Mon Odyssée Lean Startup

lundi 3 août 2009 Choose your language What is Document Connection for Mac? Communautés Numériques L informatique à la portée du Grand Public

Agile&:&de&quoi&s agit0il&?&

DEFT 09 : détection de la subjectivité et catégorisation de textes subjectifs par une approche mixte symbolique et statistique

Micro-ordinateurs, informations, idées, trucs et astuces utiliser le Bureau à distance

Les Portfolios et Moodle Petit inventaire

Thank you for choosing the Mobile Broadband USB Stick. With your USB Stick, you can access a wireless network at high speed.

THE SUBJUNCTIVE MOOD. Twenty-nineth lesson Vingt-neuvième leçon

AGROBASE : un système de gestion de données expérimentales

PRESENTATION DE SUPPORTS DE COMMUNICATION

ÉCOLE SECONDAIRE PÈRE-RENÉ-DE-GALINÉE

First Nations Assessment Inspection Regulations. Règlement sur l inspection aux fins d évaluation foncière des premières nations CONSOLIDATION

Plan du cours : Zippers. Des fonctions sur les listes avec position. Des fonctions sur les listes avec position

MODERN LANGUAGES DEPARTMENT

Perl Console. Votre compagnon pour développer en Perl. Les Journées du Perl , 17 novembre, Lyon. Alexis Sukrieh

Les défis du traitement automatique du langage pour l analyse des réseaux sociaux

LE PLAN SAUMON DE LOIRE- ALLIER THE LOIRE-ALLIER. Nicolas FORRAY Dreal Centre, Dreal de bassin Loire-Bretagne

Le Product Backlog, qu est ce c est?

Langue, techniques de rédaction et correction d épreuves (412-2A1-LG)

Ecole Technique «Transformation de données documentaires» Poitiers, mars Atelier 1: Sphinx. import, conversion, export de données

NORMALISATION DU VOCABULAIRE DU DROIT DES CONTRATS DOSSIER DE SYNTHÈSE par Sylvette Savoie Thomas et Gérard Snow

OBJECT PRONOUNS. French III

Objectif. Développer son efficacité personnelle par une meilleure communication avec soi et les autres

ARCHOS Activity Tracker

Norme de qualité. Catégorie 3 : Services de traduction juridique (de l anglais au français ou du français à l anglais)

GUIDE Excel (version débutante) Version 2013

Critères de Choix d une Echelle de Qualité De Vie. Etudes cliniques dans l autisme. Introduction

N SIMON Anne-Catherine

GAME CONTENTS CONTENU DU JEU OBJECT OF THE GAME BUT DU JEU

PeTEX Plateforme pour e-learning et expérimentation télémétrique

Deux exemples de paragraphes, donnés en contre-point l un de l autre :

Application Form/ Formulaire de demande

Langue Française. Syllabus A1. Description globale du niveau A1 utilisateur élémentaire

CATALOGUE DES FORMATIONS 2014

Cl) Cl) I-. >CD CD _.CD. o-q OCD - C, -CD 0C1) CDO CDCD. ( Co. 0c;1. Cl) r%) (31. Cl) C-)

Les attentes du marché

3615 SELFIE. HOW-TO / GUIDE D'UTILISATION

Version et explication de choix de traduction Version (un tiers de la note de traduction) 1. Contexte.

Transcription:

Identifier la cible des sentiments dans les forums de santé S. BRINGAY, E. KERGOSIEN, P. POMPIDOR, P. PONCELET

Projet Patients Mind Financement par le Réseau National des MSH (Maisons des Sciences de l Homme) 2014-2015 Lille 3 MSH Toulouse Montpellier 2

Un projet pluri-disciplinaire Informatique Statistiques Analyse des forums Chercheurs SHS Linguistique Acteurs de Santé 3

Objet d étude Forums de santé en ligne Espaces d échanges asynchrones de messages textuels Intermédiaires entre discours oral et écrit 4

Analyser les forums de santé Forums : une base de connaissances volumineuse, riche, variée, unique, atypique des perceptions qu'ont les patients de leur maladie et des soins qui leur sont éventuellement prodigués 5

Analyser les forums de santé Forums : une base de connaissances volumineuse, riche, variée, unique, atypique des perceptions qu'ont les patients de leur maladie et des soins qui leur sont éventuellement prodigués Analyser les forums, un enjeu important pour Patients : J ai perdu mes cheveux suite à ma chimio. Que font les autres dans mon cas? Professionnels de santé : Quelles sont les réactions des patientes qui ont peur de la pilule 3 ème génération? Laboratoires : Que pensent les patients du médicament X? 6

Démarche générale du projet Forums de santé 1. Extraction de marqueurs 1. de sentiment 2. d incertitude 3. de risque 2. Analyse de la perception de la santé 7

Démarche générale du projet Forums de santé 1. Extraction de marqueurs 1. de sentiment 2. d incertitude 3. de risque 2. Analyse de la perception de la santé 8

Modèle de sentiment 9

Modèle de sentiment 15/05/14 Cible des émotions 10

Tâche visée : identification de la cible I'm afraid of my doctors reaction Source Target My doctor is afraid of my reaction to the drug Source Target 11

Application Application : Agréger les informations pour plusieurs messages Peur d arrêter Peur de continuer 12

Contraintes de l étude Ne traiter que l anglais Se focaliser sur la cible Traiter les sentiments (polarité et émotion) Ne considérer que des relations sentiment / cible au sein des phrases 14/05/14 Cible des émotions 13

Contraintes de l étude Appliquer peu de pré-traitements Taille des messages variables (100 à 1 000 caractères) Style (structures grammaticales non standards, orthographe ) gé peur, ma choimio Argot LOL, FIV Expressions riches en sentiment : expression (I love), présentation (TIRED, enooooooogh,!!!!) émoticons (:-)) 14

Plan de la présentation 1. Approche proposée 2. Expérimentations menées 3. Conclusions et travaux en cours 15

Plan de la présentation 1. Approche proposée 2. Expérimentations menées 3. Conclusions et travaux en cours 16

Etat de l art Etape 1 : Identifier des sentiments Etape 2 : Identifier des cibles Etape 3 : Relier sentiment et cible 17

Etat de l art Etape 1 : Identifier des sentiments Etape 2 : Identifier des cibles Etape 3 : Relier sentiment et cible 14/05/14 Cible des émotions 18

Etat de l art Etape 1 : Identifier des sentiments Etape 2 : Identifier des cibles Etape 3 : Relier sentiment et cible 14/05/14 Cible des émotions 19

Etat de l art Etape 1 : Identifier des sentiments. de nombreuses ressources en anglais pour la polarité General Inquirer, LIWC (Linguistic Inquiry and Word Count) quelques ressources pour les émotions Dictionnaire DAL, lexique de Mohammad des extensions de ces vocabulaires pour des domaines spécifiques (co-occurrences de mots, apprentissage) 15/05/14 Cible des émotions 20

Etat de l art Etape 1 : Identifier des sentiments. de nombreuses ressources en anglais pour la polarité General Inquirer, LIWC (Linguistic Inquiry and Word Count) quelques ressources pour les émotions Dictionnaire DAL, lexique de Mohammad des extensions de ces vocabulaires pour des domaines spécifiques (co-occurrences de mots, apprentissage) 21

Etat de l art Etape 2 : Identifier des cibles Entité ou facettes d entités prédéfinies Ou fréquentes 14/05/14 Cible des émotions 22

Etat de l art Etape 3 : relier sentiment et cible Règles souvent manuelles prenant en compte les modifieurs de sens ne pas, à peine, très, les conjonctions Calcul de distance basé sur un nombre de mots l arbre syntaxique (nombre d arcs ou profondeur) 14/05/14 Cible des émotions 23

Framenet (Baker et al., 1998) Analyse sémantique de surface (Shallow semantic parsing) : associer des rôles sémantiques aux différents constituants d un énoncé une fonction par rapport à une situation schématique de type Agent, Patient, Sujet https://framenet.icsi.berkeley.edu/ 24

Framenet (Baker et al., 1998) Frame experiencer focus FEs Definition: The words in this frame describe the Experiencer's EMOTIONS with respect to some target. Although the target may refer to an actual state of affairs, quite often it refers to a general situation which causes the emotion. Annotations Examples: Smithers takes great PLEASURE in collecting matchboxes. I HATE it when you do that. LUs Examples: abhor.v, abhorrence.n, abominate.v, adoration.n, adore.v, etc. 25

Comparaison de deux approches Framenet - semafor I HATE my physician when he told me the bad prognosis Experiencer Emotion Target Circonstance Chemin - standford I Root HATE my when physician he told me the bad prognosis 26

Plan de la présentation 1. Approche proposée 2. Expérimentations menées 3. Conclusions et travaux en cours 27

ETAPE 1 MESH 6% Lexique d émotions 22% 17 000 messages Spine-health Phrases contenant des mots d émotion et des objets médicaux 28

ETAPE 1 MESH 6% ETAPE 2 Lexique d émotions 22% Phrases annotées par des rôles 17 000 messages Spine-health Etiquetage automatique des rôles sémantiques (SEMAFOR) Sélection des frames pertinentes Typage des FEs et ULs pouvant représenter la cible Phrases contenant des mots d émotion et des objets médicaux Typologie des Fes et ULs 29

Typologie des Frames 30

ETAPE 1 MESH 6% ETAPE 2 Lexique d émotions 22% Phrases annotées par des rôles ETAPE 3 17 000 messages Spine-health Etiquetage automatique des rôles sémantiques (SEMAFOR) Sélection des frames pertinentes Typage des FEs et ULs pouvant représenter la cible Phrases contenant des mots d émotion et des objets médicaux Typologie des Fes et ULs Interface de validation Phrases annotées par la typologie définie 31

Validation 345 phrases 10 experts 3 experts par phrases 32

Résultats Approche Framenet Approche chemin Correct Part. correct Incorrect Fleiss Kappa REC* 53% 34% 13% 0.58 (m) 0.63 8% 43% 49% 0.48 (m) 0.52 15/05/14 Cible des émotions 33

Résultats Correct Part. correct Incorrect Fleiss Kappa REC* Approche Framenet Approche chemin 53% 34% 13% 0.58 (m) 0.63 8% 43% 49% 0.48 (m) 0.52 Approche chemin Pas de liste prédéfinie de cibles : I fear the long term tendency Sensibilité du parseur à la langue des forums 15/05/14 Cible des émotions 34

Résultats Correct Part. correct Incorrect Fleiss Kappa REC* Approche Framenet Approche chemin 53% 34% 13% 0.58 (m) 0.63 8% 43% 49% 0.48 (m) 0.52 Approche rôle + Détection des phrases sans sentiment + Efficace quand un verbe est porteur de sentiments : I fear the surgeon will be reluctant to continue helping control my pain + Cibles liées à la santé faciles à identifier (infos contextuelles) - Limite Framenet (n existe qu en français, pas de marqueurs comme l incertitude ou le risque) 15/05/14 Cible des émotions 35

Plan de la présentation 1. Approche proposée 2. Expérimentations menées 3. Travaux en cours et perspectives 36

Perspectives sur la recherche de la cible Identification de la source My doctor is concerned that my blood glycerol increases La source n est pas toujours l énonciateur (contrairement aux avis sur les produits) Transposition au Français Traduction de la ressource de (Mohamad, 2010) http://www.jeuxdemots.org/ Relation entre phrases au niveau du paragraphe et du message Sentiment implicite (pas de mot de sentiment) 37

Perspectives dans le projet Généralisation à plusieurs messages analyse de la qualité de vie pour le cancer du sein 38

Des questions? 39