Vers un lexique arabe pour l analyse des opinions et des sentiments

Dimension: px
Commencer à balayer dès la page:

Download "Vers un lexique arabe pour l analyse des opinions et des sentiments"

Transcription

1 Vers un lexique arabe pour l analyse des opinions et des sentiments Amine Bayoudhi, Houssem Koubaa, Lamia Hadrich Belguith ANLP Group, MIRACL laboratory FSEGS, University of Sfax B.P. 1088, 3018, Sfax, TUNISIA bayoudhi.amine@gmail.com houssemkoubaa90@gmail.com l.belguith@fsegs.rnu.tn Hatem Ghorbel ISIC Lab, HE-Arc Ingénierie University of Applied Sciences CH-2610 St-Imier, Switzerland hatem.ghorbel@he-arc.ch Abstract La classification de polarité est considérée parmi les tâches les plus importantes dans le domaine de fouille d opinion. Cette tâche est très utile dans la mesure où elle permet d attribuer à un énoncé subjectif une polarité positive ou négative. Néanmoins, la classification de polarité nécessite des ressources linguistiques telles que les corpus annotés et les lexiques d opinion. Ces ressources sont très rares pour la langue arabe à cause du coût élevé demandé pour leur création. Le présent travail est situé dans ce cadre. Nous proposons une méthode pour construire un nouveau lexique d opinion pour la langue arabe. La méthode part du lexique Arabic MPQA et se base sur l exploitation d outils et de ressources linguistiques arabes et multilingues. Pour l évaluation de la couverture, nous avons testé notre lexique LAP (Lexicon of Arabic Polarized words) en faisant la classification de polarité du corpus OCA (corpus de commentaires sur les films) au niveau document et au niveau phrase. Les résultats sont encourageants et montrent une augmentation de plus de 9% du F1. Keywords analyse de l opinion et de sentiment; lexique d opinion arabe; classification de polarité; corpus d opinion annotés; I. INTRODUCTION La fouille d opinion et l analyse des sentiments attirent de nos jours l attention de plusieurs chercheurs dans le domaine de Traitement Automatique des Langages Naturels (TALN). L importance de cet axe de recherche réside surtout dans le traitement de pages web dont le contenu est généré par l utilisateur (User-generated content Web). Ce type d information, tels que les réseaux sociaux, les blogs et les forums de discussion, a connu ces dernières années une évolution énorme et est devenu une composante influente dans la vie sociale, politique et même économique. La classification de polarité est considérée parmi les tâches les plus importantes dans le domaine de fouille d opinion. Cette tâche permet d attribuer à un énoncé subjectif une polarité positive ou négative. Ceci est très utile dans la mesure où il permet de fouiller les opinions des gens à propos d un sujet donné (i.e. une organisation, un produit, un personnage, etc), et agir et prendre des décisions selon les résultats. Néanmoins, la tâche de classification de polarité nécessite des ressources linguistiques à savoir, les corpus annotés et les lexiques d opinion dépendamment de l approche adoptée. Ces ressources sont très rares pour la langue arabe à cause du coût élevé demandé pour leur création. Dans cet article, nous proposons une méthode pour construire un nouveau lexique d opinion pour la langue arabe que nous avons appelé LAP (Lexicon of Arabic Polarized words). La méthode, part du lexique Arabic MPQA et se base sur l exploitation d outils et de ressources linguistiques arabes et multilingues. Une étape d annotation manuelle est aussi considérée pour enrichir le lexique obtenu. Dans ce qui suit, nous présentons dans la section 2 quelques travaux similaires sur la création des lexiques d opinion pour la langue arabe. Dans la section 3, nous proposons notre méthode pour la création du lexique d opinion LAP. Dans la section 4, nous exposons et nous discutons les résultats obtenus. Dans la section 5, nous terminons par une conclusion et des perspectives. II. TRAVAUX PRÉCÉDENTS Bien que le domaine de fouille d opinion et d analyse de sentiments soit un domaine émergent dans la communauté de traitement automatique des langages naturels, les travaux effectués pour la langue arabe sont encore très limités. En effet, la plupart des travaux se concentrent sur la classification de polarité des documents pour éviter le coût élevé de l annotation des phrases, et adoptent aussi l approche basée sur l apprentissage automatique pour échapper du coût élevé de la création d un lexique d opinion ayant une bonne couverture. Ainsi, l obstacle qui ralentit l avancement du domaine de fouille d opinion pour l arabe est la disponibilité des ressources en termes de corpus annotés et lexiques d opinion. Dans cette section, nous passons en revue les travaux effectués dans le domaine de l analyse de l opinion en arabe. En particulier, nous mettons l accent sur les ressources linguistiques disponibles en termes de lexiques d opinion. Elhawary et Elfeky[1] sont parmi les premiers chercheurs qui se sont intéressés à construire un lexique d opinion pour la langue arabe. Leurs travaux ont été dans le cadre de 231

2 développement d un outil de classification des avis des intervenants dans le domaine des affaires. Le lexique d opinion est utilisé pour attribuer aux mots d opinion détectés des scores utilisés à leur tour comme étant des critères d apprentissage. Pour générer le lexique, Elhawary et Elfeky ont proposé de faire la propagation d un ensemble de mots annotés manuellement sur un graphe de similarité. L ensemble des mots de départ comptait plus que 600 mots positifs, 900 mots négatifs et 100 mots neutres. Concernant le graphe de similarité, il est construit par apprentissage non supervisé sur un large corpus du web, et il permet de calculer les scores des mots du lexique en se basant sur les poids des arcs. Les tests d évaluation effectués ont montré une précision relativement bonne mais un faible rappel. El-Halees [2] a proposé une approche combinée basée sur trois étapes pour la classification de documents arabes selon leurs polarités. Dans la première étape, il utilise un lexique d opinion construit à partir de deux ressources principales : (1) Le lexique anglais Sentistrength après avoir fait la traduction tout en respectant les intensités des mots, (2) Des dictionnaires en ligne permettant d enrichir le lexique par les synonymes des mots déjà existants. La taille du lexique n a pas été mentionnée, et l exactitude de l outil de classification pour l étape basée sur le lexique est de 48.7%. Dans [3], Abdul-Mageed et Diabont ont présenté le lexique "Sifaat", un lexique construit manuellement et contenant 3325 adjectifs annotés selon les trois classes positive, négative et neutre. Les résultats de l évaluation montrent une amélioration de 6% dans la classification de subjectivité et 40% dans la classification de polarité. Les auteurs ont proposé aussi d étendre le lexique par la traduction de trois lexiques d opinion anglais à savoir, SentiWordNet, Youtubelexicon et General Inquirer. Mais cette méthode, concentrée seulement sur les adjectifs, n a pas été évaluée. Abdulla et al. [4] ont proposé de créer un lexique en traduisant 300 mots de Sentistrength, puis en l enrichissant par les synonymes et les émoticons. La version finale du lexique comprenait 3479 entrées dont 1262 positives et 2217 négatives. Les résultats de l expérimentation sur le corpus collecté ont atteint 59.6% en terme d exactitude. Alhazmi et al. [5] ont proposé de construire une version arabe de SentiWordNet en passant par deux étapes : mettre à jour la base de WordNet arabe 2.0 en faisant le mappage vers WordNet Anglais 3.0, et faire le mappage de la base obtenu vers SentiWordNet Anglais 3.0. L évaluation de la couverture du lexique reporte que 5% des mots du corpus annoté ne sont pas dans le lexique. III. CREATION DU LEXIQUE LAP Etant donné que la création d un lexique d opinion "from scratch" est une tâche assez coûteuse, nous avons choisi de bénéficier des lexiques déjà disponibles, les améliorer et les enrichir. Pour ce faire, nous proposons une approche basée sur l exploitation des outils et des ressources linguistiques arabes (traducteur, lemmatiseur, dictionnaires, etc.), et des lexiques d opinion Anglais ou multilingue (MPQA lexicon, Sentistrengthlexicon), et sur l annotation semi-automatique de nouveaux corpus d opinion multi-domaines. Cette approche (Fig. 2) est constituée de quatre phases : phase d examination et de nettoyage, phase d enrichissement par importation, phase d enrichissement par annotation, et phase de reformation. Le lexique de départ que nous avons utilisé pour construire le lexique LAP est la version traduite de MPQA[6]. A. Phase d examination et de nettoyage Cette phase consiste dans un premier lieu à examiner manuellement le lexique traduit de MPQA. Cette opération nous a permis de dégager les anomalies suivantes : Existence de mots dupliqués dans la même classe. Par exemple : les mots احتقار (mépris),,( stupide )أحمق ( gêne )ازعاج se trouvent dans plusieurs entrées de la classe NegativeStrong. Existence de mots plutôt objectifs (n ont pas de polarité à priori). Par exemple : معاني قرار,( sens ) (décision), (traiter). يعامل Existence de mots mal classés (n ont pas vraiment la polarité attribuée). Par exemple : الخوف (peur) est classé comme étant un mot Positive Strong alors qu'il doit être classé comme Negative. ممتاز (excellent) est classé comme étant un mot Positive Weak alors qu'il est un mot positive Strong, ألم (douleur) est classé Positive Strong au lieu de Negative. L omission des Part of Speech (POS) des mots. En effet, le lexique est stocké sous forme de quatre fichiers de type textes représentant chaque classe sentimentale. D où l absence des POS qui peuvent être très utiles dans la détection des mots s écrivant de la même façon (i.e. ذهب peut avoir le sens de "l or" qui est un nom, et peut avoir le sens de "aller" qui est un verbe). Dans un deuxième lieu, et pour remédier à certaines de ces anomalies, nous avons procédé à une opération de nettoyage automatique en éliminant les mots dupliquées. Ces mots sont de deux types : (1) des mots dupliqués dans la même classe (ce sont des mots inutiles qui peuvent être supprimés sans aucun problème), (2) des mots dupliqués entre classes qui doivent être supprimés pour éviter l ambiguïté. En fait, à ce stade, le lexique ne dispose pas de technique de désambiguïsation. B. Phase d enrichissement par importation Cette phase est constituée de trois étapes à savoir, l enrichissement du lexique par traduction, l enrichissement par les synsets de ArabicWordNet et l enrichissement à partir du lexique Sentistrength. Enrichissement par traduction : la version arabe de MPQA ne contient pas la traduction de tous les mots de la version originale anglaise. En effet, le nombre de mots dans la version anglaise de MPQA est 8222 et le nombre de mots dans la version arabe est C est pourquoi, nous avons utilisé le traducteur de Google pour traduire le reste des mots. Parmi les mots qui ont نزيه été ajouté dans cette étape, il y a les mots ثأر,( probe ) (vengeance), بارز (marquant). Notons que pendant le processus de traduction, il y a des mots qui peuvent s ajouter au lexique à cause de l existence de plusieurs possibilités de traduction. De même, il y a des mots qui peuvent être éliminés car leurs correspondants en arabe existent déjà dans le lexique. 232

3 Fig. 1. Etapes de la construction du lexique LAP Enrichissement par les synsets de WordNet : Cette étape se base sur l hypothèse que les mots ayant les mêmes synonymes possèdent la même polarité. Par conséquent, nous avons enrichi le lexique LAP par les synsets de Arabic WordNet[7] correspondants à chaque mot du lexiquearabic MPQA. Ceci est fait en exploitant les relations de type "Near_synonym"de ArabicWordNet. Parmi les mots ajoutés au lexique dans cette étape : شديد (sévère) qui est le proche synonyme de عنيف (violent), منفصل (séparé) qui est le proche synonyme de مفكك (démonté), et واقعي (réaliste) qui est le proche synonyme de حقيقي (réel). Enrichissement à partir de Sentistrength : Pour enrichir le lexique LAP, nous avons exploité d autres lexiques d opinion multilingues disponibles gratuitement pour la recherche scientifique tel que Sentistrength[8]. Sa version arabe n est pas assez grande, elle compte seulement 1434 mots. Mais elle nous a été utile puisqu elle a alimenté le lexique LAP par de nouveaux mots, à titre d exemple, أناني (égoïste), األمثل (idéal) et (contentement). اطمئنان C. Phase d enrichissement par annotation Cette phase permet d enrichir le lexique par annotation de corpus. L annotation permet de marquer les mots subjectifs du texte et les ajouter au lexique selon leur classe sentimentale. Nous avons fait le marquage en utilisant un outil d annotation (Fig. 2) développé pour cette tâche et appelé l outil ASAT (Arabic Sentiment Annotation Tool). L outil ASAT offre la possibilité à l annotateur de marquer les mots avec différentes couleurs selon les classes sentimentales adoptées. Comme il lui offre aussi la possibilité de classer les phrases après avoir segmenté l énoncé avec l outil STAr [9].Le marquage des mots est fait selon les quatre classes du lexique Arabic MPQA à savoir, Negative Strong, Negative Weak, Positive Strong et Positive Weak. Fig. 2. Interface graphique de l outil ASAT Le corpus annoté utilisé pour l enrichissement du lexique est COPARD2 (Corpus of Opinion Arabic Debates), un corpus issu du domaine politique. Il est constitué d un ensemble de télé programmes de type débats politiques diffusés par la chaine Aljazeera. Ce corpus regroupant 20 épisodes transcrits est illustré par le tableau 1. TABLE I. CARACTERISTIQUES DU CORPUS COPARD2 Nombre de documents 20 Nombre total de mots 97,172 Nombre de segments 8,234 Nombre de segments négatifs 2,241 Nombre de segments positifs 2,075 Nombre de segments neutres 3,

4 TABLE II. EVOLUTION DE LA TAILLE DU LEXIQUE LAP Classe Arabic MPQA Arabic MPQA nettoyé Extension par traduction Extension par les synonymes de WordNet Extension parsentistrength Extension par annotation de COPARD2 lemmatisé NegativeStrong 2,860 1,752 2,657 2,666 2,666 2,991 2,281 NegativeWeak 2, ,152 1,155 2,057 3,056 2,689 PositiveStrong 1, ,378 1,386 1,386 1,990 1,726 PositiveWeak 1, ,131 1,608 1,437 Total 7,434 5,195 6,100 2,080 7,240 9,645 8,133 D. Phase de reformation Pour assurer une bonne couverture du lexique LAP et une compression de sa taille, nous avons stocké les mots sous forme de lemmes en utilisant l outil MADAMIRA [10]. Ceci permet d une part de détecter toutes les variantes des mots, et d autre part d économiser l espace mémoire et le temps d exécution. IV. ÉVALUATION ET RESULTATS Dans cette section, nous commençons par présenter les résultats de l enrichissement du lexique LAP après l exécution des étapes décrites dans la section précédente. Ensuite, nous décrivons les expériences réalisées pour évaluer la couverture du lexique. Deux types d expériences sont effectués : la classification de polarité des documents en utilisant un modèle d apprentissage automatique, et la classification de polarité des phrases en utilisant un modèle de règles. Finalement, nous exposons et discutons les résultats relatifs à chaque expérience. A. Résultats de l enrichissement du lexique LAP En suivant les quatre phases d enrichissement, le lexique LAP a évolué de 7,434 mots stockés sous forme de plusieurs variantes morphologiques, dupliqués et mal classés, à 8,133 mots lemmatisés et vérifiés. Cette évolution est illustrée par le tableau 2 en termes de nombre de mots pour chaque classe sentimentale et après l exécution de chaque traitement sur le lexique.evaluation de la couverture du lexique Pour évaluer la couverture du lexique, nous avons testé la classification du corpus OCA [11] avec le lexique Arabic MPQA [6] et avec le lexique LAP. Le corpus OCA est originalement annoté au niveau document. Pour faire l évaluation de la couverture du lexique LAP, nous avons ajouté un niveau d annotation supplémentaire à savoir le niveau phrase. Ceci a été assuré en utilisant l outil ASAT qui intègre l outil STAr [9] pour la segmentation des documents en phrases. Les phrases neutres détectées ont été ensuite éliminées étant donné que l objectif du test est l évaluation de la couverture du lexique qui ne contient pas de mots neutres. Ainsi, Le corpus OCA obtenu possède les caractéristiques détaillées dans le tableau 3. TABLE III. Caractéristique CARACTERISTIQUES DU CORPUS OCA Documents Négatifs Nombre de documents Nombre total de mots 94, ,309 Moyenne de mots par document Nombre total de segments 9,225 9,152 Nombre de segments négatifs 2,989 2,016 Nombre de segments positifs 1,327 2,659 Nombre de segments neutres 4,907 4,466 Documents Positifs 1) Évaluation par classification de polarité des documents : Cette évaluation est effectuée à travers une méthode de classification basée sur l apprentissage automatique. En fait, nous avons développé un outil de classification appelé AraSentiClass (Arabic Sentiment Classification) pour implémenter l algorithme SVM sous l environnement weka. L outil classifie les documents selon la méthode "bag of opinions " c'est-à-dire que ses critères d apprentissage sont les mots d opinion détectés grâce à un lexique d opinion ou à une liste de mots clefs. Deux tests sont effectués, le premier en utilisant le lexique Arabic MPQA et le deuxième en utilisant le lexique LAP. Les mesures d évaluation adoptés sont l exactitude (Accuracy), la précision, le rappel et le F1 score. Les résultats montrent une amélioration dans le F1 score par 8% (tableau 4). TABLE IV. Mesure CLASSIFICATION DE POLARITE DES DOCUMENTS DU CORPUS OCA AVEC LES DEUX LEXIQUES Lexique Arabic MPQA Exactitude 76.6% 83.4% Précision 72.4% 81.2% Rappel 79.04% 85% F1 score 75% 83% 234

5 2) Évaluation par classification de polarité des phrases : Cette évaluation est effectuée à travers une méthode de classification basée sur un modèle de règle, dont l outil SentiClass emploie pour prédire la classe de la phrase. Le modèle utilisé est un modèle simple prenant en considération la négation seulement comme opérateur d opinion. De plus, il s appuie sur l hypothèse que la polarité d une phrase est calculée en faisant la somme des polarités des mots d opinion qui la constituent. Ces mots sont détectés par recherche directe du mot pour le lexique Arabic MPQA et par passage au lemme du mot pour le lexique LAP. Le nombre total des phrases testées après l élimination des phrases neutres est 8,991 phrases dont 3,986 sont positives et 5,005 sont négatives. Les résultats de l évaluation montrent un avancement dans le F1 score de presque 9.5% (tableau 5). TABLE V. Mesure CLASSIFICATION DE POLARITE DES PHRASES DU CORPUS OCA AVEC LES DEUX LEXIQUES Lexique Arabic MPQA Exactitude 54.55% 64.17% Précision 49.04% 57.34% Rappel 64.05% 74.93% F1 score 55.54% 64.96% V. CONCLUSION AND PERSPECTIVES Dans cet article, nous avons présenté nos travaux portant sur la création d un lexique d opinion pour la langue arabe. La méthode proposée est basée sur un enrichissement automatique et un autre manuel du lexique Arabic MPQA. L évaluation de la couverture du lexique est effectuée sur le corpus OCA en testant deux niveaux de classification : le niveau document et le niveau phrase. Les résultats de l évaluation avec le lexique LAP sont encourageants vu que nous avons pu augmenter r le F1 score de la classification de plus de 9%. Comme perspectives, nous envisageons d'améliorer la qualité du lexique en faisant recours à une étape de validation conduite par des experts. L objectif est de vérifier que la polarité attribuée à chaque mot correspond bien au contexte le plus fréquent dans lequel il est utilisé. De plus, nous envisageons d'expérimenter l approche semi-automatique (bootstrapping) pour enrichir le lexique en se basant sur des patrons lexicaux. Finalement, nous envisageons de traiter le problème d ambiguïté des mots d opinion susceptibles d être affectés à plusieurs classes de polarité. Ceci peut se faire à notre avis à travers l ajout d'étiquettes de POS dans le lexique et à travers l attribution de score à chaque mot semblablement au lexique SentiWordNet[12]. REFERENCES [1] 1. M. Elhawary and M. Elfeky. Mining Arabic Business Reviews. In Proceedings of International Conference on Data Mining Workshops (ICDMW), pages IEEE, [2] 2. A. El-Halees. Arabic Opinion Mining Using Combined Classification Approach. In Proceedings of the International Arab Conference on Information Technology (ACIT), [3] 3. M. Abdul-Mageed and M. Diab. Toward building a large-scale Arabic sentiment lexicon. In Proceedings of the 6th International Global Word- Net Conference, Matsue, Japan, [4] 4. Nawaf A. Abdulla, Nizar A. Ahmed, Mohammed A. Shehab and Mahmoud Al-Ayyoub: Arabic Sentiment Analysis: Lexicon-based and Corpus-based, 2013 IEEE Jordan Conference on Applied Electrical Engineering and Computing Technologies (AEECT), [5] 5. Alhazmi, S., Black, W. and McNaught, J, Arabic SentiWordNet in Relation to SentiWordNet 3.0, International Journal of Computational Linguistics et 4(1):1-11. [6] 6. Elarnaoty M., AbdelRahman S., Fahmy A., «a machine learning approach for opinion holder extraction in Arabic», International Journal of Artificial Intelligence & Applications (IJAIA), Vol.3, No.2, March [7] 7. Boudabous M.M, Chaâben Kammoun N., Khedher N., Hadrich Belguith L., Sadat F., Arabic WordNet semantic relations enrichment through morpho-lexical patterns, ICCSPA 13,, February 12-14, Sharjah, UAE, (2013). [8] 8. Thelwall, M., Buckley, K., Paltoglou, G. Cai, D., & Kappas, A. (2010). Sentiment strength detection in short informal text. Journal of the American Society for Information Science and Technology, 61(12), [9] 9. Lamia Hadrich Belguith, Leila Baccour, Ghassan Mourad, Segmentation de textes arabes basée sur l analyse contextuelle des signes de ponctuations et de certaines particules, TALN 2005, Dourdan, 6-10 juin [10] 10. MADAMIRA: A Fast, Comprehensive Tool for Morphological Analysis and Disambiguation of Arabic Arfath Pasha, Mohamed Al- Badrashiny, Mona Diab, Ahmed El Kholy, Ramy Eskander, Nizar Habash, Manoj Pooleery, Owen Rambow, and Ryan M. Roth, LREC [11] 11. Mohammed Rushdi-Saleh, Maria Teresa Martín-Valdivia, Luis Alfonso Ureña López, José M. Perea-Ortega: OCA: Opinion corpus for Arabic. JASIST 62(10): (2011). [12] 12. S. Baccianella, A. Esuli, and F. Sebastiani SentiWordNet 3.0: An enhanced lexical resource for sentiment analysis and opinion mining. In Proceedings of the 7th Conference on International Language Resources and Evaluation (LREC 10), pages

Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA

Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA RÉCITAL 2005, Dourdan, 6-10 juin 2005 Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA Siham Boulaknadel (1,2), Fadoua Ataa-Allah (2) (1) LINA FRE

Plus en détail

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Karima Dhouib, Sylvie Després Faiez Gargouri ISET - Sfax Tunisie, BP : 88A Elbustan ; Sfax karima.dhouib@isets.rnu.tn,

Plus en détail

Un dictionnaire électronique pour apprenant de l'arabe (langue seconde) basé sur corpus

Un dictionnaire électronique pour apprenant de l'arabe (langue seconde) basé sur corpus JEP-TALN 2004, Traitement Automatique de l Arabe, Fès, 20 avril 2004 Un dictionnaire électronique pour apprenant de l'arabe (langue seconde) basé sur corpus ZAAFRANI Riadh Faculté des Sciences Juridiques,

Plus en détail

Évaluation de G-LexAr pour la traduction automatique statistique

Évaluation de G-LexAr pour la traduction automatique statistique TALN 2011, Montpellier, 27 juin 1 er juillet 2011 Évaluation de G-LexAr pour la traduction automatique statistique Wigdan Mekki (1), Julien Gosme (1), Fathi Debili (2), Yves Lepage (3), Nadine Lucas (1)

Plus en détail

Laboratoire 4 Développement d un système intelligent

Laboratoire 4 Développement d un système intelligent DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI LOG770 - SYSTÈMES INTELLIGENTS ÉTÉ 2012 Laboratoire 4 Développement d un système intelligent 1 Introduction Ce quatrième et dernier laboratoire porte sur le développement

Plus en détail

UTILISATION DU WEB COMME MEGA-BASE DE DONNÉES LINGUISTIQUE : APPLICATION À LA TRADUCTION DE COOCCURRENCES LEXICALES FRANÇAISES-ANGLAISES

UTILISATION DU WEB COMME MEGA-BASE DE DONNÉES LINGUISTIQUE : APPLICATION À LA TRADUCTION DE COOCCURRENCES LEXICALES FRANÇAISES-ANGLAISES UTILISATION DU WEB COMME MEGA-BASE DE DONNÉES LINGUISTIQUE : APPLICATION À LA TRADUCTION DE COOCCURRENCES LEXICALES FRANÇAISES-ANGLAISES Chrystel Millon & Stéphanie Léon Equipe DELIC Université de Provence

Plus en détail

Classification Automatique de messages : une approche hybride

Classification Automatique de messages : une approche hybride RECIAL 2002, Nancy, 24-27 juin 2002 Classification Automatique de messages : une approche hybride O. Nouali (1) Laboratoire des Logiciels de base, CE.R.I.S., Rue des 3 frères Aïssiou, Ben Aknoun, Alger,

Plus en détail

Une approche de désambiguïsation morpho_lexicale évaluée sur l analyseur morphologique Alkhalil*

Une approche de désambiguïsation morpho_lexicale évaluée sur l analyseur morphologique Alkhalil* Une approche de désambiguïsation morpho_lexicale évaluée sur l analyseur morphologique Alkhalil* K.Z Bousmaha 1,2, S. Charef_Abdoun 1, L. Hadrich_Belguith 2, M.K Rahmouni 1 1Université d Oran, Faculté

Plus en détail

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines

Plus en détail

Une méthode d apprentissage pour la composition de services web

Une méthode d apprentissage pour la composition de services web Une méthode d apprentissage pour la composition de services web Soufiene Lajmi * Chirine Ghedira ** Khaled Ghedira * * Laboratoire SOIE (ENSI) University of Manouba, Manouba 2010, Tunisia Soufiene.lajmi@ensi.rnu.tn,

Plus en détail

Luc Grivel (*, **) Luc.Grivel@univ-paris1.fr

Luc Grivel (*, **) Luc.Grivel@univ-paris1.fr MAITRISER LE PROCESSUS DE TEXT MINING DANS LE CADRE D APPLICATIONS D INTELLIGENCE ECONOMIQUE, DE GESTION DE LA RELATION CLIENT OU DE GESTION DE CONNAISSANCES Luc Grivel (*, **) Luc.Grivel@univ-paris1.fr

Plus en détail

EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE

EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE ème Colloque National AIP PRIMECA La Plagne - 7- avril 7 EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE Bruno Agard Département de Mathématiques et de Génie Industriel, École

Plus en détail

CURRICULUM VITAE. Informations Personnelles

CURRICULUM VITAE. Informations Personnelles CURRICULUM VITAE Informations Personnelles NOM: BOURAS PRENOM : Zine-Eddine STRUCTURE DE RATTACHEMENT: Département de Mathématiques et d Informatique Ecole Préparatoire aux Sciences et Techniques Annaba

Plus en détail

Trois approches du GREYC pour la classification de textes

Trois approches du GREYC pour la classification de textes DEFT 2008, Avignon (associé à TALN 08) Trois approches du GREYC pour la classification de textes Thierry Charnois Antoine Doucet Yann Mathet François Rioult GREYC, Université de Caen, CNRS UMR 6072 Bd

Plus en détail

Analyses croisées de sites Web pour détecter les sites de contrefaçon. Prof. Dr. Olivier Biberstein

Analyses croisées de sites Web pour détecter les sites de contrefaçon. Prof. Dr. Olivier Biberstein Analyses croisées de sites Web pour détecter les sites de contrefaçon Prof. Dr. Olivier Biberstein Division of Computer Science 14 Novembre 2013 Plan 1. Présentation générale 2. Projet 3. Travaux futurs

Plus en détail

CommentWatcher. plateforme Web open-source pour analyser les discussions sur des forums en ligne. Marian-Andrei RIZOIU

CommentWatcher. plateforme Web open-source pour analyser les discussions sur des forums en ligne. Marian-Andrei RIZOIU CommentWatcher plateforme Web open-source pour analyser les discussions sur des forums en ligne Marian-Andrei RIZOIU 2ème octobre 2013 BLEND 2013 Lyon, France Contexte Laboratoire ERIC Université Lumière

Plus en détail

TEXT MINING Tour d Horizon

TEXT MINING Tour d Horizon TEXT MINING Tour d Horizon Media Campus WAN IFRA "Structurer, optimiser et valoriser son contenu éditorial : les outils de text mining" 24 novembre 2009, PARIS Philippe BONNY Cabinet de Conseil et d Etudes

Plus en détail

1 Description générale. Résumé

1 Description générale. Résumé Station Sensunique: une plateforme Web modulaire, collaborative et évolutive d acquisition assistée de ressources terminologiques et non terminologiques (orientée Langues Contrôlées) Izabella Thomas 1,

Plus en détail

OPITER : Fouille de données d opinionpour les territoires

OPITER : Fouille de données d opinionpour les territoires OPITER : Fouille de données d opinionpour les territoires Eric Kergosien 1,2, Pierre Maurel 2, Mathieu Roche 1,Maguelonne Teisseire 1,2 1.Lirmm, CNRS, Université Montpellier 2 161, rue Ada, 34392 Montpellier,

Plus en détail

Extraction automatique de modèles de processus pour l étude de la résolution collective de problèmes dans les communautés du logiciel libre

Extraction automatique de modèles de processus pour l étude de la résolution collective de problèmes dans les communautés du logiciel libre Extraction automatique de modèles de processus pour l étude de la résolution collective de problèmes dans les communautés du logiciel libre Gabriel Ripoche 1,2 gripoche@uiuc.edu Les Gasser 1 gasser@uiuc.edu

Plus en détail

Sens, synonymes et définitions

Sens, synonymes et définitions TALN 2009, Senlis, 24 26 juin 2009 Sens, synonymes et définitions Ingrid Falk 1 Claire Gardent 2 Evelyne Jacquey 3 Fabienne Venant 4 (1) INRIA / Université Nancy 2 (2) CNRS / LORIA, Nancy (3) CNRS / ATILF,

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane

Plus en détail

Intégration d une étape de pré-filtrage et d une fonction multiobjectif en vue d améliorer le système ExtraNews de résumé de documents multiples

Intégration d une étape de pré-filtrage et d une fonction multiobjectif en vue d améliorer le système ExtraNews de résumé de documents multiples TALN 2008, Avignon, 9-13 juin 2008 Intégration d une étape de pré-filtrage et d une fonction multiobjectif en vue d améliorer le système ExtraNews de résumé de documents multiples Fatma Kallel Jaoua (1),

Plus en détail

Construction et maintenance d une ressource lexicale basées sur l usage

Construction et maintenance d une ressource lexicale basées sur l usage Construction et maintenance d une ressource lexicale basées sur l usage Laurie Planes 1, (1) Inbenta France, 164 route de Revel, 31400 TOULOUSE lplanes@inbenta.com Résumé. Notre société développe un moteur

Plus en détail

Ressources lexicales au service de recherche et d indexation des images

Ressources lexicales au service de recherche et d indexation des images RECITAL 2011, Montpellier, 27 juin - 1er juillet 2011 Ressources lexicales au service de recherche et d indexation des images Inga Gheorghita 1,2 (1) ATILF-CNRS, Nancy-Université (UMR 7118), France (2)

Plus en détail

ACTES DU COLLOQUE. Colloque pour les Étudiants Chercheurs en Traitement Automatique du Langage naturel et ses applications.

ACTES DU COLLOQUE. Colloque pour les Étudiants Chercheurs en Traitement Automatique du Langage naturel et ses applications. ACTES DU COLLOQUE Colloque pour les Étudiants Chercheurs en Traitement Automatique du Langage naturel et ses applications Organisé par Le groupe de recherche ANLP-RG (Arabic natural Language Processing

Plus en détail

TEXT MINING. 10.6.2003 1 von 7

TEXT MINING. 10.6.2003 1 von 7 TEXT MINING 10.6.2003 1 von 7 A LA RECHERCHE D'UNE AIGUILLE DANS UNE BOTTE DE FOIN Alors que le Data Mining recherche des modèles cachés dans de grandes quantités de données, le Text Mining se concentre

Plus en détail

DEFT 09 : détection de la subjectivité et catégorisation de textes subjectifs par une approche mixte symbolique et statistique

DEFT 09 : détection de la subjectivité et catégorisation de textes subjectifs par une approche mixte symbolique et statistique DEFT 09 «DÉfi Fouille de Textes», Atelier de clôture, Paris, 22 juin 2009 DEFT 09 : détection de la subjectivité et catégorisation de textes subjectifs par une approche mixte symbolique et statistique

Plus en détail

Évaluation et implémentation des langages

Évaluation et implémentation des langages Évaluation et implémentation des langages Les langages de programmation et le processus de programmation Critères de conception et d évaluation des langages de programmation Les fondations de l implémentation

Plus en détail

Expériences de formalisation d un guide d annotation : vers l annotation agile assistée

Expériences de formalisation d un guide d annotation : vers l annotation agile assistée Expériences de formalisation d un guide d annotation : vers l annotation agile assistée Bruno Guillaume 1,2 Karën Fort 1,3 (1) LORIA 54500 Vandœuvre-lès-Nancy (2) Inria Nancy Grand-Est (3) Université de

Plus en détail

Indexation sémantique au moyen de coupes de redondance minimale dans une ontologie

Indexation sémantique au moyen de coupes de redondance minimale dans une ontologie TALN 25, Dourdan, 6 1 juin 25 Indexation sémantique au moyen de coupes de redondance minimale dans une ontologie Florian Seydoux & Jean-Cédric Chappelier Faculté Informatique et Communications Ecole Polytechnique

Plus en détail

Désambiguïsation lexicale par propagation de mesures sémantiques locales par algorithmes à colonies de fourmis

Désambiguïsation lexicale par propagation de mesures sémantiques locales par algorithmes à colonies de fourmis TALN 2011, Montpellier, 27 juin 1 er juillet 2011 Désambiguïsation lexicale par propagation de mesures sémantiques locales par algorithmes à colonies de fourmis Didier Schwab, Jérôme Goulian, Nathan Guillaume

Plus en détail

COR-E : un modèle pour la simulation d agents affectifs fondé sur la théorie COR

COR-E : un modèle pour la simulation d agents affectifs fondé sur la théorie COR COR-E : un modèle pour la simulation d agents affectifs fondé sur la théorie COR SABRINA CAMPANO DIRECTION: NICOLAS SABOURET ENCADREMENT : NICOLAS SABOURET, VINCENT CORRUBLE, ETIENNE DE SEVIN SOUTENANCE

Plus en détail

M. F. PITA Departamento de Geografía Física. Universidad de Sevilla. C/ María de Padilla s.n. 41.002-SEVILLA (Espagne). mfpita@cica.

M. F. PITA Departamento de Geografía Física. Universidad de Sevilla. C/ María de Padilla s.n. 41.002-SEVILLA (Espagne). mfpita@cica. Un nouvel indice de sécheresse pour les domaines méditerranéens. Application au bassin du Guadalquivir (sudo-uest de l Espagne). En: Un nouvel indice de sécheresse pour les domaines méditerranéens. Application

Plus en détail

Formula Negator, Outil de négation de formule.

Formula Negator, Outil de négation de formule. Formula Negator, Outil de négation de formule. Aymerick Savary 1,2, Mathieu Lassale 1,2, Jean-Louis Lanet 1 et Marc Frappier 2 1 Université de Limoges 2 Université de Sherbrooke Résumé. Cet article présente

Plus en détail

Une plate-forme open-source de recherche d information sémantique

Une plate-forme open-source de recherche d information sémantique Une plate-forme open-source de recherche d information sémantique Ines Bannour, Haïfa Zargayouna Laboratoire d Informatique de l université Paris-Nord (LIPN) - UMR 7030 Université Paris 13 - CNRS 99, avenue

Plus en détail

Apprentissage Automatique

Apprentissage Automatique Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs

Plus en détail

Français langue étrangère Savoir-faire - Actes de paroles - Supports d apprentissage -Tâches

Français langue étrangère Savoir-faire - Actes de paroles - Supports d apprentissage -Tâches Niveau C1 Descripteur global Français langue étrangère Savoir-faire - Actes de paroles - Supports d apprentissage -Tâches La personne peut : comprendre en détail de longs discours et des échanges complexes

Plus en détail

Spécialité IAD. Master de Sciences et technologie de l UPMC. Mention informatique. Partenaires : ENST, ENSTA. Responsables : T. Artières, C.

Spécialité IAD. Master de Sciences et technologie de l UPMC. Mention informatique. Partenaires : ENST, ENSTA. Responsables : T. Artières, C. Master de Sciences et technologie de l UPMC Mention informatique Spécialité IAD Partenaires : ENST, ENSTA Responsables : T. Artières, C. Gonzales Secrétariat : N. Nardy LES THÉMATIQUES ABORDÉES Les thématiques

Plus en détail

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours Information du cours Informatique décisionnelle et data mining www.lia.univ-avignon.fr/chercheurs/torres/cours/dm Juan-Manuel Torres juan-manuel.torres@univ-avignon.fr LIA/Université d Avignon Cours/TP

Plus en détail

Techniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication

Techniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication Techniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication R. Carlos Nana Mbinkeu 1,3, C. Tangha 1, A. Chomnoue 1, A. Kuete

Plus en détail

Exploitation de hiérarchies sémantiques construites à partir du Trésor de la Langue Française informatisé (TLFi) pour la recherche d images

Exploitation de hiérarchies sémantiques construites à partir du Trésor de la Langue Française informatisé (TLFi) pour la recherche d images Exploitation de hiérarchies sémantiques construites à partir du Trésor de la Langue Française informatisé (TLFi) pour la recherche d images Inga Gheorghita 1,2,3 (1) Université de Lorraine, ATILF UMR 7118,

Plus en détail

SIMPLIFIER LA PRODUCTION DE VOS TRADUCTIONS

SIMPLIFIER LA PRODUCTION DE VOS TRADUCTIONS SIMPLIFIER LA PRODUCTION DE VOS TRADUCTIONS Le souci majeur lié aux traductions n est pas tant la traduction du document en luimême mais plutôt le flux de production sous-jacent. De nos jours ce processus

Plus en détail

Learning Object Metadata

Learning Object Metadata Page 1 of 7 Learning Object Metadata Le LOM (Learning Object Metadata), est un schéma de description de ressources d enseignement et d apprentissage. Le LOM peut être utilisé pour décrire des ressources

Plus en détail

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services 69 Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services M. Bakhouya, J. Gaber et A. Koukam Laboratoire Systèmes et Transports SeT Université de Technologie de Belfort-Montbéliard

Plus en détail

Application d un algorithme de traduction statistique à la normalisation de textos

Application d un algorithme de traduction statistique à la normalisation de textos Application d un algorithme de traduction statistique à la normalisation de textos Gabriel Bernier-Colborne 1 (1) Observatoire de linguistique Sens-Texte Université de Montréal gabriel.bernier-colborne@umontreal.ca

Plus en détail

RI sociale : intégration de propriétés sociales dans un modèle de recherche

RI sociale : intégration de propriétés sociales dans un modèle de recherche RI sociale : intégration de propriétés sociales dans un modèle de recherche Ismail Badache 1 Institut de Recherche en Informatique de Toulouse, UMR 5505 CNRS, SIG 118 Route de Narbonne F-31062 Toulouse

Plus en détail

Le Traitement Automatique des Langues en France à l ère du Big Data

Le Traitement Automatique des Langues en France à l ère du Big Data TAL = Ordinateur & Langue Vers une myriadisation des (micro)-données et des traitement Le Traitement Automatique des Langues en France à l ère du Big Data À l aube d un révolution technologique Patrick

Plus en détail

N 334 - SIMON Anne-Catherine

N 334 - SIMON Anne-Catherine N 334 - SIMON Anne-Catherine RÉALISATION D UN CDROM/DVD CONTENANT DES DONNÉES DU LANGAGE ORAL ORGANISÉES EN PARCOURS DIDACTIQUES D INITIATION LINGUISTIQUE A PARTIR DES BASES DE DONNÉES VALIBEL Introduction

Plus en détail

Apprentissage statistique dans les graphes et les réseaux sociaux

Apprentissage statistique dans les graphes et les réseaux sociaux Apprentissage statistique dans les graphes et les réseaux sociaux Patrick Gallinari Collaboration : L. Denoyer, S. Peters Université Pierre et Marie Curie AAFD 2010 1 Plan Motivations et Problématique

Plus en détail

Les défis du traitement automatique du langage pour l analyse des réseaux sociaux

Les défis du traitement automatique du langage pour l analyse des réseaux sociaux Les défis du traitement automatique du langage pour l analyse des réseaux sociaux Atefeh Farzindar * ** Mathieu Roche *** **** * NLP Technologies Inc., Montréal (Québec), Canada www.nlptechnologies.ca

Plus en détail

Accès instantané aux mots et aux locutions Le dictionnaire électronique offre une traduction rapide d'un mot ou d'une locution

Accès instantané aux mots et aux locutions Le dictionnaire électronique offre une traduction rapide d'un mot ou d'une locution @promt Office 8.0 Description abrégée Spécifiquement conçu pour la maison et les petites entreprises Traduction de documents, de courriers électroniques et de messages instantanés ICQ Traduction de pages

Plus en détail

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 25/12/2006 Stéphane Tufféry - Data Mining - http://data.mining.free.fr

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 25/12/2006 Stéphane Tufféry - Data Mining - http://data.mining.free.fr 1 Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE 2 Plan du cours Qu est-ce que le data mining? A quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data

Plus en détail

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton Linked Open Data Le Web de données Réseau, usages, perspectives Sommaire Histoire du Linked Open Data Structure et évolution du réseau Utilisations du Linked Open Data Présence sur le réseau LOD Futurs

Plus en détail

PROJET DE FIN D ETUDES

PROJET DE FIN D ETUDES MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE ****** INSTITUT NATIONAL DES SCIENCES APPLIQUEES TOULOUSE Département de Génie Electrique & Informatique ****** PROJET DE FIN D ETUDES ROLE D UNE

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

MASTER LPL : LANGUE ET INFORMATIQUE (P)

MASTER LPL : LANGUE ET INFORMATIQUE (P) MASTER LPL : LANGUE ET INFORMATIQUE (P) RÉSUMÉ DE LA FORMATION Type de diplôme := Master Domaine : Arts, Lettres, Langues Mention : LITTERATURE, PHILOLOGIE, LINGUISTIQUE Spécialité : LANGUE ET INFORMATIQUE

Plus en détail

Consolidation de réseaux lexico-sémantiques par des inférences déductives et inductives

Consolidation de réseaux lexico-sémantiques par des inférences déductives et inductives Consolidation de réseaux lexico-sémantiques par des inférences déductives et inductives Manel Zarrouk 1, Mathieu Lafourcade 1, Alain Joubert 1 1 Lirmm prénom.nom@lirmm.fr Abstract In Computational Linguistics,

Plus en détail

Traduction automatique à partir de corpus comparables: extraction de phrases parallèles à partir de données comparables multimodales

Traduction automatique à partir de corpus comparables: extraction de phrases parallèles à partir de données comparables multimodales Traduction automatique à partir de corpus comparables: extraction de phrases parallèles à partir de données comparables multimodales Haithem AFLI Loïc BARRAULT Holger SCHWENK Laboratoire d Informatique

Plus en détail

ACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES

ACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES ACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES Techniques symboliques de traitement automatique du langage pour l indexation thématique et l extraction d information temporelle Thèse Défense publique

Plus en détail

Proposition des cadres d évaluation adaptés à un système de RI personnalisé

Proposition des cadres d évaluation adaptés à un système de RI personnalisé Proposition des cadres d évaluation adaptés à un système de RI personnalisé Mariam Daoud, Lynda Tamine-Lechani Laboratoire IRIT, Université Paul Sabatier 118 Route de Narbonne, F-31062 TOULOUSE CEDEX 9

Plus en détail

Architectures Ouvertes pour l Adaptation des Logiciels

Architectures Ouvertes pour l Adaptation des Logiciels Architectures Ouvertes pour l Adaptation des Logiciels Frédéric Duclos 1, Jacky Estublier 2, Rémy Sanlaville 1 Published in review Génie Logiciel And proceedings ICSSEA, Paris 2001 1 Dassault Systèmes

Plus en détail

TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes

TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes Mohamed Moussaoui,Wajdi Dhifli,Sami Zghal,Engelbert Mephu Nguifo FSJEG, Université de Jendouba,

Plus en détail

Méthode de classification des réponses d un moteur de recherche

Méthode de classification des réponses d un moteur de recherche SETIT 2005 3 rd International Conference: Sciences of Electronic, Technologies of Information and Telecommunications March 27-31, 2005 TUNISIA Méthode de classification des réponses d un moteur de recherche

Plus en détail

Vers des outils robustes et interopérables pour le TAL : la piste UIMA

Vers des outils robustes et interopérables pour le TAL : la piste UIMA TALN 2011, Montpellier, 27 juin 1 er juillet 2011 Vers des outils robustes et interopérables pour le TAL : la piste UIMA Fabien Poulard 1 Erwan Moreau 2 Laurent Audibert 2 (1) Laboratoire d Informatique

Plus en détail

Contrôle stochastique d allocation de ressources dans le «cloud computing»

Contrôle stochastique d allocation de ressources dans le «cloud computing» Contrôle stochastique d allocation de ressources dans le «cloud computing» Jacques Malenfant 1 Olga Melekhova 1, Xavier Dutreilh 1,3, Sergey Kirghizov 1, Isis Truck 2, Nicolas Rivierre 3 Travaux partiellement

Plus en détail

Proposition de méthode d implémentation d ITIL

Proposition de méthode d implémentation d ITIL Proposition de méthode d implémentation d ITIL Said Sebaaoui (*) - Mohamed Lamrini (*) - Laila El Abbadi (**) (*) : Laboratoire Informatique et Modélisation (LIM), Faculté des Sciences Dhar el Mahraz,

Plus en détail

Une proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes

Une proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes 303 Schedae, 2007 Prépublication n 46 Fascicule n 2 Une proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes Samya Sagar, Mohamed Ben Ahmed Laboratoire

Plus en détail

! Text Encoding Initiative

! Text Encoding Initiative Format XML: suite! le contenu d un élément est la concaténation de! texte! et d éléments (imbrication)! => structure arborescente! pas de chevauchement de balises! => exemple : une analyse syntagmatique

Plus en détail

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21 IODAA de l 1nf0rmation à la Décision par l Analyse et l Apprentissage IODAA Informations générales 2 Un monde nouveau Des données numériques partout en croissance prodigieuse Comment en extraire des connaissances

Plus en détail

Nom de l application

Nom de l application Ministère de l Enseignement Supérieur et de la Recherche Scientifique Direction Générale des Etudes Technologiques Institut Supérieur des Etudes Technologiques de Gafsa Département Technologies de l Informatique

Plus en détail

Application de K-means à la définition du nombre de VM optimal dans un cloud

Application de K-means à la définition du nombre de VM optimal dans un cloud Application de K-means à la définition du nombre de VM optimal dans un cloud EGC 2012 : Atelier Fouille de données complexes : complexité liée aux données multiples et massives (31 janvier - 3 février

Plus en détail

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013 Cube de textes et opérateur d'agrégation basé sur un modèle vectoriel adapté Text Cube Model and aggregation operator based on an adapted vector space model Lamia Oukid, Ounas Asfari, Fadila Bentayeb,

Plus en détail

Détection d utilisateurs malveillants dans les réseaux sociaux

Détection d utilisateurs malveillants dans les réseaux sociaux Détection d utilisateurs malveillants dans les réseaux sociaux Luc-Aurélien Gauthier Patrick Gallinari Laboratoire d Informatique de Paris 6 Université Pierre et Marie Curie 4, place Jussieu 75005 Paris

Plus en détail

7/26/2011. Analyse des besoins. Contextualisation. Univers de pensée et univers de croyance. Droit et interculturel. Les bases de connaissances

7/26/2011. Analyse des besoins. Contextualisation. Univers de pensée et univers de croyance. Droit et interculturel. Les bases de connaissances Dixième Forum international sur la déontologie et les bonnes pratiques. 19,20,21 mai 2011 Tribunal de Grande Instance de Paris Les NTIC au service de la communication interculturelle dans le domaine du

Plus en détail

PERCEPTION ET PERCEPTION SOCIALE

PERCEPTION ET PERCEPTION SOCIALE GOBERT 1 PERCEPTION ET PERCEPTION SOCIALE 1. Perception et perception sociale Perception = processus par lequel l individu organise et interprète ses impressions sensorielles de façon à donner un sens

Plus en détail

Comment déterminer les définitions les plus pertinentes d un sigle donné?

Comment déterminer les définitions les plus pertinentes d un sigle donné? Comment déterminer les définitions les plus pertinentes d un sigle donné? Application au Domaine Biomédical Mathieu Roche, Violaine Prince LIRMM, Université Montpellier 2 CNRS UMR5506, {mroche,prince}@lirmm.fr

Plus en détail

Multi-catégorisation de textes juridiques et retour de pertinence

Multi-catégorisation de textes juridiques et retour de pertinence Multi-catégorisation de textes juridiques et retour de pertinence Vincent Pisetta, Hakim Hacid et Djamel A. Zighed article paru dans G. Ritschard et C. Djeraba (eds), Extraction et gestion des Connaissances

Plus en détail

GFM 296 UNIVERSITE LA SAGESSE FACULTÉ DE GESTION ET DE FINANCE GUIDE POUR LA REDACTION DU MEMOIRE DE MASTER MBA (FORMULAIRE D)

GFM 296 UNIVERSITE LA SAGESSE FACULTÉ DE GESTION ET DE FINANCE GUIDE POUR LA REDACTION DU MEMOIRE DE MASTER MBA (FORMULAIRE D) GFM 296 UNIVERSITE LA SAGESSE FACULTÉ DE GESTION ET DE FINANCE GUIDE POUR LA REDACTION DU MEMOIRE DE MASTER MBA (FORMULAIRE D) Introduction Ce guide a été préparé pour assister l étudiant dans la rédaction

Plus en détail

majuscu lettres accent voyelles paragraphe L orthographe verbe >>>, mémoire préfixe et son enseignement singulier usage écrire temps copier mot

majuscu lettres accent voyelles paragraphe L orthographe verbe >>>, mémoire préfixe et son enseignement singulier usage écrire temps copier mot majuscu conjugaison >>>, L orthographe singulier syllabe virgule mémoire lettres et son enseignement graphie suffixe usage accent ; écrire féminin temps voyelles mot point Renforcer l enseignement de l

Plus en détail

Fouillez facilement dans votre système Big Data. Olivier TAVARD

Fouillez facilement dans votre système Big Data. Olivier TAVARD Fouillez facilement dans votre système Big Data Olivier TAVARD A propos de moi : Cofondateur de la société France Labs Développeur (principalement Java) Formateur en technologies de moteurs de recherche

Plus en détail

ANALYSE SÉMANTICO-DISCURSIVE DES COLLOCATIONS LEXICALES EN CORPUS SPÉCIALISÉ : LA BASE CONNAISSANCE-S

ANALYSE SÉMANTICO-DISCURSIVE DES COLLOCATIONS LEXICALES EN CORPUS SPÉCIALISÉ : LA BASE CONNAISSANCE-S ANALYSE SÉMANTICO-DISCURSIVE DES COLLOCATIONS LEXICALES EN CORPUS SPÉCIALISÉ : LA BASE CONNAISSANCE-S Estelle Dubreil et Béatrice Daille LINA FRE CNRS 2729 Université de Nantes France Résumé : L association

Plus en détail

Hervé Couturier EVP, SAP Technology Development

Hervé Couturier EVP, SAP Technology Development Hervé Couturier EVP, SAP Technology Development Hervé Biausser Directeur de l Ecole Centrale Paris Bernard Liautaud Fondateur de Business Objects Questions à: Hervé Couturier Hervé Biausser Bernard Liautaud

Plus en détail

TiLT : plate-forme pour le traitement automatique des langues naturelles

TiLT : plate-forme pour le traitement automatique des langues naturelles TiLT : plate-forme pour le traitement automatique des langues naturelles Johannes Heinecke * Grégory Smits ** Christine Chardenon * Emilie Guimier De Neef * Estelle Maillebuau * Malek Boualem * * Orange

Plus en détail

Brique BDL Gestion de Projet Logiciel

Brique BDL Gestion de Projet Logiciel Brique BDL Gestion de Projet Logiciel Processus de développement pratiqué à l'enst Sylvie.Vignes@enst.fr url:http://www.infres.enst.fr/~vignes/bdl Poly: Computer elective project F.Gasperoni Brique BDL

Plus en détail

traduction - translation Les affaires sans frontières PROFIL d ENTREPRISE

traduction - translation Les affaires sans frontières PROFIL d ENTREPRISE traduction - translation Les affaires sans frontières PROFIL d ENTREPRISE S ENRICHIR AVEC PLUS DE 80 LANGUES. DOCUMENS VOUS OFFRE DES SERVICES DE TRADUCTION, D ADAPTATION, DE RÉVISION ET DE RÉDACTION DANS

Plus en détail

Évaluation d une architecture de stockage RDF distribuée

Évaluation d une architecture de stockage RDF distribuée Évaluation d une architecture de stockage RDF distribuée Maeva Antoine 1, Françoise Baude 1, Fabrice Huet 1 1 INRIA MÉDITERRANÉE (ÉQUIPE OASIS), UNIVERSITÉ NICE SOPHIA-ANTIPOLIS, I3S CNRS prénom.nom@inria.fr

Plus en détail

. 3 1 4 1.1 4 1.2 4 1.3 6 2 : 10 2.1 10 2.2 14 2.3 16 2.4 19 2.4.1 19 2.4.2 20 2.4.2.1 21 2.4.2.2 21 2.4.2.2. 21 2.4.2.2. 22 2.4.2.2. 24 2.4.3 27 2.4.3.1 27 2.4.3.2 28 2.5 31 3 33 3.1 33 3.2 34 38 2 ..,,,.,

Plus en détail

Ingénierie et gestion des connaissances

Ingénierie et gestion des connaissances Master Web Intelligence ICM Option Informatique Ingénierie et gestion des connaissances Philippe BEAUNE Philippe.Beaune@emse.fr 18 novembre 2008 Passer en revue quelques idées fondatrices de l ingénierie

Plus en détail

d évaluation Objectifs Processus d élaboration

d évaluation Objectifs Processus d élaboration Présentation du Programme pancanadien d évaluation Le Programme pancanadien d évaluation (PPCE) représente le plus récent engagement du Conseil des ministres de l Éducation du Canada (CMEC) pour renseigner

Plus en détail

SMU MEDITERRANEAN. SOUTH MEDITERRANEAN UNIVERSITY Première Université Anglophone en Tunisie (Depuis 2002)

SMU MEDITERRANEAN. SOUTH MEDITERRANEAN UNIVERSITY Première Université Anglophone en Tunisie (Depuis 2002) SMU SOUTH MEDITERRANEAN UNIVERSITY Première Université Anglophone en Tunisie (Depuis 2002) MEDITERRANEAN institute OF TECHNOLOGY The Unique English-Speaking Engineering School in Tunisia 'Masters in Systems

Plus en détail

Langue, techniques de rédaction et correction d épreuves (412-2A1-LG)

Langue, techniques de rédaction et correction d épreuves (412-2A1-LG) Langue, techniques de rédaction et correction d épreuves (412-2A1-LG) Programme : Services paralangagiers (Recherche documentaire en traduction) Plan de cours Introduction Frais d inscription Ce cours

Plus en détail

LA VEILLE MULTILINGUE ET LE PROCESSUS DE TRADUCTION. Marilena MILCU, Assistant Professor, PhD, Lucian Blaga University of Sibiu

LA VEILLE MULTILINGUE ET LE PROCESSUS DE TRADUCTION. Marilena MILCU, Assistant Professor, PhD, Lucian Blaga University of Sibiu LA VEILLE MULTILINGUE ET LE PROCESSUS DE TRADUCTION Marilena MILCU, Assistant Professor, PhD, Lucian Blaga University of Sibiu Abstract: In globalization era translator s profession, all its specific tasks,

Plus en détail

INF 1250 INTRODUCTION AUX BASES DE DONNÉES. Guide d étude

INF 1250 INTRODUCTION AUX BASES DE DONNÉES. Guide d étude INF 1250 INTRODUCTION AUX BASES DE DONNÉES Guide d étude Sous la direction de Olga Mariño Télé-université Montréal (Québec) 2011 INF 1250 Introduction aux bases de données 2 INTRODUCTION Le Guide d étude

Plus en détail

Premier colloque international sur la veille stratégique multilingue. Université de Genève (ETI, Suisse) 28-29 mai 2008

Premier colloque international sur la veille stratégique multilingue. Université de Genève (ETI, Suisse) 28-29 mai 2008 Premier colloque international sur la veille stratégique multilingue Université de Genève (ETI, Suisse) 28-29 mai 2008 La Veille multilingue : défense et illustration de la traduction stratégique Mathieu

Plus en détail

Une Démarche pour la sélection d outils de cartographie des processus métiers

Une Démarche pour la sélection d outils de cartographie des processus métiers Une Démarche pour la sélection d outils de cartographie des processus métiers Résumé El Haddadi Anass, Atahran Ahmed, Ebobissé Yves, B. Bounabat anass.elhaddadi@gmail.com, atahran.ahmed@gmail.com, ebobisseyves@yahoo.fr,

Plus en détail

Discussion et implémentation dans un dispositif de scénarisation, d une évaluation diagnostique de l apprenant

Discussion et implémentation dans un dispositif de scénarisation, d une évaluation diagnostique de l apprenant Discussion et implémentation dans un dispositif de scénarisation, d une évaluation diagnostique de l apprenant Guillaume Durand (Guillaume.Durand@etu.univ-savoie.fr) Christian Martel (Christian.Martel@univ-savoie.fr)

Plus en détail

Petit guide pour choisir une solution CRM

Petit guide pour choisir une solution CRM Petit guide pour choisir une solution CRM Trouvez la solution qui vous convient» Nos clients sont plus performants. www.update.com Avant-propos Le CRM est en passe de devenir le principal logiciel de l

Plus en détail