Approche Générique d Extraction Automatique des Evénements et leur Exploitation
|
|
- Raphaël Durand
- il y a 8 ans
- Total affichages :
Transcription
1 Université de Paris-Sorbonne École Doctorale Concepts et Langages Laboratoire LaLIC (Langue, Logique, Informatique et Cognition) Université de Tunis Institut Supérieur de Gestion Laboratoire LARODEC (Recherche Opérationnelle, Décision et Contrôle de Processus) T H È S E pour obtenir le grade de DOCTEUR DE L UNIVERSITÉ PARIS-SORBONNE Discipline : Mathématiques et Informatique Appliquées aux Sciences de l Homme Spécialité : Informatique Présentée et soutenue par : AYMEN EL KHELIFI le 30 Octobre 2012 Approche Générique d Extraction Automatique des Evénements et leur Exploitation Sous la direction de : M. Jean Pierre Desclés, Professeur émérite, en Informatique, Université Paris Sorbonne, Directeur de thèse. Mme Rim Faiz, Professeur en Informatique, Université de Carthage, Directeur de thèse. JURY : M. Guy Lapalme, Professeur en informatique, Université de Montréal (Canada), Rapporteur M. Abdelmajid Ben Hamadou, Professeur en informatique, Université de Sfax (Tunisie), Rapporteur M. Jean-Gabriel Ganascia, Professeur en informatique, Université PMC, Paris 6 (France), Examinateur Mme Delphine Battistelli, Maître de conférences (HDR), Université Paris Sorbonne (France), Examinateur 1
2 1 Domaines d applications et contexte de travail Acquérir des connaissances à partir de textes est une nécessité qui s'est accélérée ces dernières années, avec l explosion des données disponibles sur le Web et l apparition du Web 2.0. Cette masse grandissante de contenus textuels, disponible dans des documents numériques en ligne, nécessite un traitement automatique afin de filtrer des informations pertinentes et précises. Ce qui pose un défi à la communauté scientifique qui doit être en mesure de proposer des systèmes efficaces d extraction d informations notamment avec la diversité des domaines applications demandeurs de ce genre d outil. Le présent travail de thèse est réalisé au sein du laboratoire LaLIC 1, où une théorie aspectotemporelle a été développée depuis 1990 par J.P Desclés. Cette théorie considère que des opérateurs aspect-temporels agissent sur un noyau prédicatif (cf. chapitre 2). L opérateur aspecto-temporel s applique à un opérande constitué par la relation prédicative sous-jacente à l énoncé. Cette théorie inscrit ses analyses dans le cadre de la GAC et de la GRACE (Desclés et Ro, 2012) dont les objectifs sont bien plus larges que, uniquement, le traitement du temps et de l'aspect. Une méthode complémentaire à cette théorie est la technique linguistique et computationnelle de l Exploration Contextuelle (Desclés, 1997). Elle permet, entre autres, d identifier les relations sémantiques dans les textes. En effet, il existe des expressions qui structurent sémantiquement un texte et qui sont porteuses de la sémantique d une relation. Ces expressions, que nous appelons indicateurs, sont repérables à la surface des textes. Cependant, ceux-ci sont en général indéterminés sémantiquement : leur emploi dépend du contexte de leurs occurrences dans la proposition, dans la phrase ou dans le paragraphe. Il est donc nécessaire de repérer certains indices contextuels afin de réduire le bruit, qui, sans ces indices, serait trop important pour l utilisateur. En effet, un locuteur français, s il est confronté à une phrase contenant l expression "X a rencontré Y", supposerait naturellement qu elle exprime un événement de type rencontre entre deux personnes. Néanmoins, la simple présence de cette expression n est pas suffisante pour identifier clairement la relation. Par exemple, la phrase "Il est difficile de croire que X a rencontré Y" n indique pas une rencontre réalisée, bien au contraire. L objectif de l Exploration Contextuelle est alors de lever l indétermination sémantique des marqueurs linguistiques (les indicateurs associés à un point de vue) en tenant compte de leurs contextes par une approche automatisable. 1 Laboratoire de Langues, Logiques, Informatique et Cognition, 2
3 Plusieurs applications ont été développées en se basant sur cette technique d exploration contextuelle pour aboutir à des annotations automatiques de textes (Desclés et Le Priole, 2010). Nous citons principalement les applications suivantes : résumé automatique et les fiches de synthèse (Blais, 2008), l extraction et la catégorisation des citations (Mourad, 2001; Alrahabi, 2010), évaluation des articles scientifiques par une analyse des citations entre auteurs par une approche bibliosémantique (Bertin, 2011), l identification des définitions à partir de textes scientifiques (Teissedre et al., 2008, Hacène, 2008), les flux RSS pour la rencontre (Djioua et al., 2007), l annotation des relations de localisation et d identification (Le Priol et al., 2006), l annotation des spécifications informatiques de besoins pour la conception de logiciels (Garcia-Flores, 2007), l identification des hypothèses dans des textes en biologie (Desclés et al., 2010, Makkaoui et al., 2011). Notre travail s inscrit dans ce cadre général d annotation automatique. Nous proposerons des algorithmes et des formalisations compatibles avec la théorie aspecto-temporelle ci-dessus et nous basons notre extraction des événements sur des annotations déterminées par l exploration contextuelle. 2 Problématique À travers l analyse des travaux existants sur l extraction des événements (Bettard, 2012), (Muller, 2012), (Pustojeosski, 2012), (Perent, 2012), (Shih-Hung et al. 2004), (Setzer et Gaizauskas, 2000), (Wei Li et al. 2006), SyDoM (Roussey et al. 2002), (Naughton et al. 2006) etc., nous avons constaté que les approches proposées présentent plusieurs insuffisances : Elles sont testées et validées sur un corpus de taille réduite (une dizaine de textes). Elles font appel dans leurs chaines de traitement à certaines analyses linguistiques (morphologique, syntaxique, grammaticale, et de dépendance fonctionnelle) qui nécessitent des ressources linguistiques non négligeables et un temps de traitement relativement important, sans pour autant garantir une qualité d analyse fiable. De plus, une petite partie de résultats d analyses préalables est utilisée pour fournir des procédures de décision qui identifient la présence des événements associés certaines phrases. Ceci empêche le passage à une grande échelle pour les systèmes qui se basent uniquement sur cette stratégie. Cependant, le traitement d un grand nombre de documents est évidemment une nécessité qui s est renforcée ces dernières années, au vu de la masse de documents disponibles en format électronique (Web 2.0 et services d Internet) qu il faut gérer afin d extraire ou de filtrer des informations, dans notre cas 3
4 liées à des événements pertinents. A titre d exemple, plusieurs agences de presse (Reuters, Aljazeera, CNN, etc.) publient quotidiennement des milliers d articles contenant plusieurs événements de toutes sortes; des blogueurs mettent en ligne des documents par rapport à ces mêmes événements, des internautes commentent ce contenu. Les preneurs de décision, se trouvent face à un grand nombre d événements extraits dont quelques uns seulement les concernent. Dans ce contexte, nous proposons de développer une approche capable d extraire les événements, avec une certaine catégorisation qui leur est attachée, à partir dans des corpus de grande taille. Ceci passe nécessairement par la réduction de la complexité de ce problème. D un point de vue théorique, nous pouvons catégoriser les travaux d extraction d événements, en deux grandes familles : grammaticales et spécifiques. Nous avons analysé en détails deux approches représentatives de ces deux familles, respectivement TimeML et ACE. Nous avons constaté une modélisation plate, un seul niveau hiérarchique des concepts pour TimeML, et une hyper spécification pour ACE (Chapitre 3). Les deux spécifications définissent les catégories par des exemples et elles ne se référent pas à des théories sémantiques qui généralisent l extraction d événements. En d autres termes, nous avons remarqué, que la notion d «événement» est souvent mal définie, peu formalisée, et ne s inscrit pas dans des cadres théoriques plus généraux pour une analyse discursive des textes. Ainsi, nous proposons de formaliser la définition des événements et leur reconnaissance dans les textes en proposant des cartes sémantiques sous-jacentes. Les définitions et les algorithmes que nous proposons sont compatibles avec la théorie linguistico-cognitive (Desclés, 1990) qui permet d expliquer d autres phénomènes linguistiques, allant audelà de l extraction des événements, comme l utilisation de référentielle et la prise en compte des opérateurs de pensé de la langue énonciative. Par ailleurs, nous avons constaté l absence d un schéma générique d annotation des événements, ce qui entraine des problèmes d interopérabilité entre des systèmes d extraction d événements. En effet, chaque système utilisant son propre schéma d annotation, ce dernier devient interprétable par un autre. Cela freine les ambitions déclarées du Web Sémantique où, par définition, les systèmes communiquent selon des standards et doivent s interpréter mutuellement. Par conséquent, un système quelconque doit être doté des capacités qui permettent la réutilisation des annotations. Pour cela, nous proposons de mettre en place des cartes sémantiques génériques 4
5 conçues comme des ontologies de haut niveau (Upper Level Ontology et Top Domain ontology). Ces cartes sémantiques opèrent au-dessous des domaines d applications, dans le but d assurer une réutilisation inter-domaines. Nous avons remarqué qu il n y a pas de scénarios génériques d exploitation des événements annotés. Nous proposons de mettre en place des mesures de similarités génériques entre les annotations sémantiques et les événements particuliers. Enfin, nous avons constaté que les résultats obtenus par les systèmes d extraction des événements ne sont pas toujours satisfaisants. À titre d exemple, lors de la dernière compagne d évaluation organisée par le Data Linguistic consortium 2 (ACE, 2009), le meilleur système a obtenu 14,4 % de précision. Nous proposons donc, dans le cadre de notre travail, d utiliser des techniques efficaces qui permettent d augmenter le taux de reconnaissance des événements et cela dans un temps raisonnable de traitement. 3 Objectifs de notre travail À la lumière des problèmes évoqués ci-dessus, nous proposons de mettre en place une approche automatique d annotation sémantique des segments textuels contenant des événements afin d extraire ces événements et les exploiter dans des applications plus finalisées. Nous commençons par une évaluation de la composante d extraction sur un corpus de documents écrits en français. Puis, nous avons testé cette composante sur un corpus de documents écrits en arabe. Nous avons choisi deux langues représentatives de deux familles différentes afin de montrer l aspect multi-langue de l approche. Un de nos objectifs, au-delà de la modélisation et de développement d'une application d extraction des événements, est de faire le point sur les différentes approches existantes dans ce domaine. Nous proposerons, aussi, de réduire la complexité de détection des événements, qui représente la source principale de lourdeur des systèmes existants. Nous proposerons d'introduire des définitions formelles de la notion d événement et des ressources linguistiques qui lui sont associées. Nous mettons en place des cartes sémantiques génériques et des règles permettant de les reconnaître dans le texte
6 Au niveau de l implémentation du système, nous suivons les standards du W3C pour les langages de spécification et les formats des résultats produits. Nous assurerons un accès convivial aux modules et aux ressources développées par le biais d interfaces dynamiques en fonction du rôle de l utilisateur. Ce rôle peut être un constructeur de cartes sémantiques, un exploiteur des résultats d annotation ou un administrateur. En ce qui concerne le regroupement des événements similaires, nous proposons de nouvelles mesures de similarités entre les événements qui exploitent la structure ontologique sousadjacente aux cartes sémantiques et le processus d annotations obtenus. Ces mesures donnent lieu à des regroupements hiérarchiques et peuvent être utilisées dans d autres tâches telles que l indexation et la recherche d événements ou dans un résumé automatique etc. L approche doit être réorganisée en composantes indépendantes, dans le but d assurer une réutilisation des composantes élémentaires par d autres systèmes dans d autres contextes d utilisation. 4 Approche proposée L approche que nous proposons s inscrit à la fois dans le cadre du traitement automatique de la langue et du Web sémantique. D une part, elle aborde l extraction d événements dans des textes et fournit des algorithmes capables d annoter automatiquement des corpus textuels de grande taille. D autre part, elle propose des ontologies linguistiques suivant les standards définis par le W3C. Ces standards sont respectés au niveau du format des résultats fournis aux utilisateurs à la sortie de chaque étape de la chaine de traitement. L approche consiste à nettoyer les documents provenant du Web les segmenter puis à repérer par la suite les événements présents dans ces documents. Il est proposé des scénarios d exploitation générique de ces annotations, comme un regroupement d événements similaires en utilisant de nouvelles mesures de similarités, la constituant de fiches de synthèse à partir d un ensemble de documents choisis par un utilisateur cherchant à rassembler dans une fiche toute déclaration textuelle au sujet d un événement particulier. Les mesures de similarités ont été intégrées dans un algorithme de Clustering. Mais, elles peuvent utiliser d autres tâches comme l indexation, les systèmes de question réponse, résumé automatique etc.). Cette approche est formée par quatre composantes que nous décrivons ci-après brièvement : 1. Le prétraitement consiste d une part, à détecter les frontières des phrases dans un texte, d autre part à nettoyer les documents, les images, et les affiches publicitaires. Cette 6
7 composante utilise les balises originales (qui accompagnent les documents téléchargés) dans le processus de reconnaissance des frontières des segments. 2. L extraction des événements permet d extraire les événements textuels. Elle se base sur un algorithme d annotation et des cartes sémantiques ainsi que des ressources linguistiques dédiées. Nous avons proposé, d abord, une formalisation des définitions des événements et du processus de leur extraction ainsi que les ressources linguistiques utilisées. Ensuite, nous avons mis en place un algorithme qui dispose d une complexité polynomiale inférieure à ceux proposés par les autres approches. Enfin, afin de montrer l aspect multi-langue de l approche nous avons ajusté à la carte sémantique et ses ressources à la langue arabe. 3. Le Clustering consiste à regrouper les segments se référant à un même événement ou à des événements similaires. Pour cela, nous avons mis en place deux mesures de similarité : une première mesure SimCatégorielle entre les annotations sémantiques en général, qui exploite le processus d annotation. La deuxième mesure EventSim intègre les paramètres d un événement. Les deux mesures ont été utilisées dans un algorithme de groupement hiérarchique (Clustering) mais elles sont génériques et peuvent être utilisées dans la recherche d information, des systèmes de question-réponse, le résumé automatique etc. 4. l exploitation des annotations permet d utiliser les annotations ajoutées au texte lors des étapes précédentes, sous forme de fiches de synthèse paramétrables par l utilisateur. Nous avons mis en place des interfaces graphiques qui permettent un développement d autres cartes sémantiques, et d autres ressources linguistiques, tout en respectant les standards W3C, au niveau de la représentation des données et au niveau des langages utilisés. Des fiches de synthèse des événements ont été mises en place. Elles sont dynamiques et paramétrées par l utilisateur. D une manière générale, nous chercherons à montrer quel est l intérêt d exploiter dans un texte les marques de surface révélant des informations sémantiques sans un traitement en profondeur du texte et sans une analyse morphosyntaxique ou syntaxique préalable. Ces marques de surface constituent effectivement des signes efficaces pour l identification des segments pertinents par des applications en recherche ou extraction d information. Une telle approche, à la différence d autres approches, plus courantes en TAL, qui emploient des techniques fréquentielles, permet une analyse fine et plus fiable des textes. Le contenu du texte devient catégorisé par des annotations associées à des cartes. Les segments se 7
8 distinguent à partir de leur rôle discursif. Par conséquent, c est l exploitation de tout ceci qui nous permettra de proposer d autres applications plus étendues que celles offertes par les systèmes d extraction des événements classiques dédiés à cette unique action. Par ailleurs, nous avons comparé notre méthode avec des méthodes d apprentissage automatique et des méthodes linguistiques par compilation (analyse morphosyntaxique, et représentation sémantique et programmatique par des grammaires locales) sur les mêmes corpus. Nous avons obtenu une amélioration de F-score, par rapport aux deux méthodes, de respectivement de 40% et 15%. 8
Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe
Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Karima Dhouib, Sylvie Després Faiez Gargouri ISET - Sfax Tunisie, BP : 88A Elbustan ; Sfax karima.dhouib@isets.rnu.tn,
Plus en détailUNIVERSITÉ PARIS-SORBONNE
UNIVERSITÉ PARIS-SORBONNE ÉCOLE DOCTORALE CONCEPTS ET LANGAGE T H È S E pour obtenir le grade de DOCTEUR DE L UNIVERSITÉ PARIS-SORBONNE Discipline : LINGUISTIQUE Présentée et soutenue par : Zeina EL HELOU
Plus en détailIntelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com
Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines
Plus en détailDescription de Produit Logiciel. AMI News Monitor v2.0. SPD-AMINM-10 v1.0
Description de Produit Logiciel AMI News Monitor v2.0 SPD-AMINM-10 v1.0 Octobre 2010 Sommaire 1 Préambule... 3 2 Approbations... 3 3 Fonctionnalités... 4 3.1 Principes... 4 3.2 Sources d information...
Plus en détailN 334 - SIMON Anne-Catherine
N 334 - SIMON Anne-Catherine RÉALISATION D UN CDROM/DVD CONTENANT DES DONNÉES DU LANGAGE ORAL ORGANISÉES EN PARCOURS DIDACTIQUES D INITIATION LINGUISTIQUE A PARTIR DES BASES DE DONNÉES VALIBEL Introduction
Plus en détailLes modes de recherche sur le Web 2.0
Les modes de recherche sur le Web 2.0 1 Sommaire 1. Contexte 2. Le collaboratif : les moteurs thématiques 3. La syndication des résultats de recherche 4. Les connaissances : des moteurs 2 1 1. Moteurs
Plus en détailApprentissage Automatique
Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Plus en détailISTEX, vers des services innovants d accès à la connaissance
ISTEX, vers des services innovants d accès à la connaissance Synthèse rédigée par Raymond Bérard, directeur de l ABES, à partir du dossier de candidature d ISTEX aux Initiatives d excellence et des réunions
Plus en détailTrois approches du GREYC pour la classification de textes
DEFT 2008, Avignon (associé à TALN 08) Trois approches du GREYC pour la classification de textes Thierry Charnois Antoine Doucet Yann Mathet François Rioult GREYC, Université de Caen, CNRS UMR 6072 Bd
Plus en détailFormation continue des personnels URCA. Offre de la Bibliothèque Universitaire
Formation continue des personnels URCA Offre de la Bibliothèque Universitaire Année 2012-2013 Bibliothèque Universitaire Formation continue pour le personnel de l URCA Modalités o Public : personnels de
Plus en détailMASTER LPL : LANGUE ET INFORMATIQUE (P)
MASTER LPL : LANGUE ET INFORMATIQUE (P) RÉSUMÉ DE LA FORMATION Type de diplôme := Master Domaine : Arts, Lettres, Langues Mention : LITTERATURE, PHILOLOGIE, LINGUISTIQUE Spécialité : LANGUE ET INFORMATIQUE
Plus en détailDe la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues
De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues Maud Ehrmann Joint Research Centre Ispra, Italie. Guillaume Jacquet Xerox
Plus en détailLinked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton
Linked Open Data Le Web de données Réseau, usages, perspectives Sommaire Histoire du Linked Open Data Structure et évolution du réseau Utilisations du Linked Open Data Présence sur le réseau LOD Futurs
Plus en détailLE PLAISIR D APPRENDRE POUR APPRENDRE
Ville-École-Intégration, n 119, décembre 1999 LE PLAISIR D APPRENDRE POUR APPRENDRE Jean-Pierre ARCHAMBAULT (*) Les TICE favorisent le travail collectif et aident au travail individuel, ont l attrait de
Plus en détailLES LANGUES EN DANGER : UN DÉFI POUR LES TECHNOLOGIES DE LA LANGUE
2 LES LANGUES EN DANGER : UN DÉFI POUR LES TECHNOLOGIES DE LA LANGUE Nous vivons une révolution numérique qui a un impact fort sur la communication et la société. Les développements récents des technologies
Plus en détailBaccalauréat universitaire (bachelor) en mathématiques et sciences informatiques
Baccalauréat universitaire (bachelor) en mathématiques et sciences informatiques CONDITIONS GENERALES Art. A 3 Baccalauréat universitaire en mathématiques et sciences informatiques 1. La Faculté décerne
Plus en détailSITE INTERNET BLOG SITE E-COMMERCE GRILLE D ANALYSE / AUDIT PREMIERE ANALYSE. Entreprises. o Public spécialisé o Etudiants o Enfants
PREMIERE ANALYSE Nom du site web : Url du site : Objectif du site / description (balise description) : Mots-clés du site (balise keywords) : Cible du site : o Entreprises o Public spécialisé o
Plus en détailMorphosyntaxe de l'interrogation en conversation spontanée : modélisation et évaluations
U Université dumaine Faculté des Lettres, Langues et Sciences humaines Morphosyntaxe de l'interrogation en conversation spontanée : modélisation et évaluations Carole Lailler 1 L interrogation : une modalité
Plus en détailAVANT-PROPOS... 3 1. INTRODUCTION... 7 2. INSTALLATION... 8 2.1 INSTALLER LE PLUGIN ZOTERO... 8 2.2 INSTALLER LE MODULE DE CITATION...
AVANT-PROPOS... 3 1. INTRODUCTION... 7 2. INSTALLATION... 8 2.1 INSTALLER LE PLUGIN ZOTERO... 8 2.2 INSTALLER LE MODULE DE CITATION... 8 DANS MS WORD (SUR WINDOWS)... 8 DANS MS WORD (SUR MAC)... 8 DANS
Plus en détailWF MEDIA.INFO ET N OUBLIONS PAS QU UNE COMMUNICATION RÉUSSIE, C EST AVANT TOUT UN IMPACT MESURABLE ET
WF MEDIA.INFO WF MEDIA.INFO, AGENCE DE COMMUNICATION SUR CMS OPEN SOURCE AU SOLUTION PROPRIETAIRE, C EST UNE VISION OPÉRATIONNELLE ET RÉALISTE DE LA COMMUNICATION DES ENTREPRISES D AUJOURD HUI. QUE VOUS
Plus en détailIntégration d une étape de pré-filtrage et d une fonction multiobjectif en vue d améliorer le système ExtraNews de résumé de documents multiples
TALN 2008, Avignon, 9-13 juin 2008 Intégration d une étape de pré-filtrage et d une fonction multiobjectif en vue d améliorer le système ExtraNews de résumé de documents multiples Fatma Kallel Jaoua (1),
Plus en détail! Text Encoding Initiative
Format XML: suite! le contenu d un élément est la concaténation de! texte! et d éléments (imbrication)! => structure arborescente! pas de chevauchement de balises! => exemple : une analyse syntagmatique
Plus en détailEcole Technique «Transformation de données documentaires» Poitiers, 14-16 mars 2011. Atelier 1: Sphinx. import, conversion, export de données
Ecole Technique «Transformation de données documentaires» Poitiers, 14-16 mars 2011 Atelier 1: Sphinx import, conversion, export de données Introduction à la Recherche d'ist via le Web INRA Grignon, 03/2011
Plus en détailRéussir. son. référencement. web. Olivier Andrieu. Groupe Eyrolles, 2008, ISBN : 978-2-212-12264-0
Réussir son référencement web Olivier Andrieu Groupe Eyrolles, 2008, ISBN : 978-2-212-12264-0 Table des matières CHAPITRE 1 Le référencement aujourd hui : généralités, définitions......................................
Plus en détailJean Danis 1, Jean-Guy Meunier 1, Jean-François Chartier 1, Motasem Alrahabi 2, Jean-Pierre Desclés 2. Résumé. Abstract. 1.
Classification automatique et stratégie d annotation appliquées à un concept philosophique: la dimension psychologique du concept de LANGAGE dans l œuvre de Bergson 1 Jean Danis 1, Jean-Guy Meunier 1,
Plus en détailLIVRE BLANC Décembre 2014
PARSING MATCHING EQUALITY SEARCH LIVRE BLANC Décembre 2014 Introduction L analyse des tendances du marché de l emploi correspond à l évidence à une nécessité, surtout en période de tension comme depuis
Plus en détailProjet de programme pour l enseignement d exploration de la classe de 2 nde : Informatique et création numérique
Projet de programme pour l enseignement d exploration de la classe de 2 nde : Informatique et création numérique 19 mai 2015 Préambule L informatique est tout à la fois une science et une technologie qui
Plus en détailCognit Ive Cas d utilisation
Cognit Ive Cas d utilisation 96-98, rue de Montreuil - 75011 Paris _ opicot@ _ + 33 (0)1 40 09 71 55 Sommaire Présentation de la plateforme Cognit Ive SemanticMail : Traitement sémantique des mails Projets
Plus en détailEpilepsies : Parents, enseignants, comment accompagner l enfant pour éviter l échec scolaire?
Epilepsies : Parents, enseignants, comment accompagner l enfant pour éviter l échec scolaire? L épilepsie concerne plus de 500 000 personnes en France, dont la moitié sont des enfants ou des adolescents.
Plus en détailUniversité de Lorraine Licence AES LIVRET DE STAGE LICENCE 2014-2015
Université de Lorraine Licence AES LIVRET DE STAGE LICENCE 2014-2015 1 LA REDACTION DU RAPPORT DE STAGE Le mémoire ne doit pas consister à reprendre tels quels des documents internes de l entreprise ou
Plus en détailBrève introduction à la recherche d!information sur le Web à base d!agents logiciels
Plan Brève introduction à la recherche d!information sur le Web à base d!agents logiciels Bernard ESPINASSE Université d!aix-marseille 2010 Rappels sur les agents logiciels Problématique de la RI sur le
Plus en détailRapport : Base de données. Anthony Larcher 1
Rapport : Base de données Anthony Larcher 1 1 : Laboratoire d Informatique d Avignon - Université d Avignon Tél : +33 (0) 4 90 84 35 55 - Fax : + 33 (0) 4 90 84 35 01 anthony.larcher@univ-avignon.fr 14
Plus en détailIODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21
IODAA de l 1nf0rmation à la Décision par l Analyse et l Apprentissage IODAA Informations générales 2 Un monde nouveau Des données numériques partout en croissance prodigieuse Comment en extraire des connaissances
Plus en détailGestion collaborative de documents
Gestion collaborative de documents ANT box, le logiciel qui simplifie votre GED Les organisations (entreprises, collectivités, associations...) génèrent chaque jour des millions de documents, e-mails,
Plus en détailL apprentissage automatique
L apprentissage automatique L apprentissage automatique L'apprentissage automatique fait référence au développement, à l analyse et à l implémentation de méthodes qui permettent à une machine d évoluer
Plus en détailmajuscu lettres accent voyelles paragraphe L orthographe verbe >>>, mémoire préfixe et son enseignement singulier usage écrire temps copier mot
majuscu conjugaison >>>, L orthographe singulier syllabe virgule mémoire lettres et son enseignement graphie suffixe usage accent ; écrire féminin temps voyelles mot point Renforcer l enseignement de l
Plus en détailDan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier
Détection et reconnaissance des sons pour la surveillance médicale Dan Istrate le 16 décembre 2003 Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier Thèse mené dans le cadre d une collaboration
Plus en détailProblématiques de recherche. Figure Research Agenda for service-oriented computing
Problématiques de recherche 90 Figure Research Agenda for service-oriented computing Conférences dans le domaine ICWS (International Conference on Web Services) Web services specifications and enhancements
Plus en détailIntelligence Artificielle et Robotique
Intelligence Artificielle et Robotique Introduction à l intelligence artificielle David Janiszek david.janiszek@parisdescartes.fr http://www.math-info.univ-paris5.fr/~janiszek/ PRES Sorbonne Paris Cité
Plus en détailLe modèle standard, SPE (1/8)
Le modèle standard, SPE (1/8) Rappel : notion de grammaire mentale modulaire Les composants de la grammaire : module phonologique, sémantique syntaxique Syntaxe première : elle orchestre la relation mentale
Plus en détailEnseigner les Lettres avec les TICE http://lettres.ac-dijon.fr
Académie de Dijon Enseigner les Lettres avec les TICE http://lettres.ac-dijon.fr TraAM travaux académiques mutualisés, un accompagnement au développement des usages des TIC Créer un forum d écriture avec
Plus en détailAPPRENDRE LA CHIMIE EN ZEP
Résumé du rapport de recherche destiné au Centre Alain Savary, INRP APPRENDRE LA CHIMIE EN ZEP Martine Méheut, Olivier Prézeau INRP, Centre Alain Savary Apprendre la chimie en ZEP Résumé 1 Dans une perspective
Plus en détailMaster recherche. Spécialité «Savoirs et Expertises de l Activité Physique» Master
Master recherche Spécialité «Savoirs et Expertises de l Activité Physique» 3 parcours de spécialisation : Physiologie et biomécanique de l exercice, Sciences humaines et sociales appliquées aux APS Didactique
Plus en détailVision prospective et obstacles à surmonter pour les assureurs
smart solutions for smart leaders Le «Big Data» assurément Rédigé par Pascal STERN Architecte d Entreprise Vision prospective et obstacles à surmonter pour les assureurs Un avis rendu par la cour de justice
Plus en détailLES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN
LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN Les contenues de ce document sont la propriété exclusive de la société REVER. Ils ne sont transmis qu à titre d information et ne peuvent en aucun cas
Plus en détailStéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 25/12/2006 Stéphane Tufféry - Data Mining - http://data.mining.free.fr
1 Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE 2 Plan du cours Qu est-ce que le data mining? A quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data
Plus en détailL annotation comme support à la collaboration autour de documents : l outil AnT&CoW
L annotation comme support à la collaboration autour de documents : l outil AnT&CoW Lortal G. (1), Lewkowicz M. (1) et Todirascu-Courtier A. (2) (1) Laboratoire ISTIT - Tech-CICO, Université de technologie
Plus en détailQu est-ce qu une tâche?
Qu est-ce qu une tâche? «Tâches», «Perspective actionnelle», «activités centrées sur le sens» Ce sont des concepts dont on entend beaucoup parler dans notre profession, mais que signifient-ils exactement?
Plus en détailDiapo 1. Objet de l atelier. Classe visée. Travail en co-disciplinarité (identité et origine académique des IEN)
COMMENTAIRE Séminaire national Réforme de la série Gestion-administration Lyon 10 et 11 mai 2012 Vendredi matin Martine DECONINCK (IEN EG), Michèle SENDRE (IEN L), Isabelle VALLOT (IEN EG) Diapo 1. Objet
Plus en détailACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES
ACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES Techniques symboliques de traitement automatique du langage pour l indexation thématique et l extraction d information temporelle Thèse Défense publique
Plus en détailSciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION
Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Classe de terminale de la série Sciences et Technologie du Management et de la Gestion Préambule Présentation Les technologies de l information
Plus en détailLe SMS fait entendre sa voix... Énergie solaire, énergie du futur? Recherche et développement technologique
Recherche et développement technologique Bureau de dépôt Bruxelles X - Mensuel ne paraissant pas en juillet et août - 262 - Juin 2010 Le SMS fait entendre sa voix... Énergie solaire, énergie du futur?
Plus en détailN. Paparoditis, Laboratoire MATIS
N. Paparoditis, Laboratoire MATIS Contexte: Diffusion de données et services locaux STEREOPOLIS II Un véhicule de numérisation mobile terrestre Lasers Caméras Système de navigation/positionnement STEREOPOLIS
Plus en détailInstrumentation de la recherche en Education : analyse épistémologique de quelques logiciels d aide à l analyse d enregistrements vidéos
Instrumentation de la recherche en Education : analyse épistémologique de quelques logiciels d aide à l analyse d enregistrements vidéos Laurent Veillard UMR ICAR (CNRS, Université Lyon 2, ENS de lyon)
Plus en détailLes apports de l informatique. Aux autres disciplines
Les apports de l informatique Aux autres disciplines Le statut de technologie ou de sous-discipline est celui de l importation l et de la vulgarisation Le statut de science à part entière est lorsqu il
Plus en détailGKR. Geological Knowledge Representation Base de connaissances métallogéniques
GKR Geological Knowledge Representation Base de connaissances métallogéniques Objets Organiser un ensemble d informations complexes et hétérogènes pour orienter l exploration minière aux échelles tactiques
Plus en détailFORMATIONS LINGUISTIQUES DIPLOMES, TESTS & EXAMENS D ESPAGNOL COCEF
FORMATIONS LINGUISTIQUES DIPLOMES, TESTS & EXAMENS D ESPAGNOL COCEF CHAMBRE OFFICIELLE DE COMMERCE D ESPAGNE EN FRANCE CAMARA OFICIAL DE COMERCIO DE ESPAÑA EN FRANCIA www.cocef.com 22, rue Saint Augustin
Plus en détailTEXT MINING Tour d Horizon
TEXT MINING Tour d Horizon Media Campus WAN IFRA "Structurer, optimiser et valoriser son contenu éditorial : les outils de text mining" 24 novembre 2009, PARIS Philippe BONNY Cabinet de Conseil et d Etudes
Plus en détailPrésentation de notre solution de formation en ligne
English for your future http://english.newhorizons.com English Language Program Synonyme de flexibilité, efficacité, choix et réussite. Présentation de notre solution de formation en ligne L approche individuelle
Plus en détailLa Convergence des outils de veille et des sources
La Convergence des outils de veille et des sources Atelier A1- i Expo 2006 31 mai 2006 «Référentiels et évaluation des outils de veille» Raymond Descout Vice-président Ventes et Marketing Europe, CEDROM-SNi
Plus en détailRéférencement Vendredi 4 Juillet Ile Degaby
Donnez un second souffle à votre e-commerce Référencement Vendredi 4 Juillet Ile Degaby Nicolas Viron / Laurent Bizot Introduction Attente : Comment référencer son site? Thème : Fonctionnement du référencement
Plus en détailDafoe Présentation de la plate-forme UIMA
Laboratoire d Informatique de l université Paris-Nord (UMR CNRS 7030) Institut Galilée - Université Paris-Nord 99, avenue Jean-Baptiste Clément 93430 Villetaneuse, France 11 juillet 2007 Plates-formes
Plus en détailDEFT 09 : détection de la subjectivité et catégorisation de textes subjectifs par une approche mixte symbolique et statistique
DEFT 09 «DÉfi Fouille de Textes», Atelier de clôture, Paris, 22 juin 2009 DEFT 09 : détection de la subjectivité et catégorisation de textes subjectifs par une approche mixte symbolique et statistique
Plus en détail!" #$%&'(&)'*'+,--./&0'1&23,+2.)$4$%52'&%'6.%&2'
Évaluer un site web, cours de descriptions de controverses i Dans le cadre du cours Description des controverses, le repérage des acteurs et la connaissance de leurs positions passent largement par l identification
Plus en détailEmail Content Manager
La solution de routage E-crm Une entité du Groupe Email Content Manager La gestion de contenus pour l e-mailing, une hyper personnalisation des campagnes MailPerformance une solution du groupe NP6 Votre
Plus en détailCAHIER DES CLAUSES TECHNIQUES PARTICULIÈRES (CCTP) MISE EN PLACE ET MAINTENANCE D UN MOTEUR DE RECHERCHE
PREMIER MINISTRE SECRÉTARIAT GÉNÉRAL DU GOUVERNEMENT CAHIER DES CLAUSES TECHNIQUES PARTICULIÈRES (CCTP) MISE EN PLACE ET MAINTENANCE D UN MOTEUR DE RECHERCHE SUR LES SITES INTERNET GÉRÉS PAR LA DOCUMENTATION
Plus en détailClassification Automatique de messages : une approche hybride
RECIAL 2002, Nancy, 24-27 juin 2002 Classification Automatique de messages : une approche hybride O. Nouali (1) Laboratoire des Logiciels de base, CE.R.I.S., Rue des 3 frères Aïssiou, Ben Aknoun, Alger,
Plus en détailUNIVERSITE LA SAGESSE FACULTÉ DE GESTION ET DE FINANCE MBA OPTION MIS. MIAGe METHODES INFORMATIQUES APPLIQUEES A LA GESTION
GFM 296 UNIVERSITE LA SAGESSE FACULTÉ DE GESTION ET DE FINANCE MBA OPTION MIS MIAGe METHODES INFORMATIQUES APPLIQUEES A LA GESTION SPECIALITE SYSTEMES D'INFORMATION DES ENTREPRISES GUIDE POUR LA REDACTION
Plus en détailCARTOGRAPHIE DES STRUCTURES DE RECHERCHE EN STIC
Vendredi 1 er & Samedi 2 Octobre 2010 Hôtel Ramada Plaza Gammarth, Tunisie CARTOGRAPHIE DES STRUCTES DE RECHERCHE EN STIC Farouk Kamoun Professeur Emérite, membre du Laboratoire CRISTAL, ENSI Directeur
Plus en détailCURRICULUM VITAE FORMATION. 2001/2002 : Thèse ès sciences de gestion, option marketing, à l IAE de Dijon, Université de Bourgogne :
CURRICULUM VITAE Nom : DJELASSI Prénom : Souad Fonction : Maître de conférences, Université Lille2 Adresse personnelle : 4 Rue Alexandre Desrousseaux, 59000 Lille Tél. personnel : 06.68.68.26.44 Mail :
Plus en détailBusiness Intelligence
avec Excel, Power BI et Office 365 Téléchargement www.editions-eni.fr.fr Jean-Pierre GIRARDOT Table des matières 1 Avant-propos A. À qui s adresse ce livre?..................................................
Plus en détailUne plateforme de recherche et d expérimentation pour l édition ouverte
Une plateforme de recherche et d expérimentation pour l édition ouverte Colloque réalisé dans le cadre du Congrès de l Acfas 2015 à l Université du Québec à Rimouski (UQAR). Lundi 25 mai 2015 de 09h15
Plus en détailThibault Denizet. Introduction à SSIS
Thibault Denizet Introduction à SSIS 2 SSIS - Introduction Sommaire 1 Introduction à SQL Server 2008 Integration services... 3 2 Rappel sur la Business Intelligence... 4 2.1 ETL (Extract, Transform, Load)...
Plus en détailChapitre 1 Qu est-ce qu une expression régulière?
Chapitre 1 Qu est-ce qu une expression régulière? Les ordinateurs n ont pas du tout la même conception des textes que nous : pour nous, un texte est un ensemble d idées couchées sur papier. Nous nous en
Plus en détailAnalyse Sémantique de Nuages de Points 3D et d Images dans les Milieux Urbains
Analyse Sémantique de Nuages de Points 3D et d Images dans les Milieux Urbains Andrés Felipe SERNA MORALES Directrice de thèse: Beatriz MARCOTEGUI ITURMENDI serna@cmm.ensmp.fr MINES ParisTech, Mathématiques
Plus en détailConcevoir sa stratégie de recherche d information
Concevoir sa stratégie de recherche d information Réalisé : mars 2007 Dernière mise à jour : mars 2011 Bibliothèque HEC Paris Contact : biblio@hec.fr 01 39 67 94 78 Cette création est mise à disposition
Plus en détailPartie II Approche théorique
Partie II Approche théorique De nombreux phénomènes ont été mis en évidence lors des différentes enquêtes, nous amenant à diverses interrogations pouvant être résumées et transcrites en une problématique.
Plus en détailEn route vers le succès avec une solution de BI intuitive destinée aux entreprises de taille moyenne
Présentation du produit SAP s SAP pour les PME SAP BusinessObjects Business Intelligence, édition Edge Objectifs En route vers le succès avec une solution de BI intuitive destinée aux entreprises de taille
Plus en détailVous n avez aucune installation à faire et aucune mise à niveau ne vous complique la vie. Vous allez adorer votre nouveau site.
Vous souhaitez obtenir plus de clients? Découvrez comment multiplier vos contacts grâce aux 38 millions d internautes français. Aujourd hui il ne suffit plus d avoir un site internet. Il faut un site avec
Plus en détailAnalyse dialectométrique des parlers berbères de Kabylie
Saïd GUERRAB Analyse dialectométrique des parlers berbères de Kabylie Résumé de la thèse (pour affichage) Il est difficile de parler du berbère sans parler de la variation. Il y a d abord une variation
Plus en détailDécompresser, créer une archive au format «ZIP»
Décompresser, créer une archive au format «ZIP» Qu'est-ce qu'une archive? Une archive est tout simplement une collection de fichiers stockée dans un fichier unique. Rien de plus, rien de moins. Il existe
Plus en détailGuide de l utilisateur. Faites connaissance avec la nouvelle plateforme interactive de
Guide de l utilisateur Faites connaissance avec la nouvelle plateforme interactive de Chenelière Éducation est fière de vous présenter sa nouvelle plateforme i+ Interactif. Conçue selon vos besoins, notre
Plus en détailIntroduction. M2206 Intégration web. Introduction. Introduction 20/01/2014
Introduction M2206 Intégration web http://www.atinternet.fr/ressources/ressources/etudespubliques/barometre-des-moteurs/ Référencement des sites web et moteurs de recherche Introduction Introduction http://www.go-gulf.com/blog/social-networking-user/
Plus en détailMaster Informatique Aix-Marseille Université
Aix-Marseille Université http://masterinfo.univ-mrs.fr/ Département Informatique et Interactions UFR Sciences Laboratoire d Informatique Fondamentale Laboratoire des Sciences de l Information et des Systèmes
Plus en détailETRE VISIBLE SUR INTERNET. Search Engine Optimisation (SEO)
ETRE VISIBLE SUR INTERNET Search Engine Optimisation (SEO) INTRODUCTION Définition Search Engine Marketing (SEM) : opérations consistant à générer du trafic par l achat de publicités sur les moteurs de
Plus en détailAllocution d ouverture de Jean DEBEAUPUIS, Directeur Général de l Offre de soins
Allocution d ouverture de Jean DEBEAUPUIS, Directeur Général de l Offre de soins Université d été de la performance en santé - 29 août 2014- Lille Monsieur le président, Monsieur le directeur général,
Plus en détailContribution aux rapports entre la logique combinatoire et les T[Σ]-algèbres.
UNIVERSITÉ PARIS-SORBONNE ÉCOLE DOCTORALE V «CONCEPTS ET LANGAGES» Laboratoire de recherche «Langues, Logiques, Informatique, Cognition (STIH-LaLIC)» T H È S E pour obtenir le grade de DOCTEUR DE L UNIVERSITÉ
Plus en détailRecherche bibliographique
Séminaire «Maîtrise de l information scientifique» Recherche bibliographique Dernière mise à jour : 07/01/2015 - Auteur : Frédérique Flamerie Recherche bibliographique : méthode & outils La recherche bibliographique
Plus en détailÉtude sémantique du pronom ON dans une perspective textuelle et contextuelle. Thèse de doctorat Anje Müller Gjesdal Université de Bergen
Étude sémantique du pronom ON dans une perspective textuelle et contextuelle. Thèse de doctorat Anje Müller Gjesdal Université de Bergen 1 2 Remerciements Tout d abord, je tiens à remercier Mme Kjersti
Plus en détailRecherche et veille documentaire scientifique
Recherche et veille documentaire scientifique Élodie Chattot BU Médecine Pharmacie juin 2006 Introduction Le but de cet atelier est de vous initier à la méthodologie de recherche documentaire scientifique,
Plus en détailLe ranking de Augure Influencers La méthodologie AIR en détails
Le ranking de Augure Influencers La méthodologie AIR en détails V1.0 Octobre 2014 Oualid Abderrazek Product Marketing Sommaire 1. Contexte...3 2. L algorithme...3 a. Exposition...4 b. Echo...4 c. Niveau
Plus en détail1 La visualisation des logs au CNES
1 La visualisation des logs au CNES 1.1 Historique Depuis près de 2 ans maintenant, le CNES a mis en place une «cellule d analyse de logs». Son rôle est multiple : Cette cellule est chargée d analyser
Plus en détailL analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :
La vision nous permet de percevoir et d interpreter le monde qui nous entoure. La vision artificielle a pour but de reproduire certaines fonctionnalités de la vision humaine au travers de l analyse d images.
Plus en détailChef de file dans le développement de solutions de gestion de contenu
Chef de file dans le développement de solutions de gestion de contenu Depuis 1997, Groupe EBI s est donné comme mission de proposer des solutions de gestion du patrimoine informationnel des organisations
Plus en détailLa recherche d'information sur Internet
La recherche d'information sur Internet Compétence du socle : Je sais utiliser les fonctions principales d'un outil de recherche sur le Web (moteur de recherche, annuaire...) CDI du collège Léon Cazeneuve
Plus en détailSoutien technique en informatique
Service de formation aux adultes Soutien technique en informatique PLAN DE COURS Utilisation et création de bases de données 420-B64-GR 2-2-2 75 heures Session automne 2010 NOM DE L ENSEIGNANT : JIE YANG
Plus en détailExtraction d informations stratégiques par Analyse en Composantes Principales
Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction
Plus en détailUtilisation du TNI en classe d anglais. PROJET INNOVANT présenté par la SECTION D ANGLAIS du Lycée Jean-Paul de Rocca Serra, 20137 Porto-Vecchio
Touch N Invent! Utilisation du TNI en classe d anglais PROJET INNOVANT présenté par la SECTION D ANGLAIS du Lycée Jean-Paul de Rocca Serra, 20137 Porto-Vecchio Sylvie Chiariglione, Brigitte Collomb, Régine
Plus en détail