Web sémantique et intelligence artificielle

Documents pareils
CETTE FOIS CEST DIFFERENT PDF

Instructions Mozilla Thunderbird Page 1

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

Face Recognition Performance: Man vs. Machine

LES TECHNOLOGIES DU WEB APPLIQUÉES AUX DONNÉES STRUCTURÉES

Data issues in species monitoring: where are the traps?

BIG Data et R: opportunités et perspectives

Bienvenue au séminaire HP Service Anywhere Mardi 11 février 2014

Quatre axes au service de la performance et des mutations Four lines serve the performance and changes

Accès aux données Sentinelles

Forge. Présentation ( )

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014

Tier 1 / Tier 2 relations: Are the roles changing?

JDev Atelier Datalift

affichage en français Nom de l'employeur *: Lions Village of Greater Edmonton Society

La solution idéale de personnalisation interactive sur internet

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.

Aspects de droit anglais

«Rénovation des curricula de l enseignement supérieur - Kazakhstan»

Ingénierie et gestion des connaissances

PIB : Définition : mesure de l activité économique réalisée à l échelle d une nation sur une période donnée.

Gulliver.com by mobeo 1

Cette Leçon va remplir ces attentes spécifiques du curriculum :

ResearcherID, ResearchGate, etc. Quels outils pour votre profil chercheur (page web, liste de publications, etc.)?

MANUEL MARKETING ET SURVIE PDF

Township of Russell: Recreation Master Plan Canton de Russell: Plan directeur de loisirs

Improving the breakdown of the Central Credit Register data by category of enterprises

Gestion des prestations Volontaire

BNP Paribas Personal Finance

3A-IIC - Parallélisme & Grid GRID : Définitions. GRID : Définitions. Stéphane Vialle. Stephane.Vialle@supelec.fr

Eléments de statistique

Big Data -Comment exploiter les données et les transformer en prise de décisions?

Les modes de recherche sur le Web 2.0

We Generate. You Lead.

e-science : perspectives et opportunités pour de nouvelles pratiques de la recherche en informatique et mathématiques appliquées

Judge Group: P Title: Quel est meilleur: le compost ou le fertilisant chimique? Student(s): Emma O'Shea Grade: 6

Integrated Music Education: Challenges for Teaching and Teacher Training Presentation of a Book Project

1.The pronouns me, te, nous, and vous are object pronouns.

Évaluation d une architecture de stockage RDF distribuée

ANGULAR JS AVEC GDE GOOGLE

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

Stage Ingénieur en développement logiciel/modélisation 3D

Networking Solutions. Worldwide VSAT Maintenance VSAT dans le Monde Entretien. Satellite Communications Les Communications par Satellite

Bigdata et Web sémantique. les données + l intelligence= la solution

L apprentissage automatique

Hervé Couturier EVP, SAP Technology Development

Get Instant Access to ebook Cest Maintenant PDF at Our Huge Library CEST MAINTENANT PDF. ==> Download: CEST MAINTENANT PDF

Le passé composé. C'est le passé! Tout ça c'est du passé! That's the past! All that's in the past!

Small Businesses support Senator Ringuette s bill to limit credit card acceptance fees

CEST POUR MIEUX PLACER MES PDF

Apprentissage symbolique et statistique à l ère du mariage pour tous

setting the scene: 11dec 14 perspectives on global data and computing e-infrastructure challenges mark asch MENESR/DGRI/SSRI - France

Institut français des sciences et technologies des transports, de l aménagement

Instaurer un dialogue entre chercheurs et CÉR: pourquoi? Me Emmanuelle Lévesque Centre de génomique et politiques Université McGill

La révolution SaaS au service de la valorisation de la recherche

Philippe Lemerle Big Data Secteur public. Copyright 2015, Oracle and/or its affiliates. All rights reserved.

How to Login to Career Page

Frequently Asked Questions

Quick Start Guide This guide is intended to get you started with Rational ClearCase or Rational ClearCase MultiSite.

Contents Windows

WEB page builder and server for SCADA applications usable from a WEB navigator

Application Form/ Formulaire de demande

Utiliser une WebCam. Micro-ordinateurs, informations, idées, trucs et astuces

Big Data et Graphes : Quelques pistes de recherche

L état de la virtualisation

Forthcoming Database

RÉSUMÉ DE THÈSE. L implantation des systèmes d'information (SI) organisationnels demeure une tâche difficile

SCC / QUANTUM Kickoff 2015 Data Protection Best Practices

Optimized Protocol Stack for Virtualized Converged Enhanced Ethernet

L évaluation de la qualité d un dispositif d apprentissage en ligne. Quelles traces mobiliser? Comment les interpréter?

Knowledge Enabled Real-Time Recommendation System

Semantic Web Inside Guillaume Érétéo Directeur R&D

HSCS 6.4 : mieux appréhender la gestion du stockage en environnement VMware et service de fichiers HNAS Laurent Bartoletti Product Marketing Manager

Bourses d excellence pour les masters orientés vers la recherche

XtremWeb-HEP Interconnecting jobs over DG. Virtualization over DG. Oleg Lodygensky Laboratoire de l Accélérateur Linéaire

Relions les hommes à l entreprise Linking people to companies

La Poste choisit l'erp Open Source Compiere

Le projet WIKIWATER The WIKIWATER project

physicien diplômé EPFZ originaire de France présentée acceptée sur proposition Thèse no. 7178

Introduction. M2206 Intégration web. Introduction. Introduction 20/01/2014

Monitoring des classes de neige des calottes polaires par Envisat

ONTARIO Court File Number. Form 17E: Trial Management Conference Brief. Date of trial management conference. Name of party filing this brief

recommandation Domaine : Informatique, Intelligence Artificielle, Modélisation de préférences

Architecture distribuée

JOURNÉE D ÉTUDE AFNOR/BNF

UE 13 Contrôle de gestion. Responsables : Henri Bouquin, Professeur Stéphanie Thiéry-Dubuisson, Maître de Conférences

Exemple PLS avec SAS

Instructions pour mettre à jour un HFFv2 v1.x.yy v2.0.00

Yes, you Can. Travailler, oui c est possible! Work!

Women s State of the Media Democracy 2012 L observatoire international des usages et interactions des médias

Les défis statistiques du Big Data

Discours de Eric Lemieux Sommet Aéro Financement Palais des congrès, 4 décembre 2013

MapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril / 15

DocForum 18 Juin Réussites d un projet Big Data Les incontournables

Micro-ordinateurs, informations, idées, trucs et astuces utiliser le Bureau à distance

L usage des concepts du web sémantique dans le filtrage d information collaboratif

Présentation par François Keller Fondateur et président de l Institut suisse de brainworking et M. Enga Luye, CEO Belair Biotech

Provide supervision and mentorship, on an ongoing basis, to staff and student interns.

Transcription:

Web sémantique et intelligence artificielle Comment le Web Sémantique peut propulser certaines avancées en intelligence artificielle? 1. Il intervient dans 77% des tâches reliées à la création de modèles d apprentissage automatique 2. Il fait partie intégrante d un modèle mathématique 1

Qu est-ce que le Web Sémantique? Un ensemble de technologies d aide à la gestion et à la valorisation de l information 2

Intelligence Artificielle 5

Algorithmes d apprentissages «gives computers the ability to learn without being explicitly programmed» - Arthur Samuel, 1959 Apprentissage supervisé Exemples d entrées et de sorties Apprentissage non-supervisé Trouver la structure des données par elle-même Apprentissage par renforcement L'action de l'algorithme sur l'environnement produit une valeur de retour qui guide l'algorithme d'apprentissage 6

L information: l essense de l apprentissage automatique Consensus: la disponibilité d'une quantité importante de données numériques et structurées est l un des facteurs déterminants ayant contribués aux avancés récentes de l intelligence artificielle, particulièrement dans le domaine de l apprentissage automatique «The most important new development is that today we can provide these algorithms with the resources they need to succeed. Figure 1.8 shows how the size of benchmark datasets has expanded remarkably over time.» - Deep Learning, Ian Goodfellow, Yoshua Benbgio, and Aaron Courville 7

What data scientists spend the most time doing? - Enquête de 80 Data Scientist par CrowdFlower en 2016 77% du temps des scientifiques de la donnée dépensé à effectuer des tâches connexes 8

Quels sont ces tâches? 9

Cas d utilisations Cas: Acquisition de jeux de données Linked Open Data: Jeux de données intégrés Création d un corpus de textes spécialisés Création de jeux de données d apprentissages Nettoyer et organiser l information Acquisition de jeux de données Cas: Classification automatique de documents Création de jeux de données d apprentissages Nettoyer et organiser l information Acquisition de jeux de données 10

Cas 1: Acquisition de jeux de données 11

Linked Open Data 2973 jeux de données intégrées Accessible via SPARQL 149,423,660,620 (149 milliards) triplets Accessible via jeux de données sérialisées 192,230,648 (192 millions) triplets 54,225,309 entités - LODStats (stats.lod2.eu) 12

Utilisation d une base de connaissance 13

Liens entre les classes des ontologies 14

15

Corpus: musiciens 47,263 documents relatifs aux musiciens de Wikipedia Comparaison avec le «Google News model» comprennant 3 milliards de mots 16

Algorithme d apprentissage: word2vec Word2vec est un algorithme qui transforme les mots en vecteurs, de sorte que les mots ayant une signification similaire finissent par se rapprocher les uns des autres. King man + woman = queen 17

Metal + Death =? 18

Metal Death + Smooth =? 19

Cas: Classification automatique de documents Utilisation d une base de connaissance 20

Cas 3: Classification automatique de documents Création d un corpus de texte général 21

Cas: Classification automatique de documents Création d un corpus de texte relatif au domaine de la musique 22

Cas: Classification automatique de documents Création d'un corpus d entrainement général 24,374 paged Wikipedia Création d'un corpus d'entrainement spécialisé sur la musique 62 pages Wikipedia 23

Cas: Classification automatique de documents Création de l interprêteur sémantique Utilisation de l algorithme ESA (Explicit Semantic Analysis) pour la création des vecteur numériques Utilisation de l algorithme SVM (Support Vector Machine) pour la classification des documents 24

Cas: Classification automatique de documents Création d un jeu de référence 25

Cas: Classification automatique de documents Évaluation de différents modèles 26

Cas: Classification automatique de documents Avantages Création rapide de différents jeux de données d apprentissages (''slice and dice'') Évaluation rapide de la performance de chacun des modèles 27

Autres cas d application Résoudre les ambigüités entre les concepts automatiquement balisés dans un texte Identifier les entitées dupliquées entre deux jeux de données Identifier et ajouter des concepts manquants d une ontologie en provenance d une autre structure 28

Merci! Des questions? Frédérick Giasson Courriel: fred@fgiasson.com Cognonto: http://cognonto.com Site personel: http://fgiasson.com Blog: http://fgiasson.com/blog/ 29