DIC9150 Concepts fondamentaux de l informatique cognitive

Documents pareils
IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

Big Data et Graphes : Quelques pistes de recherche

BIG DATA en Sciences et Industries de l Environnement

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Big Data et Graphes : Quelques pistes de recherche

Data Mining. Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

SQL Server 2012 et SQL Server 2014

données en connaissance et en actions?

Les Entrepôts de Données

A QUOI SERVENT LES BASES DE DONNÉES?

UE 8 Systèmes d information de gestion Le programme

Les technologies du Big Data

Data 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients

Big Data On Line Analytics

De l Etudiant à SBA à l Enseignant Chercheur à l ENSMA

Workflow/DataWarehouse/DataMining LORIA - Université d automne Informatique décisionnelle - L. Mirtain 1

Master Informatique Aix-Marseille Université

Pentaho Business Analytics Intégrer > Explorer > Prévoir

Big Data et Prévisions. Philippe Picard, le 24 juin Page 1

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

Information utiles. webpage : Google+ : digiusto/

Introduction au Data-Mining

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

UFR d Informatique. FORMATION MASTER Domaine SCIENCES, TECHNOLOGIE, SANTE Mention INFORMATIQUE

Bigdata et Web sémantique. les données + l intelligence= la solution

Le Web, l'entreprise et le consommateur. Françoise Soulié Fogelman

IT SecuDay Geneva 2015 : Les apports du Big Data à la sécurité informatique

Présentations personnelles. filière IL

Introduc;on à l intelligence d affaires et aux entrepôts de données

Fouillez facilement dans votre système Big Data. Olivier TAVARD

transformer en avantage compétitif en temps réel vos données Your business technologists. Powering progress

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Introduction à l Informatique Décisionnelle - Business Intelligence (7)

Travailler avec les télécommunications

Référencement de votre site Web Google et autres moteurs de recherche (4ième édition)

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

BIG DATA. Veille technologique. Malek Hamouda Nina Lachia Léo Valette. Commanditaire : Thomas Milon. Encadré: Philippe Vismara

II L APPROCHE PEDAGOGIQUE EN 2nde PRO LOGISTIQUE ET TRANSPORT. 1 Mon téléphone portable

COR-E : un modèle pour la simulation d agents affectifs fondé sur la théorie COR

Formation. Durée de la formation : 1 journée. Formule In-house (jusque 3 participants) Formation sur mesure en entreprise.

Groupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON

Dhafer Lahbib. Préparation non paramétrique des données pour la fouille de données multitables.

5. Apprentissage pour le filtrage collaboratif

Comment le "big data" impacte le domaine de l'intelligence Economique?

Introduction au Data-Mining

Recherche et Diffusion de l Information dans les Réseaux. Philippe Robert. Le 8 avril 2014

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

NoSQL. Introduction 1/23. I NoSQL : Not Only SQL, ce n est pas du relationnel, et le contexte. I table d associations - Map - de couples (clef,valeur)

Calcul d une provision technique en assurance vie dans le cadre de Solvabilité 2. Le cas des contrats d épargne : les approches «markedto model»

En route vers le succès avec une solution de BI intuitive destinée aux entreprises de taille moyenne

Intelligence Artificielle et Robotique

Perception et utilisation des solutions de radio-identification (RFID) dans les entreprises françaises

SMU MEDITERRANEAN. SOUTH MEDITERRANEAN UNIVERSITY Première Université Anglophone en Tunisie (Depuis 2002)

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence

IFT3030 Base de données. Chapitre 2 Architecture d une base de données

Agence web en Suisse romande CH-1260 Nyon

Stratégie et Vision de SAP pour le secteur Banque- Assurance: Data-Management, BI, Mobilité

APPORT DES RESEAUX BAYESIENS DANS LA PREVENTION DE LA DELINQUANCE

Le BigData, aussi par et pour les PMEs

Du paradigme Suivi/ordonnancement/GPAO au paradigme ERP/APS/MES : révolution ou évolution?

Data Mining. Master 1 Informatique - Mathématiques UAG

Inventorier, surveiller, localiser vos biens nomades en temps réel. Meylan - France Avril 2012

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Introduction au datamining

#BigData Dossier de presse Mai 2014

Le Data Risk Center. Plateforme de pilotage et de gestion des risques Pilier I de la directive Solvabilité II

BIG DATA : une vraie révolution industrielle (1) Les fortes évolutions liées à la digitalisation

L INTELLIGENCE D AFFAIRE DANS LA VIE QUOTIDIENNE D UNE ENTREPRISE

Open Data. François Bancilhon twitter.com/fbancilhon Printemps de la recherche EDF R&D 28/9/12

L humain et ses données, le «quantified self»

Algèbre 40 Analyse Stat. 1 - IES : Probabilités discrètes et calcul intégral 29,5 6 Stat. 2 - IES : Probabilités générales 54 8 UE1-02 M-E-IS

Master I Génie Logiciel

MANAGEMENT DES SYSTEMES D INFORMATION ET DE PRODUCTION MSIP

Big Data & Risques. Mise en perspective du Big Data dans la gestion des risques bancaires. Stéphane Eyraud CEO seyraud@chappuishalder.

1 INFORMATION - INFORMATIQUE. 11 Systèmes d'information gestion des connaissances, knowledge management

Le potentiel et les défis du Big Data. Mardi 2 et Mercredi 3 Juillet 2013

Introduction à lʼinformatique. Décisionnelle (ID) / Business. Intelligence» (1)

Les quatre piliers d une solution de gestion des Big Data

ORGANISER SON ENTREPRISE POUR EXPORTER : LES SOLUTIONS RH. La gestion stratégique des achats internationaux - L. LANGUENOU - Mars 2011

L A B U S I N E S S. d a t a g i n f o r m a t i o n g a c t i o n

LES ENTREPOTS DE DONNEES

Guide de référence pour l achat de Business Analytics

CARTOGRAPHIE EN LIGNE ET GÉNÉRALISATION

4.2 Unités d enseignement du M1

Entreprise et Big Data

MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS. Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.

1 Actuate Corporation de données. + d analyses. + d utilisateurs.

QU EST-CE QUE LA RFID?

Introduction aux outils BI de SQL Server Fouille de données avec SQL Server Analysis Services (SSAS)

Intelligence Inventive & Mapping des réseaux de Recherche. Expernova & Active Innovation Management GFII 5 Mars 2015

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

INF6304 Interfaces Intelligentes

Spécificités, Applications et Outils


Hervé Couturier EVP, SAP Technology Development

Internet of big data things

Entrepôt de données 1. Introduction

2 Serveurs OLAP et introduction au Data Mining

Transcription:

DIC9150 Concepts fondamentaux de l informatique cognitive Forage de Données (Data-Mining) Roger Villemaire Département d informatique UQAM 29 novembre 2016

Plan 1 Données et Information 2 Traitement des données 3 Forage de données 4 Conclusion du cours!

Données et IA Comme nous l avons vu, le développement de l Intelligence Artificielle a déterminé l importance cruciale d avoir suffisamment d information dans les systèmes intelligents. Il n y a pas de comportement intelligent ex nihilo, sans relation avec le monde extérieur.

Nature des Données Il nous faut des concepts et des attributs fondamentaux : Approche symbolique : relations, variables, etc. Approche connexionniste : entrées, variables aléatoires, etc. et de l information à leur sujet : Approche symbolique : règles, contraintes, décisions, etc. Approche connexionniste : exemples, statistiques, etc. De plus, tout ceci doit être sous une forme traitable par la machine.

Données et Statistiques On assiste à une certaine convergence entre l analyse de données et la statistique, mais il y a toutefois un changement de paradigme : en statistique classique on suppose un certain nombre d aprioris probabilistes, de plus, les données sont rares et il faut s en servir astucieusement pour valider des hypothèses de la façon la plus adéquate, aujourd hui on a ou on peut obtenir d énormes quantités de données, mais les relations probabilistes ou même causales sont passablement moins claires.

Données et Entreprise Une source importante pour le phénomène émergent des Données Massives (Big Data) est le monde de l entreprise : Entreprise et Infrastructure informatique sont aujourd hui indissociables. Depuis au moins les années 1980, les données d entreprise sont stockées dans des bases de données.

Bases de Données Une base de données est formée de tables (relations), chaque table est formée d attributs (variables). par ex., nom, adresse, salaire, etc. L ensemble des tables permet de stocker l information par ex. au sujet des clients, employés, transactions, contrats, etc. de l entreprise. Les systèmes de bases de données modernes sont transactionnels, indépendants des langages de programmation, robustes, efficaces, distribués.

Entrepôts de Données Émergence d entrepôts de données (data-warehouse) : agrégation de données de plusieurs BD opérationnelles, pour l analyse (data analytics) et la prise de décision (tableau de bord).

Exemple Supermarché : tout ce qui passe à la caisse est enregistré dans la BD, et probablement associé à votre identité (carte de points?), les inventaires sont donc à jour, on peut voir l évolution en temps-réel, prévoir les surplus (dates de péremption), les pénuries, assurer la livraison juste-à-temps (just-on-time), on peut déterminer les tendances chez les clients et prévoir les besoins.

Exemple dossier médical intégré : on pourrait avoir accès à notre dossier médical partout (urgence), incluant les prescriptions (historique, contre-indication), globalement ceci pourrait permettre de mieux comprendre le fonctionnement du système de santé réduction des erreurs, prévision des effectifs et des ressources, diminution du temps d attente, du risque de contagion, etc.

Exemples Traçabilité en temps réel des bagages pour une compagnie aérienne. Traçabilité des rouleaux de papiers! RFID et gestion d un entrepôt.

Le Web est une énorme source de données : Twitter, Facebook, LinkedIn, Wikipedia, Flickr, etc. Exemple

Particularité du Web Manque de structure, sémantique pas très claire, pas facilement traitable par la machine. Néanmoins grande source de données exploitable pour : compléter des dossiers de façon semi-automatique, analyser des liens et des interactions.

Structure des données Données structurées le sens et la position de l information sont clairement définis par ex. une base de données. Données semi-structurées le sens et position de l information sont en partie définis document XML ou HTML. Données non structurés le sens et position de l information ne sont pas clairement définis ou alors très difficile à déterminer texte dans une langue naturelle (TLN).

Intuition Nous avons, de plus en plus, accès à énormément de données, grâce à la présence massive de l informatique, l informatisation passablement complétée des entreprises, le développement de l Internet et une informatisation sociale, la décroissance phénoménale du coût du matériel, la croissance exponentielle de la capacité de stockage (entreprise, individus) Il s agit d une énorme ressource qui devrait nous permettre de réaliser beaucoup de choses : augmentation de la productivité/diminution des coûts, développement de logiciels augmentant nos capacités, réalisation des promesses de l Intelligence Artificielle.

Science des données Données Massives (Big-Data) : ensembles de données énormes par ex. toutes les transactions d Amazon depuis la fondation de l entreprise! Forage de Données (Data-Mining) : méthodes de l Intelligence Artificielle et de la statistique permettant de découvrir des corrélations et des motifs (patterns) dans les données massives par ex. système de recommandation : ceux qui ont acheté un robot culinaire ont aussi acheté dans les 6 mois une perceuse sans fil! Analyse prédictive : se servir des données massives pour prédire ou estimer un résultat ou comportement futur cet étudiant gagnerait à faire le module optionnel XYZ!

Objectifs du Forage de données Description de motifs ou de tendances. Estimation d une valeur numérique. Classification d une valeur catégorielle. Regroupement (clustering) de valeurs en ensembles similaires. Association de causes et d effets (règles si-alors avec support et confiance).

Méthodes du Forage de données Visualisation : représentation graphique pour développer une intuition des données. Prétraitement des données : champs obsolètes ou redondants, valeurs manquantes ou incohérentes, modification du format pour simplifier le traitement. Sélection de sous-ensembles de données ou des attributs les plus intéressants/pertinents. Traitement des données à l aide d algorithmes statistiques ou d IA comme arbres de décision, réseaux neuronaux, réseaux bayésiens, par ex., pour l estimation ou la classification.

Doctorat en Informatique Cognitive Interface cognition/informatique : modélisation cognitive à l aide d outils informatiques, apport des sciences humaines, cognition (S. Robert), apport de l Intelligence Artificielle et de l informatique, recherche appliquée, effectuer une synthèse des deux approches, proposer une projet de recherche joignant cognition et informatique, technologie cognitive, les technologies cognitives de l informatique ont atteint un bon niveau de maturité au niveau technique, il reste néanmoins un potentiel d application énorme, il reste beaucoup de travail (définition du problème, formalisation, détermination des technologies les plus adéquates) à faire pour développer des applications effectives, utiles et pertinentes. Votre objectif maintenant : vous définir un projet!