Mesures d évaluation Multi-classes Réduction de dimension
|
|
- Ève Mercier
- il y a 6 ans
- Total affichages :
Transcription
1 Mesures d évaluation Multi-classes Réduction de dimension Cours 10 Nicolas Baskiotis nicolas.baskiotis@lip6.fr Master 1 DAC équipe MLIA, Laboratoire d Informatique de Paris 6 (LIP6) Université Pierre et Marie Curie (UPMC) S2 ( ) N. Baskiotis (LIP6, UPMC) ARF S2 ( ) 1 / 26
2 Plan 1 Mesures d évaluation 2 Problème multi-classes 3 Réduction de dimensions 4 Conclusion N. Baskiotis (LIP6, UPMC) ARF S2 ( ) 2 / 26
3 Mesures d évaluation Objectifs Estimer la qualité des prédictions fournies par une approche Comparer des approches entre elles sur un problème donné Comparer des algorithmes sur un ensemble de problèmes Le résultat dépend Choix de la mesure Choix du protocole de test (paramétrisation) Choix de l échantillage N. Baskiotis (LIP6, UPMC) ARF S2 ( ) 3 / 26
4 Une mesure unique? Tutorial icmla 2011, N. Japkowicz N. Baskiotis (LIP6, UPMC) ARF S2 ( ) 4 / 26
5 Matrice de confusion Contexte Un problème de classification binaire, étiquettes positif/négatif TP : Vrai positif (True positive), TN : Vrai négatif (True negative) FP : Faux positif (False positive), FN : Faux négatif (False negative) Matrice de confusion Mesures dérivées Label + Label f (x) = +1 TP FP f (x) = 1 FN TN P = TP + FN N = FP + TN Erreur 0 1 : FP+FN Précision : P+N TP TP+FP Rappel (TP rate) : TP P FP Rate : FP N F β = (1 + β 2 ) precision rappel β 2 precision+rappel N. Baskiotis (LIP6, UPMC) ARF S2 ( ) 5 / 26
6 Exemple (ou le problème du déséquilibre) Label + Label f (x) = f (x) = Erreur : 60% Précision : 40%, Rappel : 40% F 1 : 0.4 Label + Label f (x) = f (x) = Erreur : 60% Précision : 66%, Rappel : 40% F 1 : 0.5 Label + Label f (x) = f (x) = Erreur : 60% Précision : 66%, Rappel : 80% F 1 : 0.66 Label + Label f (x) = f (x) = Erreur : 66% Précision : 66%, Rappel : 40% F 1 : 0.5 N. Baskiotis (LIP6, UPMC) ARF S2 ( ) 6 / 26
7 Courbe ROC et AUC Courbe ROC : TP rate en fonction du FP rate permet de calibrer un classifieur mesure d intérêt : AUC, aire sous la courbe N. Baskiotis (LIP6, UPMC) ARF S2 ( ) 7 / 26
8 Comment comparer deux algos? Test statistique N. Baskiotis (LIP6, UPMC) ARF S2 ( ) 8 / 26
9 Plan 1 Mesures d évaluation 2 Problème multi-classes 3 Réduction de dimensions 4 Conclusion N. Baskiotis (LIP6, UPMC) ARF S2 ( ) 9 / 26
10 Cas usuel Contexte Classes : C = {C 1, C 2,..., C K } Classification binaire ne marche pas directement Approches naïves utilisant la classification binaire One-versus-one : matrice M ij = C i vs C j One-versus-all : vecteur M i = C i vs {C j i } Adaptation de la classification binaire Arbres, forets, k-nn : adaptation triviale SVMs multi-classes Réseau de neuronnes : vecteur de sortie y et softmax : p(y j ) = e y j i e y i N. Baskiotis (LIP6, UPMC) ARF S2 ( ) 10 / 26
11 Très grand nombre de classes Problèmes des approches usuelles Coût d une classification τ au mieux linéaire en fonction de K : temps τk grand nombre de dimensions passage à l échelle difficile en temps de calcul et en perfs Deux grandes familles d approche Approche flat : plonger les classes dans un espace R K, K << K Intérêt : K τ pour trouver la bonne classe Approche hiérarchique : organiser les classes hiérarchiquement dans un arbre de classes Intérêt : inférence en log(k)τ pour un arbre binaire N. Baskiotis (LIP6, UPMC) ARF S2 ( ) 11 / 26
12 Approches Error Correcting Output Code (ECOC) Principe Plonger les classes dans R K, K << K Codage : une classe un code dans K Inférence = codage : f : X K, f (x) donne un code dans K Décodage : classe dont le code est le plus proche En pratique Un code c i : un vecteur ternaire de K : ( 1, 0, 1,..., 0, 1) A chaque code, un classifieur binaire f i qui sépare {C j c i j > 0} et {C j c i j < 0} Matrice M de codage de K : matrice K K des M ij = c i j Codage d une classe C j : (c 1 j, c2 j,... ck j ) codage d un exemple : (f 1 (x), f 2 (x),..., f k (x)) Inférence : argmin j d(f (x), M.j ) en O(K τ + K) N. Baskiotis (LIP6, UPMC) ARF S2 ( ) 12 / 26
13 Approche hiérarchique Objectif Construire un arbre de partitionnement (hard ou soft) des classes Pour un nœud n : un ensemble Cn de classes, pour les fils n 1,..., n c sous-ensembles C n 1,..., C n c C n, et C n j = C n un classifieur fn à valeur dans {n 1,..., n c} Racine : ensemble de toutes les classes, feuilles : une seule classe Classification : un chemin dans l arbre (en utilisant f n ), classe de la feuille Problèmatiques Construire l hiérarchie : information a priori sur les classes : ontologie ou hiérarchie des classes apprentissage de l hiérarchie : clustering, approches gloutonnes Apprendre les classifieurs : problème de données non équilibrés Correction des erreurs : redondance des classes dans les nœuds de l arbre N. Baskiotis (LIP6, UPMC) ARF S2 ( ) 13 / 26
14 Plan 1 Mesures d évaluation 2 Problème multi-classes 3 Réduction de dimensions 4 Conclusion N. Baskiotis (LIP6, UPMC) ARF S2 ( ) 14 / 26
15 Problèmatique Ajouter des dimensions augmente l expressivité Trop de dimension : peu de variance sur une même dimension, problème sur-appris, sujet au bruit,... En texte, image (et ailleurs) : trop de dimensions dimensions peu informatives, très corrélées Réduire les dimensions mais sans perte d informations! Objectif : chercher une projection φ : R d R d avec d << d Applications apprentissage visualisation réduction du bruit N. Baskiotis (LIP6, UPMC) ARF S2 ( ) 15 / 26
16 Analyse en Composante Principale Réduction en dimension 1 Soit X = {x 1,..., x n } et x 0 un vecteur représentant ces données objectif : J(X, x 0 ) = i x 0 x i 2 plus petit possible! Minimiseur : µ = 1 n i x i, et J(x 0 ) = i x 0 µ + µ x i 2 = i x 0 µ 2 + i x i µ 2 N. Baskiotis (LIP6, UPMC) ARF S2 ( ) 16 / 26
17 Analyse en composante principale Réduction sur une dimension on cherche à projeter sur une ligne ae + b, ou e vecteur unitaire en dimension d Chaque point x i : a i e + b J(X, e) = i a ie + b x i 2 = i a2 i 2 i a ie (x i b) + i x i b 2 J a i = 0 a i = e (x i b) J(X, e) = i a2 i 2 i a2 i + i x k b 2 = i (e (x i b)) 2 + i x i b 2 avec S = i (x i b)(x i b), J(X, e) = e Se + i x i b 2 Solution (lagrangien) : Se = λe Réduction en plusieurs dimensions Même démarche : ensemble des vecteurs propres Equivalent à X µ = WSV, S diagonale, V vecteurs propres, W coordonnées des points dans le nouveau repère Ou à la diagonalisation de la matrice de covariance (X µ)(x µ ) N. Baskiotis (LIP6, UPMC) ARF S2 ( ) 17 / 26
18 Exemple N. Baskiotis (LIP6, UPMC) ARF S2 ( ) 18 / 26
19 Apprentissage de dictionnaire Une image : constituée d un petit ensemble de primitives. Problème de la PCA : base orthogonale! pas de redondance Peut-on apprendre un dictionnaire de primitives pour représenter un jeu de données? N. Baskiotis (LIP6, UPMC) ARF S2 ( ) 19 / 26
20 Compress sensing Objectif : trouver D tel que x Dx Contrainte de sparsité : x 0 très faible, peu d atomes sont nécessaires à reconstruire x simplicité : quelques atomes suffisent à expliquer x signification : la représentation explique x parcimonie : x est décrit que parce qui le représente Problème d optimisation : argmin D Dx x + λ x 0 (différentes normes, différentes variantes) Approche dérivée de la physique (analyse de wavelet, fourier,... ) N. Baskiotis (LIP6, UPMC) ARF S2 ( ) 20 / 26
21 Applications Débruitage [Mairal et al 2009] N. Baskiotis (LIP6, UPMC) ARF S2 ( ) 21 / 26
22 Applications Inpainting N. Baskiotis (LIP6, UPMC) [Mairal, Elad, Sapiro 2008] ARF S2 ( ) 21 / 26
23 Factorisation matricielle non négative Décomposition sur un dictionnaire additif uniquement x Dx, avec x > 0 Intérêt : plus interprétable, plus réaliste sur un ensemble de problèmes Multiples applications : séparation de sources, en topic discovery,... N. Baskiotis (LIP6, UPMC) ARF S2 ( ) 22 / 26
24 Auto-encoders Principe Apprendre un réseau de neuronnes qui reconstruit au mieux l entrée Encodage sur une couche cachée réduction de dimension Applications Visualisation Débruitage Réduction de dimension, espace latent de représentation N. Baskiotis (LIP6, UPMC) ARF S2 ( ) 23 / 26
25 Plan 1 Mesures d évaluation 2 Problème multi-classes 3 Réduction de dimensions 4 Conclusion N. Baskiotis (LIP6, UPMC) ARF S2 ( ) 24 / 26
26 Ce qu on a vu Ce qu est l apprentissage supervisé, non supervisé Les algos usuels d apprentissage : estimation de densité, classification linéaire, réseau de neuronnes, k-means Quelques concepts plus généraux : fonction de coût, expressivité, pénalisation, dimensionalité, noyaux, ensemble learning Comment s évaluer : validation croisée N. Baskiotis (LIP6, UPMC) ARF S2 ( ) 25 / 26
27 Ce qu on n a pas vu Ce qu est l apprentissage semi-supervisé, l apprentissage actif, le reinforcement learning, le multi-instance, le ranking, le collaborative filtering, l optimisation exploration/exploitation, l optimisation multi-critère, l apprentissage relationel, les séquences, l apprentissage de données structurées,... Le détail des approches présentées : chaque cours pourrait faire une UE à part entière! Les techniques avancées : réseaux profonds,... Les maths dérrière l ensemble de ces notions : théorie de la statistique, théorie de la décision, les bornes Les techniques d optimisation pour le big data Une (petite) partie sera couverte en M2 N. Baskiotis (LIP6, UPMC) ARF S2 ( ) 26 / 26
Etude des propriétés empiriques du lasso par simulations
Etude des propriétés empiriques du lasso par simulations L objectif de ce TP est d étudier les propriétés empiriques du LASSO et de ses variantes à partir de données simulées. Un deuxième objectif est
Plus en détailLaboratoire 4 Développement d un système intelligent
DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI LOG770 - SYSTÈMES INTELLIGENTS ÉTÉ 2012 Laboratoire 4 Développement d un système intelligent 1 Introduction Ce quatrième et dernier laboratoire porte sur le développement
Plus en détailNouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires
Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires Julien Jorge julien.jorge@univ-nantes.fr Laboratoire d Informatique de Nantes Atlantique,
Plus en détailRenforcement des trois compétences : compréhension orale, expression orale et expression écrite à partir de documents et vidéos.
Master Mathématiques et Applications Spécialité : Ingénierie mathématique et modélisation Parcours : Mathématique et Informatique : Statistique, Signal, Santé (MI3S) 2015-2016 RÉSUMÉ DES COURS : (dernière
Plus en détailChapitre 7. Récurrences
Chapitre 7 Récurrences 333 Plan 1. Introduction 2. Applications 3. Classification des récurrences 4. Résolution de récurrences 5. Résumé et comparaisons Lectures conseillées : I MCS, chapitre 20. I Rosen,
Plus en détailFormation Actuaire Data Scientist. Programme au 24 octobre 2014
Formation Actuaire Data Scientist Programme au 24 octobre 2014 A. Eléments logiciels et programmation Python 24h Objectif : Introduction au langage Python et sensibilisation aux grandeurs informatiques
Plus en détailEric Bertrand ebertrand@ixis-cib.com. 08/11/06 Maître de conférence 1
Calcul parallèle des options MC. Eric Bertrand ebertrand@ixis-cib.com 1 Plan Contexte du calcul parallèle Qualités requises Architecture Outillage Problèmes rencontrés perspectives 2 Contexte du calcul
Plus en détailApprentissage non paramétrique en régression
1 Apprentissage non paramétrique en régression Apprentissage non paramétrique en régression Résumé Différentes méthodes d estimation non paramétriques en régression sont présentées. Tout d abord les plus
Plus en détailSYSTEME DE GESTION DES ENERGIES EWTS EMBEDDED WIRELESS TELEMETRY SYSTEM
SYSTEME DE GESTION DES ENERGIES EWTS EMBEDDED WIRELESS TELEMETRY SYSTEM Copyright TECH 2012 Technext - 8, avenue Saint Jean - 06400 CANNES Société - TECHNEXT France - Tel : (+ 33) 6 09 87 62 92 - Fax :
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane
Plus en détailProjet de Traitement du Signal Segmentation d images SAR
Projet de Traitement du Signal Segmentation d images SAR Introduction En analyse d images, la segmentation est une étape essentielle, préliminaire à des traitements de haut niveau tels que la classification,
Plus en détailTechnique de compression des images médicales 4D
Technique de compression des images médicales 4D Leila Belhadef 1 et Zoulikha Mekkakia 1 1 Département d Informatique, USTO-MB, BP 1505 El Mnaouer, Oran, Algérie l.belhadef@gmail.com, mekkakia@univ-usto.dz
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme
Plus en détailApprentissage Automatique
Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Plus en détailCours de Master Recherche
Cours de Master Recherche Spécialité CODE : Résolution de problèmes combinatoires Christine Solnon LIRIS, UMR 5205 CNRS / Université Lyon 1 2007 Rappel du plan du cours 16 heures de cours 1 - Introduction
Plus en détailL'intelligence d'affaires: la statistique dans nos vies de consommateurs
L'intelligence d'affaires: la statistique dans nos vies de consommateurs Jean-François Plante, HEC Montréal Marc Fredette, HEC Montréal Congrès de l ACFAS, Université Laval, 6 mai 2013 Intelligence d affaires
Plus en détailApprentissage statistique dans les graphes et les réseaux sociaux
Apprentissage statistique dans les graphes et les réseaux sociaux Patrick Gallinari Collaboration : L. Denoyer, S. Peters Université Pierre et Marie Curie AAFD 2010 1 Plan Motivations et Problématique
Plus en détailMathématique et Automatique : de la boucle ouverte à la boucle fermée. Maïtine bergounioux Laboratoire MAPMO - UMR 6628 Université d'orléans
Mathématique et Automatique : de la boucle ouverte à la boucle fermée Maïtine bergounioux Laboratoire MAPMO - UMR 6628 Université d'orléans Maitine.Bergounioux@labomath.univ-orleans.fr Plan 1. Un peu de
Plus en détailComparaison de fonctions Développements limités. Chapitre 10
PCSI - 4/5 www.ericreynaud.fr Chapitre Points importants 3 Questions de cours 6 Eercices corrigés Plan du cours 4 Eercices types 7 Devoir maison 5 Eercices Chap Et s il ne fallait retenir que si points?
Plus en détailUML (Paquetage) Unified Modeling Language
UML (Paquetage) Unified Modeling Language Sommaire Introduction Objectifs Paquetage Espace de nommage d un paquetage Dépendances entre paquetages 2 Notion introduite véritablement par UML car superficiellement
Plus en détailALGORITHMIQUE II NOTION DE COMPLEXITE. SMI AlgoII
ALGORITHMIQUE II NOTION DE COMPLEXITE 1 2 Comment choisir entre différents algorithmes pour résoudre un même problème? Plusieurs critères de choix : Exactitude Simplicité Efficacité (but de ce chapitre)
Plus en détailFormes quadratiques. 1 Formes quadratiques et formes polaires associées. Imen BHOURI. 1.1 Définitions
Formes quadratiques Imen BHOURI 1 Ce cours s adresse aux étudiants de niveau deuxième année de Licence et à ceux qui préparent le capes. Il combine d une façon indissociable l étude des concepts bilinéaires
Plus en détailExercices - Polynômes : corrigé. Opérations sur les polynômes
Opérations sur les polynômes Exercice 1 - Carré - L1/Math Sup - Si P = Q est le carré d un polynôme, alors Q est nécessairement de degré, et son coefficient dominant est égal à 1. On peut donc écrire Q(X)
Plus en détailObjectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique
Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55
Plus en détailArbres binaires de décision
1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression
Plus en détailLa Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1
La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La licence Mathématiques et Economie-MASS de l Université des Sciences Sociales de Toulouse propose sur les trois
Plus en détailSécurité par compression! ReSIST 2010. Gilles RICHARD IRIT www.irit.fr/bite www.bite.ac.uk
Sécurité par compression! ReSIST 2010 Gilles RICHARD IRIT www.irit.fr/bite www.bite.ac.uk Introduction Sécurité.. intrusion réseau, attaques (DoS,DDoS etc.) virus, etc... spams code injection (SQL,XSS,CSRF,...)
Plus en détailAmélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons
Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons Ahmad OSMAN 1a, Valérie KAFTANDJIAN b, Ulf HASSLER a a Fraunhofer Development Center
Plus en détailPartie 1 - Séquence 3 Original d une fonction
Partie - Séquence 3 Original d une fonction Lycée Victor Hugo - Besançon - STS 2 I. Généralités I. Généralités Définition Si F(p) = L [f(t)u (t)](p), alors on dit que f est l original de F. On note f(t)
Plus en détailISFA INSTITUT DE SCIENCE FINANCIÈRE ET D ASSURANCES GRANDE ÉCOLE D ACTUARIAT ET DE GESTION DES RISQUES
ISFA INSTITUT DE SCIENCE FINANCIÈRE ET D ASSURANCES GRANDE ÉCOLE D ACTUARIAT ET DE GESTION DES RISQUES L ISFA et ses formations Focus sur S2IFA INSTITUT DE SCIENCE FINANCIÈRE ET D ASSURANCES L ISFA, CRÉÉ
Plus en détailGestion répartie de données - 1
Gestion répartie de données - 1 Sacha Krakowiak Université Joseph Fourier Projet Sardes (INRIA et IMAG-LSR) http://sardes.inrialpes.fr/~krakowia Gestion répartie de données Plan de la présentation Introduction
Plus en détailTransmission d informations sur le réseau électrique
Transmission d informations sur le réseau électrique Introduction Remarques Toutes les questions en italique devront être préparées par écrit avant la séance du TP. Les préparations seront ramassées en
Plus en détailAnalyse fonctionnelle Théorie des représentations du groupe quantique compact libre O(n) Teodor Banica Résumé - On trouve, pour chaque n 2, la classe
Analyse fonctionnelle Théorie des représentations du groupe quantique compact libre O(n) Teodor Banica Résumé - On trouve, pour chaque n 2, la classe des n n groupes quantiques compacts qui ont la théorie
Plus en détailEfficacité énergétique des réseaux de cœur et d accès
Efficacité énergétique des réseaux de cœur et d accès David Coudert Joanna Mouliérac, Frédéric Giroire MASCOTTE I3S (CNRS/Université Nice Sophia-Antipolis) INRIA Sophia-Antipolis Méditerranée 1 Contexte
Plus en détailSommaire. Couverture de zone de surveillance dans les réseaux de capteurs. De quoi parle-t-on ici (1/2)? Objectif. De quoi parle-t-on ici (2/2)?
ouverture de zone de surveillance dans les réseaux de capteurs Jean arle, Master Recherche Informatique Option Informatique Mobile 008-009 s Jean arle - Master Recherche Informatique 008-009 Objectif e
Plus en détailJournées Télécom-UPS «Le numérique pour tous» David A. Madore. david.madore@enst.fr. 29 mai 2015
et et Journées Télécom-UPS «Le numérique pour tous» David A. Madore Télécom ParisTech david.madore@enst.fr 29 mai 2015 1/31 et 2/31 : définition Un réseau de R m est un sous-groupe (additif) discret L
Plus en détailIntégration et probabilités TD1 Espaces mesurés Corrigé
Intégration et probabilités TD1 Espaces mesurés Corrigé 2012-2013 1 Petites questions 1 Est-ce que l ensemble des ouverts de R est une tribu? Réponse : Non, car le complémentaire de ], 0[ n est pas ouvert.
Plus en détailI- Définitions des signaux.
101011011100 010110101010 101110101101 100101010101 Du compact-disc, au DVD, en passant par l appareil photo numérique, le scanner, et télévision numérique, le numérique a fait une entrée progressive mais
Plus en détailPartie 1: Gestion de l interférence entre symboles
Partie 1: Gestion de l interférence entre symboles Philippe Ciblat Télécom ParisTech, France Algo de Viterbi Egalisation OFDM Section 11 : Algorithme de Viterbi Philippe Ciblat Gestion de l interférence
Plus en détailL ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Plus en détailLES TYPES DE DONNÉES DU LANGAGE PASCAL
LES TYPES DE DONNÉES DU LANGAGE PASCAL 75 LES TYPES DE DONNÉES DU LANGAGE PASCAL CHAPITRE 4 OBJECTIFS PRÉSENTER LES NOTIONS D ÉTIQUETTE, DE CONS- TANTE ET DE IABLE DANS LE CONTEXTE DU LAN- GAGE PASCAL.
Plus en détailCours d analyse numérique SMI-S4
ours d analyse numérique SMI-S4 Introduction L objet de l analyse numérique est de concevoir et d étudier des méthodes de résolution de certains problèmes mathématiques, en général issus de problèmes réels,
Plus en détailEléments de spécification des systèmes temps réel Pierre-Yves Duval (cppm)
Eléments de spécification des systèmes temps réel Pierre-Yves Duval (cppm) Ecole d informatique temps réel - La Londes les Maures 7-11 Octobre 2002 - Evénements et architectures - Spécifications de performances
Plus en détailLOGO. Module «Big Data» Extraction de Connaissances à partir de Données. Claudia MARINICA MCF, ETIS UCP/ENSEA/CNRS Claudia.Marinica@u-cergy.
Module «Big Data» Extraction de Connaissances à partir de Données Claudia MARINICA MCF, ETIS UCP/ENSEA/CNRS Claudia.Marinica@u-cergy.fr 14 Janvier 2015 Pourquoi l extraction de connaissances à partir de
Plus en détailGrégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved.
Grégoire de Lassence 1 Grégoire de Lassence Responsable Pédagogie et Recherche Département Académique Tel : +33 1 60 62 12 19 gregoire.delassence@fra.sas.com http://www.sas.com/france/academic SAS dans
Plus en détailCapacité d un canal Second Théorème de Shannon. Théorie de l information 1/34
Capacité d un canal Second Théorème de Shannon Théorie de l information 1/34 Plan du cours 1. Canaux discrets sans mémoire, exemples ; 2. Capacité ; 3. Canaux symétriques ; 4. Codage de canal ; 5. Second
Plus en détailCHAPITRE I INTRODUCTION
CHAPITRE I INTRODUCTION A. Histoire D un certain point de vue le début de l histoire de la théorie des nœuds date du temps d Alexandre de Macédoine, plus précisément de sa résolution du problème du fameux
Plus en détailExercice : la frontière des portefeuilles optimaux sans actif certain
Exercice : la frontière des portefeuilles optimaux sans actif certain Philippe Bernard Ingénierie Economique & Financière Université Paris-Dauphine Février 0 On considère un univers de titres constitué
Plus en détailINTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE
INTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE Le schéma synoptique ci-dessous décrit les différentes étapes du traitement numérique
Plus en détailBac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)
Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures) Eercice 1 (5 points) pour les candidats n ayant pas choisi la spécialité MATH Le tableau suivant donne l évolution du chiffre
Plus en détailComment démontrer des formules sans effort? exposé de maîtrise
Comment démontrer des formules sans effort? exposé de maîtrise Marc Mezzarobba Sam Zoghaib Sujet proposé par François Loeser Résumé Nous exposons un ensemble de méthodes qui permettent d évaluer «en forme
Plus en détailPython - introduction à la programmation et calcul scientifique
Université de Strasbourg Environnements Informatique Python - introduction à la programmation et calcul scientifique Feuille de TP 1 Avant de commencer Le but de ce TP est de vous montrer les bases de
Plus en détailDécouverte et analyse de dépendances dans des réseaux d entreprise
Découverte et analyse de dépendances dans des réseaux d entreprise Samer MERHI Sous la direction de: Olivier FESTOR LORIA - Equipe MADYNES - Université Henri Poincaré June 24, 2008 1 / 24 Plan 1 Introduction
Plus en détailI. Polynômes de Tchebychev
Première épreuve CCP filière MP I. Polynômes de Tchebychev ( ) 1.a) Tout réel θ vérifie cos(nθ) = Re ((cos θ + i sin θ) n ) = Re Cn k (cos θ) n k i k (sin θ) k Or i k est réel quand k est pair et imaginaire
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailMaster CCI. Compétences Complémentaires en Informatique. Livret de l étudiant
Master CCI Compétences Complémentaires en Informatique Livret de l étudiant 2014 2015 Master CCI Le Master CCI (Compétences Complémentaires en Informatique) permet à des étudiants de niveau M1 ou M2 dans
Plus en détailMoments des variables aléatoires réelles
Chapter 6 Moments des variables aléatoires réelles Sommaire 6.1 Espérance des variables aléatoires réelles................................ 46 6.1.1 Définition et calcul........................................
Plus en détailBONJOURGRID : VERSION ORIENTÉE DONNÉE & MAPREDUCE SÉCURISÉ
Laboratoire LaTICE Univ. de Tunis INRIA LYON Avalon Team Laboratoire d Informatique de Paris Nord (LIPN) BONJOURGRID : VERSION ORIENTÉE DONNÉE & MAPREDUCE SÉCURISÉ Heithem Abbes Heithem Abbes Rencontres
Plus en détailCAPTEURS - CHAINES DE MESURES
CAPTEURS - CHAINES DE MESURES Pierre BONNET Pierre Bonnet Master GSI - Capteurs Chaînes de Mesures 1 Plan du Cours Propriétés générales des capteurs Notion de mesure Notion de capteur: principes, classes,
Plus en détailMéthodes de quadrature. Polytech Paris-UPMC. - p. 1/48
Méthodes de Polytech Paris-UPMC - p. 1/48 Polynôme d interpolation de Preuve et polynôme de Calcul de l erreur d interpolation Étude de la formule d erreur Autres méthodes - p. 2/48 Polynôme d interpolation
Plus en détailINF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
Plus en détailInteractions des rayonnements avec la matière
UE3-1 : Biophysique Chapitre 2 : Interactions des rayonnements avec la matière Professeur Jean-Philippe VUILLEZ Année universitaire 2011/2012 Université Joseph Fourier de Grenoble - Tous droits réservés.
Plus en détailCryptographie Quantique
Cryptographie Quantique Jean-Marc Merolla Chargé de Recherche CNRS Email: jean-marc.merolla@univ-fcomte.fr Département d Optique P.-M. Duffieux/UMR FEMTO-ST 6174 2009 1 Plan de la Présentation Introduction
Plus en détailTP: Représentation des signaux binaires. 1 Simulation d un message binaire - Codage en ligne
Objectifs : Ce TP est relatif aux différentes méthodes de codage d une information binaire, et à la transmission en bande de base de cette information. Les grandes lignes de ce TP sont l étude des méthodes
Plus en détailTrouver un vecteur le plus court dans un réseau euclidien
Trouver un vecteur le plus court dans un réseau euclidien Damien STEHLÉ http://perso.ens-lyon.fr/damien.stehle Travail en commun avec Guillaume HANROT (INRIA Lorraine) CNRS/LIP/INRIA/ÉNS Lyon/Université
Plus en détailMachines virtuelles Cours 1 : Introduction
Machines virtuelles Cours 1 : Introduction Pierre Letouzey 1 pierre.letouzey@inria.fr PPS - Université Denis Diderot Paris 7 janvier 2012 1. Merci à Y. Régis-Gianas pour les transparents Qu est-ce qu une
Plus en détailCours de méthodes de scoring
UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-
Plus en détailProgrammation linéaire
1 Programmation linéaire 1. Le problème, un exemple. 2. Le cas b = 0 3. Théorème de dualité 4. L algorithme du simplexe 5. Problèmes équivalents 6. Complexité de l Algorithme 2 Position du problème Soit
Plus en détailI. Programmation I. 1 Ecrire un programme en Scilab traduisant l organigramme montré ci-après (on pourra utiliser les annexes):
Master Chimie Fondamentale et Appliquée : spécialité «Ingénierie Chimique» Examen «Programmation, Simulation des procédés» avril 2008a Nom : Prénom : groupe TD : I. Programmation I. 1 Ecrire un programme
Plus en détailSimulation de variables aléatoires
Chapter 1 Simulation de variables aléatoires Références: [F] Fishman, A first course in Monte Carlo, chap 3. [B] Bouleau, Probabilités de l ingénieur, chap 4. [R] Rubinstein, Simulation and Monte Carlo
Plus en détailUNIVERSITÉ DE STRASBOURG ÉCOLE DOCTORALE DES SCIENCES CHIMIQUES UMR 7177 THÈSE. présentée par. Ioana OPRISIU. soutenue le : 28 mars 2012
UNIVERSITÉ DE STRASBOURG ÉCOLE DOCTORALE DES SCIENCES CHIMIQUES UMR 7177 THÈSE présentée par Ioana OPRISIU soutenue le : 28 mars 2012 pour obtenir le grade de Docteur de l université de Strasbourg Discipline
Plus en détail(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01)
(19) TEPZZ 8 8 4_A_T (11) EP 2 838 241 A1 (12) DEMANDE DE BREVET EUROPEEN (43) Date de publication: 18.02.1 Bulletin 1/08 (1) Int Cl.: H04L 29/06 (06.01) G06F 21/ (13.01) (21) Numéro de dépôt: 141781.4
Plus en détailAnalyse Sémantique de Nuages de Points 3D et d Images dans les Milieux Urbains
Analyse Sémantique de Nuages de Points 3D et d Images dans les Milieux Urbains Andrés Felipe SERNA MORALES Directrice de thèse: Beatriz MARCOTEGUI ITURMENDI serna@cmm.ensmp.fr MINES ParisTech, Mathématiques
Plus en détailTravaux pratiques avec RapidMiner
Travaux pratiques avec RapidMiner Master Informatique de Paris 6 Spécialité IAD Parcours EDOW Module Algorithmes pour la Fouille de Données Janvier 2012 Prise en main Généralités RapidMiner est un logiciel
Plus en détailTraitement bas-niveau
Plan Introduction L approche contour (frontière) Introduction Objectifs Les traitements ont pour but d extraire l information utile et pertinente contenue dans l image en regard de l application considérée.
Plus en détailRésolution de systèmes linéaires par des méthodes directes
Résolution de systèmes linéaires par des méthodes directes J. Erhel Janvier 2014 1 Inverse d une matrice carrée et systèmes linéaires Ce paragraphe a pour objet les matrices carrées et les systèmes linéaires.
Plus en détailchargement d amplitude variable à partir de mesures Application à l approche fiabiliste de la tolérance aux dommages Modélisation stochastique d un d
Laboratoire de Mécanique et Ingénieriesnieries EA 3867 - FR TIMS / CNRS 2856 ER MPS Modélisation stochastique d un d chargement d amplitude variable à partir de mesures Application à l approche fiabiliste
Plus en détailAdobe Premiere Pro Exportation
Adobe Premiere Pro Exportation Si vous avez suivi tous les tutoriels précédents, vous êtes maintenant capable de réaliser un montage, certes basique, mais complet. Il est donc temps d apprendre à exporter
Plus en détailMaster Modélisation Aléatoire Paris VII, Cours Méthodes de Monte Carlo en nance et C++, TP n 2.
Master Modélisation Aléatoire Paris VII, Cours Méthodes de Monte Carlo en nance et C++, TP n 2. Techniques de correction pour les options barrières 25 janvier 2007 Exercice à rendre individuellement lors
Plus en détailDifférentiabilité ; Fonctions de plusieurs variables réelles
Différentiabilité ; Fonctions de plusieurs variables réelles Denis Vekemans R n est muni de l une des trois normes usuelles. 1,. 2 ou.. x 1 = i i n Toutes les normes de R n sont équivalentes. x i ; x 2
Plus en détailTABLE DES MATIÈRES CHAPITRE I. Les quanta s invitent
TABLE DES MATIÈRES AVANT-PROPOS III CHAPITRE I Les quanta s invitent I-1. L Univers est en constante évolution 2 I-2. L âge de l Univers 4 I-2.1. Le rayonnement fossile témoigne 4 I-2.2. Les amas globulaires
Plus en détailIntroduction aux algorithmes MapReduce. Mathieu Dumoulin (GRAAL), 14 Février 2014
Introduction aux algorithmes MapReduce Mathieu Dumoulin (GRAAL), 14 Février 2014 Plan Introduction de la problématique Tutoriel MapReduce Design d algorithmes MapReduce Tri, somme et calcul de moyenne
Plus en détailComme chaque ligne de cache a 1024 bits. Le nombre de lignes de cache contenu dans chaque ensemble est:
Travaux Pratiques 3. IFT 1002/IFT 1005. Structure Interne des Ordinateurs. Département d'informatique et de génie logiciel. Université Laval. Hiver 2012. Prof : Bui Minh Duc. Tous les exercices sont indépendants.
Plus en détailNON-LINEARITE ET RESEAUX NEURONAUX
NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail
Plus en détailTransmission des signaux numériques
Transmission des signaux numériques par Hikmet SARI Chef de Département d Études à la Société Anonyme de Télécommunications (SAT) Professeur Associé à Télécom Paris. Transmission en bande de base... E
Plus en détailCommunications numériques
Communications numériques 1. Modulation numérique (a) message numérique/signal numérique (b) transmission binaire/m-aire en bande de base (c) modulation sur fréquence porteuse (d) paramètres, limite fondamentale
Plus en détailBig Data et Graphes : Quelques pistes de recherche
Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de
Plus en détailINTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES
INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine
Plus en détailQuantification Scalaire et Prédictive
Quantification Scalaire et Prédictive Marco Cagnazzo Département Traitement du Signal et des Images TELECOM ParisTech 7 Décembre 2012 M. Cagnazzo Quantification Scalaire et Prédictive 1/64 Plan Introduction
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailC f tracée ci- contre est la représentation graphique d une
TLES1 DEVOIR A LA MAISON N 7 La courbe C f tracée ci- contre est la représentation graphique d une fonction f définie et dérivable sur R. On note f ' la fonction dérivée de f. La tangente T à la courbe
Plus en détailProgrammation par contraintes. Laurent Beaudou
Programmation par contraintes Laurent Beaudou On se trouve où? Un problème, une solution : la solution est-elle une solution du problème? simulation, vérification 2 On se trouve où? Un problème, une solution
Plus en détailModélisation et simulation
Modélisation et simulation p. 1/36 Modélisation et simulation INFO-F-305 Gianluca Bontempi Département d Informatique Boulevard de Triomphe - CP 212 http://www.ulb.ac.be/di Modélisation et simulation p.
Plus en détailUne comparaison de méthodes de discrimination des masses de véhicules automobiles
p.1/34 Une comparaison de méthodes de discrimination des masses de véhicules automobiles A. Rakotomamonjy, R. Le Riche et D. Gualandris INSA de Rouen / CNRS 1884 et SMS / PSA Enquêtes en clientèle dans
Plus en détailLA PHYSIQUE DES MATERIAUX. Chapitre 1 LES RESEAUX DIRECT ET RECIPROQUE
LA PHYSIQUE DES MATERIAUX Chapitre 1 LES RESEAUX DIRECT ET RECIPROQUE Pr. A. Belayachi Université Mohammed V Agdal Faculté des Sciences Rabat Département de Physique - L.P.M belayach@fsr.ac.ma 1 1.Le réseau
Plus en détailAOT 13. et Application au Contrôle Géométrique
AOT 13 Géométrie Différentielle et Application au Contrôle Géométrique Frédéric Jean Notes de cours Édition 2011/2012 ii Table des matières 1 Variétés différentiables 1 1.1 Variétés différentiables............................
Plus en détail10ème Congrès Français d'acoustique Lyon, 12-16 Avril 2010
10ème Congrès Français d'acoustique Lyon, 12-16 Avril 2010 Le compressed sensing pour l holographie acoustique de champ proche II: Mise en œuvre expérimentale. Antoine Peillot 1, Gilles Chardon 2, François
Plus en détailProblème 1 : applications du plan affine
Problème 1 : applications du plan affine Notations On désigne par GL 2 (R) l ensemble des matrices 2 2 inversibles à coefficients réels. Soit un plan affine P muni d un repère (O, I, J). Les coordonnées
Plus en détailUne méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données
Une méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données Marc Boullé Orange Labs 2 avenue Pierre Marzin 22300 Lannion marc.boulle@orange-ftgroup.com,
Plus en détailLier Erlang avec d autres langages de programmation
16 Lier Erlang avec d autres langages de programmation Les logiciels actuels, quelle que soit leur taille, sont souvent écrits dans plusieurs langages de programmation. Généralement, les pilotes de périphériques
Plus en détail