Données manquantes en ACM : l algorithme NIPALS
|
|
- Joel Bertrand
- il y a 6 ans
- Total affichages :
Transcription
1 Données manquantes en ACM : l algorithme NIPALS & VANESSA KUENTZ & BENOÎT LIQUET IMB, Université de Bordeaux, France INRIA Bordeaux Sud-Ouest, CQFD Team INSERM, U897 SFC09, Grenoble
2 Introduction NIPALS Motivation : un exemple réelle avec données manquantes Plans factoriels 1-2 de l ACM de FactoMineR 1230 individus 35 modalités, 14 modalités NA Dim Dim Q40.1_NA Q29.2_NA Q30.2_NA Q30.1_NA Q29.3_NA Q40.3_NA Q30.3_NA Q8.3_2 Q8.2_2 Q8.1_2 Q7.4_3 Q7.1_3 Q7.2_2 Q7.4_2 Q7.1_2 Q7.2_3 Q9Nav.3_1 Q9Nav.3_2 Q7.2_1 Q29.2_1 Q40.1_1 Q40.3_1 Q7.1_1 Q7.4_1 Q29.3_1 Q29.3_2 Q40.1_2 Q29.2_2 Q8.1_1 Q8.3_1 Q40.1_3 Q40.3_3 Q40.3_2 Q8.2_1 Q29.3_3 Q30.3_1 Q30.3_2 Q30.2_1 Q30.1_1 Q30.1_2 Q30.2_2 Q30.3_3 Q7.2_NA Q9Nav.3_NA Q7.1_NA Q7.4_NA Q8.2_NA Q8.3_NA Q8.1_NA Dim Dim 1
3 Introduction NIPALS ACM = ACP pondérée des profils lignes et des profils colonnes du TDC Algorithmes d ACP permettant la gestion des données manquantes : NIPALS (Regression PLS, Tenenhaus) ACP iterative (Josse, Husson & Pagès, SFDS 09) IMLS (Wasito & Mirkin, CSDA, 2005, 2006)
4 1 NIPALS pour l ACM de données incomplètes 2 3
5 Présentation générale Pour l ACM Données incomplètes Présentation générale de NIPALS Meilleure approximation d une matrice Z de rang p par une matrice Z k = Y k V t k de rang k < p = + Z Y k V t k E k minimiser: Z Y k V t k 2 si les données sont complètes W (Z Y k V t k ) 2 si les données sont incomplètes, W est une matrice de poids, w ij = 0 si z ij manquant, w ij = 1 sinon. Décomposition en valeurs singulières de Z Algorithme itératif NIPALS qui s adapte au cas incomplet
6 Présentation générale Pour l ACM Données incomplètes Etape 1 : meilleure approximation Z 1 de rang 1 Définir : Z 1 = y 1 v t 1 Z = y 1 v t 1 + E 1 min y1,v1 E 1 2 Algorithme : Initialiser y 1 Répéter jusqu à convergence 1) on fixe y 1 et on calcule v1 v 1 normalisé à 1 2) on fixe v 1 et on calcule y 1
7 Présentation générale Pour l ACM Données incomplètes Algorithme d approximation en dimension 1 1) on fixe y 1 et on calcule v1 : pour j = 1 à p, on écrit z j = v 1j y 1 + e j NA z j y 1 = + v 1j e j min v1j e j 2 P n i=1 z v 1j = ij y 1i P n i=1 y1i 2 si NA dans z j on les passe dans la somme v 1 normalisé à 1
8 Présentation générale Pour l ACM Données incomplètes Algorithme d approximation en dimension 1 2) on fixe v 1 et on calcule y 1 : pour i = 1 à n, on écrit z i = y 1i v 1 + e i z t i = + NA v t 1 y e t 1i i min y1i e i 2 P p j=1 z ijv 1j y 1i = P p v 2 j=1 1j si NA dans z i on les passe dans la somme
9 Présentation générale Pour l ACM Données incomplètes Etape 2 : meilleure approximation Z 2 de rang 2 Etape 2 : définir Z 2 = y 1 v t 1 + y 2v t 2 : Z y 1 v t 1 y 2 v t 2 = + + E 2 Z 1 Z Z 1 y 2 v t 2 = + E 2 Algorithme d approximation en dimension 1
10 en ACP NIPALS Présentation générale Pour l ACM Données incomplètes La matrice de données X n p est quantitative Comment définir Z n p pour avoir Y k est la matrice des k composantes principales des individus V k est la matrice des k axes principaux = + Z? Y k V t k E k Il suffit de prendre la matrice des données centrées et réduites : Z = (X 1g t )D 1/2 c
11 en ACM NIPALS Présentation générale Pour l ACM Données incomplètes La matrice de données X n p est qualitative Comment définir Z n q? On calcule F n q, matrice des fréquences relatives du TDC G, f is = g is n p r = (f f i.... f n. ), f i. = 1 n c = (f.1... f.s... f.q ), f.s = ns n p R = D 1 r (F rc t ) de la matrice des profils lignes centrés Il suffit alors de prendre la matrice des profils lignes centrés et réduits : Z = RD 1/2 c
12 Données incomplètes Présentation générale Pour l ACM Données incomplètes En ACP, on estime les moyennes et les écart-types des colonnes de la matrice des données complète inconnue à partir des valeurs observées. En ACM, l idée est d estimer les marges du TDC inconnu à partir du TDC observées, G : G : i s na na na na na na ˆn s ˆn i np ˆn i = p ˆn s = n ns n j
13 Données incomplètes Présentation générale Pour l ACM Données incomplètes On calcule ˆF n q, avec ˆf is = { gis n p na, si g is na, sinon ˆr = (ˆf 1....ˆf i....ˆf n. ), ˆf i. = ˆn i n p = 1 n ĉ = (ˆf.1...ˆf.s...ˆf.q ), ˆf.s = ˆns n p = ns p n j ˆR = D 1 ˆr (ˆF ˆrĉ t ) de la matrice des profils lignes centrés Il suffit alors de prendre la matrice des profils lignes centrés et réduits : Z = ˆRD 1/2 ĉ
14 Données vnf Données chiens L exemple réelle des données vnf Plans factoriels 1-2 de l ACM réalisés avec FactoMineR 1230 individus 35 modalités, 14 modalités NA Dim Dim Q40.1_NA Q29.2_NA Q30.2_NA Q30.1_NA Q29.3_NA Q40.3_NA Q30.3_NA Q8.3_2 Q8.2_2 Q8.1_2 Q7.1_3 Q7.2_2 Q7.4_2 Q7.1_2 Q7.4_3 Q7.2_3 Q9Nav.3_1 Q9Nav.3_2 Q7.2_1 Q29.2_1 Q40.1_1 Q40.3_1 Q7.1_1 Q7.4_1 Q29.3_1 Q29.3_2 Q40.1_2 Q29.2_2 Q8.1_1 Q8.3_1 Q40.1_3 Q40.3_3 Q40.3_2 Q8.2_1 Q29.3_3 Q30.3_1 Q30.3_2 Q30.2_1 Q30.1_1 Q30.1_2 Q30.2_2 Q30.3_3 Q7.2_NA Q9Nav.3_NA Q7.1_NA Q7.4_NA Q8.2_NA Q8.3_NA Q8.1_NA Dim Dim 1
15 Données vnf Données chiens L exemple réelle des données vnf Plans factoriels 1-2 de l ACM réalisés avec NIPALS 1230 individus 35 modalités Dim Dim Q8.3.2 Q8.2.2 Q8.1.2 Q Q Q Q9Nav.3.1 Q Q Q Q7.2.2 Q7.1.2 Q Q7.2.1 Q Q Q7.4.1 Q Q7.1.1 Q Q7.4.2 Q Q Q8.3.1Q7.4.3 Q8.2.1 Q8.1.1 Q7.2.3 Q9Nav.3.2 Q Q Q Q7.1.3 Q Q Dim Dim 1
16 Données vnf Données chiens L exemple réelle des données vnf Plans factoriels 1-2 des rapports de corrélations des 14 variables MCA sur 709 individus sans NA NIPALS sur 1230 individus avec NA Dim Q40.1 Q40.3 Q8.3 Q8.2 Q8.1 Q7.1 Q29.3 Q7.2 Q30.3 Q7.4 Q30.2 Q29.2 Q30.1 Q9Nav.3 Dim Q40.1 Q40.3 Q8.3 Q8.2 Q8.1 Q29.2 Q29.3 Q30.3 Q9Nav.3 Q7.2 Q7.1 Q7.4 Q30.2 Q Dim Dim 1
17 L exemple des données chiens Données vnf Données chiens Nom TAILLE POIDS VELOCITE INTELLI AFFECTIO AGRESSIV Basset petit leger lent peu peu agressif Chihuahua petit leger lent peu très nonagressif Pekinois petit leger lent peu très nonagressif Caniche petit leger rapide très très nonagressif Bull-Dog moyen lourd lent moyen très nonagressif EpagneulBreton moyen lourd rapide très très nonagressif Dalmatien moyen lourd rapide moyen très nonagressif Dim Basset Chihuahua Pekinois Mastiff Teckel DogueAllemand Bull Mastiff Saint Bernard Terre Neuve Fox Terrier Cocker Caniche Fox Hound GrdBleuGascon Levrier Doberman BergerAllemand Bull Dog Pointer EpagneulFrancais Setter Colley Beauceron Boxer EpagneulBreton Dalmatien Labrador Dim 1
18 L exemple des données chiens Données vnf Données chiens Nom TAILLE POIDS VELOCITE INTELLI AFFECTIO AGRESSIV Basset petit leger lent peu peu agressif Chihuahua NA NA lent peu très nonagressif Pekinois petit leger lent peu très nonagressif Caniche NA NA rapide très très nonagressif Bull-Dog NA NA lent moyen très nonagressif EpagneulBreton moyen lourd rapide très très nonagressif Dalmatien moyen lourd rapide moyen très nonagressif Complet Incomplet et FactoMineR Incomplet et NIPALS Dim Basset Chihuahua Pekinois Mastiff Teckel DogueAllemand Bull Mastiff Saint Bernard Fox Terrier Terre Neuve Cocker Caniche Fox Hound GrdBleuGascon Levrier Doberman Bull Dog BergerAllemand Pointer EpagneulFrancais Setter Colley Beauceron Boxer EpagneulBreton Dalmatien Labrador Dim Basset Teckel Mastiff Fox Terrier Saint Bernard DogueAllemand Bull Mastiff Terre Neuve Cocker Chihuahua Fox Hound GrdBleuGascon Levrier Pekinois Bull Dog Doberman Beauceron BergerAllemand EpagneulFrancais Setter Pointer Colley Caniche Boxer Dalmatien Labrador EpagneulBreton Dim Basset Pekinois Chihuahua Teckel Mastiff Bull Dog Saint Bernard Fox Terrier DogueAllemand Terre Neuve Bull Mastiff Cocker Fox Hound GrdBleuGascon Levrier Setter Doberman Colley BergerAllemand EpagneulFrancais Beauceron Pointer Boxer Dalmatien Labrador EpagneulBreton Caniche Dim 1 Dim 1 Dim 1
19 L exemple des données chiens Données vnf Données chiens Comparaisons des matrices Y k axe par axe: Complet FactoMineR incomplet NIPALS incomplet Dim 1 Dim 2 Dim 3 Dim 1 Dim 2 Dim 3 Dim 1 Dim 2 Dim 3 Beauceron Basset BergerAllemand Setter Teckel Terre-Neuve Corrélations entre les axes : r(dim1, Dim1) = 0.97 Dim 1 Dim 2 Dim 3 FactoMineR NIPALS
20 L exemple des données chiens Données vnf Données chiens Comparaisons des matrices Y k globalement sur tous les axes: Complet FactoMineR incomplet NIPALS incomplet Dim 1 Dim 2 Dim 3 Dim 1 Dim 2 Dim 3 Dim 1 Dim 2 Dim 3 Beauceron Basset BergerAllemand Setter Teckel Terre-Neuve Coefficient RV : compare la matrice W = Y 3 Y t 3 à la vrai matrice W = Y 3 Y t 3 : RV(Y 3, Y 3 ) = trace(w, W) p trace(w, W)trace(W, W) = 0.79 RV FactoMineR 0.79 NIPALS 0.89
21 ACM itérative NIPALS Autre algorithmes Adaptation de l ACP itérative (Josse, Husson & Pagès) Algorithme de décomposition en valeur singulière (SVD) itératif : imputer les valeurs manquantes dans une matrice réelle Z: 1 choisir le nombre k de dimension 2 remplir arbitrairement les trous dans Z 3 répéter jusqu à convergence faire une SVD de Z: Z = UΛV meilleure approximation de rang k : Z k = U k Λ k V t k remplir les trous dans Z avec les valeurs estimées : Z = WZ + (1 W)Z k
22 Autre algorithmes Algorithme d ACM itérative : 1 choisir le nombre k de dimension 2 calculer Z = ˆRD 1/2 ĉ 3 appliquer l algorithme de SVD itérative à Z et k. On note U k, Λ k et V k les résultats. 4 calculer la matrice des k premières composantes principales : Y k = U k Λ k Inconvénients : solutions Y k et V k ne sont pas emboîtées plus k est grand, plus la SVD itérative approxime bien les valeurs mises arbitrairement dans Z pour boucher les trous...
23 IMLS pour l ACM NIPALS Autre algorithmes Adaptation de la méthode IMLS (Wasito & Mirkin) Algorithme IMLS pour l ACM: 1 choisir le nombre k de dimension 2 calculer Z = ˆRD 1/2 ĉ 3 pour l = 1 à k appliquer l ACM itérative à Z en dimension 1 et noter y l la première composante principale et et v l le premier axe principal. calculer la matrice des résidus : Z = Z W(y l v t l) 4 Les vecteurs y 1... y l... y k forment les colonnes de Y k Les vecteurs v 1... v l... v k forment les colonnes de V k
24 Autre algorithmes Simulation : coefficient RV, deux axes % de NA =10 % de NA = FM ITERATIVE IMLS NIPALS FM ITERATIVE IMLS NIPALS % de NA =30 % de NA = FM ITERATIVE IMLS NIPALS FM ITERATIVE IMLS NIPALS
25 Autre algorithmes Simulation : plans factoriels des modalités Complet FactoMineR et 40 % de NA aléatoires Dim Q8.3.2 Q8.2.2 Q8.1.2 Q7.1.2 Q7.2.2 Q Q Q Q Q Q Q Q7.4.2 Q9Nav.3.1 Q Q Q7.4.1 Q Q Q Q7.2.1 Q7.1.1 Q7.2.3 Q7.4.3 Q9Nav.3.2 Q Q7.1.3 Q8.3.1 Q8.2.1 Q8.1.1 Q Q Q Q Q Dim Q8.3_2 Q8.2_2 Q8.1_2 Q40.3_3 Q7.2_2 Q7.1_NA Q29.2_1 Q29.3_1 Q30.2_1 Q29.3_2 Q9Nav.3_1 Q30.1_1 Q30.3_2 Q40.1_3 Q7.1_2 Q7.4_2 Q30.3_NA Q40.3_2 Q8.3_NA Q9Nav.3_2 Q7.4_1 Q30.1_NA Q40.1_NA Q30.3_1 Q30.2_NA Q7.2_1 Q7.2_NA Q7.4_3 Q7.4_NA Q29.3_NA Q40.3_NA Q40.1_1 Q29.2_NA Q8.2_NA Q8.1_NA Q9Nav.3_NA Q40.3_1 Q40.1_2 Q7.1_1 Q7.2_3 Q29.2_2 Q30.2_2 Q30.1_2 Q8.2_1 Q8.1_1 Q8.3_1 Q7.1_3 Q30.3_3 Q29.3_ Dim Dim 1
26 Autre algorithmes Simulation : coefficient RV, 2 à 5 axes, 30 % de NA nombre d axe =2 nombre d axe = ITERATIVE IMLS NIPALS ITERATIVE IMLS NIPALS nombre d axe =4 nombre d axe = ITERATIVE IMLS NIPALS ITERATIVE IMLS NIPALS
27 Conclusions et perspectives Autre algorithmes Aller plus loin dans la comparaison des algorithmes Complexités et problèmes de convergence? D autres algorithmes? (ACP itérative régularisée,...)
28 References NIPALS Autre algorithmes Josse, J., Husson, F., Pagès, J. (2009), Apport de l ACP probabiliste pour la gestion des données manquantes en ACP. Congrès de la SFdS, Bordeaux, mai, Tenenhaus, M., (1998), La régression PLS, Technip. Wasito, I., Mirkin, B., (2005), Nearest neighbours in least-squares data imputation algorithms, Information Sciences, 169, Wasito, I., Mirkin, B., (2006), Nearest neighbours in least-squares data imputation algorithms with different missing patterns, CSDA, 50,
La classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailExcel Avancé. Plan. Outils de résolution. Interactivité dans les feuilles. Outils de simulation. La valeur cible Le solveur
Excel Avancé Plan Outils de résolution La valeur cible Le solveur Interactivité dans les feuilles Fonctions de recherche (ex: RechercheV) Utilisation de la barre d outils «Formulaires» Outils de simulation
Plus en détailStatistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014
Tests du χ 2 Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014 A. Lourme http://alexandrelourme.free.fr Outline
Plus en détailAnalyse de la variance Comparaison de plusieurs moyennes
Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction
Plus en détailVI. Tests non paramétriques sur un échantillon
VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes
Plus en détailAnalyses multivariées avec R Commander (via le package FactoMineR) Qu est ce que R? Introduction à R Qu est ce que R?
Analyses multivariées avec R Commander Analyses multivariées avec R Commander (via le package FactoMineR) Plate-forme de Support en Méthodologie et Calcul Statistique (SMCS) - UCL 1 Introduction à R 2
Plus en détailLogiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS
Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence
Plus en détailLa nouvelle planification de l échantillonnage
La nouvelle planification de l échantillonnage Pierre-Arnaud Pendoli Division Sondages Plan de la présentation Rappel sur le Recensement de la population (RP) en continu Description de la base de sondage
Plus en détailTABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie
PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats Pierre Dagnelie TABLE DES MATIÈRES 2012 Presses agronomiques de Gembloux pressesagro.gembloux@ulg.ac.be www.pressesagro.be
Plus en détailDéroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Plus en détailArchitecture des Systèmes d Information Architecture des Systèmes d Information
Plan... Tableaux et tris I3 - Algorithmique et programmation 1 Rappels Nicol Delestre 2 Tableaux à n dimensions 3 Initiation aux tris Tableaux - v2.0.1 1 / 27 Tableaux - v2.0.1 2 / 27 Rappels : tableau
Plus en détailVers une approche Adaptative pour la Découverte et la Composition Dynamique des Services
69 Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services M. Bakhouya, J. Gaber et A. Koukam Laboratoire Systèmes et Transports SeT Université de Technologie de Belfort-Montbéliard
Plus en détailApprentissage Automatique
Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Plus en détailAnalyse en Composantes Principales
Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées
Plus en détailL ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Plus en détailINF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
Plus en détailChristophe CANDILLIER Cours de DataMining mars 2004 Page 1
Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe
Plus en détailFournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement
Introduction Phases du projet Les principales phases du projet sont les suivantes : La mise à disposition des sources Des fichiers Excel sont utilisés pour récolter nos informations L extraction des données
Plus en détailAlgorithmes pour la planification de mouvements en robotique non-holonome
Algorithmes pour la planification de mouvements en robotique non-holonome Frédéric Jean Unité de Mathématiques Appliquées ENSTA Le 02 février 2006 Outline 1 2 3 Modélisation Géométrique d un Robot Robot
Plus en détailCryptographie. Cours 3/8 - Chiffrement asymétrique
Cryptographie Cours 3/8 - Chiffrement asymétrique Plan du cours Différents types de cryptographie Cryptographie à clé publique Motivation Applications, caractéristiques Exemples: ElGamal, RSA Faiblesses,
Plus en détailFORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
Plus en détailESIEA PARIS 2011-2012
ESIEA PARIS 2011-2012 Examen MAT 5201 DATA MINING Mardi 08 Novembre 2011 Première Partie : 15 minutes (7 points) Enseignant responsable : Frédéric Bertrand Remarque importante : les questions de ce questionnaire
Plus en détailLa NP-complétude. Johanne Cohen. PRISM/CNRS, Versailles, France.
La NP-complétude Johanne Cohen PRISM/CNRS, Versailles, France. Références 1. Algorithm Design, Jon Kleinberg, Eva Tardos, Addison-Wesley, 2006. 2. Computers and Intractability : A Guide to the Theory of
Plus en détailGestion réactive des opérations de maintien et d actualisation réglementaire et technologique des systèmes complexes.
Gestion réactive des opérations de maintien et d actualisation réglementaire et technologique des systèmes complexes. LE QUERE Yann, SEVAUX Marc, TRENTESAUX Damien, TAHON Christian Equipe Systèmes de Production
Plus en détailPRXSENTATION D UN GESTIONNAIRE DE DONNEES NUMERIQUES HIERARCHISEES DESTINE AU DE- -POUILLEMENT D ENQUETES
97 PRXSENTATION D UN GESTIONNAIRE DE DONNEES NUMERIQUES HIERARCHISEES DESTINE AU DE- -POUILLEMENT D ENQUETES Jacques Vaugelade & Marie Piron (Demographie et Statistique) (UR 702) Centre ORSTOM de Ouagadougou
Plus en détail4 Exemples de problèmes MapReduce incrémentaux
4 Exemples de problèmes MapReduce incrémentaux 1 / 32 Calcul des plus courtes distances à un noeud d un graphe Calcul des plus courts chemins entre toutes les paires de noeuds d un graphe Algorithme PageRank
Plus en détailUne nouvelle approche de détection de communautés dans les réseaux sociaux
UNIVERSITÉ DU QUÉBEC EN OUTAOUAIS Département d informatique et d ingénierie Une nouvelle approche de détection de communautés dans les réseaux sociaux Mémoire (INF 6021) pour l obtention du grade de Maîtrise
Plus en détailISFA 2 année 2002-2003. Les questions sont en grande partie indépendantes. Merci d utiliser l espace imparti pour vos réponses.
On considère la matrice de données : ISFA 2 année 22-23 Les questions sont en grande partie indépendantes Merci d utiliser l espace imparti pour vos réponses > ele JCVGE FM1 GM JCRB FM2 JMLP Paris 61 29
Plus en détailLimitations of the Playstation 3 for High Performance Cluster Computing
Introduction Plan Limitations of the Playstation 3 for High Performance Cluster Computing July 2007 Introduction Plan Introduction Intérêts de la PS3 : rapide et puissante bon marché L utiliser pour faire
Plus en détailThéorie des sondages : cours 5
Théorie des sondages : cours 5 Camelia Goga IMB, Université de Bourgogne e-mail : camelia.goga@u-bourgogne.fr Master Besançon-2010 Chapitre 5 : Techniques de redressement 1. poststratification 2. l estimateur
Plus en détailAnalyse des correspondances avec colonne de référence
ADE-4 Analyse des correspondances avec colonne de référence Résumé Quand une table de contingence contient une colonne de poids très élevé, cette colonne peut servir de point de référence. La distribution
Plus en détailModélisation multi-agents - Agents réactifs
Modélisation multi-agents - Agents réactifs Syma cursus CSI / SCIA Julien Saunier - julien.saunier@ifsttar.fr Sources www-lih.univlehavre.fr/~olivier/enseignement/masterrecherche/cours/ support/algofourmis.pdf
Plus en détailAgrégation des portefeuilles de contrats d assurance vie
Agrégation des portefeuilles de contrats d assurance vie Est-il optimal de regrouper les contrats en fonction de l âge, du genre, et de l ancienneté des assurés? Pierre-O. Goffard Université d été de l
Plus en détailModélisation du comportement habituel de la personne en smarthome
Modélisation du comportement habituel de la personne en smarthome Arnaud Paris, Selma Arbaoui, Nathalie Cislo, Adnen El-Amraoui, Nacim Ramdani Université d Orléans, INSA-CVL, Laboratoire PRISME 26 mai
Plus en détail6. Hachage. Accès aux données d'une table avec un temps constant Utilisation d'une fonction pour le calcul d'adresses
6. Hachage Accès aux données d'une table avec un temps constant Utilisation d'une fonction pour le calcul d'adresses PLAN Définition Fonctions de Hachage Méthodes de résolution de collisions Estimation
Plus en détailObjectifs : piloter l organisation à travers des indicateurs (regroupés dans un tableau de bord), et informer des résultats la hiérarchie.
C HAPI TRE 8 Tableau de bord et reporting Objectifs : piloter l organisation à travers des indicateurs (regroupés dans un tableau de bord), et informer des résultats la hiérarchie. 1 Principes A Le tableau
Plus en détailEtude comparative de différents motifs utilisés pour le lancé de rayon
Etude comparative de différents motifs utilisés pour le lancé de rayon Alexandre Bonhomme Université de Montréal 1 Introduction Au cours des dernières années les processeurs ont vu leurs capacités de calcul
Plus en détailContribution à la conception par la simulation en électronique de puissance : application à l onduleur basse tension
Contribution à la conception par la simulation en électronique de puissance : application à l onduleur basse tension Cyril BUTTAY CEGELY VALEO 30 novembre 2004 Cyril BUTTAY Contribution à la conception
Plus en détailIntelligence Economique - Business Intelligence
Intelligence Economique - Business Intelligence Notion de Business Intelligence Dès qu'il y a une entreprise, il y a implicitement intelligence économique (tout comme il y a du marketing) : quelle produit
Plus en détailProgrammation linéaire
1 Programmation linéaire 1. Le problème, un exemple. 2. Le cas b = 0 3. Théorème de dualité 4. L algorithme du simplexe 5. Problèmes équivalents 6. Complexité de l Algorithme 2 Position du problème Soit
Plus en détailBaccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé
Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé A. P. M. E. P. Exercice 1 5 points 1. Réponse d. : 1 e Le coefficient directeur de la tangente est négatif et n est manifestement pas 2e
Plus en détailLa place de SAS dans l'informatique décisionnelle
La place de SAS dans l'informatique décisionnelle Olivier Decourt ABS Technologies - Educasoft Formations La place de SAS dans l'informatique décisionnelle! L'historique de SAS! La mécanique! La carrosserie
Plus en détailRétablissement d un réseau cellulaire après un désastre
Rétablissement d un réseau cellulaire après un désastre Anaïs Vergne avec Laurent Decreusefond, Ian Flint, et Philippe Martins Journées MAS 2014 29 août 2014 Rétablissement d un réseau cellulaire après
Plus en détailNon-réponse et données manquantes. Sylvie Rousseau & Gilbert Saporta décembre 2011
Non-réponse et données manquantes Sylvie Rousseau & Gilbert Saporta décembre 2011 1 EXEMPLES DE TAUX DE RÉPONSE À CERTAINES ENQUÊTES Pour les enquêtes auprès des entreprises, le taux de non-réponse est
Plus en détailExtraction d informations stratégiques par Analyse en Composantes Principales
Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction
Plus en détailChapitre V : La gestion de la mémoire. Hiérarchie de mémoires Objectifs Méthodes d'allocation Simulation de mémoire virtuelle Le mapping
Chapitre V : La gestion de la mémoire Hiérarchie de mémoires Objectifs Méthodes d'allocation Simulation de mémoire virtuelle Le mapping Introduction Plusieurs dizaines de processus doivent se partager
Plus en détailUne comparaison de méthodes de discrimination des masses de véhicules automobiles
p.1/34 Une comparaison de méthodes de discrimination des masses de véhicules automobiles A. Rakotomamonjy, R. Le Riche et D. Gualandris INSA de Rouen / CNRS 1884 et SMS / PSA Enquêtes en clientèle dans
Plus en détailAnalyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57
Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation
Plus en détailSouad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/
Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation
Plus en détailTransmission d informations sur le réseau électrique
Transmission d informations sur le réseau électrique Introduction Remarques Toutes les questions en italique devront être préparées par écrit avant la séance du TP. Les préparations seront ramassées en
Plus en détailBiostatistiques : Petits effectifs
Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l
Plus en détailEchantillonnage Non uniforme
Echantillonnage Non uniforme Marie CHABERT IRIT/INP-ENSEEIHT/ ENSEEIHT/TéSASA Patrice MICHEL et Bernard LACAZE TéSA 1 Plan Introduction Echantillonnage uniforme Echantillonnage irrégulier Comparaison Cas
Plus en détailLe D.O.N.T. Le DONT. Première partie. Son maître mot est la DISTRIBUTION. Alerte. Principes du DONT
Le D.O.N.T Acronyme pour Disturb Opponent No Trump Perturber le Sans Atout des Adversaires Le DONT Marty Bergen Mike Lawrence Larry Cohen Le DONT. Première partie Le D.O.N.T est un système d'intervention
Plus en détailÉléments d informatique Cours 3 La programmation structurée en langage C L instruction de contrôle if
Éléments d informatique Cours 3 La programmation structurée en langage C L instruction de contrôle if Pierre Boudes 28 septembre 2011 This work is licensed under the Creative Commons Attribution-NonCommercial-ShareAlike
Plus en détailLe théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche
Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche Bachir Bekka Février 2007 Le théorème de Perron-Frobenius a d importantes applications en probabilités (chaines
Plus en détailProgrammation Linéaire - Cours 1
Programmation Linéaire - Cours 1 P. Pesneau pierre.pesneau@math.u-bordeaux1.fr Université Bordeaux 1 Bât A33 - Bur 265 Ouvrages de référence V. Chvátal - Linear Programming, W.H.Freeman, New York, 1983.
Plus en détailOptimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie
Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie 1 Présenté par: Yacine KESSACI Encadrement : N. MELAB E-G. TALBI 31/05/2011 Plan 2 Motivation
Plus en détailPlus courts chemins, programmation dynamique
1 Plus courts chemins, programmation dynamique 1. Plus courts chemins à partir d un sommet 2. Plus courts chemins entre tous les sommets 3. Semi-anneau 4. Programmation dynamique 5. Applications à la bio-informatique
Plus en détailCODE TRANSACTION VA01
PAS A PAS N 1 SAISIE D UNE COMMANDE DE VENTE PI HORS INTERFACE ET GENERATION DE LA FACTURE DE VENTE 1) CREATION DE LA COMMANDE DE VENTE CODE TRANSACTION VA01 Dans le champ «Type commande client», cliquer
Plus en détailEtude des propriétés empiriques du lasso par simulations
Etude des propriétés empiriques du lasso par simulations L objectif de ce TP est d étudier les propriétés empiriques du LASSO et de ses variantes à partir de données simulées. Un deuxième objectif est
Plus en détailContrainte de flot pour RCPSP avec temps de transfert
Contrainte de flot et x-rcpsc T 1 Contrainte de flot pour RCPSP avec temps de transfert PS temp, s ij Cmax BENOIST Thierry BOUYGUES/e-Lab DIAMANTINI Maurice ENSTA/LMA Contrainte de flot et x-rcpsc T Présentation
Plus en détailOpération d Intérêt National Éco-Vallée EcoCité plaine du Var. www.ecovallee-plaineduvar.fr
Opération d Intérêt National Éco-Vallée EcoCité plaine du Var www.ecovallee-plaineduvar.fr 1 2 3 3 Eco-Vallée Un nouveau positionnement économique Faire d Eco-Vallée l accélérateur de la mutation économique
Plus en détailExercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT
Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Ces exercices portent sur les items 2, 3 et 5 du programme d informatique des classes préparatoires,
Plus en détailImputation du salaire d ego dans TeO
Imputation du salaire d ego dans TeO Objet de la note : linéariser la réponse en tranche du salaire, et imputer le salaire en cas de non réponse Champ et principe de la méthode Les individus qui se sont
Plus en détailCALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING
CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING SÉLECTION DES RISQUES PRÉVISION DES DÉFAUTS SUIVI ET CONTRÔLE Pierre-Louis GONZALEZ Différents types de
Plus en détailLes Protocoles de sécurité dans les réseaux WiFi. Ihsane MOUTAIB & Lamia ELOFIR FM05
Les Protocoles de sécurité dans les réseaux WiFi Ihsane MOUTAIB & Lamia ELOFIR FM05 PLAN Introduction Notions de sécurité Types d attaques Les solutions standards Les solutions temporaires La solution
Plus en détailFigure 3.1- Lancement du Gambit
3.1. Introduction Le logiciel Gambit est un mailleur 2D/3D; pré-processeur qui permet de mailler des domaines de géométrie d un problème de CFD (Computational Fluid Dynamics).Il génère des fichiers*.msh
Plus en détailTableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1
UN GROUPE D INDIVIDUS Un groupe d individus décrit par une variable qualitative binaire DÉCRIT PAR UNE VARIABLE QUALITATIVE BINAIRE ANALYSER UN SOUS-GROUPE COMPARER UN SOUS-GROUPE À UNE RÉFÉRENCE Mots-clés
Plus en détailProjet de Traitement du Signal Segmentation d images SAR
Projet de Traitement du Signal Segmentation d images SAR Introduction En analyse d images, la segmentation est une étape essentielle, préliminaire à des traitements de haut niveau tels que la classification,
Plus en détailExercices du Cours de la programmation linéaire donné par le Dr. Ali DERBALA
75. Un plombier connaît la disposition de trois tuyaux sous des dalles ( voir figure ci dessous ) et il lui suffit de découvrir une partie de chacun d eux pour pouvoir y poser les robinets. Il cherche
Plus en détailBases de données réparties: Fragmentation et allocation
Pourquoi une base de données distribuée? Bibliographie Patrick Valduriez, S. Ceri, Guiseppe Delagatti Bases de données réparties: Fragmentation et allocation 1 - Introduction inventés à la fin des années
Plus en détailBaromètre des professions 2015. Février 2015
Baromètre des professions 2015 Février 2015 Approche méthodologique 3 Résultats détaillés 5 1. Confiance 6 2. Encouragement à devenir 9 2 Méthodologie Collecte des données La présente étude a été réalisée
Plus en détailCorrigé des TD 1 à 5
Corrigé des TD 1 à 5 1 Premier Contact 1.1 Somme des n premiers entiers 1 (* Somme des n premiers entiers *) 2 program somme_entiers; n, i, somme: integer; 8 (* saisie du nombre n *) write( Saisissez un
Plus en détailLes Français et le chauffage. Résultats de l étude menée
Les Français et le chauffage Résultats de l étude menée par IPSOS pour Via sèva Méthodologie et échantillon METHODOLOGIE : Cette étude a été réalisée en adhoc online, auprès d un échantillon issu de l
Plus en détailDETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES
Agence fédérale pour la Sécurité de la Chaîne alimentaire Administration des Laboratoires Procédure DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES Date de mise en application
Plus en détailExemple PLS avec SAS
Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that
Plus en détailCours 9 : Plans à plusieurs facteurs
Cours 9 : Plans à plusieurs facteurs Table des matières Section 1. Diviser pour regner, rassembler pour saisir... 3 Section 2. Définitions et notations... 3 2.1. Définitions... 3 2.2. Notations... 4 Section
Plus en détailMETHODES D EVALUATION
METHODES D EVALUATION C.R.A. PANSARD & ASSOCIES Présentation du 27 septembre 2004 G. Lévy 1 METHODES D EVALUATION SOMMAIRE 1 Définition et approche de la «valeur» 2 - Les principales méthodes d évaluation
Plus en détailLois de probabilité. Anita Burgun
Lois de probabilité Anita Burgun Problème posé Le problème posé en statistique: On s intéresse à une population On extrait un échantillon On se demande quelle sera la composition de l échantillon (pourcentage
Plus en détailLe Service Central du Traitement de la Dépense. Intervenant l mentions légales.
Le Service Central du Traitement de la Dépense Intervenant l mentions légales. Sommaire L e S e r v i c e C e n t r a l d e Tr a i t e m e n t d e l a D é p e n s e : c o n t e x t e e t o b j e c t i
Plus en détailEvaluation des performances de programmes parallèles haut niveau à base de squelettes
Evaluation des performances de programmes parallèles haut niveau à base de squelettes Enhancing the Performance Predictability of Grid Applications with Patterns and Process Algebras A. Benoit, M. Cole,
Plus en détailProbabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12
Probabilités. I - Rappel : trois exemples. Exemple 1 : Dans une classe de 25 élèves, il y a 16 filles. Tous les élèves sont blonds ou bruns. Parmi les filles, 6 sont blondes. Parmi les garçons, 3 sont
Plus en détailApplication 1- VBA : Test de comportements d'investissements
Application 1- VBA : Test de comportements d'investissements Notions mobilisées Chapitres 1 à 5 du cours - Exemple de récupération de cours en ligne 1ère approche des objets (feuilles et classeurs). Corps
Plus en détailFeature Team Primer. par Craig Larman et Bas Vodde. Version 1.2
ÉQUIPE FEATURE par Craig Larman et Bas Vodde Version 1.2 Les Équipes Feature 1 et les Domaines Fonctionnels 2 sont des éléments essentiels pour dimensionner le développement en mode agile et lean. Ces
Plus en détailPremière partie. Préliminaires : noyaux itérés. MPSI B 6 juin 2015
Énoncé Soit V un espace vectoriel réel. L espace vectoriel des endomorphismes de V est désigné par L(V ). Lorsque f L(V ) et k N, on désigne par f 0 = Id V, f k = f k f la composée de f avec lui même k
Plus en détailBaccalauréat ES/L Amérique du Sud 21 novembre 2013
Baccalauréat ES/L Amérique du Sud 21 novembre 2013 A. P. M. E. P. EXERCICE 1 Commun à tous les candidats 5 points Une entreprise informatique produit et vend des clés USB. La vente de ces clés est réalisée
Plus en détailThéorie et codage de l information
Théorie et codage de l information Les codes linéaires - Chapitre 6 - Principe Définition d un code linéaire Soient p un nombre premier et s est un entier positif. Il existe un unique corps de taille q
Plus en détailBiostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke
www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3
Plus en détailCommunications performantes par passage de message entre machines virtuelles co-hébergées
Communications performantes par passage de message entre machines virtuelles co-hébergées François Diakhaté1,2 1 CEA/DAM Île de France 2 INRIA Bordeaux Sud Ouest, équipe RUNTIME Renpar 2009 1 Plan Introduction
Plus en détail2015-2016 DES PROJETS UNF3S INVESTISSEMENT D AVENIR IDEFI TIL 15 JUIN 2015 > 15 SEPTEMBRE 2015 2014 DATE DE L APPEL A PROJETS :
Université Numérique Francophone des Sciences de la San té et du Sport APPEL A PROJETS 2015-2016 DES PROJETS UNF3S ET DES PROJETS D EXTENSION AU PROGRAMME INVESTISSEMENT D AVENIR IDEFI TIL www.unf3s.org
Plus en détailIntérêt du découpage en sous-bandes pour l analyse spectrale
Intérêt du découpage en sous-bandes pour l analyse spectrale David BONACCI Institut National Polytechnique de Toulouse (INP) École Nationale Supérieure d Électrotechnique, d Électronique, d Informatique,
Plus en détailFOCUS Evolution. Lisez-Moi. Version FE 7.0.t
Lisez-Moi Version FE 7.0.t SOMMAIRE 1. PARAMETRAGE... 5 1.1. Banque... 5 1.1.1. Code Banque... 6 1.1.2. Comptes bancaires... 7 1.1.3. Edition... 8 2. FICHE CLIENTS... 9 2.1. Renseignements Comptables...
Plus en détailVERTELIS SUITE Suite logicielle pour optimiser votre performance énergétique
VERTELIS SUITE Suite logicielle pour optimiser votre performance énergétique Accompagnez votre démarche de performance énergétique Que vous soyez gestionnaire d énergie d un site industriel ou exploitant
Plus en détailL ANALYSE DU «PARC SOCIAL DE FAIT» PARISIEN EN 2003 : UNE ANALYSE TERRITORIALISÉE DES PROFILS D OCCUPATION DES PARCS ET DES QUARTIERS
ATELIER PARISIEN D URBANISME - 17, BD MORLAND 75004 PARIS TÉL : 01 42 71 28 14 FAX : 01 42 76 24 05 http://www.apur.org Observatoire de l'habitat de Paris L ANALYSE DU «PARC SOCIAL DE FAIT» PARISIEN EN
Plus en détailBien choisir son statut : la personnalisation est essentielle. Animé par : Aurélien DEMAURE
Bien choisir son statut : la personnalisation est essentielle Animé par : Aurélien DEMAURE Le cadre juridique L entreprise en nom propre L EIRL La société Les critères à retenir Le régime fiscal de l entrepreneur
Plus en détailMaître de Conférences en mathématiques appliquées Université de Bordeaux - MARS 2015 -
MARIE CHAVENT Maître de Conférences en mathématiques appliquées Université de Bordeaux - MARS 2015 - Mariée, 2 enfants, Née le 5 mai 1969 à Versailles, Nationalité Française Web : http://www.math.u-bordeaux1.fr/~machaven/
Plus en détailIdR Trading et Microstructure CA Cheuvreux. Charles-Albert Lehalle
IdR Trading et Microstructure CA Cheuvreux Charles-Albert Lehalle 2010-2014 Crédit Agricole Cheuvreux Kepler Cheuvreux L objectif de cette IdR «trading et microstructure des marchés» est de stimuler la
Plus en détailEstimation: intervalle de fluctuation et de confiance. Mars 2012. IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison
Estimation: intervalle de fluctuation et de confiance Mars 2012 IREM: groupe Proba-Stat Estimation Term.1 Intervalle de fluctuation connu : probabilité p, taille de l échantillon n but : estimer une fréquence
Plus en détail