Méthodes de classifications
|
|
- Sabine Champagne
- il y a 7 ans
- Total affichages :
Transcription
1 Méthodes de classifications Dhafer Malouche ESSAI-U2S-ENIT Juin-2013 ANR Do Well Be, Saint Nectaire
2 Plan Introduction Classification hiérarchique Partionnement Indices de validité Méthodes probabilistes pour la classification
3 Introduction 3 Introduction Classification hiérarchique Partionnement Indices de validité Méthodes probabilistes pour la classification
4 Introduction 4 Définition Algorithmes qui permettent de classer des objets observés dans des classes (appelées clusters). Les objets d une même classe doivent être similaires et les objets de deux classes différentes doivent être distincts. Différents algorithmes de classification Méthodes Hiérarchiques (classification hiérarchiques...) Partitionnement (k-means..) Méthodes Probabilistes (EM-algorithme...) et encore d autres...
5 Introduction 5 Les objets E = {w 1,..., w n } un ensemble de n objets (individus) pour lesquels on a observé d variables (qualitatives et/ou quantitatives) x 1,..., x d où x j i = x j (w i ) est la ième observation de w i selon x j. On considère w i = (x i,t ) t Ti temporelles (ST). i = 1,..., n des signaux ou séries Une matrice D = (d ii ), n n (n est le nombre d objets à classer), où d ii est une mesure de similarité entre deux objets w i et w i,
6 Introduction 6 Etape 1 : calcul des similarités Cas de variables quantitatives. Distance Euclidienne d(w i, w i ) = d (x j i x j i ) 2. j=1 ou la distance de Minkowski pour tout p > 0 d d(w i, w i ) = (x j i x j i ) p j=1 1/p encore d autres exemples de distances : Canberra, Manhattan... Sous R : dist, il faut spécifier une matrice de données quantitative le type de distance.
7 Introduction 7 Distance entre signaux ou ST Distance Euclidienne ou l une des distances déjà définies (Séries sont toutes de même longueurs ). Dynamic time wrapping ou Déformation temporelle dynamique (par Keogh & Pazzani, ) Permet de comparer deux séquences de ST pas forcément de même longueur. Dilatation ou compression des séquence pour obtenir le meilleur alignement possible Sous R, package dtw. 1 Keogh, E. J. and Pazzani, M. J. (2001). Derivative dynamic time warping. In the 1st SIAM Int. Conf. on Data Mining (SDM-2001), Chicago, IL, USA.
8 Classification hiérarchique 8 Introduction Classification hiérarchique Partionnement Indices de validité Méthodes probabilistes pour la classification
9 Classification hiérarchique 9 Algorithme ascendant (agrégatif) hiérarchique 1. k = n le nombre de classes 2. Chaque classes contient une observation : n classes C 1,..., C n. 3. Calculer la matrice de distances entre classes (phase agrégative de l algorithme). 4. Considérer les deux classes C i et C j telles que. d(c i, C j ) = min (i,j ) d(c i, C j ) 5. Agréger C i et C j dans une seule classe C ij. Donc k = k k = 1? Si oui STOP, sinon, aller à 3.
10 Classification hiérarchique 10 Cluster Dendrogram Florida North Carolina California Maryland Arizona New Mexico Delaware Alabama Louisiana Illinois New York Michigan Nevada Alaska Mississippi South Carolina Washington Oregon Wyoming Oklahoma Virginia Rhode Island Massachusetts New Jersey Missouri Arkansas Tennessee Georgia Colorado Texas Idaho Nebraska Kentucky Montana Ohio Utah Indiana Kansas Connecticut Pennsylvania Hawaii West Virginia Maine South Dakota North Dakota Vermont Minnesota Wisconsin Iowa New Hampshire Height dist(usarrests) hclust (*, "average")
11 Classification hiérarchique 11 Méthodes d agrégations d(c l, C ij ) = α i d(c l, C i ) + α j d(c l, C j ) + βd(c i, C j )+ γ d(c l, C i ) d(c l, C j ) Algorithme de classification α i α j β γ Single Linkage 1/2 1/2 0 1/2 Complete Linkage 1/2 1/2 0 1/2 Centroïd Linkage n i n i +n j n j n i +n j n i n j n i +n j 0 Méthode de Ward n i +n l n i +n j +n l n j +n l n i +n j +n l n l n i +n j +n l 0
12 Classification hiérarchique 12 Méthodes d agrégations Single Linkage : d(c l, C ij ) = min(d(c l, C i ), d(c l, C j )) Complete Linkage : d(c l, C ij ) = max(d(c l, C i ), d(c l, C j )) Centroïd Linkage : d(c l, C ij ) = d(m l, m ij ) où m l et m ij sont resp. les centres de gravité de C l et C ij. Méthode de Ward (après une ACP 2 ) : elle a pour objectif de minimiser l accroissement dans la variance intra-classe : E = k l=1 x i C l d(x i, m l ) 2. 2 Analyse en composantes principales
13 Classification hiérarchique 13 Algorithme descendant hiérarchique (DIANA). 1. k = 1, Toutes sont dans la même classe C 1 2. Considérer C i la classe de diamètre maximale (d(c i ) = max w,w C i d(w, w )). 3. Introduire C j =. 3.1 Pour chaque w C i, calculer d (w, C i \ {w}) = 1 C i 1 w C i \{w} 3.2 Calculer la différence (w, C i, C j ) = d (w, C i \ {w}) d(w, C j ) d(w, w ). 4. Si w m = argmax w Ci d (w, C i \ {w}) et (w m, C i, C j ) > 0 alors w m C j 5. si k < n alors k = k + 1 revient à 1/ sinon STOP.
14 Partionnement 14 Introduction Classification hiérarchique Partionnement Indices de validité Méthodes probabilistes pour la classification
15 Partionnement 15 Objectif A partir d une fonction critère J donnée, partitionner w 1,..., w n en K classes (K est fixé d avance) en minimisant ou maximisant la fonction J Méthode exhaustive : calculer pour toute les partitions possible C, le critère J(C) et la solution est alors C sol = argmaxj(c). Solution impossible si n devient grand. En effet le nombre de partitions possible est égal à P(n, K) = 1 m = 1 K! K ( 1)K m CK m m N. Pour n = 30, et K = 3, P(n, K) est de l ordre de
16 Partionnement 16 K means Critère à minimiser : la somme des carrées des erreurs (SSE) : J(C) = d(w, m(c)) c C w c où m(c) est le centre de gravité de c. Algorithme : 1. Initialise K centres m 1,..., m K et 2. Affecter chaque individu vers la classe la plus proche C = {c 1,..., c K } : w c l si d(w, m l ) = min d(w, m l l ). =1,...,K 3. Re-calculer les centres de gravité des nouvelles classes, 4. Répéter 2 et 3 jusqu à convergence.
17 Indices de validité 17 Introduction Classification hiérarchique Partionnement Indices de validité Méthodes probabilistes pour la classification
18 Indices de validité 18 Mesure de la validité d une classification Deux types de mesures : Indices de validité interne : à partir d un résultat de classification et de l information intrinsèque dans la base de données on mesure la qualité du résultat : indice de connectivité indice de silhouette indice de Dunn Indice de validité externe : comparer la classification obtenue avec une autre classification (soit une partition déjà connue ou une autre classification obtenue par une autre méthode)
19 Indices de validité 19 Notations Soit n le nombre des observations, d le nombre des variables, x 1,..., x n les vecteurs d observations à classer, C = {C 1,..., C k } une classification à tester, C(i) est la classe contenant x i, i.e., C(i) x i. Pour tout x i, et j {1,..., n} \ {i} : x (j) i est le j ième voisin le plus proche de x i : d(x i, x (1) ) d(x i, x (2) )... d(x i, x (j) )... d(x i, x (n 1) ) On pose pour tout i, j {1,..., n} δ(x i, x (j) i ) = 0 si x i, x (j) i 1/j sinon C(i)
20 Indices de validité 20 Indices de Connectivité Pour une classification C, Conn(C) = i,j=1,...,n δ(x i, x (j) i ) Conn(C) prend ses valeurs dans [0, + [ et c est un cœfficient qui doit être minimisée : Conn(C) proche de zéro une bonne connectivité à l intérieure des classes. R : clvalid package, connectivity
21 Indices de validité 21 Largeur de la silhouette C est la moyenne de toutes les valeurs de la silhouette. Valeur de la silhouette pour une observation x i : où S(i) = b i a i max(b i, a i ) ai est la distance moyenne entre x i et tous les autres x j C(i). a i = 1 n(c(i)) x C(i) d(x i, x). bi est la distance moyenne entre x i et les observations dans la classe la pus proche de x i : b i = min C C\C(i) 1 n(c) d(x i, x). x C
22 Indices de validité 22 Largeur de la silhouette Définie par S(C) = 1 S(i) n La largeur de la silhouette est un nombre qui est toujours compris entre 1 et +1. S doit être maximisée. une valeur de S(i) négative indique que cet individu n est pas dans la bonne classe et il pourrait être déplacé vers la classe la plus proche. R, package cluster, silhouette i
23 Indices de validité 23 Indices externes P une partition existante de l ensemble des individus E, P = {G 1,..., G r }. C = {C 1,..., C k } une classification obtenue à l aide d un algorithme de classification (hiérarchique, kmeans...) Objectif : comparer la classification C et la partition P Définition de quelques indices de validité externes : package clv sour R
24 Indices de validité 24 Calcul des indices externes Soient deux individus x i et x i. Quatre cas sont possibles Cas 1 C C et G P tel que x i, x i C et x i, x i G Cas 2 C C et G G P tel que x i, x i C et x i G, x i G Cas 3 C C C et G P tel que x i C, x i C et x i, x i G Cas 4 C C C et G G P tel que x i C, x i C et x i G, x i G
25 Indices de validité 25 Calcul des indices externes Notons par A l l ensemble des paires (x i, x i ) vérifiant le cas l et par a l = A l. Trois indices : Indice de Rand Rand = a 1 + a 4 a 1 + a 2 + a 3 + a 4 Indice de Jaccard Jaccard = a 1 a 1 + a 2 + a 3. Indice de Folkes et Mallows a1 a 1 FM = a 1 + a 3 a 1 + a 2
26 Méthodes probabilistes pour la classification 26 Introduction Classification hiérarchique Partionnement Indices de validité Méthodes probabilistes pour la classification
27 Méthodes probabilistes pour la classification 27 l EM-algorithme Soit X = (X 1,..., X n ) g(x θ) un n échantillon de vecteurs aléatoire dans R d. On suppose g(x θ) = f (x, z θ)dz Objectif : calculer θ = argmax θ L(x θ) = argmax θ où x = (x 1,..., x n ) est une réalisation de X. n g(x i θ) On pose (X, Z) f (x, z θ), et la densité de Z θ, X = x est i=1 k(z θ, x) = f (x, z θ) g(x θ).
28 Méthodes probabilistes pour la classification 28 l EM-algorithme Donc log g(x θ) = log f (x, z θ) log k(z θ, x) Pour un θ 0 fixé, log g(x θ)k(z θ 0, x) = log f (x, z θ)k(z θ 0, x) log k(z θ, x)k(z θ 0, x) (1) En intégrant (1) par rapport à z, on obtient log g(x θ) = E θ0 (log f (x, Z θ)) E θ0 (log k(z x, θ))
29 Méthodes probabilistes pour la classification 29 l EM-algorithme La fonction vraisemblance s écrit alors log L(x θ) = n log g(x i θ) i=1 = E θ0 (log L c (x, Z θ)) }{{} Q(θ x,θ 0 ) n E θ0 (log k(z x i, θ)) i=1 où L c est appelée la vraisemblance complète. Ainsi, dans la recherche du maximum de log L(x θ), dans l EM-algorithme on maximize, d une façon itérative, Q(θ x, θ 0 ).
30 Méthodes probabilistes pour la classification 30 l EM-algorithme 1. Considérons une valeur initiale θ (0) 2. Calculer l espérance (E step) Q(θ x, θ (m) ) = (log L c (x, Z θ)) E θ(m) où la moyenne a été calculée par rapport à k(z θ (m), x) et m = 0 3. Maximiser la fonction Q(θ x, θ (m) ) en θ (M step) : et m = m + 1. θ (m+1) = argmax θ Q(θ x, θ (m) ) 4. Répéter les étapes 2-3 jusqu à le point fix soit atteint : θ (m+1) = θ (m)
31 Méthodes probabilistes pour la classification 31 l EM-algorithme, dans la classification On suppose que les données x = (x 1,..., x n ) (R d ) n est un n échantillon qu on suppose issu d une loi de probabilité g(x θ) = k α l g l (x θ l ) l=1 où α l ]0, 1[, l = 1,..., k et k l=1 α l = 1 et g l (x θ l ) est la densité d une loi Gaussienne multivariée : f l (x θ l ) = 1 (2π) d/2 exp Σ l 1/2 ( 1 2 (x µ l) Σ 1 l (x µ l ) Donc X g(x θ) et Z est la variable à valeurs dans {1,..., k}, où k est la nombre de classes et P(Z = l) = α l, l = 1,..., k. )
32 Méthodes probabilistes pour la classification 32 Mise en œuvre sous R : le package mclust Description détaillé du package dans C. Fraley and A. E. Raftery (2006). MCLUST Version 3 for R : Normal Mixture Modeling and Model-Based Clustering, Technical Report no. 504, Department of Statistics, University of Washington C. Fraley and A. E. Raftery (2002). Model-based clustering, discriminant analysis, and density estimation. Journal of the American Statistical Association 97 : Utiliser la commande Mclust, Mclust applique l EM-algorithme (avec des différentes paramétrisations), et utilise le BIC comme critère de sélection du modèle : chercher le modèle M k correspondant au BIC maximal. BIC = 2 log Vraisemblance Nbre paramètres log(n)
La classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailClassification non supervisée
AgroParisTech Classification non supervisée E. Lebarbier, T. Mary-Huard Table des matières 1 Introduction 4 2 Méthodes de partitionnement 5 2.1 Mesures de similarité et de dissimilarité, distances.................
Plus en détailObjectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique
Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55
Plus en détailKit de dépistage et de déclaration du virus Ebola (CARE)
C A R E Kit de dépistage et de déclaration du virus Ebola (CARE) Si vous tombez malade, faites-vous soigner dès que possible pour avoir les meilleures chances de guérison! Cher voyageur, Que vous rentriez
Plus en détailPlus courts chemins, programmation dynamique
1 Plus courts chemins, programmation dynamique 1. Plus courts chemins à partir d un sommet 2. Plus courts chemins entre tous les sommets 3. Semi-anneau 4. Programmation dynamique 5. Applications à la bio-informatique
Plus en détailDétection de têtes dans un nuage de points 3D à l aide d un modèle de mélange sphérique
Détection de têtes dans un nuage de points 3D à l aide d un modèle de mélange sphérique Denis Brazey & Bruno Portier 2 Société Prynɛl, RD974 290 Corpeau, France denis.brazey@insa-rouen.fr 2 Normandie Université,
Plus en détailStéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 04/04/2008 Stéphane Tufféry - Data Mining - http://data.mining.free.fr
Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE 1 Plan du cours Qu est-ce que le data mining? A quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data
Plus en détailCours de méthodes de scoring
UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-
Plus en détailApplication de K-means à la définition du nombre de VM optimal dans un cloud
Application de K-means à la définition du nombre de VM optimal dans un cloud EGC 2012 : Atelier Fouille de données complexes : complexité liée aux données multiples et massives (31 janvier - 3 février
Plus en détailSéance 11 : Typologies
Séance 11 : Typologies Sommaire Proc CLUSTER : Typologie hiérarchique... 3 Proc FASTCLUS : Typologie nodale... 8 Proc MODECLUS : Typologie non paramétrique... 11 - Les phénomènes observés (attitudes, comportements,
Plus en détailIntroduction au pricing d option en finance
Introduction au pricing d option en finance Olivier Pironneau Cours d informatique Scientifique 1 Modélisation du prix d un actif financier Les actions, obligations et autres produits financiers cotés
Plus en détailAgrégation des portefeuilles de contrats d assurance vie
Agrégation des portefeuilles de contrats d assurance vie Est-il optimal de regrouper les contrats en fonction de l âge, du genre, et de l ancienneté des assurés? Pierre-O. Goffard Université d été de l
Plus en détailSimulation de variables aléatoires
Chapter 1 Simulation de variables aléatoires Références: [F] Fishman, A first course in Monte Carlo, chap 3. [B] Bouleau, Probabilités de l ingénieur, chap 4. [R] Rubinstein, Simulation and Monte Carlo
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane
Plus en détailMaster IAD Module PS. Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique. Gaël RICHARD Février 2008
Master IAD Module PS Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique Gaël RICHARD Février 2008 1 Reconnaissance de la parole Introduction Approches pour la reconnaissance
Plus en détailIntroduction aux algorithmes MapReduce. Mathieu Dumoulin (GRAAL), 14 Février 2014
Introduction aux algorithmes MapReduce Mathieu Dumoulin (GRAAL), 14 Février 2014 Plan Introduction de la problématique Tutoriel MapReduce Design d algorithmes MapReduce Tri, somme et calcul de moyenne
Plus en détailProcessus aléatoires avec application en finance
Genève, le 16 juin 2007. Processus aléatoires avec application en finance La durée de l examen est de deux heures. N oubliez pas d indiquer votre nom et prénom sur chaque feuille. Toute documentation et
Plus en détailOptimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie
Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie 1 Présenté par: Yacine KESSACI Encadrement : N. MELAB E-G. TALBI 31/05/2011 Plan 2 Motivation
Plus en détailMCMC et approximations en champ moyen pour les modèles de Markov
MCMC et approximations en champ moyen pour les modèles de Markov Gersende FORT LTCI CNRS - TELECOM ParisTech En collaboration avec Florence FORBES (Projet MISTIS, INRIA Rhône-Alpes). Basé sur l article:
Plus en détailRapport de Stage. Titre : Clustering à l aide d une représentation supervisée
Nicolas Creff Du 1er février au 31 juillet 2011 Promotion 2011 Majeure SCIA Rapport de Stage Titre : Clustering à l aide d une représentation supervisée Sujet : Personnalisation de scores à l aide de la
Plus en détailProbabilités III Introduction à l évaluation d options
Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un
Plus en détailPostal Standards Lettermail
Tarifs pour entreprises - 2015 Postal Standards Lettermail Clients titulaires d'une convention et Solutions pour petites entreprises (Entrepreneur) En vigueur le 12 janvier 2015 MC Marque de commerce de
Plus en détailProbabilités sur un univers fini
[http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur
Plus en détailMATHS FINANCIERES. Mireille.Bossy@sophia.inria.fr. Projet OMEGA
MATHS FINANCIERES Mireille.Bossy@sophia.inria.fr Projet OMEGA Sophia Antipolis, septembre 2004 1. Introduction : la valorisation de contrats optionnels Options d achat et de vente : Call et Put Une option
Plus en détailQuantification Scalaire et Prédictive
Quantification Scalaire et Prédictive Marco Cagnazzo Département Traitement du Signal et des Images TELECOM ParisTech 7 Décembre 2012 M. Cagnazzo Quantification Scalaire et Prédictive 1/64 Plan Introduction
Plus en détailDavid Trick, David Trick and Associates
Les ententes de transfert des crédits du collège à l université et l enseignement universitaire de premier cycle : l Ontario dans un contexte pancanadien et international David Trick, David Trick and Associates
Plus en détailProbabilités et Statistiques. Feuille 2 : variables aléatoires discrètes
IUT HSE Probabilités et Statistiques Feuille : variables aléatoires discrètes 1 Exercices Dénombrements Exercice 1. On souhaite ranger sur une étagère 4 livres de mathématiques (distincts), 6 livres de
Plus en détailPartie 1. La structure des réseaux sociaux
Partie 1. La structure des réseaux sociaux Analyse et Modélisation des Réseaux, Université Bordeaux IV Sections : Introduction 1 Introduction 2 3 L expérience de Milgram Les réseaux aléatoires 4 Le clustering
Plus en détailSouad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/
Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation
Plus en détailExercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT
Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Ces exercices portent sur les items 2, 3 et 5 du programme d informatique des classes préparatoires,
Plus en détailFormules emprunts obligataires
Formules emprunts obligataires Sommaire Formules emprunts obligataires1 I Emprunts obligataires avec obligations remboursées au pair (R=C)2 1 Cas général2 2 Annuités constantes3 3 Amortissements constants3
Plus en détailOptimisation, traitement d image et éclipse de Soleil
Kléber, PCSI1&3 014-015 I. Introduction 1/8 Optimisation, traitement d image et éclipse de Soleil Partie I Introduction Le 0 mars 015 a eu lieu en France une éclipse partielle de Soleil qu il était particulièrement
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailHistorique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications
L intelligence économique outil stratégique pour l entreprise Professeur Bernard DOUSSET dousset@irit.fr http://atlas.irit.fr Institut de Recherche en Informatique de Toulouse (IRIT) Equipe Systèmes d
Plus en détailMathématique et Automatique : de la boucle ouverte à la boucle fermée. Maïtine bergounioux Laboratoire MAPMO - UMR 6628 Université d'orléans
Mathématique et Automatique : de la boucle ouverte à la boucle fermée Maïtine bergounioux Laboratoire MAPMO - UMR 6628 Université d'orléans Maitine.Bergounioux@labomath.univ-orleans.fr Plan 1. Un peu de
Plus en détailL ÉTAT ACTUEL DES SYSTÈMES
L ÉTAT ACTUEL DES SYSTÈMES DE SUIVI DES CERTIFICATS D ÉNERGIE RENOUVELABLE EN AMÉRIQUE DU NORD Rapport présenté à la Commission de coopération environnementale Décembre 2003 AUTEURS : Meredith Wingate
Plus en détailModélisation géostatistique des débits le long des cours d eau.
Modélisation géostatistique des débits le long des cours d eau. C. Bernard-Michel (actuellement à ) & C. de Fouquet MISTIS, INRIA Rhône-Alpes. 655 avenue de l Europe, 38334 SAINT ISMIER Cedex. Ecole des
Plus en détailACP Voitures 1- Méthode
acp=princomp(voit,cor=t) ACP Voitures 1- Méthode Call: princomp(x = voit, cor = T) Standard deviations: Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 2.1577815 0.9566721 0.4903373 0.3204833 0.2542759 0.1447788
Plus en détailProgrammation linéaire
1 Programmation linéaire 1. Le problème, un exemple. 2. Le cas b = 0 3. Théorème de dualité 4. L algorithme du simplexe 5. Problèmes équivalents 6. Complexité de l Algorithme 2 Position du problème Soit
Plus en détailSystème de sécurité de périmètre INTREPID
TM Système de sécurité de périmètre INTREPID La nouvelle génération de systèmes de sécurité de périmètre MicroPoint Cable combine la technologie brevetée de Southwest Microwave, la puissance d un micro
Plus en détailParallélisation de l algorithme des k-médoïdes. Application au clustering de courbes.
Parallélisation de l algorithme des k-médoïdes. Application au clustering de courbes. Benjamin Auder 1 & Jairo Cugliari 2 1 Laboratoire LMO. Université Paris-Sud. Bât 425. 91405 Orsay Cedex, France. benjamin.auder@math.u-psud.fr
Plus en détailPROJET DEMONSTRATEUR SMART GRID POUR LA REGION PACIFIC NORTHWEST
LES SMART GRIDS DEVIENNENT REALITE SMART GRID PROJET DEMONSTRATEUR SMART GRID POUR LA REGION PACIFIC NORTHWEST Date : 27/01/2011 Projets Smart Grid aux Etats-Unis : la voie de l efficacité énergétique
Plus en détailNON-LINEARITE ET RESEAUX NEURONAUX
NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail
Plus en détailTESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION
TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun
Plus en détailExercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015
Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par
Plus en détailUne nouvelle approche de détection de communautés dans les réseaux sociaux
UNIVERSITÉ DU QUÉBEC EN OUTAOUAIS Département d informatique et d ingénierie Une nouvelle approche de détection de communautés dans les réseaux sociaux Mémoire (INF 6021) pour l obtention du grade de Maîtrise
Plus en détailExamen d informatique première session 2004
Examen d informatique première session 2004 Le chiffre à côté du titre de la question indique le nombre de points sur 40. I) Lentille électrostatique à fente (14) Le problème étudié est à deux dimensions.
Plus en détailEtudier aux Etats-Unis:
Etudier aux Etats-Unis: all you need to know before you go! EducationUSA.info Une grande aventure vous attend mais soyez préparés! EducationUSA.state.gov Qui sommes-nous? Commission franco-américaine d
Plus en détailExamen Médian - 1 heure 30
NF01 - Automne 2014 Examen Médian - 1 heure 30 Polycopié papier autorisé, autres documents interdits Calculatrices, téléphones, traducteurs et ordinateurs interdits! Utilisez trois copies séparées, une
Plus en détailChapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Plus en détailTempérature corporelle d un castor (une petite introduction aux séries temporelles)
Température corporelle d un castor (une petite introduction aux séries temporelles) GMMA 106 GMMA 106 2014 2015 1 / 32 Cas d étude Temperature (C) 37.0 37.5 38.0 0 20 40 60 80 100 Figure 1: Temperature
Plus en détail1.6- Génération de nombres aléatoires
1.6- Génération de nombres aléatoires 1- Le générateur aléatoire disponible en C++ 2 Création d'un générateur aléatoire uniforme sur un intervalle 3- Génération de valeurs aléatoires selon une loi normale
Plus en détailCONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Plus en détailTests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA
Plus en détailSéminaire TEST. 1 Présentation du sujet. October 18th, 2013
Séminaire ES Andrés SÁNCHEZ PÉREZ October 8th, 03 Présentation du sujet Le problème de régression non-paramétrique se pose de la façon suivante : Supposons que l on dispose de n couples indépendantes de
Plus en détailMots- clé : dette publique ; fédéralisme ; classements ; provinces ; états ; cantons ; länder.
Endettement des provinces canadiennes : analyse comparative avec les entités fédérées des États- Unis, de l Australie, de l Allemagne et de la Suisse Marcelin Joanis (Université de Sherbrooke, CIRANO et
Plus en détailModèles à Événements Discrets. Réseaux de Petri Stochastiques
Modèles à Événements Discrets Réseaux de Petri Stochastiques Table des matières 1 Chaînes de Markov Définition formelle Idée générale Discrete Time Markov Chains Continuous Time Markov Chains Propriétés
Plus en détailThéorie de l estimation et de la décision statistique
Théorie de l estimation et de la décision statistique Paul Honeine en collaboration avec Régis Lengellé Université de technologie de Troyes 2013-2014 Quelques références Decision and estimation theory
Plus en détailResolution limit in community detection
Introduction Plan 2006 Introduction Plan Introduction Introduction Plan Introduction Point de départ : un graphe et des sous-graphes. But : quantifier le fait que les sous-graphes choisis sont des modules.
Plus en détailPrincipe de symétrisation pour la construction d un test adaptatif
Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université
Plus en détailPost-processing of multimodel hydrological forecasts for the Baskatong catchment
+ Post-processing of multimodel hydrological forecasts for the Baskatong catchment Fabian Tito Arandia Martinez Marie-Amélie Boucher Jocelyn Gaudet Maria-Helena Ramos + Context n Master degree subject:
Plus en détail1 Complément sur la projection du nuage des individus
TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent
Plus en détail1 - PRESENTATION GENERALE...
Contenu PREAMBULE... 2 INTRODUCTION... 2 1 - PRESENTATION GENERALE... 4 Qualité et optimalité... 8 2 - AGREGATION AUTOUR DE CENTRES MOBILES... 9 2.1 LES BASES DE L'ALGORITHME... 10 2.2 TECHNIQUES CONNEXES...
Plus en détailProbabilités sur un univers fini
[http://mp.cpgedupuydelome.fr] édité le 10 août 2015 Enoncés 1 Proailités sur un univers fini Evènements et langage ensemliste A quelle condition sur (a,, c, d) ]0, 1[ 4 existe-t-il une proailité P sur
Plus en détailL ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Plus en détailChapitre 2 : Systèmes radio mobiles et concepts cellulaires
Chapitre 2 : Systèmes radio mobiles et concepts cellulaires Systèmes cellulaires Réseaux cellulaires analogiques de 1ère génération : AMPS (USA), NMT(Scandinavie), TACS (RU)... Réseaux numériques de 2ème
Plus en détailCOURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES
COURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES EPF 4/ 5 ème année - Option Ingénierie d Affaires et de Projets - Finance Bertrand LIAUDET 4 : Modélisation non-supervisée
Plus en détailThéorèmes de Point Fixe et Applications 1
Théorèmes de Point Fixe et Applications 1 Victor Ginsburgh Université Libre de Bruxelles et CORE, Louvain-la-Neuve Janvier 1999 Published in C. Jessua, C. Labrousse et D. Vitry, eds., Dictionnaire des
Plus en détailOSHKOSH (Wisconsin) EAA AirVenture. du 24 au 28 juillet 2007. Projet de voyage réalisé pour L Aero-Club Valais Par Mr Jean-Yves Bonvin
OSHKOSH (Wisconsin) EAA AirVenture du 24 au 28 juillet 2007 Projet de voyage réalisé pour L Aero-Club Valais Par Mr Jean-Yves Bonvin A Oshkosh, petite ville du Wisconsin, se tient chaque année le meeting
Plus en détailRésolution d équations non linéaires
Analyse Numérique Résolution d équations non linéaires Said EL HAJJI et Touria GHEMIRES Université Mohammed V - Agdal. Faculté des Sciences Département de Mathématiques. Laboratoire de Mathématiques, Informatique
Plus en détailLe modèle de Black et Scholes
Le modèle de Black et Scholes Alexandre Popier février 21 1 Introduction : exemple très simple de modèle financier On considère un marché avec une seule action cotée, sur une période donnée T. Dans un
Plus en détailData Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.
des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le
Plus en détailCrédits de carbone : une opportunité à saisir dès aujourd'hui
Crédits de carbone : une opportunité à saisir dès aujourd'hui Présentation devant les Comptables agréés de Montréal et l'association du jeune Barreau de Montréal Le 4 novembre 2010 Roger Fournier, CA Premier
Plus en détailSyda Productions Fotolia. Sous-titre 10pt. américaine Partir avec MICEFA (2014-2015)
Syda Productions Fotolia TITRE étudier SUR Dans 2 LIGNES une université 24pt Sous-titre 10pt américaine Partir avec MICEFA (2014-2015) 5 Raisons de se lancer dans le programme micefa Avoir une meilleure
Plus en détail3 Approximation de solutions d équations
3 Approximation de solutions d équations Une équation scalaire a la forme générale f(x) =0où f est une fonction de IR dans IR. Un système de n équations à n inconnues peut aussi se mettre sous une telle
Plus en détailLOGO. Module «Big Data» Extraction de Connaissances à partir de Données. Claudia MARINICA MCF, ETIS UCP/ENSEA/CNRS Claudia.Marinica@u-cergy.
Module «Big Data» Extraction de Connaissances à partir de Données Claudia MARINICA MCF, ETIS UCP/ENSEA/CNRS Claudia.Marinica@u-cergy.fr 14 Janvier 2015 Pourquoi l extraction de connaissances à partir de
Plus en détailOptimisation de la compression fractale D images basée sur les réseaux de neurones
Optimisation de la compression fractale D images basée sur les réseaux de neurones D r BOUKELIF Aoued Communication Networks,Architectures and Mutimedia laboratory University of S.B.A aoued@hotmail.com
Plus en détailProgrammation Linéaire - Cours 1
Programmation Linéaire - Cours 1 P. Pesneau pierre.pesneau@math.u-bordeaux1.fr Université Bordeaux 1 Bât A33 - Bur 265 Ouvrages de référence V. Chvátal - Linear Programming, W.H.Freeman, New York, 1983.
Plus en détailObjectifs du cours d aujourd hui. Informatique II : Cours d introduction à l informatique et à la programmation objet. Complexité d un problème (2)
Objectifs du cours d aujourd hui Informatique II : Cours d introduction à l informatique et à la programmation objet Complexité des problèmes Introduire la notion de complexité d un problème Présenter
Plus en détailCaroline Hurault-Delarue 1, Cécile Chouquet 2, Nicolas Savy 2, Isabelle Lacroix 1, Christine Damase- Michel 1
Trajectoires individuelles d'exposition aux psychotropes au cours de la grossesse et partitionnement en fonction du profil d'exposition : utilisation des K-means pour données longitudinales Caroline Hurault-Delarue
Plus en détailC f tracée ci- contre est la représentation graphique d une
TLES1 DEVOIR A LA MAISON N 7 La courbe C f tracée ci- contre est la représentation graphique d une fonction f définie et dérivable sur R. On note f ' la fonction dérivée de f. La tangente T à la courbe
Plus en détailClustering par optimisation de la modularité pour trajectoires d objets mobiles
Clustering par optimisation de la modularité pour trajectoires d objets mobiles Mohamed K. El Mahrsi, Télécom ParisTech, Département INFRES 46, rue Barrault 75634 Paris CEDEX 13, France Fabrice Rossi,
Plus en détailCircuits RL et RC. Chapitre 5. 5.1 Inductance
Chapitre 5 Circuits RL et RC Ce chapitre présente les deux autres éléments linéaires des circuits électriques : l inductance et la capacitance. On verra le comportement de ces deux éléments, et ensuite
Plus en détailMoments des variables aléatoires réelles
Chapter 6 Moments des variables aléatoires réelles Sommaire 6.1 Espérance des variables aléatoires réelles................................ 46 6.1.1 Définition et calcul........................................
Plus en détailIntroduction aux outils BI de SQL Server 2014. Fouille de données avec SQL Server Analysis Services (SSAS)
MIT820: Entrepôts de données et intelligence artificielle Introduction aux outils BI de SQL Server 2014 Fouille de données avec SQL Server Analysis Services (SSAS) Description générale Ce tutoriel a pour
Plus en détailchargement d amplitude variable à partir de mesures Application à l approche fiabiliste de la tolérance aux dommages Modélisation stochastique d un d
Laboratoire de Mécanique et Ingénieriesnieries EA 3867 - FR TIMS / CNRS 2856 ER MPS Modélisation stochastique d un d chargement d amplitude variable à partir de mesures Application à l approche fiabiliste
Plus en détail" # $ % % & ' ( ) * +,! '()*+ *, + ' +' + ' ' -+ - +.+. /0 / 1 0 12 1 1 2 34+ 4 1 +. 50 5 * 0 4 * 0 6! "##$ % &!
"# $ %%& ' ( )*+, '()*+,'+''-++.+/0112134+1.50*406 "##$ %& 8CC "#$%& ' ( )* +,-./ 0 123 456+7 3 7-55-89.*/ 0 +3 *+:3 ;< =3 3-3 8 0 23 >-8-3 >5? //*/*0;* @A: *53,,3 / * $/ >B+? - 5, 2 34*56 7 /+#** //8
Plus en détailVers une Optimisation de l Algorithme AntTreeStoch
Revue des Sciences et de la Technologie - RST- Volume 3 N 1 / janvier 2012 Vers une Optimisation de l Algorithme AntTreeStoch O. KADRI, H. MOUSS, A. ABDELHADI, R. MAHDAOUI Laboratoire d Automatique et
Plus en détailImplémentation parallèle de certains algorithmes de fouille de données avec le framework MapReduce
Implémentation parallèle de certains algorithmes de fouille de données avec le framework MapReduce Algorithmes : K-means et Apriori Maria Malek LARIS-EISTI maria.malek@eisti.fr 1 Cloud Computing et MapReduce
Plus en détailCours Informatique Master STEP
Cours Informatique Master STEP Bases de la programmation: Compilateurs/logiciels Algorithmique et structure d'un programme Programmation en langage structuré (Fortran 90) Variables, expressions, instructions
Plus en détailAnalyses multivariées avec R Commander (via le package FactoMineR) Qu est ce que R? Introduction à R Qu est ce que R?
Analyses multivariées avec R Commander Analyses multivariées avec R Commander (via le package FactoMineR) Plate-forme de Support en Méthodologie et Calcul Statistique (SMCS) - UCL 1 Introduction à R 2
Plus en détailBien vendre. aux. Etats-Unis. Enthousiasme ENJEUX. EXTRA C ONDENSED C ORPS 40 ÉT R OI T. 95% FILET 0,7P T Etats-Unis. Dossier réalisé par Sophie Marek
ENJEUX Dossier réalisé par Sophie Marek Bien vendre TETIÈRE aux F R ANKLIN G O THIC EXTRA C ONDENSED C ORPS 40 ÉT R OI T. 95% FILET 0,7P T STEVE ALLEN/JUPITERIMAGES/AFP S implanter sur le marché américain
Plus en détailRapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/2011. 1.1 Présentation. 1.2 Ressources
Master Maths Finances 2010/2011 Data Mining janvier 2011 RapidMiner 1 Introduction 1.1 Présentation RapidMiner est un logiciel open source et gratuit dédié au data mining. Il contient de nombreux outils
Plus en détailArbres binaires de décision
1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression
Plus en détailUn exemple de régression logistique sous
Fiche TD avec le logiciel : tdr341 Un exemple de régression logistique sous A.B. Dufour & A. Viallefont Etude de l apparition ou non d une maladie cardiaque des coronaires 1 Présentation des données Les
Plus en détail4. Martingales à temps discret
Martingales à temps discret 25 4. Martingales à temps discret 4.1. Généralités. On fixe un espace de probabilités filtré (Ω, (F n ) n, F, IP ). On pose que F contient ses ensembles négligeables mais les
Plus en détailModélisation et Simulation
Cours de modélisation et simulation p. 1/64 Modélisation et Simulation G. Bontempi Département d Informatique Boulevard de Triomphe - CP 212 http://www.ulb.ac.be/di Cours de modélisation et simulation
Plus en détailde calibration Master 2: Calibration de modèles: présentation et simulation d
Master 2: Calibration de modèles: présentation et simulation de quelques problèmes de calibration Plan de la présentation 1. Présentation de quelques modèles à calibrer 1a. Reconstruction d une courbe
Plus en détailVous êtes bien à la bonne présentation, c est juste que je trouvais que le titre de cette présentation étais un peu long,
Vous êtes bien à la bonne présentation, c est juste que je trouvais que le titre de cette présentation étais un peu long, en fait ça me faisait penser au nom d un certain projet gouvernemental je me suis
Plus en détail