Cours 4 : Traitement de données quantitatives multivariées - Introduction au partitionnement de données. Guénaël CABANES et Basarab MATEI
|
|
- Stéphanie Pagé
- il y a 6 ans
- Total affichages :
Transcription
1 Cours 4 : Traitement de données quantitatives multivariées - Introduction au partitionnement de données Guénaël CABANES et Basarab MATEI
2 Généralités Exemple Introduction Guénaël CABANES et Basarab MATEI 2
3 Généralités Introduction Généralités Exemple Le partitionnement de données (data clustering en anglais) est une méthode statistique d analyse des données qui a pour but de regrouper un ensemble de données en différents paquets homogènes, c est à dire que les données de chaque sous-ensemble partagent des caractéristiques communes, qui correspondent le plus souvent à des critères de proximité que l on définit en introduisant des mesures de distance. Guénaël CABANES et Basarab MATEI 3
4 Généralités Introduction Généralités Exemple Pour obtenir un bon partitionnement, il faut : Minimiser l inertie (la variance) intra-classe pour obtenir des classes (= groupes ou clusters) les plus homogènes possibles. Maximiser l inertie inter-classe afin d obtenir des groupes bien différenciés. Guénaël CABANES et Basarab MATEI 4
5 Exemple Introduction Généralités Exemple On veut découvrir automatiquement les groupes de données similaires : Guénaël CABANES et Basarab MATEI 5
6 Exemple Introduction Généralités Exemple On veut découvrir automatiquement les groupes de données similaires : Guénaël CABANES et Basarab MATEI 5
7 Problemes Mesure de performance Algorithme Effectif Guénaël CABANES et Basarab MATEI 6
8 Introduction Problemes Mesure de performance Algorithme Effectif La méthode des K-Moyennes est un cas particulier de la méthode des centres mobiles. L objectif principal de ces méthodes est de choisir un certain nombre de représentants (= centre ou prototypes) dans l espace des données. Chaque prototype représente un groupe. Ainsi à la fin du processus on associe chaque point de donnée à son prototype le plus proche, de faàon à obtenir une segmentation des données en différents groupes homogènes. Guénaël CABANES et Basarab MATEI 7
9 Problemes Mesure de performance Algorithme Effectif 1 Choisir k centres initiaux au hasard (par exemple parmi les données). 2 Affecter chaque donnée x au groupe i dont le centre Ci est le plus proche de x. 3 Si aucun élément ne change de groupe alors arràłt. 4 Sinon calculer les nouveaux centres : pour tout i, Ci est le centre de gravité (le barycentre) des éléments du groupe i. 5 Aller en 2. Guénaël CABANES et Basarab MATEI 8
10 Problemes Mesure de performance Algorithme Effectif Exemple : Guénaël CABANES et Basarab MATEI 9
11 Problemes Mesure de performance Algorithme Effectif Exemple : Guénaël CABANES et Basarab MATEI 9
12 Problemes Mesure de performance Algorithme Effectif Exemple : Guénaël CABANES et Basarab MATEI 9
13 Problemes Mesure de performance Algorithme Effectif Exemple : Guénaël CABANES et Basarab MATEI 9
14 Problemes Mesure de performance Algorithme Effectif Exemple : Guénaël CABANES et Basarab MATEI 9
15 Problemes Mesure de performance Algorithme Effectif Exemple : Guénaël CABANES et Basarab MATEI 9
16 Problemes Mesure de performance Algorithme Effectif Exemple : Guénaël CABANES et Basarab MATEI 9
17 Problemes Mesure de performance Algorithme Effectif Exemple : Guénaël CABANES et Basarab MATEI 9
18 Problemes Mesure de performance Algorithme Effectif Exemple : Guénaël CABANES et Basarab MATEI 9
19 Problemes Introduction Problemes Mesure de performance Algorithme Effectif Choix de la mesure de distance (métrique) Ce choix est très important, avec des mesures de distance différentes on obtient des résultats différents! Le plus souvent on utilise la distance euclidienne : n x i y i 2 i=1 avec n le nombre de variables. Guénaël CABANES et Basarab MATEI 10
20 Problemes Introduction Problemes Mesure de performance Algorithme Effectif Instabilité Le résultat final est fortement dépendant de l initialisation des centre. Pour remédier à àa on lance l algorithme plusieurs fois avec une initialisation aléatoire et on ne garde que le meilleur résultat. Choix du nombre de groupes Le nombre de groupes obtenu en sortie de l algorithme doit àłtre choisi par l utilisateur. Or en général il n est pas connu! On lance donc généralement l algorithme plusieurs fois avec des choix différents pour le nombre de groupes et on ne garde que le meilleur résultat. Guénaël CABANES et Basarab MATEI 11
21 Mesure de performance Problemes Mesure de performance Algorithme Effectif On a vu qu il est nécessaire de relancer l algorithme des K-Moyennes de nombreuses fois et de garder le meilleur résultat. Il nous faut donc une estimation de la qualité de la segmentation. Indice de Davies-Bouldin (DB) Soit s i la distance moyenne des données du groupe i à leur prototype c i, cet indice sélectionne la segmentation qui maximise la distance entre groupe et minimise la variance intra-groupe. C est un des plus utilisées. DB(K) = 1 K K i=1 max j i s i + s j dist(c i, c j ) Guénaël CABANES et Basarab MATEI 12
22 Algorithme Effectif Problemes Mesure de performance Algorithme Effectif 1 Choisir k entre 1 et k max. 2 Lancer 50 fois l algorithme élémentaire de K-Moyennes et garder la meilleure segmentation S k selon l indice DB. 3 Si toutes les valeurs de k ont été testé, retenir parmi les S k la meilleure segmentation S selon DB, sinon aller en 1. Guénaël CABANES et Basarab MATEI 13
23 Algorithme Problèmes Méthode Ascendante Hiérarchique Guénaël CABANES et Basarab MATEI 14
24 Introduction Algorithme Problèmes Créer à chaque étape une partition obtenue en agrégeant 2 à 2 les éléments les plus proches (élément = donnée ou groupe de données). L algorithme fournit une hiérarchie de partitions : arbre contenant l historique de la classification et permettant de retrouver n-1 partitions. Nécessité de se munir d une métrique (distance euclidienne,...). Nécessité de fixer une règle pour agréger une donnée ou un groupe de donnée avec un autre groupe : le critère d agrégation. Guénaël CABANES et Basarab MATEI 15
25 Algorithme Introduction Algorithme Problèmes 1 Calculer la matrice de distance entre les n éléments et regrouper les 2 éléments les plus proches. 2 Si toutes les données ne sont pas regroupées en un seul groupe, retourner en 1. 3 Sinon construire le dendrogramme (arbre hiérarchique) et utiliser un critère de qualité (Davies-Bouldin,...) pour choisir la coupure la plus pertinente. 4 En déduire une segmentation des données. Guénaël CABANES et Basarab MATEI 16
26 Algorithme Introduction Algorithme Problèmes Exemple : Guénaël CABANES et Basarab MATEI 17
27 Algorithme Introduction Algorithme Problèmes Exemple : Guénaël CABANES et Basarab MATEI 17
28 Algorithme Introduction Algorithme Problèmes Exemple : Guénaël CABANES et Basarab MATEI 17
29 Algorithme Introduction Algorithme Problèmes Exemple : Guénaël CABANES et Basarab MATEI 17
30 Algorithme Introduction Algorithme Problèmes Exemple : Guénaël CABANES et Basarab MATEI 17
31 Algorithme Introduction Algorithme Problèmes Exemple : Guénaël CABANES et Basarab MATEI 17
32 Problèmes Introduction Algorithme Problèmes Choix de la règle d agrégation Ce choix est très important, avec des règles différentes on obtient des résultats différents! Il existe de nombreuses règles possibles : Distance entre les barycentres des deux éléments. Distance entre les deux données les plus proches des deux éléments. Distance entre les deux données les plus éloignées des deux éléments. Distance moyenne entre une données d un élément et une donnée de l autre élément. Guénaël CABANES et Basarab MATEI 18
33 Introduction Ce sont des algorithmes d apprentissage initialement construits pour la classification binaire. L idée est de rechercher une règle de décision basée sur une séparation par hyperplan de marge optimale. Le principe de l algorithme est d intégrer lors de la phase d apprentissage une estimation de sa complexité pour limiter le phénomène d over-fitting. Méthode qui ne substitue pas au problème déjà compliqué de la classification un problème encore plus complexe comme l estimation d une densité de probabilités (par exemple). Guénaël CABANES et Basarab MATEI 19
34 de l algorithme L algorithme se base principalement sur 3 astuces pour obtenir de très bonnes performances tant en qualité de prédiction qu en complexité de calcul. On cherche l hyperplan comme solution d un problème d optimisation sous-contraintes. La fonction à optimiser intègre un terme de qualité de prédiction et un terme de complexité du modèle. Le passage à la recherche de surfaces séparatrices non linéaires est introduit en utilisant un noyau kernel qui code une transformation non linéaire des données. Numériquement, toutes les équations s obtiennent en fonction de certains produits scalaires utilisant le noyau et certains points de la base de données (ce sont les vecteurs support ). Guénaël CABANES et Basarab MATEI 20
35 Utilisations récentes Dans tout type de problème de classification à deux classes : Classification d images : reconnaissance de visages Interprétation textuelle : détection de Spam Aide au diagnostic biologique De nouveaux centres d intérêts se développent actuellement : Utilisation comme outil de sélection de variables Sparse SVM : modèles parcimonieux pour la classification Contraintes : A priori, capable d utiliser un grand nombre de variables puisque l astuce du noyau envoie le problème dans l espace des individus. Plus il y a d individus dans la base de données et meilleure est la prédiction, mais plus les calculs sont longs... Guénaël CABANES et Basarab MATEI 21
36 Problème On cherche à prédire Y (à valeurs dans { 1, +1}) en fonction de variables explicatives X 1,...X p. Chercher le modèle ˆϕ tel que P(ˆϕ(X) Y) minimale. Guénaël CABANES et Basarab MATEI 22
37 On cherche Guénaël CABANES en plus et Basarab un MATEI modèle23qui maximise la marge de Introduction Pénalisation On va chercher un modèle pénalisé par sa faculté d adaptation aux données Comparer par exemple ceci avec la séparation précédente :
38 Notion de marge Plutôt que d estimer ϕ comme fonction à valeurs dans { 1, 1}, on cherche f telle que ϕ = sgn(f). L erreur de la méthode est alors P(ϕ(X) Y) = P(Y f(x) < 0) On définit alors la quantité Y f(x) comme la marge de f en (X, Y). C est un indice de confiance sur la prédiction. Guénaël CABANES et Basarab MATEI 24
39 Hyperplan séparateur - Mise en équation Dans le cas o la séparation est possible, on choisit celui qui obtient la marge optimale. L hyperplan a une équation de la forme : f(x) =< w, b > +b = 0 où w est orthogonal au plan Un point est bien classé si et seulement si f(x) y > 0 Le jeu de données étant fini, on peut imposer y f(x) 1 La distance entre un point x et l hyperplan H est donnée par d(x, H) = < w, x > +b w = < w, x > +b w Guénaël CABANES et Basarab MATEI 25
40 Recherche de l hyperplan optimal La recherche de l hyperplan optimal revient à trouver w La marge devant être maximale, on cherche w à minimiser min 1 2 w 2 sous les contraintes b t.q. i, < w, x i > +b 1 Ce problème d optimisation est résolu par la méthode primal/dual et la solution s écrit sous la forme n f(x) = λ i y i < x, x i > +b i=1 Ce qu il faut retenir : L équation n utilise que des produits scalaires entre x et x i La résolution est quadratique en n = le nombre d individus La plupart des λ i sont nuls, sauf pour certaines observations, ces observations sont alors les vecteurs support Guénaël CABANES et Basarab MATEI 26
41 Les valeurs aberrantes : Une valeur aberrante est une valeur erronée correspondant à une mauvaise mesure, une erreur de calcul, une erreur de saisie ou une fausse déclaration. Exemples : Dates incohérentes : le 29 février d une année non bissextile, les dates de souscription antérieures à la date de naissance du client Codes sexe prenant plus de deux valeurs différentes Numéros de téléphone avec un nombre de chiffres incorrect Guénaël CABANES et Basarab MATEI 27
42 Les valeurs aberrantes, solutions : Supprimer les observations concernées, si leur nombre n est pas trop élevé et leur distribution suffisamment aléatoire Conserver les observations, en tolérant une petite marge d erreur dans les résultats des modèles Conserver les observations, mais remplacer la valeur aberrante par une autre valeur qui est la plus proche de sa valeur véritable (moyenne...) Conserver les observations mes écarter les variables de la suite de l analyse si elle n est pas jugée vitale Guénaël CABANES et Basarab MATEI 28
43 Les valeurs manquantes : Les valeurs manquantes apparaissent le plus souvent dans les variables déclaratives dont la saisie était facultative est n a pas était faite (ex : les réponses aux enquàłtes). La plupart des méthodes statistiques ne peuvent pas manipuler les données manquantes et les observations correspondantes doivent àłtre laissées de càté Il faut vérifier si les valeurs ne sont pas manquantes aux hasard et s il existe des différences systématiques entre les observations complètes et incomplètes Guénaël CABANES et Basarab MATEI 29
44 Les valeurs manquantes, solutions : Remplacer la valeur manquante par la valeur la plus fréquente (variables qualitatives) ou la moyenne ou la médiane (variables numériques) Ne pas utiliser la variable concernée, si sa contribution à l analyse du problème ne paraàt pas essentielle Traiter la valeur manquante comme une valeur à part entière, contenant une certaine information (ajouter la classe valeurs manquantes) Guénaël CABANES et Basarab MATEI 30
45 Guénaël CABANES et Basarab MATEI 31
46 Introduction Il existe de très nombreuses méthodes de segmentation des données. Les résultats obtenus dépendent : De l algorithme utilisé (K-Moyennes, Méthodes Ascendantes selon la règle d agrégation, MVS,...). De la métrique (distance Euclidienne, distance de Manhattan, distance de Minkowski,...). De l indice de performance (Davies-Bouldin, Calinski-Harabatz, Silhouette,...). Cependant plus les groupes sont compacts et bien séparés, plus les différentes méthodes aurons tendance à donner les màłmes résultats. Guénaël CABANES et Basarab MATEI 32
La classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailObjectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique
Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme
Plus en détailReprésentation d un entier en base b
Représentation d un entier en base b 13 octobre 2012 1 Prérequis Les bases de la programmation en langage sont supposées avoir été travaillées L écriture en base b d un entier est ainsi défini à partir
Plus en détailL ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Plus en détailArbres binaires de décision
1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression
Plus en détailLa Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1
La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La licence Mathématiques et Economie-MASS de l Université des Sciences Sociales de Toulouse propose sur les trois
Plus en détailSouad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/
Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane
Plus en détailProjet de Traitement du Signal Segmentation d images SAR
Projet de Traitement du Signal Segmentation d images SAR Introduction En analyse d images, la segmentation est une étape essentielle, préliminaire à des traitements de haut niveau tels que la classification,
Plus en détailProgrammation linéaire
1 Programmation linéaire 1. Le problème, un exemple. 2. Le cas b = 0 3. Théorème de dualité 4. L algorithme du simplexe 5. Problèmes équivalents 6. Complexité de l Algorithme 2 Position du problème Soit
Plus en détailQuantification Scalaire et Prédictive
Quantification Scalaire et Prédictive Marco Cagnazzo Département Traitement du Signal et des Images TELECOM ParisTech 7 Décembre 2012 M. Cagnazzo Quantification Scalaire et Prédictive 1/64 Plan Introduction
Plus en détailClassification non supervisée
AgroParisTech Classification non supervisée E. Lebarbier, T. Mary-Huard Table des matières 1 Introduction 4 2 Méthodes de partitionnement 5 2.1 Mesures de similarité et de dissimilarité, distances.................
Plus en détailIntroduction au datamining
Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des
Plus en détailESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring
ESSEC Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring Les méthodes d évaluation du risque de crédit pour les PME et les ménages Caractéristiques Comme les montants des crédits et des
Plus en détail3 Approximation de solutions d équations
3 Approximation de solutions d équations Une équation scalaire a la forme générale f(x) =0où f est une fonction de IR dans IR. Un système de n équations à n inconnues peut aussi se mettre sous une telle
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailThéorie et Codage de l Information (IF01) exercices 2013-2014. Paul Honeine Université de technologie de Troyes France
Théorie et Codage de l Information (IF01) exercices 2013-2014 Paul Honeine Université de technologie de Troyes France TD-1 Rappels de calculs de probabilités Exercice 1. On dispose d un jeu de 52 cartes
Plus en détailCours d Analyse. Fonctions de plusieurs variables
Cours d Analyse Fonctions de plusieurs variables Licence 1ère année 2007/2008 Nicolas Prioux Université de Marne-la-Vallée Table des matières 1 Notions de géométrie dans l espace et fonctions à deux variables........
Plus en détailResolution limit in community detection
Introduction Plan 2006 Introduction Plan Introduction Introduction Plan Introduction Point de départ : un graphe et des sous-graphes. But : quantifier le fait que les sous-graphes choisis sont des modules.
Plus en détailLa segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM
La segmentation à l aide de EG-SAS A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM Définition de la segmentation - Au lieu de considérer une population dans son ensemble,
Plus en détailRésolution de systèmes linéaires par des méthodes directes
Résolution de systèmes linéaires par des méthodes directes J. Erhel Janvier 2014 1 Inverse d une matrice carrée et systèmes linéaires Ce paragraphe a pour objet les matrices carrées et les systèmes linéaires.
Plus en détailCapacité d un canal Second Théorème de Shannon. Théorie de l information 1/34
Capacité d un canal Second Théorème de Shannon Théorie de l information 1/34 Plan du cours 1. Canaux discrets sans mémoire, exemples ; 2. Capacité ; 3. Canaux symétriques ; 4. Codage de canal ; 5. Second
Plus en détailProgrammation Linéaire - Cours 1
Programmation Linéaire - Cours 1 P. Pesneau pierre.pesneau@math.u-bordeaux1.fr Université Bordeaux 1 Bât A33 - Bur 265 Ouvrages de référence V. Chvátal - Linear Programming, W.H.Freeman, New York, 1983.
Plus en détailTSTI 2D CH X : Exemples de lois à densité 1
TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun
Plus en détailStatistiques Descriptives à une dimension
I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des
Plus en détailAgrégation des portefeuilles de contrats d assurance vie
Agrégation des portefeuilles de contrats d assurance vie Est-il optimal de regrouper les contrats en fonction de l âge, du genre, et de l ancienneté des assurés? Pierre-O. Goffard Université d été de l
Plus en détailProgrammes des classes préparatoires aux Grandes Ecoles
Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme
Plus en détailINTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES
INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine
Plus en détailLa programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique
La programmation linéaire : une introduction Qu est-ce qu un programme linéaire? Qu est-ce qu un programme linéaire? Exemples : allocation de ressources problème de recouvrement Hypothèses de la programmation
Plus en détailProgrammation linéaire
Programmation linéaire DIDIER MAQUIN Ecole Nationale Supérieure d Electricité et de Mécanique Institut National Polytechnique de Lorraine Mathématiques discrètes cours de 2ème année Programmation linéaire
Plus en détailIdentification de nouveaux membres dans des familles d'interleukines
Identification de nouveaux membres dans des familles d'interleukines Nicolas Beaume Jérôme Mickolajczak Gérard Ramstein Yannick Jacques 1ère partie : Définition de la problématique Les familles de gènes
Plus en détailRapport de Stage. Titre : Clustering à l aide d une représentation supervisée
Nicolas Creff Du 1er février au 31 juillet 2011 Promotion 2011 Majeure SCIA Rapport de Stage Titre : Clustering à l aide d une représentation supervisée Sujet : Personnalisation de scores à l aide de la
Plus en détailExtraction d informations stratégiques par Analyse en Composantes Principales
Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction
Plus en détailUne comparaison de méthodes de discrimination des masses de véhicules automobiles
p.1/34 Une comparaison de méthodes de discrimination des masses de véhicules automobiles A. Rakotomamonjy, R. Le Riche et D. Gualandris INSA de Rouen / CNRS 1884 et SMS / PSA Enquêtes en clientèle dans
Plus en détailStatistique : Résumé de cours et méthodes
Statistique : Résumé de cours et méthodes 1 Vocabulaire : Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère
Plus en détailLicence Sciences et Technologies Examen janvier 2010
Université de Provence Introduction à l Informatique Licence Sciences et Technologies Examen janvier 2010 Année 2009-10 Aucun document n est autorisé Les exercices peuvent être traités dans le désordre.
Plus en détailOPTIMISATION À UNE VARIABLE
OPTIMISATION À UNE VARIABLE Sommaire 1. Optimum locaux d'une fonction... 1 1.1. Maximum local... 1 1.2. Minimum local... 1 1.3. Points stationnaires et points critiques... 2 1.4. Recherche d'un optimum
Plus en détailThéorie des Jeux Et ses Applications
Théorie des Jeux Et ses Applications De la Guerre Froide au Poker Clément Sire Laboratoire de Physique Théorique CNRS & Université Paul Sabatier www.lpt.ups-tlse.fr Quelques Définitions de la Théorie des
Plus en détailMéthodes de quadrature. Polytech Paris-UPMC. - p. 1/48
Méthodes de Polytech Paris-UPMC - p. 1/48 Polynôme d interpolation de Preuve et polynôme de Calcul de l erreur d interpolation Étude de la formule d erreur Autres méthodes - p. 2/48 Polynôme d interpolation
Plus en détailBaccalauréat ES Pondichéry 7 avril 2014 Corrigé
Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient
Plus en détailSoutenance de stage Laboratoire des Signaux et Systèmes
Soutenance de stage Laboratoire des Signaux et Systèmes Bornes inférieures bayésiennes de l'erreur quadratique moyenne. Application à la localisation de points de rupture. M2R ATSI Université Paris-Sud
Plus en détailOptimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications
Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications A. Optimisation sans contrainte.... Généralités.... Condition nécessaire et condition suffisante
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détailAnalyse dialectométrique des parlers berbères de Kabylie
Saïd GUERRAB Analyse dialectométrique des parlers berbères de Kabylie Résumé de la thèse (pour affichage) Il est difficile de parler du berbère sans parler de la variation. Il y a d abord une variation
Plus en détailApprentissage non paramétrique en régression
1 Apprentissage non paramétrique en régression Apprentissage non paramétrique en régression Résumé Différentes méthodes d estimation non paramétriques en régression sont présentées. Tout d abord les plus
Plus en détailExercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT
Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Ces exercices portent sur les items 2, 3 et 5 du programme d informatique des classes préparatoires,
Plus en détailL apprentissage automatique
L apprentissage automatique L apprentissage automatique L'apprentissage automatique fait référence au développement, à l analyse et à l implémentation de méthodes qui permettent à une machine d évoluer
Plus en détailAlgorithmes d'apprentissage
Algorithmes d'apprentissage 1 Agents qui apprennent à partir d'exemples La problématique : prise de décision automatisée à partir d'un ensemble d'exemples Diagnostic médical Réponse à une demande de prêt
Plus en détailMoments des variables aléatoires réelles
Chapter 6 Moments des variables aléatoires réelles Sommaire 6.1 Espérance des variables aléatoires réelles................................ 46 6.1.1 Définition et calcul........................................
Plus en détailDéfinitions. Numéro à préciser. (Durée : )
Numéro à préciser (Durée : ) On étudie dans ce problème l ordre lexicographique pour les mots sur un alphabet fini et plusieurs constructions des cycles de De Bruijn. Les trois parties sont largement indépendantes.
Plus en détailContexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples,
Non-linéarité Contexte Pour permettre aux algorithmes de cryptographie d être sûrs, les fonctions booléennes qu ils utilisent ne doivent pas être inversées facilement. Pour cela, elles doivent être très
Plus en détailt 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :
Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant
Plus en détailCOURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES
COURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES EPF 4/ 5 ème année - Option Ingénierie d Affaires et de Projets - Finance Bertrand LIAUDET 4 : Modélisation non-supervisée
Plus en détailI. Polynômes de Tchebychev
Première épreuve CCP filière MP I. Polynômes de Tchebychev ( ) 1.a) Tout réel θ vérifie cos(nθ) = Re ((cos θ + i sin θ) n ) = Re Cn k (cos θ) n k i k (sin θ) k Or i k est réel quand k est pair et imaginaire
Plus en détailOscillations libres des systèmes à deux degrés de liberté
Chapitre 4 Oscillations libres des systèmes à deux degrés de liberté 4.1 Introduction Les systèmes qui nécessitent deux coordonnées indépendantes pour spécifier leurs positions sont appelés systèmes à
Plus en détailStéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 04/04/2008 Stéphane Tufféry - Data Mining - http://data.mining.free.fr
Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE 1 Plan du cours Qu est-ce que le data mining? A quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data
Plus en détailExercices du Cours de la programmation linéaire donné par le Dr. Ali DERBALA
75. Un plombier connaît la disposition de trois tuyaux sous des dalles ( voir figure ci dessous ) et il lui suffit de découvrir une partie de chacun d eux pour pouvoir y poser les robinets. Il cherche
Plus en détailProbabilités sur un univers fini
[http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur
Plus en détailCalcul différentiel. Chapitre 1. 1.1 Différentiabilité
Chapitre 1 Calcul différentiel L idée du calcul différentiel est d approcher au voisinage d un point une fonction f par une fonction plus simple (ou d approcher localement le graphe de f par un espace
Plus en détail14. Introduction aux files d attente
14. Introduction aux files d attente MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v2) MTH2302D: Files d attente 1/24 Plan 1. Introduction 2. Modèle M/M/1 3. Modèle M/M/1/K MTH2302D: Files
Plus en détailNombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN
Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Table des matières. Introduction....3 Mesures et incertitudes en sciences physiques
Plus en détailJournées Télécom-UPS «Le numérique pour tous» David A. Madore. david.madore@enst.fr. 29 mai 2015
et et Journées Télécom-UPS «Le numérique pour tous» David A. Madore Télécom ParisTech david.madore@enst.fr 29 mai 2015 1/31 et 2/31 : définition Un réseau de R m est un sous-groupe (additif) discret L
Plus en détailMéthodes d apprentissage statistique «Machine Learning»
Méthodes d apprentissage statistique «Machine Learning» Fabrice TAILLIEU, Sébastien DELUCINGE, Rémi BELLINA Le marché de l assurance a rarement été marqué par un environnement aussi difficile qu au cours
Plus en détailEXERCICES - ANALYSE GÉNÉRALE
EXERCICES - ANALYSE GÉNÉRALE OLIVIER COLLIER Exercice 1 (2012) Une entreprise veut faire un prêt de S euros auprès d une banque au taux annuel composé r. Le remboursement sera effectué en n années par
Plus en détailHistorique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications
L intelligence économique outil stratégique pour l entreprise Professeur Bernard DOUSSET dousset@irit.fr http://atlas.irit.fr Institut de Recherche en Informatique de Toulouse (IRIT) Equipe Systèmes d
Plus en détailCours de méthodes de scoring
UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-
Plus en détailCHAPITRE 5. Stratégies Mixtes
CHAPITRE 5 Stratégies Mixtes Un des problèmes inhérents au concept d équilibre de Nash en stratégies pures est que pour certains jeux, de tels équilibres n existent pas. P.ex.le jeu de Pierre, Papier,
Plus en détailTABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie
PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats Pierre Dagnelie TABLE DES MATIÈRES 2012 Presses agronomiques de Gembloux pressesagro.gembloux@ulg.ac.be www.pressesagro.be
Plus en détail3. Caractéristiques et fonctions d une v.a.
3. Caractéristiques et fonctions d une v.a. MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v2) MTH2302D: fonctions d une v.a. 1/32 Plan 1. Caractéristiques d une distribution 2. Fonctions
Plus en détailProgrammation linéaire et Optimisation. Didier Smets
Programmation linéaire et Optimisation Didier Smets Chapitre 1 Un problème d optimisation linéaire en dimension 2 On considère le cas d un fabricant d automobiles qui propose deux modèles à la vente, des
Plus en détailChapitre 2 : Systèmes radio mobiles et concepts cellulaires
Chapitre 2 : Systèmes radio mobiles et concepts cellulaires Systèmes cellulaires Réseaux cellulaires analogiques de 1ère génération : AMPS (USA), NMT(Scandinavie), TACS (RU)... Réseaux numériques de 2ème
Plus en détailTexte Agrégation limitée par diffusion interne
Page n 1. Texte Agrégation limitée par diffusion interne 1 Le phénomène observé Un fût de déchets radioactifs est enterré secrètement dans le Cantal. Au bout de quelques années, il devient poreux et laisse
Plus en détailFonctions de plusieurs variables
Module : Analyse 03 Chapitre 00 : Fonctions de plusieurs variables Généralités et Rappels des notions topologiques dans : Qu est- ce que?: Mathématiquement, n étant un entier non nul, on définit comme
Plus en détailFiltrage stochastique non linéaire par la théorie de représentation des martingales
Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de
Plus en détailSécurité par compression! ReSIST 2010. Gilles RICHARD IRIT www.irit.fr/bite www.bite.ac.uk
Sécurité par compression! ReSIST 2010 Gilles RICHARD IRIT www.irit.fr/bite www.bite.ac.uk Introduction Sécurité.. intrusion réseau, attaques (DoS,DDoS etc.) virus, etc... spams code injection (SQL,XSS,CSRF,...)
Plus en détailCommunications collectives et ordonnancement en régime permanent pour plates-formes hétérogènes
Loris MARCHAL Laboratoire de l Informatique du Parallélisme Équipe Graal Communications collectives et ordonnancement en régime permanent pour plates-formes hétérogènes Thèse réalisée sous la direction
Plus en détailCours d analyse numérique SMI-S4
ours d analyse numérique SMI-S4 Introduction L objet de l analyse numérique est de concevoir et d étudier des méthodes de résolution de certains problèmes mathématiques, en général issus de problèmes réels,
Plus en détailChapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Plus en détailProjet SINF2275 «Data mining and decision making» Projet classification et credit scoring
Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems
Plus en détailChp. 4. Minimisation d une fonction d une variable
Chp. 4. Minimisation d une fonction d une variable Avertissement! Dans tout ce chapître, I désigne un intervalle de IR. 4.1 Fonctions convexes d une variable Définition 9 Une fonction ϕ, partout définie
Plus en détailConception d un lecteur de musique intelligent basé sur l apprentissage automatique.
Université de Mons Faculté des Sciences Institut d Informatique Service d Algorithmique Conception d un lecteur de musique intelligent basé sur l apprentissage automatique. Mémoire réalisé par Xavier DUBUC
Plus en détailCanevas théoriques du projet sur le poker Partie A
Partie A Dans une partie de poker, particulièrement au Texas Hold em Limit, il est possible d effectuer certains calculs permettant de prendre la meilleure décision. Quelques-uns de ces calculs sont basés
Plus en détailNon-réponse et données manquantes. Sylvie Rousseau & Gilbert Saporta décembre 2011
Non-réponse et données manquantes Sylvie Rousseau & Gilbert Saporta décembre 2011 1 EXEMPLES DE TAUX DE RÉPONSE À CERTAINES ENQUÊTES Pour les enquêtes auprès des entreprises, le taux de non-réponse est
Plus en détailReprésentation des Nombres
Chapitre 5 Représentation des Nombres 5. Representation des entiers 5.. Principe des représentations en base b Base L entier écrit 344 correspond a 3 mille + 4 cent + dix + 4. Plus généralement a n a n...
Plus en détailExamen optimisation Centrale Marseille (2008) et SupGalilee (2008)
Examen optimisation Centrale Marseille (28) et SupGalilee (28) Olivier Latte, Jean-Michel Innocent, Isabelle Terrasse, Emmanuel Audusse, Francois Cuvelier duree 4 h Tout resultat enonce dans le texte peut
Plus en détailAnalyse de la variance Comparaison de plusieurs moyennes
Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction
Plus en détailTravaux pratiques. Compression en codage de Huffman. 1.3. Organisation d un projet de programmation
Université de Savoie Module ETRS711 Travaux pratiques Compression en codage de Huffman 1. Organisation du projet 1.1. Objectifs Le but de ce projet est d'écrire un programme permettant de compresser des
Plus en détailLES TYPES DE DONNÉES DU LANGAGE PASCAL
LES TYPES DE DONNÉES DU LANGAGE PASCAL 75 LES TYPES DE DONNÉES DU LANGAGE PASCAL CHAPITRE 4 OBJECTIFS PRÉSENTER LES NOTIONS D ÉTIQUETTE, DE CONS- TANTE ET DE IABLE DANS LE CONTEXTE DU LAN- GAGE PASCAL.
Plus en détailSimulation de variables aléatoires
Chapter 1 Simulation de variables aléatoires Références: [F] Fishman, A first course in Monte Carlo, chap 3. [B] Bouleau, Probabilités de l ingénieur, chap 4. [R] Rubinstein, Simulation and Monte Carlo
Plus en détailPourquoi l apprentissage?
Pourquoi l apprentissage? Les SE sont basés sur la possibilité d extraire la connaissance d un expert sous forme de règles. Dépend fortement de la capacité à extraire et formaliser ces connaissances. Apprentissage
Plus en détailData Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.
des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le
Plus en détailOptimisation Discrète
Prof F Eisenbrand EPFL - DISOPT Optimisation Discrète Adrian Bock Semestre de printemps 2011 Série 7 7 avril 2011 Exercice 1 i Considérer le programme linéaire max{c T x : Ax b} avec c R n, A R m n et
Plus en détailFormes quadratiques. 1 Formes quadratiques et formes polaires associées. Imen BHOURI. 1.1 Définitions
Formes quadratiques Imen BHOURI 1 Ce cours s adresse aux étudiants de niveau deuxième année de Licence et à ceux qui préparent le capes. Il combine d une façon indissociable l étude des concepts bilinéaires
Plus en détailDe même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que
Introduction. On suppose connus les ensembles N (des entiers naturels), Z des entiers relatifs et Q (des nombres rationnels). On s est rendu compte, depuis l antiquité, que l on ne peut pas tout mesurer
Plus en détailAnalyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I
Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Roxane Duroux 1 Cadre de l étude Cette étude s inscrit dans le cadre de recherche de doses pour des essais cliniques
Plus en détailConventions d écriture et outils de mise au point
Logiciel de base Première année par alternance Responsable : Christophe Rippert Christophe.Rippert@Grenoble-INP.fr Introduction Conventions d écriture et outils de mise au point On va utiliser dans cette
Plus en détailCours de Master Recherche
Cours de Master Recherche Spécialité CODE : Résolution de problèmes combinatoires Christine Solnon LIRIS, UMR 5205 CNRS / Université Lyon 1 2007 Rappel du plan du cours 16 heures de cours 1 - Introduction
Plus en détailContinuité et dérivabilité d une fonction
DERNIÈRE IMPRESSIN LE 7 novembre 014 à 10:3 Continuité et dérivabilité d une fonction Table des matières 1 Continuité d une fonction 1.1 Limite finie en un point.......................... 1. Continuité
Plus en détailL'intelligence d'affaires: la statistique dans nos vies de consommateurs
L'intelligence d'affaires: la statistique dans nos vies de consommateurs Jean-François Plante, HEC Montréal Marc Fredette, HEC Montréal Congrès de l ACFAS, Université Laval, 6 mai 2013 Intelligence d affaires
Plus en détail