Session 1 durée 3 heures
|
|
- Gabin Bouchard
- il y a 8 ans
- Total affichages :
Transcription
1 Université de Nantes Mai 27 Master MIM Examen d'analyse de données Session durée 3 heures Les documents sont interdits. Les calculatrices sont autorisées. Exercice : - Etude d un tableau à l aide d une ACP (7 points) A 2 B C Soit le tableau T = D2 E F x quantitatives x, y, z y décrivant pour les 6 individus A,B,,F les valeurs prises par les variables z / Construction de la matrice des corrélations a. Calculer la moyenne, la variance et les écart-type des variables. b. Déterminer le tableau centré réduit. c. En déduire que la matrice des corrélations est M= d. Interpréter cette matrice. 2/ Ajustement du nuage des individus a. Déterminer les valeurs propres de M. b. Interpréter ces valeurs propres en terme d inertie. En déduire le % d inertie projeté sur chaque axe. c. Déterminer un vecteur propre unitaire associé à λ et λ 2. d. Quelle est la signification des axes définis par ces vecteurs? 3/ Représentation des individus a. Calculer les composantes principales F et F 2. b. Quelle est la signification de F et F 2? c. Placer les individus dans le plan (u,u 2 ) (prendre pour unité 4cm) 4/ Représentation des variables a. Calculer les facteurs principaux G et G 2. b. Quelle est la signification de G et G 2? c. Placer les variables dans le plan (v,v 2 ) et tracer le cercle des corrélations.
2 Exercice 2 : Analyse de documents (7 points) Une entreprise veut choisir un nom pour un nouveau produit, qui doit paraître de qualité supérieure, prestigieux, luxueux, convenant à un public masculin, connaisseur, raffiné, distingué, de niveau socioéconomique élevé... L'entreprise hésite entre 2 marques (cf ère ligne du tableau ci-dessous). Pour faire un choix entre ces marques, un échantillon de clients potentiels a été interrogé. Onze attributs leur étaient proposés (cf. ère colonne du tableau). Pour chaque attribut, la personne interrogée devait désigner une ou plusieurs marques auxquelles l'attribut se rapportait le mieux. Les résultats obtenus sont les suivants : Orly Alezan Corsaire Directoire Ducat Fontenoy Icare Zodiaque Pavois Cocker Escale Hotesse Total Vieillot Nouveauriche Sobreélégant Cocasse Racé Mièvre Distingué Vulgaire Pour un Pour une Pour une petite Total On traite ce tableau par une méthode d'analyse des données multidimensionnelles. Les principaux résultats sont rassemblés dans les tableaux et graphiques ci-dessous :. Fréquences Orly Alezan Corsaire Directoire Ducat Fontenoy Icare Zodiaqu Pavois Cocker Escale Hotesse Total e Vieillot,9%,7%,22% 3,32%,57%,87%,79%,44%,79%,35%,%,9% 9,69% Nouveau-riche,75%,79%,9%,96%,87%,79%,9%,9%,75%,79%,6%,5% 9,6% Sobre-élégant,79% 2,%,9%,3%,6%,96%,52%,7%,6%,5%,26%,48% 9,87% Cocasse,9%,26%,3%,3%,52%,44%,5%,57%,35% 2,8%,7%,7% 9,43% Racé,35% 2,88%,6%,7%,26%,52%,52%,35%,44%,3%,44%,26% 8,65% Mièvre,26%,79%,9%,6%,6%,44%,5%,79%,52%,79%,52%,4% 7,6% Distingué,96%,79%,9%,48%,35%,83%,52%,9%,44%,35%,44% 2,36% 9,69% Vulgaire,35%,35% 2,79%,7%,52%,%,79%,6%,26%,87%,87%,6% 8,2% Pour un,79%,5% 2,%,35%,6%,4%,44%,44%,87%,44%,4%,% 9,26% Pourune,79%,26%,79%,7%,35%,7%,52%,7%,9%,52% 2,% 2,88% 9,78% Pour une petite,6%,44%,7%,6%,96%,7%,52%,96%,79% 2,%,87%,% 8,2% Total 6,8% 9,78% 9,26%,53% 7,25% 7,34% 6,8% 6,2% 6,9%,74% 7,34%,4% %
3 2. Fréquences lignes Orly Alezan Corsaire Directoire Ducat Fonteno Icare Zodiaqu Pavois Cocker Escale Hotesse Total y e Vieillot,9%,8% 2,6% 34,23% 6,22% 9,% 8,% 4,5% 8,% 3,6%,%,9% % Nouveau-riche 8,8% 8,8%,9%,% 9,9% 8,8%,9%,9% 8,8% 8,8% 6,36%,9% % Sobre-élégant 7,96% 2,35%,88% 3,27% 6,9% 9,73% 5,3%,77% 6,9%,62% 2,65% 5,4% % Cocasse,93% 2,78% 3,89% 3,89% 5,56% 4,63%,% 6,67% 3,7% 23,5%,85%,85% % Racé 4,4% 33,33% 7,7% 8,8% 3,3% 6,6% 6,6% 4,4% 5,5% 5,5% 5,5% 3,3% % Mièvre 3,45%,34%,5% 8,5% 8,5% 5,75% 3,79%,34% 6,9%,34% 6,9% 4,94% % Distingué 9,9% 8,%,9% 5,32% 3,6% 8,92% 5,4%,9% 4,5% 3,6% 4,5% 24,32% % Vulgaire 4,26% 4,26% 34,4% 2,3% 6,38%,% 9,57% 7,45% 3,9%,64%,64% 7,45% % Pour un 8,49%,32% 2,7% 3,77% 6,6% 2,26% 4,72% 4,72% 9,43% 4,72% 2,26%,% % Pour une 8,4% 2,68% 8,4% 7,4% 3,57%,79% 5,36% 7,4%,89% 5,36% 2,54% 29,46% % Pour une petite 7,45% 5,32% 2,3% 7,45%,7% 2,3% 6,38%,7% 9,57% 25,53%,64%,% % Total 6,8% 9,78% 9,26%,53% 7,25% 7,34% 6,8% 6,2% 6,9%,74% 7,34%,4% % 3. Fréquences colonnes Orly Alezan Corsaire Directoire Ducat Fontenoy Icare Zodiaque Pavois Cocker Escale Hotesse Total Vieillot,28%,79% 3,2% 28,79% 2,69%,9%,54% 7,4%,39% 3,25%,%,87% 9,69% Nouveauriche 25,64% 8,4%,94% 8,33% 2,5%,7%,28%,4% 25,32% 7,32% 8,33%,43% 9,6% Sobreélégant,54% 2,54%,94%,36% 8,43% 3,% 7,69% 2,82% 8,86% 9,76% 3,57% 4,78% 9,87% Cocasse,28% 2,68% 4,5%,36% 7,23% 5,95% 5,38% 25,35% 5,6% 2,33% 2,38%,74% 9,43% Racé 5,3% 29,46% 6,6% 6,6% 3,6% 7,4% 7,69% 5,63% 6,33% 2,2% 5,95% 2,6% 8,65% Mièvre 3,85% 8,4%,94% 5,3% 8,43% 5,95% 5,38% 2,68% 7,59% 7,32% 7,4%,3% 7,6% Distingué 4,% 8,4%,94% 2,88% 4,82% 25,% 7,69%,4% 6,33% 3,25% 5,95% 23,48% 9,69% Vulgaire 5,3% 3,57% 3,9%,52% 7,23%,%,54% 9,86% 3,8% 8,3%,9% 6,9% 8,2% Pour un,54%,7% 2,7% 3,3% 8,43% 5,48% 6,4% 7,4% 2,66% 4,7% 5,48%,% 9,26% Pour une,54% 2,68% 8,49% 6,6% 4,82% 2,38% 7,69%,27%,27% 4,88% 27,38% 28,7% 9,78% Pour une 8,97% 4,46%,89% 5,3% 3,25% 2,38% 7,69% 5,49%,39% 9,5%,9%,% 8,2% petite Total % % % % %, % % % % % % % 4. Valeurs propres Nombre Valeurs Propres et Inertie de toutes les Dimensions de Dims. Inertie Totale =,6855 Chi 2 = 696,79 dl = p =, ValProp. %age %age Chi 2 Inertie Cumulé,82 29,92 29,92 28,4852 2,33 2,8484 5, ,2368 3,43 7,42 68,95 9,4437 4,82 3,34 82,255 92,954 5,64,537 92, ,383 6,22 3,487 96, ,262 7,, ,88 2,74 8,89,46 99,549,8 9,26, ,9829 3,223,,7,,92
4 5. Résultats relatifs aux lignes NomLigne Coordonnées Ligne et Contributions à l'inertie Standardisation : Profils ligne et colonne Coord Coord Coord Masse Inertie Ctr Cos 2 Ctr Cos 2 Ctr Cos 2... N F F.2 F 3 F F F 2 F 2 F.3 F3 Vieillot,266 -,572,662,97,44,38,78,238,362,48,486 Nouveauriche 2 -,436 -,57 -,7,96,89,,337,8,43,, Sobre-élégant 3 -,49 -,26 -,94,99,48,9,567,35,59,35,27 Cocasse 4,64 -,8,25,94,95,96,66,,23,, Racé 5 -,3 -,27 -,74,86,,,,47,3,4,7 Mièvre 6 -,9,33 -,44,76,28,3,36,,5,,9 Distingué 7 -,667,4,262,97,99,237,74,,,64, Vulgaire 8,686,544,26,82,23,22,57,83,325,, Pour un 9,249,3 -,8,93,68,3,39,2,38,,26 Pour une -,33,779,83,98,33,53,8,447,732,3,4 Pour une petite,292 -,29 -,28,82,72,39,6,,3,37,89 6. Résultats relatifs aux colonnes Nom Col. Coordonnées Colonne et Contributions à l'inertie Standardisation : Profils ligne et colonne Coord. Coord. Coord. Masse Inertie Ctr Cos 2 Ctr Cos 2 Ctr Cos 2 N F F.2 F 3 F F F 2 F 2 F.3 F3 Orly -,452, -,8,68,55,76,49,5,2,4,3 Alezan 2 -,262 -,267 -,723,98,34,37,83,53,86,49,627 Corsaire 3,88,393,25,93,74,332,572,7,35,4,4 Directoire 4 -,34 -,482,484,5,,,2,22,439,259,442 Ducat 5,6 -,288,26,72,33,,94,45,32,47,248 Fontenoy 6 -,395 -,27,52,73,6,63,32,4,46,6,46 Icare 7,267,,55,68,26,27,3,,,2,3 Zodiaque 8,537,4 -,38,62,6,98,492,6,22,,3 Pavois 9 -,6 -,35 -,27,69,48,5,32,48,22,,2 Cocker,322 -,7 -,339,7,78,6,235,,3,8,26 Escale -,35,676 -,8,73,73,,2,252,754,5, Hotesse 2 -,724,552,24,,6,289,54,23,34,44,47
5 , Tracˇ 2D des Coordonnˇes Ligne & Colonne ; Dimension : x 2 Table d'entrˇe (Lignes x Colonnes) : x 2 Standardisation : Profils ligne et colonne,8 Pourune Escale,6,4 Hotesse Vulgaire Corsaire,2, -,2 Orly Distinguˇ Mi vre Nouveau-riche Sobre-ˇlˇgant Fontenoy Alezan Pavois Racˇ Pourun Zodiaque Icare Pourunepetite Cocker Cocasse Ducat -,4 -,6 Directoire Vieillot Dimension 2; Valeur Propre :,3296 (2,85 % d'inertie) -,8 -, -,8 -,6 -,4 -,2,,2,4,6,8, Dimension ; Valeur Propre :,828 (29,92 % d'inertie) ) a) Quelle est la méthode d'analyse utilisée ici? Pourquoi utilise-t-on cette méthode? b) Quelle information nous apporte le test du Khi deux présenté en 4. Coord.L. Coord.C. 2) a) Dans le tableau des fréquences lignes, on lit 2,35% à l'intersection de la ligne "sobre-élégant" et de la colonne "alezan". Comment a été obtenue cette valeur? Que signifie-t-elle? b) Comparer qualitativement le profil de la marque "Corsaire" au profil moyen. 3) a) Au vu du tableau des valeurs propres, combien de variables factorielles faudrait-il étudier dans le cadre d'une étude complète des données observées? b) Quel résultat manque-t-il pour aider au choix des axes? c) Dans cette étude, on se limite aux trois premiers axes. Quel pourcentage d'inertie est expliqué par ces trois axes? 4) a) Rappeler la définition de la notion de qualité de représentation d'un point. b) Les points sont-ils bien représentés dans le plan F-F2? 5) Etude de la première variable factorielle a) On considère le nuage des attributs. Quels sont les individus dont la contribution est supérieure à la moyenne? Pour chacun d'eux, préciser le signe de la coordonnée correspondante. Comment peut-on interpréter cet axe en termes d'opposition entre attributs. b) Même question pour le nuage des marques envisagées. 6) Mener une étude analogue pour la deuxième variable. 7) Faire une synthèse des deux études précédentes en décrivant les résultats obtenus dans le premier plan factoriel. 8) A votre avis, quelle est la marque qui a finalement été retenue par l'entreprise?
6 Exercice 3 : Classification (6 points) Cinq objets sont représentés en grandeur. La distance utilisée entre les objets est la distance euclidienne (mesurée en mm au double-décimètre). I. Construction d'une CAH / Construire le tableau de distance. Les distances seront exprimées en mm (arrondir au mm près). 2/ Effectuer une CAH sur ce tableau en utilisant comme critère d'agrégation celui du "saut minimal". a. Construire tous les tableaux intermédiaires b. Construire le dendrogramme résultant. c. Construire le tableau des distances ultramétriques correspondant. d. Quelle est la partition qui vous semble préférable. En déduire les groupes.
7 II Classification à l'aide de centres mobiles Construire une partition en deux classes des objets à l'aide de la méthode des centres mobiles. On choisira comme premiers centres mobiles les objets et 3. Décrire sur les différentes figures les étapes successives. Etape Etape 2 Etape 3 Etape 4
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détail1 Complément sur la projection du nuage des individus
TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent
Plus en détailExtraction d informations stratégiques par Analyse en Composantes Principales
Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction
Plus en détailL'analyse des données à l usage des non mathématiciens
Montpellier L'analyse des données à l usage des non mathématiciens 2 ème Partie: L'analyse en composantes principales AGRO.M - INRA - Formation Permanente Janvier 2006 André Bouchier Analyses multivariés.
Plus en détailLogiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS
Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence
Plus en détailAnalyse en Composantes Principales
Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées
Plus en détailIntroduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Plus en détailINTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES
INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine
Plus en détailACP Voitures 1- Méthode
acp=princomp(voit,cor=t) ACP Voitures 1- Méthode Call: princomp(x = voit, cor = T) Standard deviations: Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 2.1577815 0.9566721 0.4903373 0.3204833 0.2542759 0.1447788
Plus en détailIntroduction. Préambule. Le contexte
Préambule... INTRODUCTION... BREF HISTORIQUE DE L ACP... 4 DOMAINE D'APPLICATION... 5 INTERPRETATIONS GEOMETRIQUES... 6 a - Pour les n individus... 6 b - Pour les p variables... 7 c - Notion d éléments
Plus en détailDéroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Plus en détailLa segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM
La segmentation à l aide de EG-SAS A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM Définition de la segmentation - Au lieu de considérer une population dans son ensemble,
Plus en détailISFA 2 année 2002-2003. Les questions sont en grande partie indépendantes. Merci d utiliser l espace imparti pour vos réponses.
On considère la matrice de données : ISFA 2 année 22-23 Les questions sont en grande partie indépendantes Merci d utiliser l espace imparti pour vos réponses > ele JCVGE FM1 GM JCRB FM2 JMLP Paris 61 29
Plus en détailScénario: Données bancaires et segmentation de clientèle
Résumé Scénario: Données bancaires et segmentation de clientèle Exploration de données bancaires par des méthodes uni, bi et multidimensionnelles : ACP, AFCM k-means, CAH. 1 Présentation Le travail proposé
Plus en détailSPHINX Logiciel de dépouillement d enquêtes
SPHINX Logiciel de dépouillement d enquêtes sphinx50frversion4.doc 1 Les trois stades du SPHINX sont ceux que comporte habituellement toute enquête d opinion: Elaboration du questionnaire (fiche outil
Plus en détailStatistique Descriptive Multidimensionnelle. (pour les nuls)
Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Multidimensionnelle (pour les nuls) (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219
Plus en détailUFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES
Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,
Plus en détailSéries Statistiques Simples
1. Collecte et Représentation de l Information 1.1 Définitions 1.2 Tableaux statistiques 1.3 Graphiques 2. Séries statistiques simples 2.1 Moyenne arithmétique 2.2 Mode & Classe modale 2.3 Effectifs &
Plus en détail1 - PRESENTATION GENERALE...
Contenu PREAMBULE... 2 INTRODUCTION... 2 1 - PRESENTATION GENERALE... 4 Qualité et optimalité... 8 2 - AGREGATION AUTOUR DE CENTRES MOBILES... 9 2.1 LES BASES DE L'ALGORITHME... 10 2.2 TECHNIQUES CONNEXES...
Plus en détailStatistique : Résumé de cours et méthodes
Statistique : Résumé de cours et méthodes 1 Vocabulaire : Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère
Plus en détailAnalyse des correspondances avec colonne de référence
ADE-4 Analyse des correspondances avec colonne de référence Résumé Quand une table de contingence contient une colonne de poids très élevé, cette colonne peut servir de point de référence. La distribution
Plus en détailt 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :
Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant
Plus en détailPuissances d un nombre relatif
Puissances d un nombre relatif Activités 1. Puissances d un entier relatif 1. Diffusion d information (Activité avec un tableur) Stéphane vient d apprendre à 10h, la sortie d une nouvelle console de jeu.
Plus en détailBaccalauréat ES/L Amérique du Sud 21 novembre 2013
Baccalauréat ES/L Amérique du Sud 21 novembre 2013 A. P. M. E. P. EXERCICE 1 Commun à tous les candidats 5 points Une entreprise informatique produit et vend des clés USB. La vente de ces clés est réalisée
Plus en détailTS Physique Satellite à la recherche de sa planète Exercice résolu
P a g e 1 Phsique atellite à la recherche de sa planète Exercice résolu Enoncé Le centre spatial de Kourou a lancé le 1 décembre 005, avec une fusée Ariane 5, un satellite de météorologie de seconde génération
Plus en détailInitiation à l analyse en composantes principales
Fiche TD avec le logiciel : tdr601 Initiation à l analyse en composantes principales A.B. Dufour & J.R. Lobry Une première approche très intuitive et interactive de l ACP. Centrage et réduction des données.
Plus en détailChapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Plus en détailItems étudiés dans le CHAPITRE N5. 7 et 9 p 129 D14 Déterminer par le calcul l'antécédent d'un nombre par une fonction linéaire
CHAPITRE N5 FONCTIONS LINEAIRES NOTION DE FONCTION FONCTIONS LINEAIRES NOTION DE FONCTION FONCTIONS LINEAIRES NOTION DE FONCTION Code item D0 D2 N30[S] Items étudiés dans le CHAPITRE N5 Déterminer l'image
Plus en détailExemples d utilisation de G2D à l oral de Centrale
Exemples d utilisation de G2D à l oral de Centrale 1 Table des matières Page 1 : Binaire liquide-vapeur isotherme et isobare Page 2 : Page 3 : Page 4 : Page 5 : Page 6 : intéressant facile facile sauf
Plus en détailChapitre 6 Test de comparaison de pourcentages χ². José LABARERE
UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables
Plus en détailLeçon N 4 : Statistiques à deux variables
Leçon N 4 : Statistiques à deux variables En premier lieu, il te faut relire les cours de première sur les statistiques à une variable, il y a tout un langage à se remémorer : étude d un échantillon d
Plus en détailFORMULES DE CALCUL. Prix = PV TTC = PV HT x (1 + taux de TVA) TVA = PV HT x taux de TVA PV HT = PV TTC 1 + taux de TVA
FORMULES DE CALCUL Le prix : Prix = PV TTC = PV HT x (1 + taux de TVA) TVA = PV HT x taux de TVA PV HT = PV TTC 1 + taux de TVA Ex : PV TTC = 250 x 1,196 = 299. TVA = 250 x 19,6 % = 49. PV HT = 299 = 250.
Plus en détailBaccalauréat ES Amérique du Nord 4 juin 2008
Baccalauréat ES Amérique du Nord 4 juin 2008 EXERCICE 1 Commun à tous les candidats f est une fonction définie sur ] 2 ; + [ par : 4 points f (x)=3+ 1 x+ 2. On note f sa fonction dérivée et (C ) la représentation
Plus en détailL'analyse de données. Polycopié de cours ENSIETA - Réf. : 1463. Arnaud MARTIN
L'analyse de données Polycopié de cours ENSIETA - Réf : 1463 Arnaud MARTIN Septembre 2004 Table des matières 1 Introduction 1 11 Domaines d'application 2 12 Les données 2 13 Les objectifs 3 14 Les méthodes
Plus en détailStatistiques Descriptives à une dimension
I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des
Plus en détailFORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)
87 FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) Dans le cadre de la réforme pédagogique et de l intérêt que porte le Ministère de l Éducation
Plus en détailChristophe CANDILLIER Cours de DataMining mars 2004 Page 1
Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe
Plus en détailAnalyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57
Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation
Plus en détailIntroduction au datamining
Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des
Plus en détailSTATISTIQUES DESCRIPTIVES
STATISTIQUES DESCRIPTIVES ORGANISATION DES DONNÉES Etude de population 53 784 56 28 4 13 674 8375 9974 60 Consommation annuelle du lait Dossier n 1 Juin 2005 Tous droits réservés au réseau AGRIMÉDIA Conçu
Plus en détailBACCALAUREAT GENERAL MATHÉMATIQUES
BACCALAUREAT GENERAL FEVRIER 2014 MATHÉMATIQUES SERIE : ES Durée de l épreuve : 3 heures Coefficient : 5 (ES), 4 (L) 7(spe ES) Les calculatrices électroniques de poche sont autorisées, conformement à la
Plus en détailTP 7 : oscillateur de torsion
TP 7 : oscillateur de torsion Objectif : étude des oscillations libres et forcées d un pendule de torsion 1 Principe général 1.1 Définition Un pendule de torsion est constitué par un fil large (métallique)
Plus en détailChapitre 4 : Régression linéaire
Exercice 1 Méthodes statistiques appliquées aux sciences sociales (STAT-D-203) Titulaire : Catherine Vermandele Chapitre 4 : Régression linéaire Le diplôme de Master of Business Administration ou MBA est
Plus en détailBACCALAURÉAT PROFESSIONNEL SUJET
SESSION 203 Métropole - Réunion - Mayotte BACCALAURÉAT PROFESSIONNEL ÉPREUVE E4 CULTURE SCIENTIFIQUE ET TECHNOLOGIQUE : MATHÉMATIQUES Toutes options Durée : 2 heures Matériel(s) et document(s) autorisé(s)
Plus en détailDETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES
Agence fédérale pour la Sécurité de la Chaîne alimentaire Administration des Laboratoires Procédure DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES Date de mise en application
Plus en détailTraitement des données avec Microsoft EXCEL 2010
Traitement des données avec Microsoft EXCEL 2010 Vincent Jalby Septembre 2012 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation
Plus en détailQ6 : Comment calcule t-on l intensité sonore à partir du niveau d intensité?
EXERCICE 1 : QUESTION DE COURS Q1 : Qu est ce qu une onde progressive? Q2 : Qu est ce qu une onde mécanique? Q3 : Qu elle est la condition pour qu une onde soit diffractée? Q4 : Quelles sont les différentes
Plus en détailProbabilités stationnaires d une chaîne de Markov sur TI-nspire Louis Parent, ing., MBA École de technologie supérieure, Montréal, Québec 1
Introduction Probabilités stationnaires d une chaîne de Markov sur TI-nspire Louis Parent, ing., MBA École de technologie supérieure, Montréal, Québec 1 L auteur remercie Mme Sylvie Gervais, Ph.D., maître
Plus en détailFonctions de plusieurs variables
Module : Analyse 03 Chapitre 00 : Fonctions de plusieurs variables Généralités et Rappels des notions topologiques dans : Qu est- ce que?: Mathématiquement, n étant un entier non nul, on définit comme
Plus en détailT de Student Khi-deux Corrélation
Les tests d inférence statistiques permettent d estimer le risque d inférer un résultat d un échantillon à une population et de décider si on «prend le risque» (si 0.05 ou 5 %) Une différence de moyennes
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailEvaluation de la variabilité d'un système de mesure
Evaluation de la variabilité d'un système de mesure Exemple 1: Diamètres des injecteurs de carburant Problème Un fabricant d'injecteurs de carburant installe un nouveau système de mesure numérique. Les
Plus en détailLa structure de la base de données et l utilisation de PAST. Musée Royal de l Afrique Centrale (MRAC Tervuren)
La structure de la base de données et l utilisation de PAST La structure de la base de données données originales SPÉCIMENS Code des spécimens: Identification des spécimens individuels. Dépend du but de
Plus en détailThéorie et Codage de l Information (IF01) exercices 2013-2014. Paul Honeine Université de technologie de Troyes France
Théorie et Codage de l Information (IF01) exercices 2013-2014 Paul Honeine Université de technologie de Troyes France TD-1 Rappels de calculs de probabilités Exercice 1. On dispose d un jeu de 52 cartes
Plus en détailIndividus et informations supplémentaires
ADE-4 Individus et informations supplémentaires Résumé La fiche décrit l usage des individus supplémentaires dans des circonstances variées. En particulier, cette pratique est étendue aux analyses inter
Plus en détailExercice : la frontière des portefeuilles optimaux sans actif certain
Exercice : la frontière des portefeuilles optimaux sans actif certain Philippe Bernard Ingénierie Economique & Financière Université Paris-Dauphine Février 0 On considère un univers de titres constitué
Plus en détailFonctions linéaires et affines. 1 Fonctions linéaires. 1.1 Vocabulaire. 1.2 Représentation graphique. 3eme
Fonctions linéaires et affines 3eme 1 Fonctions linéaires 1.1 Vocabulaire Définition 1 Soit a un nombre quelconque «fixe». Une fonction linéaire associe à un nombre x quelconque le nombre a x. a s appelle
Plus en détailINTRODUCTION AU DATA MINING
INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre
Plus en détailEntrepôt de données 1. Introduction
Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de
Plus en détailQuelques éléments de statistique multidimensionnelle
ANNEXE 1 Quelques éléments de statistique multidimensionnelle Les méthodes d analyse statistique exploratoire utilisées au cours des chapitres précédents visent à mettre en forme de vastes ensembles de
Plus en détailTerminale STMG Lycée Jean Vilar 2014/2015. Terminale STMG. O. Lader
Terminale STMG O. Lader Table des matières Interrogation 1 : Indice et taux d évolution........................... 2 Devoir maison 1 : Taux d évolution................................ 4 Devoir maison 1
Plus en détailMAP 553 Apprentissage statistique
MAP 553 Apprentissage statistique Université Paris Sud et Ecole Polytechnique http://www.cmap.polytechnique.fr/~giraud/map553/map553.html PC1 1/39 Apprentissage? 2/39 Apprentissage? L apprentissage au
Plus en détailLE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION
LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION Sylvie Gervais Service des enseignements généraux École de technologie supérieure (sylvie.gervais@etsmtl.ca) Le laboratoire des condensateurs
Plus en détail«Tous les sons sont-ils audibles»
Chapitre 6 - ACOUSTIQUE 1 «Tous les sons sont-ils audibles» I. Activités 1. Différents sons et leur visualisation sur un oscilloscope : Un son a besoin d'un milieu matériel pour se propager. Ce milieu
Plus en détailINF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
Plus en détailStatistiques avec la graph 35+
Statistiques avec la graph 35+ Enoncé : Dans une entreprise, on a dénombré 59 femmes et 130 hommes fumeurs. L entreprise souhaite proposer à ses employés plusieurs méthodes pour diminuer, voire arrêter,
Plus en détailStructure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données
Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques
Plus en détailDécouverte du logiciel ordinateur TI-n spire / TI-n spire CAS
Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS Mémento Ouvrir TI-Nspire CAS. Voici la barre d outils : L insertion d une page, d une activité, d une page où l application est choisie, pourra
Plus en détailCalcul élémentaire des probabilités
Myriam Maumy-Bertrand 1 et Thomas Delzant 1 1 IRMA, Université Louis Pasteur Strasbourg, France Licence 1ère Année 16-02-2006 Sommaire La loi de Poisson. Définition. Exemple. 1 La loi de Poisson. 2 3 4
Plus en détailSéance 0 : Linux + Octave : le compromis idéal
Séance 0 : Linux + Octave : le compromis idéal Introduction Linux est un système d'exploitation multi-tâches et multi-utilisateurs, basé sur la gratuité et développé par une communauté de passionnés. C'est
Plus en détailTHEME 2. LE SPORT CHAP 1. MESURER LA MATIERE: LA MOLE
THEME 2. LE SPORT CHAP 1. MESURER LA MATIERE: LA MOLE 1. RAPPEL: L ATOME CONSTITUANT DE LA MATIERE Toute la matière de l univers, toute substance, vivante ou inerte, est constituée à partir de particules
Plus en détailPREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE
PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE Jean-Paul Valois, Claude Mouret & Nicolas Pariset Total, 64018 Pau Cédex MOTS CLEFS : Analyse spatiale, ACP, Lissage, Loess PROBLEMATIQUE En analyse multivariée,
Plus en détailSuites numériques. Exercice 1 Pour chacune des suites suivantes, calculer u 1, u 2, u 3, u 10 et u 100 : Introduction : Intérêts simpleset composés.
Suites numériques 1ère STG Introduction : Intérêts simpleset composés. On dispose d un capital de 1 000 euros que l on peut placer de deux façons différentes : à intérêts simples au taux annuel de 10%.
Plus en détailIntroduction à l'analyse multivariée (factorielle) sous R. Stéphane CHAMPELY
Introduction à l'analyse multivariée (factorielle) sous R Stéphane CHAMPELY 7 septembre 2005 2 Table des matières 1 Introduction 5 1.1 Les données multivariées....................... 5 1.2 L'approche factorielle
Plus en détailFeuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.
Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences
Plus en détailStéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 04/04/2008 Stéphane Tufféry - Data Mining - http://data.mining.free.fr
Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE 1 Plan du cours Qu est-ce que le data mining? A quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data
Plus en détailEtudier l influence de différents paramètres sur un phénomène physique Communiquer et argumenter en utilisant un vocabulaire scientifique adapté
Compétences travaillées : Mettre en œuvre un protocole expérimental Etudier l influence de différents paramètres sur un phénomène physique Communiquer et argumenter en utilisant un vocabulaire scientifique
Plus en détailFICHE 1 Fiche à destination des enseignants
FICHE 1 Fiche à destination des enseignants 1S 8 (b) Un entretien d embauche autour de l eau de Dakin Type d'activité Activité expérimentale avec démarche d investigation Dans cette version, l élève est
Plus en détailTravaux pratiques avec RapidMiner
Travaux pratiques avec RapidMiner Master Informatique de Paris 6 Spécialité IAD Parcours EDOW Module Algorithmes pour la Fouille de Données Janvier 2012 Prise en main Généralités RapidMiner est un logiciel
Plus en détailVI. Tests non paramétriques sur un échantillon
VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes
Plus en détailLes probabilités. Chapitre 18. Tester ses connaissances
Chapitre 18 Les probabilités OBJECTIFS DU CHAPITRE Calculer la probabilité d événements Tester ses connaissances 1. Expériences aléatoires Voici trois expériences : - Expérience (1) : on lance une pièce
Plus en détailUNIVERSITÉ DE MONTRÉAL DÉPARTEMENT DE SOCIOLOGIE ************* Cours de niveau gradué en méthodes quantitatives *************
************* Cours de niveau gradué en méthodes quantitatives ************* SOL 6210 - Analyse quantitative avancée Le séminaire d analyse quantitative avancée se donne en classe une fois par année. Chaque
Plus en détailESIEA PARIS 2011-2012
ESIEA PARIS 2011-2012 Examen MAT 5201 DATA MINING Mardi 08 Novembre 2011 Première Partie : 15 minutes (7 points) Enseignant responsable : Frédéric Bertrand Remarque importante : les questions de ce questionnaire
Plus en détailSDLS08 - Modes propres d'une plaque carrée calculés sur base réduite
Titre : SDLS08 - Modes propres d'une plaque carrée calculé[...] Date : 03/08/2011 Page : 1/6 SDLS08 - Modes propres d'une plaque carrée calculés sur base réduite Résumé : Ce cas test a pour objectif de
Plus en détailMRK -6081 A : Méthodes d Analyse de Données en Marketing Automne 2010
E MRK -6081 A : Méthodes d Analyse de Données en Marketing Automne 2010 Professeure :Elissar Toufaily Plage horaire du cours : Cours en salle Jeudi 15h 30-18h30 Local 4221 PAP Du 2 septembre. 2010 au 9
Plus en détailEvaluation de la typicité des vins liés au terroir : proposition de méthodes pour les professionnels de la filière
Evaluation de la typicité des vins liés au terroir : proposition de méthodes pour les professionnels de la filière Ronan SYMONEAUX, Isabelle MAITRE, Frédérique JOURJON UMT VINITERA- Laboratoire GRAPPE
Plus en détailAnnexe commune aux séries ES, L et S : boîtes et quantiles
Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans
Plus en détailStatistiques à deux variables
Statistiques à deux variables Table des matières I Position du problème. Vocabulaire 2 I.1 Nuage de points........................................... 2 I.2 Le problème de l ajustement.....................................
Plus en détailLogistique, Transports
Baccalauréat Professionnel Logistique, Transports 1. France, juin 2006 1 2. Transport, France, juin 2005 2 3. Transport, France, juin 2004 4 4. Transport eploitation, France, juin 2003 6 5. Transport,
Plus en détailStatistique descriptive. Fabrice MAZEROLLE Professeur de sciences économiques Université Paul Cézanne. Notes de cours
Statistique descriptive Fabrice MAZEROLLE Professeur de sciences économiques Université Paul Cézanne Notes de cours Dernière mise à jour le mercredi 25 février 2009 1 ère année de Licence Aix & Marseille
Plus en détailMesures et incertitudes
En physique et en chimie, toute grandeur, mesurée ou calculée, est entachée d erreur, ce qui ne l empêche pas d être exploitée pour prendre des décisions. Aujourd hui, la notion d erreur a son vocabulaire
Plus en détailCOURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES
COURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES EPF 4/ 5 ème année - Option Ingénierie d Affaires et de Projets - Finance Bertrand LIAUDET 4 : Modélisation non-supervisée
Plus en détailLicence MASS 2000-2001. (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7
Feuilles de 1 à 7 Ces feuilles avec 25 exercices et quelques rappels historiques furent distribuées à des étudiants de troisième année, dans le cadre d un cours intensif sur deux semaines, en début d année,
Plus en détailStatistiques 0,14 0,11
Statistiques Rappels de vocabulaire : "Je suis pêcheur et je désire avoir des informations sur la taille des truites d'une rivière. Je décide de mesurer les truites obtenues au cours des trois dernières
Plus en détailÉtalonnage Consolidation au Québec
Étalonnage Consolidation au Québec Fiche de présentation Sommaire 1. Pourquoi participer à cet étalonnage?... 1 2. Composition détaillée du questionnaire... 2 3. Extraits de la synthèse livrée... 3 4.
Plus en détailQuestionnaire sur les Antécédents Linguistiques. (Version 2.0, 2012)
Questionnaire sur les Antécédents Linguistiques (Version 2.0, 2012) Voyez http://cogsci.psu.edu/ pour l usage et crédit en ligne Veuillez fournir vos coordonnées ci-dessous: Nom: Email: Téléphone: Veuillez
Plus en détailPROGRAMME (Susceptible de modifications)
Page 1 sur 8 PROGRAMME (Susceptible de modifications) Partie 1 : Méthodes des revues systématiques Mercredi 29 mai 2013 Introduction, présentation du cours et des participants Rappel des principes et des
Plus en détailActivités numériques [13 Points]
N du candidat L emploi de la calculatrice est autorisé. Le soin, la qualité de la présentation entrent pour 2 points dans l appréciation des copies. Les résultats seront soulignés. La correction est disponible
Plus en détail