Analyse Statistique pour Le Traitement d Enquêtes
|
|
|
- Chantal Blanchard
- il y a 10 ans
- Total affichages :
Transcription
1 DAT 104, année p. 1/90 Analyse Statistique pour Le Traitement d Enquêtes Mastère Développement Agricole Tropical Stéphanie Laffont & Vivien ROSSI UMR ENSAM-INRA Analyse des systèmes et Biométrie [email protected]
2 DAT 104, année p. 2/90 Plan du cours Introduction
3 DAT 104, année p. 2/90 Plan du cours Introduction Traitements préliminaires Le questionnaire L échantillonnage La collecte des données
4 DAT 104, année p. 2/90 Plan du cours Introduction Traitements préliminaires Traitements statistiques Analyse uni-varié des variables : tris à plats, répartition, histogrammes,... Analyse bi-variée des variables : tris croisés, corrélations, test du χ 2,... Analyse multi-variée : ACP, AFC
5 DAT 104, année p. 2/90 Plan du cours Introduction Traitements préliminaires Traitements statistiques Conclusion
6 DAT 104, année p. 3/90 Plan du cours Introduction Traitements préliminaires Traitements statistiques Conclusion
7 DAT 104, année p. 4/90 Détails des phases d une enquête (I) I. L idée
8 DAT 104, année p. 4/90 Détails des phases d une enquête (I) I. L idée 1- Le commanditaire
9 DAT 104, année p. 4/90 Détails des phases d une enquête (I) I. L idée 1- Le commanditaire 2- Le but
10 DAT 104, année p. 4/90 Détails des phases d une enquête (I) I. L idée 1- Le commanditaire 2- Le but 3- La population
11 DAT 104, année p. 4/90 Détails des phases d une enquête (I) I. L idée 1- Le commanditaire 2- Le but 3- La population 4- Les types d informations à collecter
12 DAT 104, année p. 4/90 Détails des phases d une enquête (I) I. L idée 1- Le commanditaire 2- Le but 3- La population 4- Les types d informations à collecter 5- Le budget
13 DAT 104, année p. 5/90 Détails des phases d une enquête (II) II. La préparation
14 DAT 104, année p. 5/90 Détails des phases d une enquête (II) II. La préparation 1- Etude du domaine
15 DAT 104, année p. 5/90 Détails des phases d une enquête (II) II. La préparation 1- Etude du domaine 2- Formulation du problème posé
16 DAT 104, année p. 5/90 Détails des phases d une enquête (II) II. La préparation 1- Etude du domaine 2- Formulation du problème posé 3- Détermination de la population
17 DAT 104, année p. 5/90 Détails des phases d une enquête (II) II. La préparation 1- Etude du domaine 2- Formulation du problème posé 3- Détermination de la population 4- Détermination des objectifs
18 DAT 104, année p. 5/90 Détails des phases d une enquête (II) II. La préparation 1- Etude du domaine 2- Formulation du problème posé 3- Détermination de la population 4- Détermination des objectifs 5- Définition des informations à recueillir
19 DAT 104, année p. 6/90 Détails des phases d une enquête (II) II. La préparation 6- Choix de l échantillon
20 DAT 104, année p. 6/90 Détails des phases d une enquête (II) II. La préparation 6- Choix de l échantillon 7- Choix du mode de collecte
21 DAT 104, année p. 6/90 Détails des phases d une enquête (II) II. La préparation 6- Choix de l échantillon 7- Choix du mode de collecte 8- Rédaction du projet de questionnaire, du guide d entretien
22 DAT 104, année p. 6/90 Détails des phases d une enquête (II) II. La préparation 6- Choix de l échantillon 7- Choix du mode de collecte 8- Rédaction du projet de questionnaire, du guide d entretien 9- Test du projet de questionnaire et guide d entretien
23 DAT 104, année p. 6/90 Détails des phases d une enquête (II) II. La préparation 6- Choix de l échantillon 7- Choix du mode de collecte 8- Rédaction du projet de questionnaire, du guide d entretien 9- Test du projet de questionnaire et guide d entretien 10- Rédaction du questionnaire définitif, du guide d entretien définitif
24 DAT 104, année p. 7/90 Etude du domaine Identifier les éléments pertinents
25 DAT 104, année p. 7/90 Etude du domaine Identifier les éléments pertinents Recueillir un maximum d idées de personnes : compétentes sur le domaine concernées par le problème
26 DAT 104, année p. 8/90 Formulation du problème posé Les options possibles des décisions à prendre Les hypothèses a priori
27 DAT 104, année p. 9/90 Détermination de la population Qui en fait parti? Qui en exclu?
28 DAT 104, année p. 10/90 Détermination des objectifs Les objectifs sont souvent limités par :
29 DAT 104, année p. 10/90 Détermination des objectifs Les objectifs sont souvent limités par : Le budget disponible
30 DAT 104, année p. 10/90 Détermination des objectifs Les objectifs sont souvent limités par : Le budget disponible La longueur du questionnaire acceptable pour l enquêté Aller à l essentiel
31 DAT 104, année p. 10/90 Détermination des objectifs Les objectifs sont souvent limités par : Le budget disponible La longueur du questionnaire acceptable pour l enquêté Aller à l essentiel Les outils de traitements
32 Choix du mode de collecte DAT 104, année p. 11/90
33 DAT 104, année p. 11/90 Choix du mode de collecte Entretien face à face
34 DAT 104, année p. 11/90 Choix du mode de collecte Entretien face à face Questionnaire par enquêteur
35 DAT 104, année p. 11/90 Choix du mode de collecte Entretien face à face Questionnaire par enquêteur Dépouillement de documents
36 DAT 104, année p. 11/90 Choix du mode de collecte Entretien face à face Questionnaire par enquêteur Dépouillement de documents Questionnaire auto administré
37 DAT 104, année p. 11/90 Choix du mode de collecte Entretien face à face Questionnaire par enquêteur Dépouillement de documents Questionnaire auto administré Extraction de fichiers
38 DAT 104, année p. 12/90 Choix de l échantillonnage Définition : Sous ensemble de la population censé la représenter dans son ensemble
39 DAT 104, année p. 12/90 Choix de l échantillonnage Définition : Sous ensemble de la population censé la représenter dans son ensemble Utilité : Limiter le coût de l enquête
40 DAT 104, année p. 12/90 Choix de l échantillonnage Définition : Sous ensemble de la population censé la représenter dans son ensemble Utilité : Limiter le coût de l enquête Relève de la théorie des sondages
41 DAT 104, année p. 13/90 Détails des phases d une enquête (III) III. Recueil des données
42 DAT 104, année p. 13/90 Détails des phases d une enquête (III) III. Recueil des données 1- Approche de l enquêté
43 DAT 104, année p. 13/90 Détails des phases d une enquête (III) III. Recueil des données 1- Approche de l enquêté 2- Soumission des questions
44 DAT 104, année p. 13/90 Détails des phases d une enquête (III) III. Recueil des données 1- Approche de l enquêté 2- Soumission des questions 3- Enregistrement des réponses
45 DAT 104, année p. 14/90 Détails des phases d une enquête (IV) IV. Analyse
46 DAT 104, année p. 14/90 Détails des phases d une enquête (IV) IV. Analyse 1- Codage et transformation des données
47 DAT 104, année p. 14/90 Détails des phases d une enquête (IV) IV. Analyse 1- Codage et transformation des données 2- Analyse univariée
48 DAT 104, année p. 14/90 Détails des phases d une enquête (IV) IV. Analyse 1- Codage et transformation des données 2- Analyse univariée 3- Analyse bivariée
49 DAT 104, année p. 14/90 Détails des phases d une enquête (IV) IV. Analyse 1- Codage et transformation des données 2- Analyse univariée 3- Analyse bivariée 4- Analyse multivariée
50 DAT 104, année p. 15/90 Détails des phases d une enquête (V) V. Rapport et conclusion
51 DAT 104, année p. 15/90 Détails des phases d une enquête (V) V. Rapport et conclusion 1- Structure
52 DAT 104, année p. 15/90 Détails des phases d une enquête (V) V. Rapport et conclusion 1- Structure 2- Contenu
53 DAT 104, année p. 15/90 Détails des phases d une enquête (V) V. Rapport et conclusion 1- Structure 2- Contenu 3- Présentation
54 DAT 104, année p. 16/90 Les Méthodes d échantillonnages Méthodes empiriques : Méthode des unités types Méthode des quotas
55 DAT 104, année p. 16/90 Les Méthodes d échantillonnages Méthodes empiriques : Méthode des unités types Méthode des quotas Méthodes probabilistes Méthodes aléatoires Sondage élémentaire Sondage stratifié Echantillonnage systématique Echantillonnage à plusieurs degrés
56 DAT 104, année p. 17/90 Plan du cours Introduction Traitements préliminaires Traitements statistiques Conclusion
57 DAT 104, année p. 18/90 Introduction du cadre statistique Présentation sous forme d un tableau : r 1,1 r 1,2 r 1,n r 2,1 r 2,2 r 1,n r q,1 r q,2 r q,n
58 DAT 104, année p. 18/90 Introduction du cadre statistique Présentation sous forme d un tableau : r 1,1 r 1,2 r 1,n r 2,1 r 2,2 r 1,n r q,1 r q,2 r q,n r i,j réponse à la i ème question sur le j ème questionnaire, avec i = 1,...,q et j = 1,...,n.
59 DAT 104, année p. 18/90 Introduction du cadre statistique Présentation sous forme d un tableau : r 1,1 r 1,2 r 1,n r 2,1 r 2,2 r 1,n r q,1 r q,2 r q,n La j ème colonne regroupe toutes les réponses du j ème questionnaire.
60 DAT 104, année p. 18/90 Introduction du cadre statistique Présentation sous forme d un tableau : r 1,1 r 1,2 r 1,n r 2,1 r 2,2 r 1,n r q,1 r q,2 r q,n La i ème ligne regroupe toutes les réponses à la i ème question.
61 DAT 104, année p. 18/90 Introduction du cadre statistique Présentation sous forme d un tableau : r 1,1 r 1,2 r 1,n r 2,1 r 2,2 r 1,n r q,1 r q,2 r q,n Toutes les enquêtes peuvent s exprimer sous la forme du tableau ci-dessus
62 DAT 104, année p. 19/90 Formalisation des données La réponse R i à la question Q i, i = 1,...,q, du questionnaire est appelée variable.
63 DAT 104, année p. 19/90 Formalisation des données La réponse R i à la question Q i, i = 1,...,q, du questionnaire est appelée variable. La i ème ligne du tableau précédent rassemble n observations de la variable R i.
64 DAT 104, année p. 19/90 Formalisation des données La réponse R i à la question Q i, i = 1,...,q, du questionnaire est appelée variable. La i ème ligne du tableau précédent rassemble n observations de la variable R i. Deux types de variables : quantitatives et qualitatives Deux traitements différents
65 DAT 104, année p. 20/90 Les types de variables Les variables qantitatives Données numériques Exemples : taille, poids, concentrations, ph,...
66 DAT 104, année p. 21/90 Les types de variables Les variables qalitatives Données non numériques
67 DAT 104, année p. 21/90 Les types de variables Les variables qalitatives Données non numériques Exemples : couleur des yeux, lieu de naissance,...
68 DAT 104, année p. 21/90 Les types de variables Les variables qalitatives Données non numériques Exemples : couleur des yeux, lieu de naissance,... Les modalités sont les valeurs possibles d une variable qualitatives : Modalités ordonnées Ex : Faible, Moyen, Bon, Très Bon Modalités quelconques Ex : Bleu, Vert, Marron
69 DAT 104, année p. 22/90 Plan du cours Introduction Traitements préliminaires Traitements statistiques Analyse uni-varié des variables : tris à plats, répartition, histogrammes,... Analyse bi-variée des variables : tris croisés, corrélations, test du χ 2,... Analyse multi-variée : ACP, AFC Conclusion
70 DAT 104, année p. 23/90 Analyse univariée ou Tris à plats Présentation générale : Soient x 1,...,x n des observations de la variable X Exemple : les n réponses r i1,...,r in de la question Q i.
71 DAT 104, année p. 23/90 Analyse univariée ou Tris à plats Présentation générale : Soient x 1,...,x n des observations de la variable X Exemple : les n réponses r i1,...,r in de la question Q i. Objectif : Résumer l information contenue dans x 1,...,x n
72 DAT 104, année p. 23/90 Analyse univariée ou Tris à plats Présentation générale : Soient x 1,...,x n des observations de la variable X Exemple : les n réponses r i1,...,r in de la question Q i. Objectif : Résumer l information contenue dans x 1,...,x n Moyens : Approches numériques Approches graphiques
73 DAT 104, année p. 23/90 Analyse univariée ou Tris à plats Présentation générale : Soient x 1,...,x n des observations de la variable X Exemple : les n réponses r i1,...,r in de la question Q i. Objectif : Résumer l information contenue dans x 1,...,x n Moyens : Approches numériques Approches graphiques Outils différents suivant que la variables soit qualitative ou quantitative
74 DAT 104, année p. 24/90 Traitements numériques (1 va quant.) Estimation de la valeur centrale de X La moyenne des x 1,,x n : x = 1 n n i=1 x i La médiane des x 1,,x n : x (n/2) le x i du milieu.
75 DAT 104, année p. 24/90 Traitements numériques (1 va quant.) Estimation de la valeur centrale de X La moyenne des x 1,,x n : x = 1 n n i=1 x i La médiane des x 1,,x n : x (n/2) le x i du milieu. La dispersion de X L écart-type à la moyenne : σ = n i=1 (x i x) 2 1 n Les quartiles, le minimum, le maximum
76 DAT 104, année p. 25/90 Traitements numériques (1 va quant.) Exemple, la série de notes : 10, 12, 7, 14, 11, 8, 9, 15, 5, 12, 10.5, 11, 14, 8, 16 Min Q 1 Médiane Q 3 Max
77 DAT 104, année p. 26/90 Traitement graphique (1 va quant.) Histogramme - Représentation des effectifs par classe - Dépendant des classes : nombre et taille Exemple : Les mêmes notes 10, 12, 7, 14, 11, 8, 9, 15, 5, 12, 10.5, 11, 14, 8, 16. Les classes : C 1 = [3 6[, C 2 = [6 9[, C 3 = [9 12[, C 4 = [12 15[, C 5 = [15 18[
78 DAT 104, année p. 27/90 Traitement graphique (1 va quant.) Notes
79 DAT 104, année p. 28/90 Traitements numériques (1 va qualit.) Soient m 1,...,m k les k modalités de X
80 DAT 104, année p. 28/90 Traitements numériques (1 va qualit.) Soient m 1,...,m k les k modalités de X La fréquence de la modalité m i dans l échantillon x 1,...,x n : f i = n i n où n i est le nombre d occurences de la modalité m i dans x 1,...,x n
81 DAT 104, année p. 29/90 Traitements numériques (1 va qualit.) Modalités quelconques Le tableau des fréquences des modalités m 1,...,m k dans x 1,...,x n est Modalités m 1 m 2 m k Fréquences f 1 f 2 f k
82 DAT 104, année p. 30/90 Traitements numériques (1 va qualit.) Modalités ordonnées Le tableau des fréquences des modalités m 1,...,m k dans x 1,...,x n est : Modalités m 1 m 2 m k Fréquences f 1 f 2 f k Fréquences cumulées n 1 n n 1 +n 2 n n 1 + +n k n = 1
83 DAT 104, année p. 31/90 Traitements graphiques (1 va qualit.) Modalités quelconques : Illustration visuelle de la répartition dans les classes Diagramme en batons, histogramme, graphique en secteurs,...
84 DAT 104, année p. 31/90 Traitements graphiques (1 va qualit.) Modalités quelconques : Illustration visuelle de la répartition dans les classes Diagramme en batons, histogramme, graphique en secteurs,... Modalités ordonnées Idem mais il faut respecter l ordre des modalités
85 DAT 104, année p. 32/90 Exemple : modalités quelconques Quel type d engrais utilisez-vous? a : chimiques, b : biologiques c : mélange des deux, d : aucun
86 DAT 104, année p. 32/90 Exemple : modalités quelconques Quel type d engrais utilisez-vous? a : chimiques, b : biologiques c : mélange des deux, d : aucun Réponses : b, b, a, a, c, d, c, b, c, a, d, c, b, a, c, a, b, c, c,b.
87 DAT 104, année p. 32/90 Exemple : modalités quelconques Quel type d engrais utilisez-vous? a : chimiques, b : biologiques c : mélange des deux, d : aucun Réponses : b, b, a, a, c, d, c, b, c, a, d, c, b, a, c, a, b, c, c,b. Le tableau des fréquences : a b c d 5/20 6/20 7/20 2/20
88 Exemple : modalités quelconques DAT 104, année p. 33/90
89 Exemple : modalités quelconques DAT 104, année p. 34/90
90 DAT 104, année p. 35/90 Exemple : modalités ordonnées Comment trouvez-vous le café? TB : Très bon, B : Bon, A : Acceptable, M : Mauvais
91 DAT 104, année p. 35/90 Exemple : modalités ordonnées Comment trouvez-vous le café? TB : Très bon, B : Bon, A : Acceptable, M : Mauvais Réponses : A, B, B, TB, M, A, B, A, TB, M, B, TB, A, A, B, M, M, TB, A, B
92 DAT 104, année p. 36/90 Exemple : modalités ordonnées Tableau des fréquences : TB B A M Fréquences Fréq. cumulées
93 DAT 104, année p. 36/90 Exemple : modalités ordonnées Tableau des fréquences : TB B A M Fréquences Fréq. cumulées Commentaires : 50% des clients apprécient ce café (TB+B) 80% des clients sont satisfaits du café (TB+B+A)
94 Exemple : modalités ordonnées DAT 104, année p. 37/90
95 Exemple : modalités ordonnées DAT 104, année p. 38/90
96 DAT 104, année p. 39/90 Plan du cours Introduction Traitements préliminaires Traitements statistiques Analyse uni-varié des variables : tris à plats, répartition, histogrammes,... Analyse bi-variée des variables : tris croisés, corrélations, test du χ 2,... Analyse multi-variée : ACP, AFC Conclusion
97 DAT 104, année p. 40/90 Analyse bivariée ou Tris Croisés Présentation générale : Soient x 1,...,x n des observations de la variable X et y 1,...,y n des observations conjointes de la variable Y. Exemple : les n réponses à deux questions différentes.
98 DAT 104, année p. 40/90 Analyse bivariée ou Tris Croisés Présentation générale : Soient x 1,...,x n des observations de la variable X et y 1,...,y n des observations conjointes de la variable Y. Exemple : les n réponses à deux questions différentes. Objectif : Etudier le lien entre X et Y
99 DAT 104, année p. 40/90 Analyse bivariée ou Tris Croisés Présentation générale : Soient x 1,...,x n des observations de la variable X et y 1,...,y n des observations conjointes de la variable Y. Exemple : les n réponses à deux questions différentes. Objectif : Etudier le lien entre X et Y Moyens : Approches numériques Approches graphiques
100 DAT 104, année p. 40/90 Analyse bivariée ou Tris Croisés Présentation générale : Soient x 1,...,x n des observations de la variable X et y 1,...,y n des observations conjointes de la variable Y. Exemple : les n réponses à deux questions différentes. Objectif : Etudier le lien entre X et Y Moyens : Approches numériques Approches graphiques Outils différents suivant que les variables soient qualitatives ou quantitatives
101 DAT 104, année p. 41/90 Cas de deux variables quantitatives Recherche d un lien linéaire entre X et Y Coefficient de corrélation linéaire entre X et Y : n i=1 ρ x,y = (x i x)(y i ȳ) σ x σ y
102 DAT 104, année p. 41/90 Cas de deux variables quantitatives Recherche d un lien linéaire entre X et Y Coefficient de corrélation linéaire entre X et Y : n i=1 ρ x,y = (x i x)(y i ȳ) σ x σ y Interprétation de ρ x,y Si ρ x,y est proche de 1, le lien entre X et Y est linaiére Sinon le lien n est pas linéaire (on peut rien dire de plus)
103 DAT 104, année p. 42/90 Cas de deux variables quantitatives Etude graphique du lien entre X et Y Représentation du nuage de points : x 1,...,x n en abscisse et y 1,...,y n Si le nuage a une forme spécifique = il existe un lien Si le nuage n a pas de structure particulière = pas de lien?
104 DAT 104, année p. 43/90 Exemple : deux variables quantitatives X = {4.59, 3.37, 9.33, 4.85, 9.64, 3.68, 6.19, 5.39, 2.43,...} Y = {-0.99, -0.70, -3.31, -1.39, -4.35, 0.84, }. ρ XY = 0.91 proche de 1 = lien linéaire entre X et Y.
105 Exemple : deux variables quantitatives DAT 104, année p. 44/90
106 DAT 104, année p. 45/90 Exemple : deux variables quantitatives X = { -3.03, -4.44, 1.45, -1.83, 0.66, 1.31, -3.69, -0.19,...} Y = { , , 9.57, 37.51, , 6.05,...}. ρ XY = pas proche de 1 = pas de lien linéaire.
107 DAT 104, année p. 46/90 Exemple : deux variables quantitatives il semble exister un lien quadratique entre X et Y
108 DAT 104, année p. 47/90 Cas de deux Variables Qualitatives mx 1,...,mx k les modalités de X.
109 DAT 104, année p. 47/90 Cas de deux Variables Qualitatives mx 1,...,mx k les modalités de X. my 1,...,my l les modalités de Y.
110 DAT 104, année p. 47/90 Cas de deux Variables Qualitatives mx 1,...,mx k les modalités de X. my 1,...,my l les modalités de Y. n ij est l effectif de l intersection des modalités mx i et my j.
111 DAT 104, année p. 47/90 Cas de deux Variables Qualitatives mx 1,...,mx k les modalités de X. my 1,...,my l les modalités de Y. n ij est l effectif de l intersection des modalités mx i et my j. n i = l j=1 n ij (i.e. l effectif de la modalité mx i ).
112 DAT 104, année p. 47/90 Cas de deux Variables Qualitatives mx 1,...,mx k les modalités de X. my 1,...,my l les modalités de Y. n ij est l effectif de l intersection des modalités mx i et my j. n i = l j=1 n ij (i.e. l effectif de la modalité mx i ). n j = k i=1 n ij (i.e. l effectif de la modalité my j ).
113 DAT 104, année p. 48/90 Le tableau de contingence my 1 my j my l mx 1 n 11 n 1j n 1l n mx i n i1 n ij n il n i.... mx k n k1 n kj n kl n k n 1 n j n l n La constitution de ce tableau est l opération appelée tri croisé.
114 DAT 104, année p. 49/90 Test d indépendance du χ 2 (2 va qualit.) Caractériser l indépendance entre deux variables X et Y est très utile dans une étude et en particulier pour une enquête.
115 DAT 104, année p. 49/90 Test d indépendance du χ 2 (2 va qualit.) Caractériser l indépendance entre deux variables X et Y est très utile dans une étude et en particulier pour une enquête. La mesure de liaison d 2 entre X et Y est d 2 = k i=1 l j=1 (n ij n i n j n )2 n i n j n
116 DAT 104, année p. 49/90 Test d indépendance du χ 2 (2 va qualit.) Caractériser l indépendance entre deux variables X et Y est très utile dans une étude et en particulier pour une enquête. La mesure de liaison d 2 entre X et Y est d 2 = k i=1 l j=1 (n ij n i n j n )2 n i n j n Si les variables X et Y sont indépendantes d 2 suit approximativement une loi de χ 2 (l 1)(k 1).
117 DAT 104, année p. 50/90 Test d indépendance du χ 2 (2 va qualit.) Sous l hypothèse que X et Y sont indépendantes, on connait donc les valeurs vraisemblables que peut prendre d 2
118 DAT 104, année p. 50/90 Test d indépendance du χ 2 (2 va qualit.) Sous l hypothèse que X et Y sont indépendantes, on connait donc les valeurs vraisemblables que peut prendre d 2 Si d 2 est supérieur à la valeur critique vc qu une variable χ 2 (l 1)(k 1) à une probabilité α de dépasser alors on rejettera l hypothèse d indépendance de X et Y.
119 DAT 104, année p. 51/90 Test d indépendance du χ 2 (2 va qualit.) La valeur critique vc est définie par P(χ 2 (l 1)(k 1) > vc) = α pour trouver vc on doit utiliser des tables de probabilité.
120 DAT 104, année p. 51/90 Test d indépendance du χ 2 (2 va qualit.) La valeur critique vc est définie par P(χ 2 (l 1)(k 1) > vc) = α pour trouver vc on doit utiliser des tables de probabilité. Si d 2 < vc, on accepte l hypthotèse d indépendance de X et Y au seuil α Sinon on la rejette.
121 DAT 104, année p. 51/90 Test d indépendance du χ 2 (2 va qualit.) La valeur critique vc est définie par P(χ 2 (l 1)(k 1) > vc) = α pour trouver vc on doit utiliser des tables de probabilité. Si d 2 < vc, on accepte l hypthotèse d indépendance de X et Y au seuil α Sinon on la rejette. Bien entendu, si d 2 et vc sont proches il est préférable de mitiger la conclusion.
122 DAT 104, année p. 52/90 Exemple : 2 va qualit. Q 1 Comment trouvez-vous le café? R 1 1-TB très bon, 2-B bon, 3-A acceptable, 4-M mauvais
123 DAT 104, année p. 52/90 Exemple : 2 va qualit. Q 1 Comment trouvez-vous le café? R 1 1-TB très bon, 2-B bon, 3-A acceptable, 4-M mauvais Q 2 Comment jugez-vous la qualité du service? R 2 1-S satisfaisante, 2-C convenable, 3-Insuffisante
124 DAT 104, année p. 52/90 Exemple : 2 va qualit. Q 1 Comment trouvez-vous le café? R 1 1-TB très bon, 2-B bon, 3-A acceptable, 4-M mauvais Q 2 Comment jugez-vous la qualité du service? R 2 1-S satisfaisante, 2-C convenable, 3-Insuffisante R 1 : 1TB, 2B, 3A, 2B, 2B, 3A, 4M, 2B, 1TB, 3A, 4M, 3A, 2B, 2B, 2B, 1TB, 2B, 3A, 4M, 2B, 2B, 1TB, 2B, 4M, 3A, 1TB R 2 : 1S, 1S, 2C, 3I, 1S, 2C, 2C, 2C, 3I, 3I, 3I, 2C, 1S, 2C, 2C, 1S, 1S, 3I, 3I, 1S, 1S, 1S, 3I, 3I, 2C, 1S.
125 DAT 104, année p. 53/90 Exemple : 2 va qualit. Tri croisé des variables café et service : Figure 1: Tableau de contingence
126 Exemple : 2 va qualit. DAT 104, année p. 54/90
127 DAT 104, année p. 55/90 Exemple : 2 va qualit. Commentaires : -Les clients semblent avoir la même opinion concernant le café et le service. -Y aurait-il une dépendance entre les deux variables?
128 DAT 104, année p. 55/90 Exemple : 2 va qualit. Commentaires : -Les clients semblent avoir la même opinion concernant le café et le service. -Y aurait-il une dépendance entre les deux variables? Effectuons un test statistique afin d approfondir la question. Test d indépendance du χ 2 réalisé avec StatBox :
129 Exemple : 2 va qualit. Variable en lignes : Café Variable en colonnes : Service Tests d indépendance entre les lignes et les colonnes du tableau de contingence : Valeur observée du khi 2 (ddl = 6) : 14,28 P-value associée : 0,03 Le test étant unilatéral, la p-value est comparée au seuil de signification : alpha= 0,05 Valeur critique du khi 2 (ddl = 6) : 12,57 Conclusion : Au seuil de signification alpha= 0,05 on peut rejeter l hypothèse nulle d indépendance entre les lignes et les colonnes. Autrement dit, la dépendance entre les lignes et les colonnes est significative DAT 104, année p. 56/90
130 DAT 104, année p. 57/90 Plan du cours Introduction Traitements préliminaires Traitements statistiques Analyse uni-varié des variables : tris à plats, répartition, histogrammes,... Analyse bi-variée des variables : tris croisés, corrélations, test du χ 2,... Analyse multi-variée : ACP, AFC Conclusion
131 DAT 104, année p. 58/90 Analyse multi-variée Formalisations Les n points sujets : p variables par individu 1 er sujet (x 11 x 12 x 1p ) 2 ème sujet (x 21 x 22 x 2p ).. n ème sujet (x n1 x n2 x np )
132 DAT 104, année p. 58/90 Analyse multi-variée Formalisations Les p points variables : n individus par variable V 1 V 2 V p x 11 x 12 x 1p x 21 x 22.. x 2p. x n1 x n2 x np
133 DAT 104, année p. 58/90 Analyse multi-variée Formalisations Objectif : Etudier globalement toutes les variables et tous les individus
134 DAT 104, année p. 58/90 Analyse multi-variée Formalisations Objectif : Etudier globalement toutes les variables et tous les individus Moyens : Variables quantitatives : ACP Variables qualitatives : AFC
135 DAT 104, année p. 59/90 Variables quantitatives : ACP Difficulté : n et p sont souvent supérieurs à 10 ou 20 Les points sujets ou variables sont dans un espace de dimension élevée
136 DAT 104, année p. 59/90 Variables quantitatives : ACP Difficulté : n et p sont souvent supérieurs à 10 ou 20 Les points sujets ou variables sont dans un espace de dimension élevée Extraction d un espace de dimension plus petite contenant beaucoup d information l ACP
137 DAT 104, année p. 59/90 Variables quantitatives : ACP Difficulté : n et p sont souvent supérieurs à 10 ou 20 Les points sujets ou variables sont dans un espace de dimension élevée Extraction d un espace de dimension plus petite contenant beaucoup d information l ACP Illustration en dimension 3 (3 variables)
138 Variables quantitatives : ACP DAT 104, année p. 60/90
139 DAT 104, année p. 61/90 Première composante principale Première composante : direction suivant laquelle le nuage est le plus étiré
140 DAT 104, année p. 62/90 Seconde composante principale Projection des individus sur le plan perpendiculaire à la première composante :
141 DAT 104, année p. 63/90 Seconde composante principale Deuxième composante : direction selon laquelle le nuage des projections est le plus étendu
142 DAT 104, année p. 64/90 Remarques générales sur l ACP Représentation graphique optimisée Réduit la dimension en conservant un maximum d information Préserve au mieux la disposition originale des points
143 DAT 104, année p. 64/90 Remarques générales sur l ACP Représentation graphique optimisée Réduit la dimension en conservant un maximum d information Préserve au mieux la disposition originale des points ACP normalisée? Quand? Si les données ont des échelles très différentes Pourquoi? Pour ne pas donner trop d importance aux variables qui ont les plus grandes valeurs
144 DAT 104, année p. 65/90 Exemple de réalisation d une ACP Les notes d une classe de collège : Maths Physique Français Sc.Nat. Anglais Histoire Elève 1 18,00 13,00 2,00 11,00 9,00 7,00 Elève 2 18,00 14,00 2,00 12,00 8,00 6,00 Elève 3 14,00 11,00 6,00 10,00 11,00 9,00 Elève 4 5,00 8,00 15,00 10,00 14,00 12,00 Elève 5 14,00 14,00 6,00 12,00 8,00 6,00 Elève 6 1,00 0,00 19,00 0,00 20,00 20,00 Elève 7 8,00 6,0 0 12,00 8,00 16,00 14,00 Elève 8 12,00 10,00 8,00 10,00 12,00 10,00 Elève 9 17,00 13,00 3,00 11,00 9,00 7,00 Elève 10 11,00 12,00 9,00 10,00 10,00 8, Elève 18 14,00 10,00 6,00 10,00 12,00 10,00
145 Traitements de base du jeu de données Notes DAT 104, année p. 66/90 Exemple de réalisation d une ACP Première étape tris à plats :
146 DAT 104, année p. 67/90 Exemple de réalisation d une ACP Représentation graphique globale : Box plots
147 Exemple de réalisation d une ACP Représentation graphique par variable : histogrammes Histogramme des notes de Math DAT 104, année p. 68/90
148 DAT 104, année p. 69/90 Exemple de réalisation d une ACP Deuxième étape : étude des corrélations
149 DAT 104, année p. 70/90 Exemple de réalisation d une ACP Etude numérique des corrélations : Matrice des corrélations Beaucoup de liens linéaires : Entre Math et Français Entre Physique Sc.Nat, Anglais et Histoire
150 DAT 104, année p. 71/90 Exemple de réalisation d une ACP Calcul des composantes principales : Les valeurs propres :
151 DAT 104, année p. 71/90 Exemple de réalisation d une ACP Calcul des composantes principales : Les valeurs propres :
152 DAT 104, année p. 72/90 Exemple de réalisation d une ACP Les vecteurs propres associés i.e. les composantes principales
153 DAT 104, année p. 73/90 Exemple de réalisation d une ACP Les deux premiers axes principaux : F1 = 0.34*Maths *Physique *Français * Science Nat F2 = 0.62*Maths *Physique *Français *Science Nat expliquent 98,42% de la variance : c est exceptionnel!
154 DAT 104, année p. 74/90 Exemple de réalisation d une ACP Représentation des variables dans le plan principal (F1,F2) :
155 DAT 104, année p. 75/90 Exemple de réalisation d une ACP Représentation des individus sur le premier plan principal:
156 DAT 104, année p. 76/90 Exemple de réalisation d une ACP Représentation des individus et variables sur le premier plan principal:
157 DAT 104, année p. 77/90 Exemple de réalisation d une ACP Graphique très utile pour faire les commentaires Attention : éviter l interprétation simultanée variable-individu
158 DAT 104, année p. 78/90 Plan du cours Introduction Traitements préliminaires Traitements statistiques Analyse uni-varié des variables : tris à plats, répartition, histogrammes,... Analyse bi-variée des variables : tris croisés, corrélations, test du χ 2,... Analyse multi-variée : ACP, AFC Conclusion
159 DAT 104, année p. 79/90 Variables qualitatives : AFC Adaptation de l ACP au cas des variables qualitatives
160 DAT 104, année p. 79/90 Variables qualitatives : AFC Adaptation de l ACP au cas des variables qualitatives Les principales différences entre AFC et ACP AFC : Chaque modalité d une variable est représentée par un point ACP : Chaque variable est représentée par un point
161 DAT 104, année p. 79/90 Variables qualitatives : AFC Adaptation de l ACP au cas des variables qualitatives Les principales différences entre AFC et ACP ACP : sa qualité est évaluée sur le pourcentage de la variance restitué AFC : plus délicat, car les variances restituées par les valeurs propres sont sous estimées
162 DAT 104, année p. 79/90 Variables qualitatives : AFC Adaptation de l ACP au cas des variables qualitatives Les principales différences entre AFC et ACP AFC : Ajout de variables illustratives n intervenant pas dans le calcul des axes principaux Aide à l interprétation
163 DAT 104, année p. 80/90 Exemple de réalisation d une AFC On a demandé aux élèves de classer les matières par ordre de préférence :
164 DAT 104, année p. 81/90 Exemple de réalisation d une AFC Toutes les variables sont qualitatives = AFC
165 DAT 104, année p. 81/90 Exemple de réalisation d une AFC Toutes les variables sont qualitatives = AFC On considère alors toutes les variables suivantes : Math.a, Math.b, Math.c, Math.d, Math.e, Math.f, Phy.a, Phy.b, Phy.c, Phy.e, Phy.f, Fran.a, Fran.c, Fran.d, Fran.e, Fran.f, ScNat.b, ScNat.c, ScNat.d, ScNat.f, Ang.a, Ang.b, Ang.c, Ang.d, Ang.e, Hist.b, Hist.c, Hist.d, Hist.e et Hist.f
166 DAT 104, année p. 82/90 Exemple de réalisation d une AFC Etude des valeurs propres :
167 DAT 104, année p. 83/90 Exemple de réalisation d une AFC Histogramme des valeurs propres : Le premier plan principal restitue 73.47% de la variance = Il restitue suffisament d information pour faire une interpréta- -tion des données.
168 DAT 104, année p. 84/90 Exemple de réalisation d une AFC Représentation des variables sur le plan principal :
169 DAT 104, année p. 85/90 Exemple de réalisation d une AFC Ajoutons deux variables illustratives : Moy.Fran (1 ou 2) Moy.Math (1 ou 2)
170 DAT 104, année p. 86/90 Exemple de réalisation d une AFC Représentation de ces variables illustratives :
171 DAT 104, année p. 87/90 Exemple de réalisation d une AFC Interprétations Les élèves qui ont la moyenne en Français et pas la moyenne en Math préfèrent les matières littéraires
172 DAT 104, année p. 87/90 Exemple de réalisation d une AFC Interprétations Les élèves qui ont la moyenne en Français et pas la moyenne en Math préfèrent les matières littéraires Les élèves qui ont la moyenne en Math et pas la moyenne en Français préfèrent les matières scientifiques
173 DAT 104, année p. 88/90 Exemple de réalisation d une AFC Interprétations Il émerge quatre groupes dans la classe Groupe 1 : Littéraire avec préférence Anglais-Histoire Groupe 2 : Scientifique avec préférence Physique-Sc.Nat Groupe 3 : Scientifique avec préférence Math Groupe 4 : Littéraire avec préférence Français
174 DAT 104, année p. 89/90 Conclusion : Traitement d enquête La création du questionnnaire est une étape fondamentale Bien adapter les questions au problème que l on se pose et aux traitements qu on souhaite leur faire subir.
175 DAT 104, année p. 89/90 Conclusion : Traitement d enquête La création du questionnnaire est une étape fondamentale Bien adapter les questions au problème que l on se pose et aux traitements qu on souhaite leur faire subir. Utilisation des outils statistiques généraux fonctionnement facilité pour des données de bonnes qualités
176 DAT 104, année p. 90/90 Conclusion : Outils statistiques Nombre et Nature des variables Méthodes 1 variable quantitative histogramme, box plots 1 variable qualitative diagramme à secteur 2 variables quantitatives nuage de points 2 variables qualitatives tableau de contingence k variables quantitatives ACP k variables qualitatives AFC
Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS
Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence
Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie
Partie I : Séries statistiques descriptives univariées (SSDU) A Introduction Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie et tous sont organisés selon le même
Séries Statistiques Simples
1. Collecte et Représentation de l Information 1.1 Définitions 1.2 Tableaux statistiques 1.3 Graphiques 2. Séries statistiques simples 2.1 Moyenne arithmétique 2.2 Mode & Classe modale 2.3 Effectifs &
Traitement des données avec Microsoft EXCEL 2010
Traitement des données avec Microsoft EXCEL 2010 Vincent Jalby Septembre 2012 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation
SPHINX Logiciel de dépouillement d enquêtes
SPHINX Logiciel de dépouillement d enquêtes sphinx50frversion4.doc 1 Les trois stades du SPHINX sont ceux que comporte habituellement toute enquête d opinion: Elaboration du questionnaire (fiche outil
Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.
Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction. Etudes et traitements statistiques des données : le cas illustratif de la démarche par sondage INTRODUCTION
Statistiques Descriptives à une dimension
I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des
UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES
Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,
Cycle de formation certifiante Sphinx
Cycle de formation certifiante Sphinx 28, 29, 30 Mai 2015 Initiation, Approfondissement et Maîtrise Etudes qualitatives / quantitatives Initiation, approfondissement et maîtrise des études qualitatives
Annexe commune aux séries ES, L et S : boîtes et quantiles
Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans
Aide-mémoire de statistique appliquée à la biologie
Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela
Statistique Descriptive Élémentaire
Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier
Statistique Descriptive Multidimensionnelle. (pour les nuls)
Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Multidimensionnelle (pour les nuls) (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219
Statistique : Résumé de cours et méthodes
Statistique : Résumé de cours et méthodes 1 Vocabulaire : Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère
Chapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Extraction d informations stratégiques par Analyse en Composantes Principales
Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 [email protected] 1 Introduction
données en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier
Statistiques Appliquées à l Expérimentation en Sciences Humaines Christophe Lalanne, Sébastien Georges, Christophe Pallier Table des matières 1 Méthodologie expérimentale et recueil des données 6 1.1 Introduction.......................................
Biostatistiques : Petits effectifs
Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 [email protected] Plan Données Générales : Définition des statistiques Principe de l
Introduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données
Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques
Relation entre deux variables : estimation de la corrélation linéaire
CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence
Analyse en Composantes Principales
Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Localisation des fonctions
MODALISA 7 Localisation des fonctions Vous trouverez dans ce document la position des principales fonctions ventilées selon l organisation de Modalisa en onglets. Sommaire A. Fonctions communes à tous
La classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Estimation et tests statistiques, TD 5. Solutions
ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
VI. Tests non paramétriques sur un échantillon
VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes
Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»
Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences
1 Complément sur la projection du nuage des individus
TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent
La survie nette actuelle à long terme Qualités de sept méthodes d estimation
La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg
Chapitre 3 : INFERENCE
Chapitre 3 : INFERENCE 3.1 L ÉCHANTILLONNAGE 3.1.1 Introduction 3.1.2 L échantillonnage aléatoire 3.1.3 Estimation ponctuelle 3.1.4 Distributions d échantillonnage 3.1.5 Intervalles de probabilité L échantillonnage
Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888
Lecture critique d article Rappels Bio statistiques Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888 Plan du cours Rappels fondamentaux Statistiques descriptives Notions de tests statistiques
Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014
Tests du χ 2 Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014 A. Lourme http://alexandrelourme.free.fr Outline
LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION
LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION Sylvie Gervais Service des enseignements généraux École de technologie supérieure ([email protected]) Le laboratoire des condensateurs
DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES
Agence fédérale pour la Sécurité de la Chaîne alimentaire Administration des Laboratoires Procédure DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES Date de mise en application
t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :
Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant
Pratique de l analyse de données SPSS appliqué à l enquête «Identités et Capital social en Wallonie»
Centre de recherche en démographie et sociétés UCL/IACCHOS/DEMO Pratique de l analyse de données SPSS appliqué à l enquête «Identités et Capital social en Wallonie» 1 2 3+ analyses univariées Type de variables
Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57
Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation
INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES
INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine
PROBABILITES ET STATISTIQUE I&II
PROBABILITES ET STATISTIQUE I&II TABLE DES MATIERES CHAPITRE I - COMBINATOIRE ELEMENTAIRE I.1. Rappel des notations de la théorie des ensemble I.1.a. Ensembles et sous-ensembles I.1.b. Diagrammes (dits
TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.
STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,
Observatoire Economique et Statistique d Afrique Subsaharienne
Observatoire Economique et Statistique d Afrique Subsaharienne Termes de référence pour le recrutement de quatre (4) consultants dans le cadre du Projet «Modules d initiation à la statistique à l attention
Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE
UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables
Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01)
(19) TEPZZ 8 8 4_A_T (11) EP 2 838 241 A1 (12) DEMANDE DE BREVET EUROPEEN (43) Date de publication: 18.02.1 Bulletin 1/08 (1) Int Cl.: H04L 29/06 (06.01) G06F 21/ (13.01) (21) Numéro de dépôt: 141781.4
1. Vocabulaire : Introduction au tableau élémentaire
L1-S1 Lire et caractériser l'information géographique - Le traitement statistique univarié Statistique : le terme statistique désigne à la fois : 1) l'ensemble des données numériques concernant une catégorie
Principe d un test statistique
Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre
Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens
Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques
Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé
Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé A. P. M. E. P. Exercice 1 5 points 1. Réponse d. : 1 e Le coefficient directeur de la tangente est négatif et n est manifestement pas 2e
Statistiques descriptives
Statistiques descriptives L3 Maths-Eco Université de Nantes Frédéric Lavancier F. Lavancier (Univ. Nantes) Statistiques descriptives 1 1 Vocabulaire de base F. Lavancier (Univ. Nantes) Statistiques descriptives
SERIE 1 Statistique descriptive - Graphiques
Exercices de math ECG J.P. 2 ème A & B SERIE Statistique descriptive - Graphiques Collecte de l'information, dépouillement de l'information et vocabulaire La collecte de l information peut être : directe:
Leçon N 4 : Statistiques à deux variables
Leçon N 4 : Statistiques à deux variables En premier lieu, il te faut relire les cours de première sur les statistiques à une variable, il y a tout un langage à se remémorer : étude d un échantillon d
Satisfaction des stagiaires de BRUXELLES FORMATION Résultats 2013
Satisfaction des stagiaires de BRUXELLES FORMATION Résultats 2013 Cahier méthodologique, tableau récapitulatif 2009-2013 et Matrices importance/performance Mars 2014 Service Études et Statistiques Table
Classe de première L
Classe de première L Orientations générales Pour bon nombre d élèves qui s orientent en série L, la classe de première sera une fin d étude en mathématiques au lycée. On a donc voulu ici assurer à tous
Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE
UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction
UNE REPRESENTATION GRAPHIQUE DE LA LIAISON STATISTIQUE ENTRE DEUX VARIABLES ORDONNEES. Éric TÉROUANNE 1
33 Math. Inf. Sci. hum., (33 e année, n 130, 1995, pp.33-42) UNE REPRESENTATION GRAPHIQUE DE LA LIAISON STATISTIQUE ENTRE DEUX VARIABLES ORDONNEES Éric TÉROUANNE 1 RÉSUMÉ Le stéréogramme de liaison est
TABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Programmation linéaire
Programmation linéaire DIDIER MAQUIN Ecole Nationale Supérieure d Electricité et de Mécanique Institut National Polytechnique de Lorraine Mathématiques discrètes cours de 2ème année Programmation linéaire
Logiciel Le Sphinx Plus 2 version 5. Le Sphinx Développement 74650 Chavanod
Logiciel Le Sphinx Plus 2 version 5 Le Sphinx Développement 74650 Chavanod 2005-2006 Plan Présentation générale du logiciel Stade Élaboration du questionnaire Stade Collecte des réponses Stade Traitements
ENQUETE DE SATISFACTION (Guide méthodologique)
Guide méthodologique ENQUETE DE SATISFACTION (Guide méthodologique) L enquête satisfaction tient une place importante dans la gestion de la qualité. Du moment que l organisation attribue un caractère prioritaire
Analyse de la variance Comparaison de plusieurs moyennes
Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction
Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007
Vision industrielle et télédétection - Détection d ellipses Guillaume Martinez 17 décembre 2007 1 Table des matières 1 Le projet 3 1.1 Objectif................................ 3 1.2 Les choix techniques.........................
NOTE SUR LA MODELISATION DU RISQUE D INFLATION
NOTE SUR LA MODELISATION DU RISQUE D INFLATION 1/ RESUME DE L ANALYSE Cette étude a pour objectif de modéliser l écart entre deux indices d inflation afin d appréhender le risque à très long terme qui
Table des matières. I Mise à niveau 11. Préface
Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3
IBM SPSS Statistics Base 20
IBM SPSS Statistics Base 20 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p. 316. Cette version s applique à IBM SPSS
MATHÉMATIQUES. Mat-4104
MATHÉMATIQUES Pré-test D Mat-404 Questionnaire e pas écrire sur le questionnaire Préparé par : M. GHELLACHE Mai 009 Questionnaire Page / 0 Exercice ) En justifiant votre réponse, dites quel type d étude
Résumé du Cours de Statistique Descriptive. Yves Tillé
Résumé du Cours de Statistique Descriptive Yves Tillé 15 décembre 2010 2 Objectif et moyens Objectifs du cours Apprendre les principales techniques de statistique descriptive univariée et bivariée. Être
Étude des Corrélations entre Paramètres Statiques et Dynamiques des Convertisseurs Analogique-Numérique en vue d optimiser leur Flot de Test
11 juillet 2003 Étude des Corrélations entre Paramètres Statiques et Dynamiques des Convertisseurs Analogique-Numérique en vue d optimiser leur Flot de Test Mariane Comte Plan 2 Introduction et objectif
Data mining 1. Exploration Statistique
PUBLICATIONS DU LABORATOIRE DE STATISTIQUE ET PROBABILITÉS Data mining 1 Exploration Statistique ALAIN BACCINI & PHILIPPE BESSE Version septembre 2004 mises à jour : wwwlspups-tlsefr/besse Laboratoire
Lire ; Compter ; Tester... avec R
Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................
Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision
Page n 1. Tests du χ 2 une des fonctions des statistiques est de proposer, à partir d observations d un phénomène aléatoire (ou modélisé comme tel) une estimation de la loi de ce phénomène. C est que nous
La structure de la base de données et l utilisation de PAST. Musée Royal de l Afrique Centrale (MRAC Tervuren)
La structure de la base de données et l utilisation de PAST La structure de la base de données données originales SPÉCIMENS Code des spécimens: Identification des spécimens individuels. Dépend du but de
Licence Economie-Gestion, 1ère Année Polycopié de Statistique Descriptive. Année universitaire : 2014-2015.
Licence Economie-Gestion, 1ère Année Polycopié de Statistique Descriptive. Année universitaire : 2014-2015. Thèmes des séances de TD Thème n.1: Tableaux statistiques et représentations graphiques. Thème
Item 169 : Évaluation thérapeutique et niveau de preuve
Item 169 : Évaluation thérapeutique et niveau de preuve COFER, Collège Français des Enseignants en Rhumatologie Date de création du document 2010-2011 Table des matières ENC :...3 SPECIFIQUE :...3 I Différentes
Analyses multivariées avec R Commander (via le package FactoMineR) Qu est ce que R? Introduction à R Qu est ce que R?
Analyses multivariées avec R Commander Analyses multivariées avec R Commander (via le package FactoMineR) Plate-forme de Support en Méthodologie et Calcul Statistique (SMCS) - UCL 1 Introduction à R 2
L'analyse des données à l usage des non mathématiciens
Montpellier L'analyse des données à l usage des non mathématiciens 2 ème Partie: L'analyse en composantes principales AGRO.M - INRA - Formation Permanente Janvier 2006 André Bouchier Analyses multivariés.
Introduction au Data-Mining
Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane
Le modèle de régression linéaire
Chapitre 2 Le modèle de régression linéaire 2.1 Introduction L économétrie traite de la construction de modèles. Le premier point de l analyse consiste à se poser la question : «Quel est le modèle?». Le
RÉALISATION DE GRAPHIQUES AVEC OPENOFFICE.ORG 2.3
RÉALISATION DE GRAPHIQUES AVEC OPENOFFICE.ORG 2.3 Pour construire un graphique : On lance l assistant graphique à l aide du menu Insérer è Diagramme en ayant sélectionné au préalable une cellule vide dans
La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1
La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La licence Mathématiques et Economie-MASS de l Université des Sciences Sociales de Toulouse propose sur les trois
INTRODUCTION AU DATA MINING
INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre
Théorie des sondages : cours 5
Théorie des sondages : cours 5 Camelia Goga IMB, Université de Bourgogne e-mail : [email protected] Master Besançon-2010 Chapitre 5 : Techniques de redressement 1. poststratification 2. l estimateur
EVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO
EVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO Auteur Baguinébié Bazongo 1 Ingénieur Statisticien Economiste Chef de l Unité de recherche à l Institut national
quelques Repères pour Doctorants
Gilles HUNAULT 2005 quelques Repères en STATISTIQUES pour Doctorants Université d Angers c [email protected] http ://www.info.univ-angers.fr/pub/gh/ 3 Le principe consistant à ne pouvoir affirmer
Chapitre 1. La démarche statistique appliquée au management. Minicas. Questions :
Chapitre 1 La démarche statistique appliquée au management Minicas Comment estimer les dégâts d une catastrophe naturelle (tempêtes, ouragans, etc.)? Aux États-Unis, la FEMA (Federal Emergency Management
Durée de L épreuve : 2 heures. Barème : Exercice n 4 : 1 ) 1 point 2 ) 2 points 3 ) 1 point
03 Mai 2013 Collège Oasis Durée de L épreuve : 2 heures. apple Le sujet comporte 4 pages et est présenté en livret ; apple La calculatrice est autorisée ; apple 4 points sont attribués à la qualité de
INF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
Statistiques à une variable
Statistiques à une variable Calcul des paramètres statistiques TI-82stats.fr? Déterminer les paramètres de la série statistique : Valeurs 0 2 3 5 8 Effectifs 16 12 28 32 21? Accès au mode statistique Touche
La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM
La segmentation à l aide de EG-SAS A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM Définition de la segmentation - Au lieu de considérer une population dans son ensemble,
Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES
LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,
Analyse des correspondances avec colonne de référence
ADE-4 Analyse des correspondances avec colonne de référence Résumé Quand une table de contingence contient une colonne de poids très élevé, cette colonne peut servir de point de référence. La distribution
