Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9

Dimension: px
Commencer à balayer dès la page:

Download "Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9"

Transcription

1 Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9 L analyse de variance à un facteur permet de vérifier, moyennant certaines hypothèses, si un facteur (un critère de classification, celui qui définit les groupes ou les échantillons indépendants) a un effet significatif sur la variable X étudiée. L analyse de variance à 2 ou plusieurs facteurs généralise cette méthode lorsque nous avons plus d un critère de classification. Remarque : on présente souvent dans la littérature le problème de l analyse de variance à un facteur sous la forme d un modèle linéaire comme suit : X ij = µ + a j + e ij où X ij est le score observé du sujet i dans le traitement j, µ la moyenne de la population totale, α l effet du traitement j, et e ij la valeur de l erreur de mesure. j µ et α j sont des constantes qui garderaient les mêmes valeurs respectives si on mesurait plusieurs fois le score du sujet i dans la condition j. Par contre, la valeur de l erreur changerait à chaque nouvelle mesure du même sujet et différerait d un sujet à l autre. Pour la simplicité, nous nous limiterons au cas de deux facteurs, mais la méthode se généralise aisément à plusieurs facteurs. Prenons l exemple suivant : Nous étudions le stress (score de stress = variable X) au sein d une société. Nous repérons les employés suivant leur âge (>/< 50 ans : 1 er facteur à 2 niveaux) et leur niveau de responsabilité (techniciens, cadres inférieurs et cadres supérieurs : second facteur à 3 niveaux). Nous définissons ainsi un plan d expérience à 2 facteurs (ou deux critères de classification) ; on parle encore de plan factoriel 2 x 3 (2 niveaux sur le premier facteur et trois niveaux sur le second). Nous appellerons le premier facteur, le facteur A et le second, le facteur B. Une cellule correspond à un certain niveau du facteur A et un certain niveau du facteur B (par exemple les cadres inférieurs de moins de 50 ans). Dans chaque cellule les sujets sont différents (lorsqu il s agit des mêmes sujets on parle de plan à mesures répétées : ceci fera l objet d une prochaine séance de TP). Lorsqu il y a le même nombre de sujets dans chaque cellule on parlera d un plan balancé ou équilibré sinon nous dirons que le plan est non balancé ou non équilibré. Si nous avons 6 sujets par cellule, nous pouvons visualiser la situation de notre exemple par le tableau suivant : < 50 ans > 50 ans Techniciens XXXXXX XXXXXX Cadre Inf. XXXXXX XXXXXX Cadre Sup. XXXXXX XXXXXX 1

2 Nous allons nous intéresser à la moyenne de X dans chacune des cellules et sur les marges. Dans l exemple considéré, nous obtenons : < 50 ans > 50 ans Techniciens 15,0000 9, ,3333 Cadre Inf. 15, , ,5000 Cadre Sup. 14, , , , , ,0556 Trois types d effets, donc de sources de variation, entrent en jeu : 1. L effet principal du facteur Age (cf moyennes marginales des colonnes): compte non tenu du niveau de responsabilité, l âge a-t-il un effet sur le stress? Donc, 14,89 est-il statistiquement différent de 17,22? Si oui, nous aurons montré la présence d un effet du facteur «âge». Ceci est en fait l objet de l ANOVA à 1 facteur. 2. L effet principal du facteur Niveau responsabilité (cf moyennes marginales des lignes). Compte non tenu de l âge, le niveau de responsabilité a-t-il un effet sur le stress? Donc, 12.33, 15.5 et sont-ils statistiquement différents? Si oui, nous aurons montré la présence d un effet du facteur Niveau de responsabilité. 3. L interaction entre le facteur Age et le facteur niveau de responsabilité. Ici on ne s intéresse plus aux marges, mais aux cellules. Les 6 moyennes sont donc prises en compte. On se demande si l effet de l âge est le même quel que soit le niveau du facteur Niveau de responsabilité, ou si l effet du niveau de responsabilité est le même à chaque niveau du facteur Age. Quand un facteur n a pas les mêmes effets simples principaux à tous les niveaux de l autre facteur, les deux facteurs sont dits en interaction. Une interaction entre 2 facteurs A et B est souvent indiquée par un signe de multiplication : A X B. Les effets principaux et les interactions sont indépendants. Il est donc possible d obtenir des effets principaux significatifs sans interaction significative entre les facteurs ; il est aussi possible d obtenir une interaction significative sans aucun effet principal significatif. Graphiquement si nous représentons les moyennes à travers les niveaux de responsabilités en fixant la tranche d âge, nous obtenons les 2 trajectoires suivantes : 2

3 Estimated Marginal Means of Score de stress 25,00 Tranche d'âge <50ans >50ans Estimated Marginal Means 20,00 15,00 10,00 Techn. Cadre Inf. Niveau de responsabilité Cadre Sup. L examen de ce type de graphique permet de mettre en évidence la présence d une interaction entre les deux facteurs principaux. Sous sa forme linéaire, ce problème de l analyse de variance à deux facteurs s exprime comme suit : X ijk = µ + a j + ß k +? jk + e ijk où µ est la moyenne générale de X, a j l effet du traitement j, ß k l effet du traitement k,? jk l effet de l interaction des traitements j et k, et e ijk est un terme d erreur. Si le facteur A n a pas d effet, tous les a j sont nuls. Si le facteur B n a pas d effet, tous les ß k sont nuls et s il n y a pas d effet de l interaction, tous les? jk sont nuls. Principe de l analyse de variance à 2 facteurs. On se propose de tester trois hypothèses différentes : 1. H 0 il n y a pas d effet principal du facteur A H 1 il y a un effet principal du facteur A 2. H 0 il n y a pas d effet principal du facteur B H 1 il y a un effet principal du facteur B 3. H 0 il n y a pas d interaction entre les facteurs A et B H 1 il y a une interaction entre les facteurs A et B. Comme dans l ANOVA à un facteur pour répondre à ces questions, nous partons de la décomposition de la variabilité totale de X. SS total = SS A + SS B + SS A*B + SS within Notations : Chaque cellule du plan est repérée par deux indices j et k qui renvoient au niveau j du facteur A et au niveau k du facteur B. X ijk est le i ème individu de la cellule (j,k) M est la moyenne générale de X sur l ensemble des observations, 3

4 M j k est la moyenne de X dans la cellule (j,k) M. k est la moyenne de X dans l ensemble des cellules du niveau k du facteur B, M j. est la moyenne de X dans l ensemble des cellules du niveau j du facteur A, n jk = nombre de sujets dans la cellule (j,k) (nous noterons n dans le cas des plans balancés) n. k = le nombre de sujets dans l ensemble des cellules du niveau k du facteur B, n j. = le nombre de sujets dans l ensemble des cellules du niveau j du facteur A, N = Nombre total de sujets, J = nombre de modalités du facteur A, K = nombre de modalités du facteur B La formule de décomposition de la variation totale pour un plan équilibré est la suivante : k j i j k k n n j.. k j ( M ( M n k j i jk ( X j.. k ( X ijk M )² = M )² + M )² + ( M jk ijk M M j. jk M )². k + M )² + De manière résumée cette somme se réécrit : SS total = SS A + SS B + SS A*B + SS within A chaque somme de carrés est associée un nombre de degrés de liberté : Somme : SS total = SS A +SS B + SS A*B + SS within d.l. N-1 J-1 K-1 (J-1)(K-1) N-(J.K) N = Nombre total de sujets, J = nombre de modalités du facteur A, K = nombre de modalités du facteur B Les ratios SS/d.l. définissent les MS (carrés moyens) MS A = SS A / (J-1), MS B = SS B / (K-1), MS A*B = SS A*B / [(J-1).(K-1)], MS within = SS within / (N-1) Sous l hypothèse nulle les ratios MS A /MS within, MS B /MS within, MS A*B /MS within se distribuent suivant une loi F de Fisher-Snédecor : MS A = F J-1, N-1 MS B = F K-1, N-1 MS A*B = F (J-1)(K-1), N-1 Hypothèses : Comme dans l ANOVA à 1 facteur, nous supposerons que la variable X se distribue normalement (suivant une loi Normale) dans chaque cellule (j,k) avec la même variance s² et que les observations sont indépendantes les une des autres (on vérifiera l allure normale par un graphique «box-plot» de X dans chaque cellule). Les échantillons (de chaque cellule) sont indépendants les uns des autres. 4

5 Comparaisons multiples. Comme en analyse de variance à un facteur, on peut procéder à des comparaisons a priori et a posteriori (post hoc) lorsque l ANOVA détecte un ou des effets significatifs. Il est important de toujours contrôler le niveau global de l erreur lors de comparaisons a priori. Ce contrôle se fait automatiquement par SPSS dans le cas des comparaisons «post hoc». Notons encore que les comparaisons post hoc proposées par SPSS ne permettent pas des comparaisons entre les moyennes de deux cellules ; Seules les comparaisons des effets principaux (entre tous les niveaux d un facteur sur les marges) sont proposées au niveau des tests «post hoc». Si l on souhaite faire des comparaisons non planifiées de moyennes entre 2 cellules (à n envisager que s il y a une interaction significative), il convient de passer par un test de Tukey dans une ANOVA à 1 facteur sur la variable croisée A*B (créée par «Transform compute»). Si cette nouvelle variable possède beaucoup de modalités les tests post hoc seront fort conservateurs (et peu puissants). Il est encore possible de faire les comparaisons des moyennes aux différents niveaux d un facteur pour un niveau fixé de l autre (faire «select cases») ; c est l examen d une trajectoire dans le graphique des moyennes décrit ci-dessus. Ces comparaisons se font par un test de Tukey dans une ANOVA à 1 facteur après avoir sélectionné les sujets au niveau donné du second facteur. On peut répéter ainsi l opération pour tous les niveaux du second facteur. Ce type de test permet de déterminer à quel niveau d un facteur un autre facteur du plan exerce ses effets. On parle, dans ce cas, de tests sur les effets simples. Alternatives. L analyse de variance est une procédure robuste qui admet sans trop de problèmes des déviations légères par rapport aux conditions de normalité et d homogénéité des variances. Notons encore qu il n existe pas de test non paramétrique universellement reconnu lorsque la condition de normalité est gravement violée. Effet de taille. Dans l ANOVA 1 facteur, nous avons défini l effet de taille par η² comme la proportion de la variance de X expliquée par le facteur : η² = SS facteur / SS total Dans l ANOVA à 2 facteurs, nous pouvons définir un effet de taille (complet) pour chaque source de variation (facteur A, facteur B et interaction A*B). η² A = SS A / SS total, η² B = SS B / SS total, η² A*B = SS A*B / SS total (Ces effets de taille ne sont pas fournit par SPSS). Par contre, SPSS détermine l effet de taille partiel h² partiel (Partial eta square) η² p(a) = SS A / (SS A + SS within ), η² p(b) = SS B / (SS B + SS within ), η² A*B = SS A*B / (SS A*B + SS within ) 5

6 Exercice 1 On évalue l efficacité d un nouveau traitement ayant pour objet d améliorer le développement global des enfants atteints de trisomie 21. Pour cela, une étude a été menée auprès de 12 enfants. Six d entre eux ont reçu un produit actif alors que 6 autres ont reçu un placebo, et ce pendant 6 mois. Un indice de développement global de chaque enfant est calculé avant et après le début de l étude par un même psychologue. Cet indice de développement global résume l ensemble des capacités en termes de coordination, posture, langage et sociabilité. La nature du traitement donné n est connue ni de la famille ni du patient ni du psychologue. Deux psychologues ont participés à l étude. Les données fournies par l institut J. Lejeune sont reprises dans le fichier HP6-4.sav. Peut-on conclure à l efficacité du traitement? Observe-t-on le même résultat quel que soit le psychologue? Exercice 2 58 participants, dont 30 garçons et 28 filles, ont parcouru aussi vite que possible une distance à la nage. Le temps obtenu a été falsifié de façon à donner une performance moins bonne qu attendu. Une demi-heure plus tard les sujets ont dû re-parcourir et leurs temps ont été à nouveau enregistrés. Les auteurs avaient prédit que lors du second essai, les nageurs les plus pessimistes réaliseraient un moins bon temps et que les optimistes obtiendraient de meilleurs résultats que lors du premier essai. La variable dépendante étudiée est le rapport (ratio) temps1/temps2 ; une valeur supérieure à 1 signife que le nageur à mieux réussi au second essai. Les données sont reprises dans le fichier H13-13.sav Pouvez-vous confirmer la prédiction des auteurs? Ces résultats sont-ils indépendants du genre? Vérifiez par un graphique «box-plot» la condition de normalité ; en cas de doute pour l un ou l autre sous-groupe, effectuez un test de Kolmogorov-Smirnov. Si vous confirmez la prédiction des auteurs, déterminez les cellules présentant des résultats moyens significativement différents. Refaites les analyses sans tenir compte du facteur sexe. Exercice 3 On forme 9 groupes de volontaires qui participent chacun à l expérience suivante : pendant une semaine, les participants sont soumis à des annonces publicitaires visuelles. Selon le groupe, la masse totale de publicité (variable «taux») est nulle situation «sans» -, «moyenne» ou «forte». Les publicités ventent les qualités de trois pseudo-marques de nouilles. L une des marques est dite «dominante» (85 % des publicités), un autre est «survivante» (15 % des publicités) et la troisième est «inexistante» (pas de publicité). On mesure ensuite chez les volontaires par une variable numérique X l impact de l une des pseudo-marques de nouilles son image de marque -. Pour chaque groupe, on mesure l impact d une seule des trois marques. Les neuf groupes sont obtenus par le croisement de la situation S et de la marque M. Les données sont reprises dans le fichier NG2.sav Déterminez les facteurs qui influencent l image de marque du produit. Vérifiez par un graphique Box-plot la condition de normalité de la variable X dans chaque cellule. Tracez les 6

7 trajectoires des moyennes. Le cas échéant (lorsqu un effet est significatif) déterminez les cellules présentant des différences significatives. Interprétez vos résultats. Exercice 4 Dans une expérience on présente à chaque sujet soit oralement soit par écrit un mot qui est soit un mot familier soit un mot non familier. Après une période d attente on interroge le sujet et on calcule le nombre de syllabes non significatives mémorisées. L expérience est réalisée sur 24 sujets répartis en 4 groupes de six et les résultats sont repris dans le fichier LM7.sav Quels sont les facteurs mis en présence? Quelle est la variable étudiée? Quels sont les facteurs qui présentent un effet significatif quant à la variable étudiée? Représentez les trajectoires des moyennes. Exercice 5 Dans une étude consacrée aux processus de mémoire, des animaux ont été testés à une tâche d apprentissage de l évitement. Lors de l essai d apprentissage, les animaux recevaient un stimulus anxiogène dès qu ils franchissaient une certaine ligne. L expérimentateur a distingué trois groupes d animaux selon l endroit du cortex où il leur avait été plantés des électrodes (site neutre, zone A et zone B). Chaque groupe a encore été subdivisé selon le moment de réception de la stimulation électrique (50, 100 ou 150 millièmes de seconde après avoir franchi la ligne et avoir reçu le stimulus anxiogène). Si la zone stimulée du cerveau jouait un rôle dans la mémoire, la stimulation affecterait probablement la consolidation de la mémorisation et retarderait l apprentissage de la réponse d évitement ; l animal n hésiterait pas à franchir à nouveau la ligne. Les données relatives à la latence (temps nécessaire avant de franchir la ligne) sont reprises dans le fichier UL5-3.sav. Quelles sont les facteurs susceptibles d influencer la latence? Effectuez une analyse de variance, représentez les trajectoires des moyennes en fonction de la variable «Délai». Etudier les trois effets simples (un par «site»). Solutions Exercice 1 Les éventuels effets du traitement, du psychologue et de l interaction psy x traitement peuvent être mis en évidence par une analyse de la variance à 2 facteurs (2x2). On utilisera la procédure «Analyze General - Linear Model univariate» avec «indice» comme variable dépendante et les variables «psychologue» et «traitements» comme facteurs à effets fixes ; on sélectionnera le test d homogénéité des variances dans les options et l on choisira les graphiques des moyennes en fonction du traitement avec une trajectoire par psychologue. Au niveau du modèle, nous choisissons le modèle complet (effets principaux + interaction). Le test de Levene ne rejette pas l hypothèse d égalité des variances : 7

8 Levene's Test of Equality of Error Variances(a) Dependent Variable: Augmentation de l'indice de développement global F df1 df2 Sig., ,625 Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a Design: Intercept+Traitement+Psychologue+Traitement * Psychologue Tests of Between-Subjects Effects Dependent Variable: Augmentation de l'indice de développement global Source Type III Sum of Squares df Mean Square F Sig. Partial Eta Squared Corrected Model 2195,713(a) 3 731,904 2,658,120,499 Intercept 34518, , ,367,000,940 Psychologue 44, ,083,160,700,020 Traitement 2043, ,630 7,422,026,481 Psychologue * Traitement 108, ,000,392,549,047 Error 2202, ,339 Total 38916, Corrected Total 4398, a R Squared =,499 (Adjusted R Squared =,311) Estimated Marginal Means of Augmentation de l'indice de développement global 70,0 Psychologue 1 2 Estimated Marginal Means 60,0 50,0 40,0 placebo Traitement produit actif Nous pouvons conclure qu il y a un effet principal significatif du facteur Traitement (F(1,8) = 7,422 ; p = 0.026) ; pas d effet Psychologue significatif (F(1,8) = 0,16 ; p > 0.05) ni d interaction Psychologue x Traitement significative (F(1,8) = ; p > 0.05). Cela signifie que le traitement a un bien un effet positif sur le développement global des enfants atteints de trisomie et que les résultats ne varient pas en fonction du psychologue qui a fait passer le test (pas d effet psy) et que cet effet du traitement est identique quel que soit le psychologue qui a fait passer le test (pas d interaction). 8

9 Exercice 2 Nous sommes en présence de deux facteurs explicatifs : le facteur optimisme «optim» et le facteur «sexe». Nous effectuerons donc une Analyse de variance à 2 facteurs. Par après nous regarderons ce qu une ANOVA à 1 facteur aurait donné ou encore un test t pour échantillons indépendants. Dans un premier temps, nous vérifions la condition de normalité par un graphique «Box-plot clustered» : Nous obtenons le graphique ci-après : 1,150 Sexe garçon fille 1, ,050 1,000 ratio 0,950 0, , ,800 Optimiste optim Pessimiste Les valeurs extrêmes pour le segment «garçon-pessimiste» semble perturber la condition de normalité. Le test de Kolmogorov-Smirnov (limité à ce segment : par «select cases») ne rejette pas la condition de normalité de la variable «ratio» dans ce segment. 9

10 One-Sample Kolmogorov-Smirnov Test ratio N 13 Normal Parameters(a,b) Mean Std. Deviation Most Extreme Absolute.179 Differences Positive.158 Negative Kolmogorov-Smirnov Z.646 Asymp. Sig. (2-tailed).797 a Test distribution is Normal. b Calculated from data. La procédure «Analyze General Linear Model univariate» pour le modèle complet donne les résultats suivants : Le test de Levene ne rejette pas l hypothèse d égalité des variances : Levene's Test of Equality of Error Variances(a) Dependent Variable: ratio F df1 df2 Sig Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a Design: Intercept+Sexe+optim+Sexe * optim Dependent Variable: ratio Tests of Between-Subjects Effects Source Type III Sum of Squares df Mean Square F Sig. Corrected Model.040(a) Intercept Sexe optim Sexe * optim Error Total Corrected Total a R Squared =.174 (Adjusted R Squared =.128) Avec un risqué de 1ère espèce de 5%, nous pouvons conclure qu il y a bien un effet significatif principal du facteur Optimisme (F(1,54) = ; p = 0.035) ainsi qu une interaction Sexe x Optimisme significative (F(1,54) = ; p = 0.038) ; par contre il n y a pas d effet principal Sexe (F(1,54) = ; p >.05). Le graphique des trajectoires des moyennes permet de visualiser ce résultat : 10

11 Estimated Marginal Means of ratio Sexe garçon fille Estimated Marginal Means 1,000 0,975 0,950 Optimiste optim Pessimiste Le graphique semble indiquer qu il n y a pas de différence significative entre garçons et filles optimistes mais bien lorsqu ils sont pessimistes. Pour vérifier ceci, nous devons procéder à des comparaisons «post hoc». SPSS ne fournit ces tests que pour les effets principaux (sur les marges) et uniquement lorsqu il y a plus de 2 modalités par facteur. Dans le cas présent les deux facteurs ont chacun deux modalités donc aucun résultat de comparaison n est disponible. Pour avoir toutes les comparaisons des 4 cellules (Garçon-optimiste, Garçon-pessimiste, Filleoptimiste, Fille-pessimiste) nous créons la variable croisée (optim*sexe) dans une nouvelle variable = 10*optim + sexe : (11 = Garçon-optimiste, 12 = Fille-optimiste, 21 = Garçonpessimiste, 22 = Fille-pessimiste). On effectue ensuite une ANOVA à 1 facteur (cette nouvelle variable) en demandant le test post Hoc de Tukey. Le tableau des comparaisons montre qu il y a bien une différence significative entre les filles et les garçons pessimistes ainsi qu entre les garçons optimistes et pessimistes et qu il n y en en pas entre les filles et les garçons optimistes. Dependent Variable: ratio Tukey HSD Multiple Comparisons (I) croisem Garçon-optim Mean 95% Confidence Interval Difference (J) croisem (I-J) Std. Error Sig. Lower Bound Upper Bound Fille-optim Garçon-pessim (*) Fille-pessim Fille-optim Garçon-optim Garçon-pessim Garçon-pessim Fille-pessim Garçon-optim (*) Fille-optim Fille-pessim (*) Fille-pessim Garçon-optim Fille-optim Garçon-pessim (*) * The mean difference is significant at the.05 level. 11

12 Les garçons pessimistes semblent donc être beaucoup plus affectés par la perception d un échec que les filles pessimistes. Si nous avions effectué une analyse de variance (de la variable ratio) à 1 facteur (optim) nous n aurions pas pu établir qu il y avait une différence entre les optimistes et les pessimistes comme le montre le tableau ci-dessous (p-valeur 6,1 %) : ratio ANOVA Sum of Squares df Mean Square F Sig. Between Groups Within Groups Total Rappelons que l Anova est un test bilatéral ; si l on se rapporte à l hypothèse des auteurs : «lors du second essai, les nageurs les plus pessimistes réaliseraient un moins bon temps et les optimistes obtiendraient de meilleurs résultats» ; un test-t unilatéral est plus approprié et permet de rejeter l hypothèse nulle puisque alors la p-valeur vaut 3,05 %. Comme il n y a que 2 groupes, nous aurions aussi pu faire un test t pour échantillons indépendants et nous aurions obtenu : Independent Samples Test Independent Samples Test Levene t-test for Equality of Means F Sig. t df Sig. (2-tailed) Mean Diff Std. Error Diff 95% CI of diff ratio Equal var assumed 1,542 0,219 1, ,061 0,031 0, , , Equal var not assumed 1,95 55,08 0,056 0,031 0,016-0, ,0637 Lower Upper Exercice 3 Une représentation de la distribution de X (= Impact) dans chaque cellule s obtient par un graphique box-plot via la procédure «Graph box-plot- clustered» : 12

13 Taux Fort Moyen Sans Impact Dominante survivante Marque Inexistante Si la non-normalité de certaines cellules peut être suspectée on procédera à un test de K-S sur l échantillon en question ; c est le cas de la cellule (inexistante sans) : le tableau ci-après ne rejète pas la normalité dans cette cellule : One-Sample Kolmogorov-Smirnov Test Impact N 9 Mean 1.89 Normal Parameters(a,b) Std. Deviation.601 Most Extreme Differences Absolute.351 Positive.316 Negative Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed).217 a Test distribution is Normal. b Calculated from data. Il en va de même pour la cellule (dominante fort) : One-Sample Kolmogorov-Smirnov Test Impact N 9 Mean 8.00 Normal Parameters(a,b) Std. Deviation Most Extreme Differences Absolute.278 Positive.278 Negative Kolmogorov-Smirnov Z.833 Asymp. Sig. (2-tailed).491 a Test distribution is Normal. b Calculated from data. 13

14 Nous pouvons donc supposer que la variable «Impact» est distribuée normalement dans chacune des cellules. Nous sommes en présence de deux facteurs qui sont susceptibles d influencer l image de marque d un produit : la «marque» et le «taux» de publicité. Nous procédons donc à une analyse de variance à deux facteurs («taux» et «marque»). La procédure «Analysze General Linear Model Univariate» fournit le résultat suivant : Le test de Levene ne rejette pas, au niveau de 5 %, l homogénéité des variances dans chaque cellule : Levene's Test of Equality of Error Variances(a) Dependent Variable: Impact F df1 df2 Sig Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a Design: Intercept+Taux+Marque+Taux * Marque Le tableau de l ANOVA est le suivant : Dependent Variable: Impact Tests of Between-Subjects Effects Source Type III Sum of Squares df Mean Square F Sig. Corrected Model (a) Intercept Taux Marque Taux * Marque Error Total Corrected Total a R Squared =.815 (Adjusted R Squared =.794) Tous les facteurs et leur croisement sont très hautement significatifs. Ainsi nous notons un effet principal significatif du facteur Marque (F(2,72)= ; p = 0.000) et du facteur Taux (F(2,72) = ; p = 0.000) ainsi qu une interaction Marque x Taux significative (F(4,72) = ; p = 0.000). En ce qui concerne la marque, l examen des moyennes (via analyze - compare means- means) ainsi que le graphe nous indiquent que plus la marque est présente dans les publicités plus grand sera son impact ; la «puissance publicitaire» d une marque semble donc influencer son image de marque. Impact Impact * Marque Marque Mean N Std. Deviation Dominante 5, ,660 survivante 3, ,687 Inexistante 1,33 27,784 Total 3, ,387 14

15 En ce qui concerne le taux, l analyse des moyennes indique que plus le taux est important plus l impact est grand. Toutefois, d un point de vue descriptif, il ne semble pas y avoir une grande différence entre un taux fort et un taux moyen. Impact * Taux Impact Taux Mean N Std. Deviation Fort 3, ,281 Moyen 3, ,797 Sans 2, ,207 Total 3, ,387 L interaction (cf graphe) semble indiquer que l inégalité entre les marques augmente avec le taux général de publicité. Un test post hoc permettra d analyser plus en détails ces observations descriptives. Estimated Marginal Means of Impact 8 Taux Fort Moyen Sans Estimated Marginal Means Dominante survivante Marque Inexistante Ainsi, après avoir construit la variable croisée «Marque-taux» (croisement = 10*Taux + marque) 15

16 Un test de Tukey dans une ANOVA à un facteur («croisement») permet de mettre en évidence les paires de cellules qui ont un impact moyen statistiquement différent. Tukey HSD Impact Subset for alpha =.05 croisement N fort-inexist moy-inexist sans -inexist sans -domin sans -surviv fort-surviv moy-surviv moy-domin fort-domin Sig Means for groups in homogeneous subsets are displayed. a Uses Harmonic Mean Sample Size = Ce tableau mis en parallèle avec le graphique ci-dessus, nous permet d affirmer que l impact moyen d une marque dominante dans un contexte de publicité fort est statistiquement différent de toutes les autres situations. Dans un contexte sans publicité, il n y a pas de différence de perception des marques (groupe 3). Pour une marque «survivante», il n y a pas de différence significative de sa perception entre un contexte à fort taux publicitaire et un contexte sans publicité. En guise de conclusion, la course à la publicité semble en contradiction avec la libre concurrence puisqu un taux élevé de publicité augmente des inégalités non justifiées entre les marques. Exercice 4 La variable étudiée est le nombre de syllabes (non significatives) mémorisées. Les facteurs mis en jeu sont le caractère oral ou écrit des mots présentés (variable «orec») et le caractère familier ou non de ces mêmes mots (variable «fam»). Le tableau d analyse de variance à deux facteurs est le suivant : Tests of Between-Subjects Effects Dependent Variable: Nombre de syllabes mémorisées Source Type III Sum of Squares df Mean Square F Sig. Corrected Model (a) Intercept Fam OrEcr Fam * OrEcr Error Total Corrected Total a R Squared =.493 (Adjusted R Squared =.417) 16

17 On y observe que seul le facteur «familier-non familier» est significatif dans l explication du nombre de mots mémorisés (F (1,20) = ; p = 0.001). Le graphique des trajectoires des moyennes est le suivant : l inversion des moyennes que l on observe n est pas significative (F(1,24) = ; p >.05). Estimated Marginal Means of Nombre de syllabes mémorisées 18 OrEcr Oral Ecrit Estimated Marginal Means Familier Fam Non-familier Exercice 5 Nous sommes en présence d un plan d expérience à deux facteurs inter-sujet : le facteur «délai» entre le franchissement de la ligne et l envoi du stimulus anxiogène et le facteur zone du cerveau recevant les stimuli («site»). Le test de Levene ne rejette pas l hypothèse d égalité des variances. Test d'égalité des variances des erreurs de Levene(a) Variable dépendante: latence F ddl1 ddl2 Signification, ,996 Teste l'hypothèse nulle que la variance des erreurs de la variable dépendante est égale sur les différents groupes. a Plan : Intercept+Delai+site+Delai * site Le tableau d analyse de variance est le suivant : Tests of Between-Subjects Effects Dependent Variable: latence Source Type III Sum of Squares Df Mean Square F Sig. Corrected Model (a) Intercept site Delai site * Delai Error Total Corrected Total a R Squared =.465 (Adjusted R Squared =.346) 17

18 Il en ressort qu il n y a pas d effet principal «délai», c est à dire que toute autre chose étant égale, la latence n est pas significativement influencée par le délai entre le franchissement de la ligne et l envoi du stimulus. C est ce que montre aussi le test post hoc de Tukey. latence Tukey HSD(a,b) Subset Delai N Sig..056 Means for groups in homogeneous subsets are displayed. Based on Type III Sum of Squares The error term is Mean Square(Error) = a Uses Harmonic Mean Sample Size = b Alpha =.05. Il y a un effet principal «site» (F(2,36) = ; p = 0.005). Le test post hoc de Tukey montre qu il s agit de la zone test qui fournit une latence moyenne significativement différente de celle obtenue dans les deux autres zones. latence Tukey HSD(a,b) Subset site N 1 2 Zone A Zone B site neutre Sig Means for groups in homogeneous subsets are displayed. Based on Type III Sum of Squares The error term is Mean Square(Error) = a Uses Harmonic Mean Sample Size = b Alpha =.05. L analyse de variance décèle également une source de variation dans le croisement «site * délai» (F(4,36) = ; p = 0.025). Le graphique des trajectoires des moyennes permet de visualiser cette interaction. 18

19 Estimated Marginal Means of latence Estimated Marginal Means 30 27, ,5 20 site site neutre Zone A Zone B 17, Delai 150 Afin de vérifier les sources de variation, on effectue une analyse des effets simples. Il s agit d une ANOVA à 1 facteur, limitée à une trajectoire. Pour ce faire, on sélection dans un premier temps les données d une trajectoire (par Select cases introduire la condition : «if site = 1»). Dans le cas du site neutre, nous n observons aucune différence significative comme le confirme le tableau d analyse de variance : latence ANOVA Sum of Squares df Mean Square F Sig. Between Groups Within Groups Total Dans le cas de la zone A, il y a bien une différence significative entre les moyennes suivant le «délai» ; la latence moyenne à 50 msec est significativement plus faible que celle à 150 msec. La latence moyenne à 100 msec n est pas significativement différente de celle lorsque le délai est de 50 msec ou 150 msec. latence ANOVA Sum of Squares df Mean Square F Sig. Between Groups Within Groups Total

20 Tukey HSD latence Subset for alpha =.05 Delai N Sig Means for groups in homogeneous subsets are displayed. a Uses Harmonic Mean Sample Size = Dans le cas de la zone B, il y a bien une différence significative entre les moyennes suivant le «délai» ; la latence moyenne à 100 msec est significativement plus faible que celle à 150 msec et 50 msec. latence ANOVA Sum of Squares df Mean Square F Sig. Between Groups Within Groups Total Tukey HSD latence Subset for alpha =.05 Delai N Sig Means for groups in homogeneous subsets are displayed. a Uses Harmonic Mean Sample Size = Nous pouvons donc conclure que l effet du facteur «délai» diffère suivant les valeurs du facteur «site». Plus précisément, cet effet est significatif uniquement lorsque les stimulations sont appliquées dans les zones A et B du cerveau mais pas sur le site neutre. Une autre manière d expliquer la source de la variation introduite par le croisement des deux facteurs est de procéder à une comparaison de toutes les cellules en introduisant une nouvelle variable et en effectuant un test post hoc de Tukey dans une analyse de variance à un facteur (cette nouvelle variable). Ceci ne fait pas l objet de la présente question. Signalons encore que plus le nombre de cellules à comparer est important, moins nous aurons de chance de mettre en évidence une faible différence entre les moyennes. 20

Introduction aux Statistiques et à l utilisation du logiciel R

Introduction aux Statistiques et à l utilisation du logiciel R Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

Cours 9 : Plans à plusieurs facteurs

Cours 9 : Plans à plusieurs facteurs Cours 9 : Plans à plusieurs facteurs Table des matières Section 1. Diviser pour regner, rassembler pour saisir... 3 Section 2. Définitions et notations... 3 2.1. Définitions... 3 2.2. Notations... 4 Section

Plus en détail

Cours 7 : Exemples. I- Régression linéaire simple II- Analyse de variance à 1 facteur III- Tests statistiques

Cours 7 : Exemples. I- Régression linéaire simple II- Analyse de variance à 1 facteur III- Tests statistiques Cours 7 : Exemples I- Régression linéaire simple II- Analyse de variance à 1 facteur III- Tests statistiques Exemple 1 : On cherche à expliquer les variations de y par celles d une fonction linéaire de

Plus en détail

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

L analyse discriminante

L analyse discriminante L analyse discriminante À Propos de ce document... Introduction... La démarche à suivre sous SPSS... 2. Statistics... 2 2. Classify... 2 Analyse des résultats... 3. Vérification de l existence de différences

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences

Plus en détail

Marketing Data Set: Follow-Up to Purchases of a Consumer Panel

Marketing Data Set: Follow-Up to Purchases of a Consumer Panel Marketing Data Set: Follow-Up to Purchases of a Consumer Panel Typologie des consommateurs et Mesure de la loyauté/fidélité Stéphanie Ledauphin-Menard, Sébastien Lê Face aux problèmes de pouvoir d achat

Plus en détail

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons

Plus en détail

TESTS STATISTIQUES: COMPARAISON, INDÉPENDANCE ET RÉGRESSION LINÉAIRE

TESTS STATISTIQUES: COMPARAISON, INDÉPENDANCE ET RÉGRESSION LINÉAIRE TESTS STATISTIQUES: COMPARAISON, INDÉPENDANCE ET RÉGRESSION LINÉAIRE Les résultats donnés par R et SAS donnent les valeurs des tests, la valeur-p ainsi que les intervalles de confiance. TEST DE COMPARAISON

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

Estimation et tests statistiques, TD 5. Solutions

Estimation et tests statistiques, TD 5. Solutions ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études

Plus en détail

Le chi carré. Le sommaire. Approche quantitative

Le chi carré. Le sommaire. Approche quantitative Approche quantitative Le chi carré Les objectifs pédagogiques Définir le test du chi carré Déterminer la nature des données propres au chi carré Savoir calculer le chi carré Savoir déterminer les fréquences

Plus en détail

CHAMPION Matthieu Modèles de Marché en Visual Basic ESILV S04 S6. Sommaire... 1. Introduction... 2

CHAMPION Matthieu Modèles de Marché en Visual Basic ESILV S04 S6. Sommaire... 1. Introduction... 2 Sommaire Sommaire... 1 Introduction... 2 1 Trois différentes techniques de pricing... 3 1.1 Le modèle de Cox Ross Rubinstein... 3 1.2 Le modèle de Black & Scholes... 8 1.3 Méthode de Monte Carlo.... 1

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction

Plus en détail

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables

Plus en détail

Simulation d un système d assurance automobile

Simulation d un système d assurance automobile Simulation d un système d assurance automobile DESSOUT / PLESEL / DACHI Plan 1 Introduction... 2 Méthodes et outils utilisés... 2.1 Chaines de Markov... 2.2 Méthode de Monte Carlo... 2.3 Méthode de rejet...

Plus en détail

Normalité des rendements?

Normalité des rendements? Normalité des rendements? Daniel Herlemont 31 mars 2011 Table des matières 1 Introduction 1 2 Test de Normalité des rendements 2 3 Graphiques quantile-quantile 2 4 Estimation par maximum de vraisemblance

Plus en détail

Concours de recrutement interne PLP 2009

Concours de recrutement interne PLP 2009 Concours de recrutement interne PLP 2009 Le sujet est constitué de quatre exercices indépendants. Le premier exercice, de nature pédagogique au niveau du baccalauréat professionnel, porte sur le flocon

Plus en détail

EXEMPLE : FAILLITE D ENTREPRISES

EXEMPLE : FAILLITE D ENTREPRISES EXEMPLE : FAILLITE D ENTREPRISES Cet exemple a pour objectif d étudier la faillite d entreprises. Les données proviennent de l ouvrage de R.A.Johnson et D.W Wichern : «Applied Multivariate Statistical

Plus en détail

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1 UN GROUPE D INDIVIDUS Un groupe d individus décrit par une variable qualitative binaire DÉCRIT PAR UNE VARIABLE QUALITATIVE BINAIRE ANALYSER UN SOUS-GROUPE COMPARER UN SOUS-GROUPE À UNE RÉFÉRENCE Mots-clés

Plus en détail

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7 Table des matières Préface Public 1 Structure de l ouvrage 1 Caractéristiques de l ouvrage 3 Contenu 3 Pédagogie 4 Remarques sur l adaptation française 4 Ressources numériques 5 Biographie 6 PREMIÈRE PARTIE

Plus en détail

T de Student Khi-deux Corrélation

T de Student Khi-deux Corrélation Les tests d inférence statistiques permettent d estimer le risque d inférer un résultat d un échantillon à une population et de décider si on «prend le risque» (si 0.05 ou 5 %) Une différence de moyennes

Plus en détail

Evaluation de la variabilité d'un système de mesure

Evaluation de la variabilité d'un système de mesure Evaluation de la variabilité d'un système de mesure Exemple 1: Diamètres des injecteurs de carburant Problème Un fabricant d'injecteurs de carburant installe un nouveau système de mesure numérique. Les

Plus en détail

Jeux sous forme normale

Jeux sous forme normale CHAPITRE 4 Jeux sous forme normale Dans les problèmes de décision, nous avons relié les choix qui pouvaient être faits par un agent avec les utilités qu il pouvait en dériver. L idée qu un agent rationnel

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

X-ENS PSI - 2009 Un corrigé

X-ENS PSI - 2009 Un corrigé X-ENS PSI - 009 Un corrigé Première partie.. Des calculs élémentaires donnent χ A(α) = χ B(α) = X X + et χ A(α)+B(α) = X X + 4α + 4 On en déduit que Sp(A(α)) = Sp(B(α)) = {j, j } où j = e iπ 3 Sp(A(α)

Plus en détail

Exemples d application

Exemples d application AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif

Plus en détail

Points méthodologiques Adapter les méthodes statistiques aux Big Data

Points méthodologiques Adapter les méthodes statistiques aux Big Data Points méthodologiques Adapter les méthodes statistiques aux Big Data I. Répétition de tests et inflation du risque alpha II. Significativité ou taille de l effet? 2012-12-03 Biomédecine quantitative 36

Plus en détail

Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr

Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr Dominique Muller Laboratoire Inter-universitaire de Psychologie Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr Supports de cours : webcom.upmf-grenoble.fr/lip/perso/dmuller/m2r/acm/

Plus en détail

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015 Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par

Plus en détail

Probabilités conditionnelles Loi binomiale

Probabilités conditionnelles Loi binomiale Exercices 23 juillet 2014 Probabilités conditionnelles Loi binomiale Équiprobabilité et variable aléatoire Exercice 1 Une urne contient 5 boules indiscernables, 3 rouges et 2 vertes. On tire au hasard

Plus en détail

Utilisation du Logiciel de statistique SPSS 8.0

Utilisation du Logiciel de statistique SPSS 8.0 Utilisation du Logiciel de statistique SPSS 8.0 1 Introduction Etude épidémiologique transversale en population générale dans 4 pays d Afrique pour comprendre les différences de prévalence du VIH. 2000

Plus en détail

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail

Correction de l épreuve intermédiaire de mai 2009.

Correction de l épreuve intermédiaire de mai 2009. Licence de Gestion. 3ème Année Année universitaire 8-9 Optimisation Appliquée C. Léonard Correction de l épreuve intermédiaire de mai 9. Exercice 1 Avec les notations du cours démontrer que la solution

Plus en détail

Introduction à MINITAB

Introduction à MINITAB Introduction à MINITAB Version 14 pour Windows Septembre 2003 2003, 2004 par Minitab Inc. Tous droits réservés. MINITAB et le logo MINITAB sont des marques déposées de Minitab Inc. Toutes les autres marques

Plus en détail

Régression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr

Régression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr Régression linéaire Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr 2005 Plan Régression linéaire simple Régression multiple Compréhension de la sortie de la régression Coefficient de détermination R

Plus en détail

Etude des propriétés empiriques du lasso par simulations

Etude des propriétés empiriques du lasso par simulations Etude des propriétés empiriques du lasso par simulations L objectif de ce TP est d étudier les propriétés empiriques du LASSO et de ses variantes à partir de données simulées. Un deuxième objectif est

Plus en détail

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants) CIVILITE-SES.doc - 1 - Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants) 1 PRÉSENTATION DU DOSSIER CIVILITE On s intéresse

Plus en détail

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine

Plus en détail

Leçon N 4 : Statistiques à deux variables

Leçon N 4 : Statistiques à deux variables Leçon N 4 : Statistiques à deux variables En premier lieu, il te faut relire les cours de première sur les statistiques à une variable, il y a tout un langage à se remémorer : étude d un échantillon d

Plus en détail

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,

Plus en détail

4. Résultats et discussion

4. Résultats et discussion 17 4. Résultats et discussion La signification statistique des gains et des pertes bruts annualisés pondérés de superficie forestière et du changement net de superficie forestière a été testée pour les

Plus en détail

Décrire les données. Chapitre 2

Décrire les données. Chapitre 2 Chapitre 2 Décrire les données La description des données est une étape importante de la démarche d analyse. Beaucoup d enquêtes se limitent à cette étape, qui donne un premier niveau de lecture des résultats

Plus en détail

Lire ; Compter ; Tester... avec R

Lire ; Compter ; Tester... avec R Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................

Plus en détail

Modèles pour données répétées

Modèles pour données répétées Résumé Les données répétées, ou données longitudinales, constituent un domaine à la fois important et assez particulier de la statistique. On entend par données répétées des données telles que, pour chaque

Plus en détail

TESTS D HYPOTHÈSE FONDÉS SUR LE χ². http://fr.wikipedia.org/wiki/eugénisme

TESTS D HYPOTHÈSE FONDÉS SUR LE χ². http://fr.wikipedia.org/wiki/eugénisme TESTS D HYPOTHÈSE FONDÉS SUR LE χ² http://fr.wikipedia.org/wiki/eugénisme Logo du Second International Congress of Eugenics 1921. «Comme un arbre, l eugénisme tire ses constituants de nombreuses sources

Plus en détail

Probabilités sur un univers fini

Probabilités sur un univers fini [http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur

Plus en détail

VI. Tests non paramétriques sur un échantillon

VI. Tests non paramétriques sur un échantillon VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes

Plus en détail

FORMULAIRE DE STATISTIQUES

FORMULAIRE DE STATISTIQUES FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

Chapitre 2 Le problème de l unicité des solutions

Chapitre 2 Le problème de l unicité des solutions Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Ces exercices portent sur les items 2, 3 et 5 du programme d informatique des classes préparatoires,

Plus en détail

La crise économique vue par les salariés français

La crise économique vue par les salariés français La crise économique vue par les salariés français Étude du lien entre la performance sociale et le contexte socioéconomique Baggio, S. et Sutter, P.-E. La présente étude s intéresse au lien entre cette

Plus en détail

Module 16 : Les fonctions de recherche et de référence

Module 16 : Les fonctions de recherche et de référence Module 16 : Les fonctions de recherche et de référence 16.0 Introduction L une des fonctions les plus importantes d Excel, c est la possibilité de chercher une valeur spécifique dans un grand nombre de

Plus en détail

Biostatistiques : Petits effectifs

Biostatistiques : Petits effectifs Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Compter à Babylone. L écriture des nombres

Compter à Babylone. L écriture des nombres Compter à Babylone d après l article de Christine Proust «Le calcul sexagésimal en Mésopotamie : enseignement dans les écoles de scribes» disponible sur http://www.dma.ens.fr/culturemath/ Les mathématiciens

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

23. Interprétation clinique des mesures de l effet traitement

23. Interprétation clinique des mesures de l effet traitement 23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d

Plus en détail

Le bootstrap expliqué par l exemple

Le bootstrap expliqué par l exemple Le bootstrap expliqué par l exemple 1 Le bootstrap expliqué par l exemple 1. Les concepts du bootstrap 2. Des variantes adaptées au contexte 3. Comparaison des différentes méthodes 4. Les cas sensibles

Plus en détail

Transmission d informations sur le réseau électrique

Transmission d informations sur le réseau électrique Transmission d informations sur le réseau électrique Introduction Remarques Toutes les questions en italique devront être préparées par écrit avant la séance du TP. Les préparations seront ramassées en

Plus en détail

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Filtrage stochastique non linéaire par la théorie de représentation des martingales Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de

Plus en détail

1. Les tests passés lors de la Journée Défense et Citoyenneté (JDC)

1. Les tests passés lors de la Journée Défense et Citoyenneté (JDC) LES JEUNES FACE A L ECRIT UN NOUVEAU DISPOSITIF D EVALUATION MASSIVE DE LEURS PERFORMANCES EN LECTURE Thierry Rocher* * DEPP, thierry.rocher@education.gouv.fr Mots-clés : illettrisme, test automatisé,

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

Arithmétique binaire. Chapitre. 5.1 Notions. 5.1.1 Bit. 5.1.2 Mot

Arithmétique binaire. Chapitre. 5.1 Notions. 5.1.1 Bit. 5.1.2 Mot Chapitre 5 Arithmétique binaire L es codes sont manipulés au quotidien sans qu on s en rende compte, et leur compréhension est quasi instinctive. Le seul fait de lire fait appel au codage alphabétique,

Plus en détail

2010 Minitab, Inc. Tous droits réservés. Version 16.1.0 Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des

2010 Minitab, Inc. Tous droits réservés. Version 16.1.0 Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des 2010 Minitab, Inc. Tous droits réservés. Version 16.1.0 Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des marques déposées de Minitab, Inc. aux Etats-Unis et

Plus en détail

Les débats sur l évolution des

Les débats sur l évolution des D o c u m e n t d e t r a v a i l d e l a B r a n c h e R e t r a i t e s d e l a C a i s s e d e s d é p ô t s e t c o n s i g n a t i o n s n 9 8-0 7 C o n t a c t : La u re nt V e r n i è r e 0 1 4

Plus en détail

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

Une introduction. Lionel RIOU FRANÇA. Septembre 2008 Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

Probabilités sur un univers fini

Probabilités sur un univers fini [http://mp.cpgedupuydelome.fr] édité le 10 août 2015 Enoncés 1 Proailités sur un univers fini Evènements et langage ensemliste A quelle condition sur (a,, c, d) ]0, 1[ 4 existe-t-il une proailité P sur

Plus en détail

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes. 1 Définitions, notations Calcul matriciel Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes. On utilise aussi la notation m n pour le

Plus en détail

Exemple PLS avec SAS

Exemple PLS avec SAS Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that

Plus en détail

Des HR Metrics aux HR Analytics

Des HR Metrics aux HR Analytics Des HR Metrics aux HR Analytics Qui utilise ces mesures? Comment catégoriser et comparer? Quels liens établir? Comment savoir si vous faites la différence? Chiffres ou analyses? Intégrez-vous les managers

Plus en détail

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur

Plus en détail

Principe de symétrisation pour la construction d un test adaptatif

Principe de symétrisation pour la construction d un test adaptatif Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université

Plus en détail

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre. Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences

Plus en détail

CHAPITRE 5. Stratégies Mixtes

CHAPITRE 5. Stratégies Mixtes CHAPITRE 5 Stratégies Mixtes Un des problèmes inhérents au concept d équilibre de Nash en stratégies pures est que pour certains jeux, de tels équilibres n existent pas. P.ex.le jeu de Pierre, Papier,

Plus en détail

I. Polynômes de Tchebychev

I. Polynômes de Tchebychev Première épreuve CCP filière MP I. Polynômes de Tchebychev ( ) 1.a) Tout réel θ vérifie cos(nθ) = Re ((cos θ + i sin θ) n ) = Re Cn k (cos θ) n k i k (sin θ) k Or i k est réel quand k est pair et imaginaire

Plus en détail

Introduction. II. Aire de répartition des requins

Introduction. II. Aire de répartition des requins Premiers résultats des observations acoustiques effectuées sur les requins bouledogue et tigre entre le 2 décembre 2011 et le 2 décembre 2012 sur la côte ouest de la Réunion Introduction Ces premiers résultats

Plus en détail

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011 Master 1 Biologie et technologie du végétal Année 010-011 Statistiques Rappels de cours et travaux dirigés (Seul ce document sera autorisé en examen) auteur : Jean-Marc Labatte jean-marc.labatte@univ-angers.fr

Plus en détail

TSTI 2D CH X : Exemples de lois à densité 1

TSTI 2D CH X : Exemples de lois à densité 1 TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun

Plus en détail

Intégration et probabilités TD1 Espaces mesurés Corrigé

Intégration et probabilités TD1 Espaces mesurés Corrigé Intégration et probabilités TD1 Espaces mesurés Corrigé 2012-2013 1 Petites questions 1 Est-ce que l ensemble des ouverts de R est une tribu? Réponse : Non, car le complémentaire de ], 0[ n est pas ouvert.

Plus en détail

Analyse et interprétation des données

Analyse et interprétation des données 8 Analyse et interprétation des données Les données de l enquête peuvent être utilisées pour différents types d analyses aussi bien au niveau national qu au niveau international. Ce chapitre explique comment

Plus en détail

DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES

DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES Agence fédérale pour la Sécurité de la Chaîne alimentaire Administration des Laboratoires Procédure DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES Date de mise en application

Plus en détail

Comment ne pas construire un score-titanic

Comment ne pas construire un score-titanic Comment ne pas construire un score-titanic Mon mailing Olivier Decourt ABS Technologies / Educasoft Formations 1- Les principes 2- Un premier exemple : les vins de France 3- Mise en œuvre sous SAS 4- Un

Plus en détail

MODELE A CORRECTION D ERREUR ET APPLICATIONS

MODELE A CORRECTION D ERREUR ET APPLICATIONS MODELE A CORRECTION D ERREUR ET APPLICATIONS Hélène HAMISULTANE Bibliographie : Bourbonnais R. (2000), Econométrie, DUNOD. Lardic S. et Mignon V. (2002), Econométrie des Séries Temporelles Macroéconomiques

Plus en détail

FONCTIONS. I Généralités sur les fonctions. Définitions. Remarque. Exercice 01. Remarque

FONCTIONS. I Généralités sur les fonctions. Définitions. Remarque. Exercice 01. Remarque FNCTINS I Généralités sur les fonctions Définitions Soit D une partie de l'ensemble IR. n définit une fonction f de D dans IR, en associant à chaque réel de D, un réel et un seul noté f() et que l'on appelle

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

La régression logistique. Par Sonia NEJI et Anne-Hélène JIGOREL

La régression logistique. Par Sonia NEJI et Anne-Hélène JIGOREL La régression logistique Par Sonia NEJI et Anne-Hélène JIGOREL Introduction La régression logistique s applique au cas où: Y est qualitative à 2 modalités Xk qualitatives ou quantitatives Le plus souvent

Plus en détail

Document d orientation sur les allégations issues d essais de non-infériorité

Document d orientation sur les allégations issues d essais de non-infériorité Document d orientation sur les allégations issues d essais de non-infériorité Février 2013 1 Liste de contrôle des essais de non-infériorité N o Liste de contrôle (les clients peuvent se servir de cette

Plus en détail

Item 169 : Évaluation thérapeutique et niveau de preuve

Item 169 : Évaluation thérapeutique et niveau de preuve Item 169 : Évaluation thérapeutique et niveau de preuve COFER, Collège Français des Enseignants en Rhumatologie Date de création du document 2010-2011 Table des matières ENC :...3 SPECIFIQUE :...3 I Différentes

Plus en détail