Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9

Dimension: px
Commencer à balayer dès la page:

Download "Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9"

Transcription

1 Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9 L analyse de variance à un facteur permet de vérifier, moyennant certaines hypothèses, si un facteur (un critère de classification, celui qui définit les groupes ou les échantillons indépendants) a un effet significatif sur la variable X étudiée. L analyse de variance à 2 ou plusieurs facteurs généralise cette méthode lorsque nous avons plus d un critère de classification. Remarque : on présente souvent dans la littérature le problème de l analyse de variance à un facteur sous la forme d un modèle linéaire comme suit : X ij = µ + a j + e ij où X ij est le score observé du sujet i dans le traitement j, µ la moyenne de la population totale, α l effet du traitement j, et e ij la valeur de l erreur de mesure. j µ et α j sont des constantes qui garderaient les mêmes valeurs respectives si on mesurait plusieurs fois le score du sujet i dans la condition j. Par contre, la valeur de l erreur changerait à chaque nouvelle mesure du même sujet et différerait d un sujet à l autre. Pour la simplicité, nous nous limiterons au cas de deux facteurs, mais la méthode se généralise aisément à plusieurs facteurs. Prenons l exemple suivant : Nous étudions le stress (score de stress = variable X) au sein d une société. Nous repérons les employés suivant leur âge (>/< 50 ans : 1 er facteur à 2 niveaux) et leur niveau de responsabilité (techniciens, cadres inférieurs et cadres supérieurs : second facteur à 3 niveaux). Nous définissons ainsi un plan d expérience à 2 facteurs (ou deux critères de classification) ; on parle encore de plan factoriel 2 x 3 (2 niveaux sur le premier facteur et trois niveaux sur le second). Nous appellerons le premier facteur, le facteur A et le second, le facteur B. Une cellule correspond à un certain niveau du facteur A et un certain niveau du facteur B (par exemple les cadres inférieurs de moins de 50 ans). Dans chaque cellule les sujets sont différents (lorsqu il s agit des mêmes sujets on parle de plan à mesures répétées : ceci fera l objet d une prochaine séance de TP). Lorsqu il y a le même nombre de sujets dans chaque cellule on parlera d un plan balancé ou équilibré sinon nous dirons que le plan est non balancé ou non équilibré. Si nous avons 6 sujets par cellule, nous pouvons visualiser la situation de notre exemple par le tableau suivant : < 50 ans > 50 ans Techniciens XXXXXX XXXXXX Cadre Inf. XXXXXX XXXXXX Cadre Sup. XXXXXX XXXXXX 1

2 Nous allons nous intéresser à la moyenne de X dans chacune des cellules et sur les marges. Dans l exemple considéré, nous obtenons : < 50 ans > 50 ans Techniciens 15,0000 9, ,3333 Cadre Inf. 15, , ,5000 Cadre Sup. 14, , , , , ,0556 Trois types d effets, donc de sources de variation, entrent en jeu : 1. L effet principal du facteur Age (cf moyennes marginales des colonnes): compte non tenu du niveau de responsabilité, l âge a-t-il un effet sur le stress? Donc, 14,89 est-il statistiquement différent de 17,22? Si oui, nous aurons montré la présence d un effet du facteur «âge». Ceci est en fait l objet de l ANOVA à 1 facteur. 2. L effet principal du facteur Niveau responsabilité (cf moyennes marginales des lignes). Compte non tenu de l âge, le niveau de responsabilité a-t-il un effet sur le stress? Donc, 12.33, 15.5 et sont-ils statistiquement différents? Si oui, nous aurons montré la présence d un effet du facteur Niveau de responsabilité. 3. L interaction entre le facteur Age et le facteur niveau de responsabilité. Ici on ne s intéresse plus aux marges, mais aux cellules. Les 6 moyennes sont donc prises en compte. On se demande si l effet de l âge est le même quel que soit le niveau du facteur Niveau de responsabilité, ou si l effet du niveau de responsabilité est le même à chaque niveau du facteur Age. Quand un facteur n a pas les mêmes effets simples principaux à tous les niveaux de l autre facteur, les deux facteurs sont dits en interaction. Une interaction entre 2 facteurs A et B est souvent indiquée par un signe de multiplication : A X B. Les effets principaux et les interactions sont indépendants. Il est donc possible d obtenir des effets principaux significatifs sans interaction significative entre les facteurs ; il est aussi possible d obtenir une interaction significative sans aucun effet principal significatif. Graphiquement si nous représentons les moyennes à travers les niveaux de responsabilités en fixant la tranche d âge, nous obtenons les 2 trajectoires suivantes : 2

3 Estimated Marginal Means of Score de stress 25,00 Tranche d'âge <50ans >50ans Estimated Marginal Means 20,00 15,00 10,00 Techn. Cadre Inf. Niveau de responsabilité Cadre Sup. L examen de ce type de graphique permet de mettre en évidence la présence d une interaction entre les deux facteurs principaux. Sous sa forme linéaire, ce problème de l analyse de variance à deux facteurs s exprime comme suit : X ijk = µ + a j + ß k +? jk + e ijk où µ est la moyenne générale de X, a j l effet du traitement j, ß k l effet du traitement k,? jk l effet de l interaction des traitements j et k, et e ijk est un terme d erreur. Si le facteur A n a pas d effet, tous les a j sont nuls. Si le facteur B n a pas d effet, tous les ß k sont nuls et s il n y a pas d effet de l interaction, tous les? jk sont nuls. Principe de l analyse de variance à 2 facteurs. On se propose de tester trois hypothèses différentes : 1. H 0 il n y a pas d effet principal du facteur A H 1 il y a un effet principal du facteur A 2. H 0 il n y a pas d effet principal du facteur B H 1 il y a un effet principal du facteur B 3. H 0 il n y a pas d interaction entre les facteurs A et B H 1 il y a une interaction entre les facteurs A et B. Comme dans l ANOVA à un facteur pour répondre à ces questions, nous partons de la décomposition de la variabilité totale de X. SS total = SS A + SS B + SS A*B + SS within Notations : Chaque cellule du plan est repérée par deux indices j et k qui renvoient au niveau j du facteur A et au niveau k du facteur B. X ijk est le i ème individu de la cellule (j,k) M est la moyenne générale de X sur l ensemble des observations, 3

4 M j k est la moyenne de X dans la cellule (j,k) M. k est la moyenne de X dans l ensemble des cellules du niveau k du facteur B, M j. est la moyenne de X dans l ensemble des cellules du niveau j du facteur A, n jk = nombre de sujets dans la cellule (j,k) (nous noterons n dans le cas des plans balancés) n. k = le nombre de sujets dans l ensemble des cellules du niveau k du facteur B, n j. = le nombre de sujets dans l ensemble des cellules du niveau j du facteur A, N = Nombre total de sujets, J = nombre de modalités du facteur A, K = nombre de modalités du facteur B La formule de décomposition de la variation totale pour un plan équilibré est la suivante : k j i j k k n n j.. k j ( M ( M n k j i jk ( X j.. k ( X ijk M )² = M )² + M )² + ( M jk ijk M M j. jk M )². k + M )² + De manière résumée cette somme se réécrit : SS total = SS A + SS B + SS A*B + SS within A chaque somme de carrés est associée un nombre de degrés de liberté : Somme : SS total = SS A +SS B + SS A*B + SS within d.l. N-1 J-1 K-1 (J-1)(K-1) N-(J.K) N = Nombre total de sujets, J = nombre de modalités du facteur A, K = nombre de modalités du facteur B Les ratios SS/d.l. définissent les MS (carrés moyens) MS A = SS A / (J-1), MS B = SS B / (K-1), MS A*B = SS A*B / [(J-1).(K-1)], MS within = SS within / (N-1) Sous l hypothèse nulle les ratios MS A /MS within, MS B /MS within, MS A*B /MS within se distribuent suivant une loi F de Fisher-Snédecor : MS A = F J-1, N-1 MS B = F K-1, N-1 MS A*B = F (J-1)(K-1), N-1 Hypothèses : Comme dans l ANOVA à 1 facteur, nous supposerons que la variable X se distribue normalement (suivant une loi Normale) dans chaque cellule (j,k) avec la même variance s² et que les observations sont indépendantes les une des autres (on vérifiera l allure normale par un graphique «box-plot» de X dans chaque cellule). Les échantillons (de chaque cellule) sont indépendants les uns des autres. 4

5 Comparaisons multiples. Comme en analyse de variance à un facteur, on peut procéder à des comparaisons a priori et a posteriori (post hoc) lorsque l ANOVA détecte un ou des effets significatifs. Il est important de toujours contrôler le niveau global de l erreur lors de comparaisons a priori. Ce contrôle se fait automatiquement par SPSS dans le cas des comparaisons «post hoc». Notons encore que les comparaisons post hoc proposées par SPSS ne permettent pas des comparaisons entre les moyennes de deux cellules ; Seules les comparaisons des effets principaux (entre tous les niveaux d un facteur sur les marges) sont proposées au niveau des tests «post hoc». Si l on souhaite faire des comparaisons non planifiées de moyennes entre 2 cellules (à n envisager que s il y a une interaction significative), il convient de passer par un test de Tukey dans une ANOVA à 1 facteur sur la variable croisée A*B (créée par «Transform compute»). Si cette nouvelle variable possède beaucoup de modalités les tests post hoc seront fort conservateurs (et peu puissants). Il est encore possible de faire les comparaisons des moyennes aux différents niveaux d un facteur pour un niveau fixé de l autre (faire «select cases») ; c est l examen d une trajectoire dans le graphique des moyennes décrit ci-dessus. Ces comparaisons se font par un test de Tukey dans une ANOVA à 1 facteur après avoir sélectionné les sujets au niveau donné du second facteur. On peut répéter ainsi l opération pour tous les niveaux du second facteur. Ce type de test permet de déterminer à quel niveau d un facteur un autre facteur du plan exerce ses effets. On parle, dans ce cas, de tests sur les effets simples. Alternatives. L analyse de variance est une procédure robuste qui admet sans trop de problèmes des déviations légères par rapport aux conditions de normalité et d homogénéité des variances. Notons encore qu il n existe pas de test non paramétrique universellement reconnu lorsque la condition de normalité est gravement violée. Effet de taille. Dans l ANOVA 1 facteur, nous avons défini l effet de taille par η² comme la proportion de la variance de X expliquée par le facteur : η² = SS facteur / SS total Dans l ANOVA à 2 facteurs, nous pouvons définir un effet de taille (complet) pour chaque source de variation (facteur A, facteur B et interaction A*B). η² A = SS A / SS total, η² B = SS B / SS total, η² A*B = SS A*B / SS total (Ces effets de taille ne sont pas fournit par SPSS). Par contre, SPSS détermine l effet de taille partiel h² partiel (Partial eta square) η² p(a) = SS A / (SS A + SS within ), η² p(b) = SS B / (SS B + SS within ), η² A*B = SS A*B / (SS A*B + SS within ) 5

6 Exercice 1 On évalue l efficacité d un nouveau traitement ayant pour objet d améliorer le développement global des enfants atteints de trisomie 21. Pour cela, une étude a été menée auprès de 12 enfants. Six d entre eux ont reçu un produit actif alors que 6 autres ont reçu un placebo, et ce pendant 6 mois. Un indice de développement global de chaque enfant est calculé avant et après le début de l étude par un même psychologue. Cet indice de développement global résume l ensemble des capacités en termes de coordination, posture, langage et sociabilité. La nature du traitement donné n est connue ni de la famille ni du patient ni du psychologue. Deux psychologues ont participés à l étude. Les données fournies par l institut J. Lejeune sont reprises dans le fichier HP6-4.sav. Peut-on conclure à l efficacité du traitement? Observe-t-on le même résultat quel que soit le psychologue? Exercice 2 58 participants, dont 30 garçons et 28 filles, ont parcouru aussi vite que possible une distance à la nage. Le temps obtenu a été falsifié de façon à donner une performance moins bonne qu attendu. Une demi-heure plus tard les sujets ont dû re-parcourir et leurs temps ont été à nouveau enregistrés. Les auteurs avaient prédit que lors du second essai, les nageurs les plus pessimistes réaliseraient un moins bon temps et que les optimistes obtiendraient de meilleurs résultats que lors du premier essai. La variable dépendante étudiée est le rapport (ratio) temps1/temps2 ; une valeur supérieure à 1 signife que le nageur à mieux réussi au second essai. Les données sont reprises dans le fichier H13-13.sav Pouvez-vous confirmer la prédiction des auteurs? Ces résultats sont-ils indépendants du genre? Vérifiez par un graphique «box-plot» la condition de normalité ; en cas de doute pour l un ou l autre sous-groupe, effectuez un test de Kolmogorov-Smirnov. Si vous confirmez la prédiction des auteurs, déterminez les cellules présentant des résultats moyens significativement différents. Refaites les analyses sans tenir compte du facteur sexe. Exercice 3 On forme 9 groupes de volontaires qui participent chacun à l expérience suivante : pendant une semaine, les participants sont soumis à des annonces publicitaires visuelles. Selon le groupe, la masse totale de publicité (variable «taux») est nulle situation «sans» -, «moyenne» ou «forte». Les publicités ventent les qualités de trois pseudo-marques de nouilles. L une des marques est dite «dominante» (85 % des publicités), un autre est «survivante» (15 % des publicités) et la troisième est «inexistante» (pas de publicité). On mesure ensuite chez les volontaires par une variable numérique X l impact de l une des pseudo-marques de nouilles son image de marque -. Pour chaque groupe, on mesure l impact d une seule des trois marques. Les neuf groupes sont obtenus par le croisement de la situation S et de la marque M. Les données sont reprises dans le fichier NG2.sav Déterminez les facteurs qui influencent l image de marque du produit. Vérifiez par un graphique Box-plot la condition de normalité de la variable X dans chaque cellule. Tracez les 6

7 trajectoires des moyennes. Le cas échéant (lorsqu un effet est significatif) déterminez les cellules présentant des différences significatives. Interprétez vos résultats. Exercice 4 Dans une expérience on présente à chaque sujet soit oralement soit par écrit un mot qui est soit un mot familier soit un mot non familier. Après une période d attente on interroge le sujet et on calcule le nombre de syllabes non significatives mémorisées. L expérience est réalisée sur 24 sujets répartis en 4 groupes de six et les résultats sont repris dans le fichier LM7.sav Quels sont les facteurs mis en présence? Quelle est la variable étudiée? Quels sont les facteurs qui présentent un effet significatif quant à la variable étudiée? Représentez les trajectoires des moyennes. Exercice 5 Dans une étude consacrée aux processus de mémoire, des animaux ont été testés à une tâche d apprentissage de l évitement. Lors de l essai d apprentissage, les animaux recevaient un stimulus anxiogène dès qu ils franchissaient une certaine ligne. L expérimentateur a distingué trois groupes d animaux selon l endroit du cortex où il leur avait été plantés des électrodes (site neutre, zone A et zone B). Chaque groupe a encore été subdivisé selon le moment de réception de la stimulation électrique (50, 100 ou 150 millièmes de seconde après avoir franchi la ligne et avoir reçu le stimulus anxiogène). Si la zone stimulée du cerveau jouait un rôle dans la mémoire, la stimulation affecterait probablement la consolidation de la mémorisation et retarderait l apprentissage de la réponse d évitement ; l animal n hésiterait pas à franchir à nouveau la ligne. Les données relatives à la latence (temps nécessaire avant de franchir la ligne) sont reprises dans le fichier UL5-3.sav. Quelles sont les facteurs susceptibles d influencer la latence? Effectuez une analyse de variance, représentez les trajectoires des moyennes en fonction de la variable «Délai». Etudier les trois effets simples (un par «site»). Solutions Exercice 1 Les éventuels effets du traitement, du psychologue et de l interaction psy x traitement peuvent être mis en évidence par une analyse de la variance à 2 facteurs (2x2). On utilisera la procédure «Analyze General - Linear Model univariate» avec «indice» comme variable dépendante et les variables «psychologue» et «traitements» comme facteurs à effets fixes ; on sélectionnera le test d homogénéité des variances dans les options et l on choisira les graphiques des moyennes en fonction du traitement avec une trajectoire par psychologue. Au niveau du modèle, nous choisissons le modèle complet (effets principaux + interaction). Le test de Levene ne rejette pas l hypothèse d égalité des variances : 7

8 Levene's Test of Equality of Error Variances(a) Dependent Variable: Augmentation de l'indice de développement global F df1 df2 Sig., ,625 Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a Design: Intercept+Traitement+Psychologue+Traitement * Psychologue Tests of Between-Subjects Effects Dependent Variable: Augmentation de l'indice de développement global Source Type III Sum of Squares df Mean Square F Sig. Partial Eta Squared Corrected Model 2195,713(a) 3 731,904 2,658,120,499 Intercept 34518, , ,367,000,940 Psychologue 44, ,083,160,700,020 Traitement 2043, ,630 7,422,026,481 Psychologue * Traitement 108, ,000,392,549,047 Error 2202, ,339 Total 38916, Corrected Total 4398, a R Squared =,499 (Adjusted R Squared =,311) Estimated Marginal Means of Augmentation de l'indice de développement global 70,0 Psychologue 1 2 Estimated Marginal Means 60,0 50,0 40,0 placebo Traitement produit actif Nous pouvons conclure qu il y a un effet principal significatif du facteur Traitement (F(1,8) = 7,422 ; p = 0.026) ; pas d effet Psychologue significatif (F(1,8) = 0,16 ; p > 0.05) ni d interaction Psychologue x Traitement significative (F(1,8) = ; p > 0.05). Cela signifie que le traitement a un bien un effet positif sur le développement global des enfants atteints de trisomie et que les résultats ne varient pas en fonction du psychologue qui a fait passer le test (pas d effet psy) et que cet effet du traitement est identique quel que soit le psychologue qui a fait passer le test (pas d interaction). 8

9 Exercice 2 Nous sommes en présence de deux facteurs explicatifs : le facteur optimisme «optim» et le facteur «sexe». Nous effectuerons donc une Analyse de variance à 2 facteurs. Par après nous regarderons ce qu une ANOVA à 1 facteur aurait donné ou encore un test t pour échantillons indépendants. Dans un premier temps, nous vérifions la condition de normalité par un graphique «Box-plot clustered» : Nous obtenons le graphique ci-après : 1,150 Sexe garçon fille 1, ,050 1,000 ratio 0,950 0, , ,800 Optimiste optim Pessimiste Les valeurs extrêmes pour le segment «garçon-pessimiste» semble perturber la condition de normalité. Le test de Kolmogorov-Smirnov (limité à ce segment : par «select cases») ne rejette pas la condition de normalité de la variable «ratio» dans ce segment. 9

10 One-Sample Kolmogorov-Smirnov Test ratio N 13 Normal Parameters(a,b) Mean Std. Deviation Most Extreme Absolute.179 Differences Positive.158 Negative Kolmogorov-Smirnov Z.646 Asymp. Sig. (2-tailed).797 a Test distribution is Normal. b Calculated from data. La procédure «Analyze General Linear Model univariate» pour le modèle complet donne les résultats suivants : Le test de Levene ne rejette pas l hypothèse d égalité des variances : Levene's Test of Equality of Error Variances(a) Dependent Variable: ratio F df1 df2 Sig Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a Design: Intercept+Sexe+optim+Sexe * optim Dependent Variable: ratio Tests of Between-Subjects Effects Source Type III Sum of Squares df Mean Square F Sig. Corrected Model.040(a) Intercept Sexe optim Sexe * optim Error Total Corrected Total a R Squared =.174 (Adjusted R Squared =.128) Avec un risqué de 1ère espèce de 5%, nous pouvons conclure qu il y a bien un effet significatif principal du facteur Optimisme (F(1,54) = ; p = 0.035) ainsi qu une interaction Sexe x Optimisme significative (F(1,54) = ; p = 0.038) ; par contre il n y a pas d effet principal Sexe (F(1,54) = ; p >.05). Le graphique des trajectoires des moyennes permet de visualiser ce résultat : 10

11 Estimated Marginal Means of ratio Sexe garçon fille Estimated Marginal Means 1,000 0,975 0,950 Optimiste optim Pessimiste Le graphique semble indiquer qu il n y a pas de différence significative entre garçons et filles optimistes mais bien lorsqu ils sont pessimistes. Pour vérifier ceci, nous devons procéder à des comparaisons «post hoc». SPSS ne fournit ces tests que pour les effets principaux (sur les marges) et uniquement lorsqu il y a plus de 2 modalités par facteur. Dans le cas présent les deux facteurs ont chacun deux modalités donc aucun résultat de comparaison n est disponible. Pour avoir toutes les comparaisons des 4 cellules (Garçon-optimiste, Garçon-pessimiste, Filleoptimiste, Fille-pessimiste) nous créons la variable croisée (optim*sexe) dans une nouvelle variable = 10*optim + sexe : (11 = Garçon-optimiste, 12 = Fille-optimiste, 21 = Garçonpessimiste, 22 = Fille-pessimiste). On effectue ensuite une ANOVA à 1 facteur (cette nouvelle variable) en demandant le test post Hoc de Tukey. Le tableau des comparaisons montre qu il y a bien une différence significative entre les filles et les garçons pessimistes ainsi qu entre les garçons optimistes et pessimistes et qu il n y en en pas entre les filles et les garçons optimistes. Dependent Variable: ratio Tukey HSD Multiple Comparisons (I) croisem Garçon-optim Mean 95% Confidence Interval Difference (J) croisem (I-J) Std. Error Sig. Lower Bound Upper Bound Fille-optim Garçon-pessim (*) Fille-pessim Fille-optim Garçon-optim Garçon-pessim Garçon-pessim Fille-pessim Garçon-optim (*) Fille-optim Fille-pessim (*) Fille-pessim Garçon-optim Fille-optim Garçon-pessim (*) * The mean difference is significant at the.05 level. 11

12 Les garçons pessimistes semblent donc être beaucoup plus affectés par la perception d un échec que les filles pessimistes. Si nous avions effectué une analyse de variance (de la variable ratio) à 1 facteur (optim) nous n aurions pas pu établir qu il y avait une différence entre les optimistes et les pessimistes comme le montre le tableau ci-dessous (p-valeur 6,1 %) : ratio ANOVA Sum of Squares df Mean Square F Sig. Between Groups Within Groups Total Rappelons que l Anova est un test bilatéral ; si l on se rapporte à l hypothèse des auteurs : «lors du second essai, les nageurs les plus pessimistes réaliseraient un moins bon temps et les optimistes obtiendraient de meilleurs résultats» ; un test-t unilatéral est plus approprié et permet de rejeter l hypothèse nulle puisque alors la p-valeur vaut 3,05 %. Comme il n y a que 2 groupes, nous aurions aussi pu faire un test t pour échantillons indépendants et nous aurions obtenu : Independent Samples Test Independent Samples Test Levene t-test for Equality of Means F Sig. t df Sig. (2-tailed) Mean Diff Std. Error Diff 95% CI of diff ratio Equal var assumed 1,542 0,219 1, ,061 0,031 0, , , Equal var not assumed 1,95 55,08 0,056 0,031 0,016-0, ,0637 Lower Upper Exercice 3 Une représentation de la distribution de X (= Impact) dans chaque cellule s obtient par un graphique box-plot via la procédure «Graph box-plot- clustered» : 12

13 Taux Fort Moyen Sans Impact Dominante survivante Marque Inexistante Si la non-normalité de certaines cellules peut être suspectée on procédera à un test de K-S sur l échantillon en question ; c est le cas de la cellule (inexistante sans) : le tableau ci-après ne rejète pas la normalité dans cette cellule : One-Sample Kolmogorov-Smirnov Test Impact N 9 Mean 1.89 Normal Parameters(a,b) Std. Deviation.601 Most Extreme Differences Absolute.351 Positive.316 Negative Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed).217 a Test distribution is Normal. b Calculated from data. Il en va de même pour la cellule (dominante fort) : One-Sample Kolmogorov-Smirnov Test Impact N 9 Mean 8.00 Normal Parameters(a,b) Std. Deviation Most Extreme Differences Absolute.278 Positive.278 Negative Kolmogorov-Smirnov Z.833 Asymp. Sig. (2-tailed).491 a Test distribution is Normal. b Calculated from data. 13

14 Nous pouvons donc supposer que la variable «Impact» est distribuée normalement dans chacune des cellules. Nous sommes en présence de deux facteurs qui sont susceptibles d influencer l image de marque d un produit : la «marque» et le «taux» de publicité. Nous procédons donc à une analyse de variance à deux facteurs («taux» et «marque»). La procédure «Analysze General Linear Model Univariate» fournit le résultat suivant : Le test de Levene ne rejette pas, au niveau de 5 %, l homogénéité des variances dans chaque cellule : Levene's Test of Equality of Error Variances(a) Dependent Variable: Impact F df1 df2 Sig Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a Design: Intercept+Taux+Marque+Taux * Marque Le tableau de l ANOVA est le suivant : Dependent Variable: Impact Tests of Between-Subjects Effects Source Type III Sum of Squares df Mean Square F Sig. Corrected Model (a) Intercept Taux Marque Taux * Marque Error Total Corrected Total a R Squared =.815 (Adjusted R Squared =.794) Tous les facteurs et leur croisement sont très hautement significatifs. Ainsi nous notons un effet principal significatif du facteur Marque (F(2,72)= ; p = 0.000) et du facteur Taux (F(2,72) = ; p = 0.000) ainsi qu une interaction Marque x Taux significative (F(4,72) = ; p = 0.000). En ce qui concerne la marque, l examen des moyennes (via analyze - compare means- means) ainsi que le graphe nous indiquent que plus la marque est présente dans les publicités plus grand sera son impact ; la «puissance publicitaire» d une marque semble donc influencer son image de marque. Impact Impact * Marque Marque Mean N Std. Deviation Dominante 5, ,660 survivante 3, ,687 Inexistante 1,33 27,784 Total 3, ,387 14

15 En ce qui concerne le taux, l analyse des moyennes indique que plus le taux est important plus l impact est grand. Toutefois, d un point de vue descriptif, il ne semble pas y avoir une grande différence entre un taux fort et un taux moyen. Impact * Taux Impact Taux Mean N Std. Deviation Fort 3, ,281 Moyen 3, ,797 Sans 2, ,207 Total 3, ,387 L interaction (cf graphe) semble indiquer que l inégalité entre les marques augmente avec le taux général de publicité. Un test post hoc permettra d analyser plus en détails ces observations descriptives. Estimated Marginal Means of Impact 8 Taux Fort Moyen Sans Estimated Marginal Means Dominante survivante Marque Inexistante Ainsi, après avoir construit la variable croisée «Marque-taux» (croisement = 10*Taux + marque) 15

16 Un test de Tukey dans une ANOVA à un facteur («croisement») permet de mettre en évidence les paires de cellules qui ont un impact moyen statistiquement différent. Tukey HSD Impact Subset for alpha =.05 croisement N fort-inexist moy-inexist sans -inexist sans -domin sans -surviv fort-surviv moy-surviv moy-domin fort-domin Sig Means for groups in homogeneous subsets are displayed. a Uses Harmonic Mean Sample Size = Ce tableau mis en parallèle avec le graphique ci-dessus, nous permet d affirmer que l impact moyen d une marque dominante dans un contexte de publicité fort est statistiquement différent de toutes les autres situations. Dans un contexte sans publicité, il n y a pas de différence de perception des marques (groupe 3). Pour une marque «survivante», il n y a pas de différence significative de sa perception entre un contexte à fort taux publicitaire et un contexte sans publicité. En guise de conclusion, la course à la publicité semble en contradiction avec la libre concurrence puisqu un taux élevé de publicité augmente des inégalités non justifiées entre les marques. Exercice 4 La variable étudiée est le nombre de syllabes (non significatives) mémorisées. Les facteurs mis en jeu sont le caractère oral ou écrit des mots présentés (variable «orec») et le caractère familier ou non de ces mêmes mots (variable «fam»). Le tableau d analyse de variance à deux facteurs est le suivant : Tests of Between-Subjects Effects Dependent Variable: Nombre de syllabes mémorisées Source Type III Sum of Squares df Mean Square F Sig. Corrected Model (a) Intercept Fam OrEcr Fam * OrEcr Error Total Corrected Total a R Squared =.493 (Adjusted R Squared =.417) 16

17 On y observe que seul le facteur «familier-non familier» est significatif dans l explication du nombre de mots mémorisés (F (1,20) = ; p = 0.001). Le graphique des trajectoires des moyennes est le suivant : l inversion des moyennes que l on observe n est pas significative (F(1,24) = ; p >.05). Estimated Marginal Means of Nombre de syllabes mémorisées 18 OrEcr Oral Ecrit Estimated Marginal Means Familier Fam Non-familier Exercice 5 Nous sommes en présence d un plan d expérience à deux facteurs inter-sujet : le facteur «délai» entre le franchissement de la ligne et l envoi du stimulus anxiogène et le facteur zone du cerveau recevant les stimuli («site»). Le test de Levene ne rejette pas l hypothèse d égalité des variances. Test d'égalité des variances des erreurs de Levene(a) Variable dépendante: latence F ddl1 ddl2 Signification, ,996 Teste l'hypothèse nulle que la variance des erreurs de la variable dépendante est égale sur les différents groupes. a Plan : Intercept+Delai+site+Delai * site Le tableau d analyse de variance est le suivant : Tests of Between-Subjects Effects Dependent Variable: latence Source Type III Sum of Squares Df Mean Square F Sig. Corrected Model (a) Intercept site Delai site * Delai Error Total Corrected Total a R Squared =.465 (Adjusted R Squared =.346) 17

18 Il en ressort qu il n y a pas d effet principal «délai», c est à dire que toute autre chose étant égale, la latence n est pas significativement influencée par le délai entre le franchissement de la ligne et l envoi du stimulus. C est ce que montre aussi le test post hoc de Tukey. latence Tukey HSD(a,b) Subset Delai N Sig..056 Means for groups in homogeneous subsets are displayed. Based on Type III Sum of Squares The error term is Mean Square(Error) = a Uses Harmonic Mean Sample Size = b Alpha =.05. Il y a un effet principal «site» (F(2,36) = ; p = 0.005). Le test post hoc de Tukey montre qu il s agit de la zone test qui fournit une latence moyenne significativement différente de celle obtenue dans les deux autres zones. latence Tukey HSD(a,b) Subset site N 1 2 Zone A Zone B site neutre Sig Means for groups in homogeneous subsets are displayed. Based on Type III Sum of Squares The error term is Mean Square(Error) = a Uses Harmonic Mean Sample Size = b Alpha =.05. L analyse de variance décèle également une source de variation dans le croisement «site * délai» (F(4,36) = ; p = 0.025). Le graphique des trajectoires des moyennes permet de visualiser cette interaction. 18

19 Estimated Marginal Means of latence Estimated Marginal Means 30 27, ,5 20 site site neutre Zone A Zone B 17, Delai 150 Afin de vérifier les sources de variation, on effectue une analyse des effets simples. Il s agit d une ANOVA à 1 facteur, limitée à une trajectoire. Pour ce faire, on sélection dans un premier temps les données d une trajectoire (par Select cases introduire la condition : «if site = 1»). Dans le cas du site neutre, nous n observons aucune différence significative comme le confirme le tableau d analyse de variance : latence ANOVA Sum of Squares df Mean Square F Sig. Between Groups Within Groups Total Dans le cas de la zone A, il y a bien une différence significative entre les moyennes suivant le «délai» ; la latence moyenne à 50 msec est significativement plus faible que celle à 150 msec. La latence moyenne à 100 msec n est pas significativement différente de celle lorsque le délai est de 50 msec ou 150 msec. latence ANOVA Sum of Squares df Mean Square F Sig. Between Groups Within Groups Total

20 Tukey HSD latence Subset for alpha =.05 Delai N Sig Means for groups in homogeneous subsets are displayed. a Uses Harmonic Mean Sample Size = Dans le cas de la zone B, il y a bien une différence significative entre les moyennes suivant le «délai» ; la latence moyenne à 100 msec est significativement plus faible que celle à 150 msec et 50 msec. latence ANOVA Sum of Squares df Mean Square F Sig. Between Groups Within Groups Total Tukey HSD latence Subset for alpha =.05 Delai N Sig Means for groups in homogeneous subsets are displayed. a Uses Harmonic Mean Sample Size = Nous pouvons donc conclure que l effet du facteur «délai» diffère suivant les valeurs du facteur «site». Plus précisément, cet effet est significatif uniquement lorsque les stimulations sont appliquées dans les zones A et B du cerveau mais pas sur le site neutre. Une autre manière d expliquer la source de la variation introduite par le croisement des deux facteurs est de procéder à une comparaison de toutes les cellules en introduisant une nouvelle variable et en effectuant un test post hoc de Tukey dans une analyse de variance à un facteur (cette nouvelle variable). Ceci ne fait pas l objet de la présente question. Signalons encore que plus le nombre de cellules à comparer est important, moins nous aurons de chance de mettre en évidence une faible différence entre les moyennes. 20

Analyse de la variance à deux facteurs

Analyse de la variance à deux facteurs 1 1 IRMA, Université Louis Pasteur Strasbourg, France Master 1 Psychologie du développement 06-10-2008 Contexte Nous nous proposons d analyser l influence du temps et de trois espèces ligneuses d arbre

Plus en détail

Analyse de variance à deux facteurs

Analyse de variance à deux facteurs Analyse de variance multifactorielle Ursula Hess UQAM ANOVA à deux facteurs L'analyse de variance à deux facteurs permet d analyser l impact combiné de deux variables Chiens Sit Stay Roll over jeunes 5

Plus en détail

Comparaison entre un groupe expérimental et un groupe témoin (Corrigé) /30

Comparaison entre un groupe expérimental et un groupe témoin (Corrigé) /30 Comparaison entre un groupe expérimental et un groupe témoin (Corrigé) /30 I1 Connaissances préalables : Buts spécifiques : Outils nécessaires: Consignes générales : Test t de comparaison de moyennes pour

Plus en détail

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,

Plus en détail

3. COMPARAISON DE PLUS DE DEUX GROUPES

3. COMPARAISON DE PLUS DE DEUX GROUPES 3. COMPARAISON DE PLUS DE DEUX GROUPES La comparaison de moyennes de plus de deux échantillons se fait généralement par une analyse de variance (ANOVA) L analyse de variance suppose l homogénéité des variances

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

Correction de l épreuve de Statistiques et Informatique appliquées à la Psychologie

Correction de l épreuve de Statistiques et Informatique appliquées à la Psychologie Université de Bretagne Occidentale Année Universitaire 2013-2014 U.F.R. de Lettres et Sciences Humaines CS 93837-29238 BREST CEDEX 3 Section : Psychologie - Licence 3è année Enseignant responsable : F.-G.

Plus en détail

STATISTIQUES. Cours I : Test d hypothèses. Télécom Physique Strasbourg Module 2101. Fabrice Heitz. Octobre 2014

STATISTIQUES. Cours I : Test d hypothèses. Télécom Physique Strasbourg Module 2101. Fabrice Heitz. Octobre 2014 Télécom Physique Strasbourg Module 2101 STATISTIQUES Cours I : Test d hypothèses Fabrice Heitz Octobre 2014 Fabrice Heitz (Télécom PS) Statistiques 2014 1 / 75 Cours I TESTS D HYPOTHÈSES Fabrice Heitz

Plus en détail

Analyse de la variance

Analyse de la variance M2 Statistiques et Econométrie Fanny MEYER Morgane CADRAN Margaux GAILLARD Plan du cours I. Introduction II. Analyse de la variance à un facteur III. Analyse de la variance à deux facteurs IV. Analyse

Plus en détail

Introduction aux Statistiques et à l utilisation du logiciel R

Introduction aux Statistiques et à l utilisation du logiciel R Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil

Plus en détail

Master 1 de Psychologie du Travail et des Organisations : Recueil et analyse des données - Corrigés des T.D. ( 2014/2015) -

Master 1 de Psychologie du Travail et des Organisations : Recueil et analyse des données - Corrigés des T.D. ( 2014/2015) - Dominique Ferrieux - Université Paul Valéry - Montpellier III Master de Psychologie du Travail et des Organisations : Recueil et analyse des données - Corrigés des T.D. ( /) - Deuxième partie : Plans :

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences

Plus en détail

Cours (8) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012. Test du Khi 2

Cours (8) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012. Test du Khi 2 Test du Khi 2 Le test du Khi 2 (khi deux ou khi carré) fournit une méthode pour déterminer la nature d'une répartition, qui peut être continue ou discrète. Domaine d application du test : Données qualitatives

Plus en détail

Principe des tests statistiques

Principe des tests statistiques Principe des tests statistiques Jean Vaillant Un test de signification est une procédure permettant de choisir parmi deux hypothèses celles la plus probable au vu des observations effectuées à partir d

Plus en détail

Cours 7 : Exemples. I- Régression linéaire simple II- Analyse de variance à 1 facteur III- Tests statistiques

Cours 7 : Exemples. I- Régression linéaire simple II- Analyse de variance à 1 facteur III- Tests statistiques Cours 7 : Exemples I- Régression linéaire simple II- Analyse de variance à 1 facteur III- Tests statistiques Exemple 1 : On cherche à expliquer les variations de y par celles d une fonction linéaire de

Plus en détail

Cours 11 : Homogénéité de la variance et transformations non linéaires

Cours 11 : Homogénéité de la variance et transformations non linéaires Cours 11 : Homogénéité de la variance et transformations non linéaires Table des matières Section 1. Régularité de la nature et effets linéaires... 2 Section 2. Homogénéité des variances... 2 Section 3.

Plus en détail

T de Student Khi-deux Corrélation

T de Student Khi-deux Corrélation Les tests d inférence statistiques permettent d estimer le risque d inférer un résultat d un échantillon à une population et de décider si on «prend le risque» (si 0.05 ou 5 %) Une différence de moyennes

Plus en détail

T.P. 8 - Exercice 1 Khi-Carré d ajustement (Corrigé)

T.P. 8 - Exercice 1 Khi-Carré d ajustement (Corrigé) T.P. 8 - Exercice 1 Khi-Carré d ajustement (Corrigé) Connaissances préalables : Buts spécifiques : Outils nécessaires : Consignes générales : Distribution de fréquences, proportions. Test d ajustement.

Plus en détail

TD de statistique : tests du Chi 2

TD de statistique : tests du Chi 2 TD de statistique : tests du Chi 2 Jean-Baptiste Lamy 6 octobre 2008 1 Test du Chi 2 C est l équivalent de la comparaison de moyenne, mais pour les variables qualitatives. 1.1 Cas 1 : comparer les répartitions

Plus en détail

Cours 9 : Plans à plusieurs facteurs

Cours 9 : Plans à plusieurs facteurs Cours 9 : Plans à plusieurs facteurs Table des matières Section 1. Diviser pour regner, rassembler pour saisir... 3 Section 2. Définitions et notations... 3 2.1. Définitions... 3 2.2. Notations... 4 Section

Plus en détail

Analyse de la variance à un facteur

Analyse de la variance à un facteur Analyse de la variance à un facteur Frédéric Bertrand et Myriam Maumy-Bertrand IRMA, UMR 7501, Université de Strasbourg 08 juin 2015 F. Bertrand et M. Maumy-Bertrand (UdS) Analyse de la variance à un facteur

Plus en détail

MÉTHODES ET STATISTIQUES POUR LIRE UN ARTICLE

MÉTHODES ET STATISTIQUES POUR LIRE UN ARTICLE MÉTHODES ET STATISTIQUES POUR LIRE UN ARTICLE Forum HH 05.02.2013 Ghislaine Gagnon Unité HPCI Qualitatif ou quantitatif? Les 2 méthodes peuvent être utilisées séparément ou en conjonction - le qualitatif

Plus en détail

Etude des propriétés empiriques du lasso par simulations

Etude des propriétés empiriques du lasso par simulations Etude des propriétés empiriques du lasso par simulations L objectif de ce TP est d étudier les propriétés empiriques du LASSO et de ses variantes à partir de données simulées. Un deuxième objectif est

Plus en détail

L essentiel sur les tests statistiques

L essentiel sur les tests statistiques L essentiel sur les tests statistiques 21 septembre 2014 2 Chapitre 1 Tests statistiques Nous considérerons deux exemples au long de ce chapitre. Abondance en C, G : On considère une séquence d ADN et

Plus en détail

Marketing Data Set: Follow-Up to Purchases of a Consumer Panel

Marketing Data Set: Follow-Up to Purchases of a Consumer Panel Marketing Data Set: Follow-Up to Purchases of a Consumer Panel Typologie des consommateurs et Mesure de la loyauté/fidélité Stéphanie Ledauphin-Menard, Sébastien Lê Face aux problèmes de pouvoir d achat

Plus en détail

6. Comparaisons non planifiées : tests post-hoc

6. Comparaisons non planifiées : tests post-hoc 6. Comparaisons non planifiées : tests post-hoc Soumis par Éric Raufaste Dernière mise à jour : 27-01-2013 UOH - Psychométrie et Statistique en L2 Objectifs. Montrer quand et comment comparer les moyennes

Plus en détail

Nous concluons au travers de quatre axes principaux qui ont guidé la. 1) La théorie du regret de Loomes et Sugden comme théorie de la décision

Nous concluons au travers de quatre axes principaux qui ont guidé la. 1) La théorie du regret de Loomes et Sugden comme théorie de la décision Conclusion générale Nous concluons au travers de quatre axes principaux qui ont guidé la rédaction de cette thèse. 1) La théorie du regret de Loomes et Sugden comme théorie de la décision rationnelle compatible

Plus en détail

Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr

Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr Dominique Muller Laboratoire Inter-universitaire de Psychologie Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr Supports de cours : webcom.upmf-grenoble.fr/lip/perso/dmuller/m2r/acm/

Plus en détail

Statistiques appliquées aux études médicamenteuses cliniques. Pierre BOUTOUYRIE Pharmacologie HEGP

Statistiques appliquées aux études médicamenteuses cliniques. Pierre BOUTOUYRIE Pharmacologie HEGP Statistiques appliquées aux études médicamenteuses cliniques Pierre BOUTOUYRIE Pharmacologie HEGP Grands principes méthodologiques Tout dépend de la formulation de la question scientifique Exemple : on

Plus en détail

STAT0162-1 Analyse statistique de données qualitatives et quantitatives en sciences sociales. Transparents Philippe Lambert

STAT0162-1 Analyse statistique de données qualitatives et quantitatives en sciences sociales. Transparents Philippe Lambert STAT0162-1 Analyse statistique de données qualitatives et quantitatives en sciences sociales Transparents Philippe Lambert http : //www.statsoc.ulg.ac.be/quali.html Institut des Sciences Humaines et Sociales

Plus en détail

L analyse discriminante

L analyse discriminante L analyse discriminante À Propos de ce document... Introduction... La démarche à suivre sous SPSS... 2. Statistics... 2 2. Classify... 2 Analyse des résultats... 3. Vérification de l existence de différences

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

Analyse de la Variance pour Plans à Mesures Répétées

Analyse de la Variance pour Plans à Mesures Répétées Analyse de la Variance pour Plans à Mesures Répétées Pr Roch Giorgi roch.giorgi@univ-amu.fr SESSTIM, Faculté de Médecine, Aix-Marseille Université, Marseille, France http://sesstim-orspaca.org http://optim-sesstim.univ-amu.fr/

Plus en détail

L analyse de variance à un critère de classification (ANOVA)

L analyse de variance à un critère de classification (ANOVA) Bio 041 L analyse de variance à un critère de classification (ANOVA) Pierre Legendre & Daniel Borcard, Université de Montréal Référence: Scherrer (007), section 14.1.1.1 et 14.1. 1 - Introduction Objectif:

Plus en détail

Estimation et tests statistiques, TD 5. Solutions

Estimation et tests statistiques, TD 5. Solutions ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études

Plus en détail

Analyse de la variance avec Excel

Analyse de la variance avec Excel Analyse de la variance avec Excel Benoît Laine (ULB) 7 mars 2005 1 Quelques rappels sur l ANOVA 1.1 Introduction L objet de l analyse de variance est de définir et d étudier par le biais d un modèle statistique

Plus en détail

L analyse de variance à deux critère de classification

L analyse de variance à deux critère de classification L analyse de variance à deux critère de classification Objectif : comparer l influence de chaque facteur sur la moyenne de plusieurs (k) groupes indépendants d observations La méthode détaillée ci-dessous

Plus en détail

Le raisonnement par récurrence

Le raisonnement par récurrence Le raisonnement par récurrence Nous notons N l ensemble des entiers naturels : N = {0,,, } Nous dirons naturel au lieu de entier naturel Le principe du raisonnement par récurrence Soit A une partie de

Plus en détail

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. 1 Généralités sur les tests statistiques 2

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. 1 Généralités sur les tests statistiques 2 UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 Master d économie Cours de M. Desgraupes MATHS/STATS Document 4 : Les tests statistiques 1 Généralités sur les tests

Plus en détail

Conditions d application des méthodes statistiques paramétriques :

Conditions d application des méthodes statistiques paramétriques : Conditions d application des méthodes statistiques paramétriques : applications sur ordinateur GLELE KAKAÏ R., SODJINOU E., FONTON N. Cotonou, Décembre 006 Conditions d application des méthodes statistiques

Plus en détail

Analyse de variance à un facteur Tests d hypothèses Analyse de variance à deux facteurs. Analyse de la variance ANOVA

Analyse de variance à un facteur Tests d hypothèses Analyse de variance à deux facteurs. Analyse de la variance ANOVA Analyse de la variance ANOVA Terminologie Modèles statistiques Estimation des paramètres 1 Analyse de variance à un facteur Terminologie Modèles statistiques Estimation des paramètres 2 3 Exemple. Analyse

Plus en détail

Enquête consommation - Tableaux croisés dynamiques

Enquête consommation - Tableaux croisés dynamiques Enquête consommation Tableaux croisés dynamiques 1. Chargement des données dans Excel Souvent les données collectées sont stockées dans un fichier au format texte, dont les informations sont séparées par

Plus en détail

11. Tests d hypothèses (partie 1/2)

11. Tests d hypothèses (partie 1/2) 11. Tests d hypothèses (partie 1/2) MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v1) MTH2302D: tests d hypothèses 1/30 Plan 1. Introduction 2. Hypothèses et erreurs 3. Tests d hypothèses

Plus en détail

Essai de répétabilité et de reproductibilité : calculs à effectuer à la main pour comprendre la démarche générale.

Essai de répétabilité et de reproductibilité : calculs à effectuer à la main pour comprendre la démarche générale. 4. EXEMPLE N 4 Essai de répétabilité et de reproductibilité : calculs à effectuer à la main pour comprendre la démarche générale. 4.1. Objectif Le calcul de la répétabilité et de la reproductibilité implique

Plus en détail

La méthode des quotas

La méthode des quotas La méthode des quotas Oliviero Marchese, décembre 2006 1 La méthode des quotas Principe de la méthode Point de départ et but recherché Caractère «intuitif» de la méthode A quoi ressemble une feuille de

Plus en détail

L analyse de la variance avec R commander

L analyse de la variance avec R commander L analyse de la variance avec R commander 19 mars 2014 1 Installer R Pour installer R, il vous suffit d aller sur le site http://www.r-project.org/. Choisissez un miroir pour le téléchargement. Sélectionner

Plus en détail

TABLEAU 5 Nombre moyen (et écarts types) de mots produits selon le niveau scolaire et les trois conditions de révision

TABLEAU 5 Nombre moyen (et écarts types) de mots produits selon le niveau scolaire et les trois conditions de révision Dans ce tableau, si le chercheur ne s intéresse pas aux notes item par item mais simplement à la note globale, alors il conservera seulement les première et dernière colonnes et calculera des statistiques

Plus en détail

Introduction à l analyse quantitative

Introduction à l analyse quantitative Introduction à l analyse quantitative Vue d ensemble du webinaire Le webinaire sera enregistré. Les diapositives et tous les autres documents seront envoyés aux participants après la séance. La séance

Plus en détail

Leçon N 4 : Statistiques à deux variables

Leçon N 4 : Statistiques à deux variables Leçon N 4 : Statistiques à deux variables En premier lieu, il te faut relire les cours de première sur les statistiques à une variable, il y a tout un langage à se remémorer : étude d un échantillon d

Plus en détail

Interprétation d une analyse de variance avec mesures répétées

Interprétation d une analyse de variance avec mesures répétées Approche quantitative Interprétation d une analyse de variance avec mesures répétées «Les faits sont têtus. Il est plus facile de s arranger avec les statistiques.» Mark Twain L objectif de ce document

Plus en détail

R i = a 0 +b 0 B i +ε i, R = Xβ +ε,

R i = a 0 +b 0 B i +ε i, R = Xβ +ε, Statistiques 2010-2011 TP sur le Modèle linéaire gaussien avec R 1 Les exercices Vous traiterez les exercices suivants avec le logiciel R. Exercice 1 Des photographies aériennes de champs d orge sont analysées

Plus en détail

Document d orientation sur les allégations issues d essais de non-infériorité

Document d orientation sur les allégations issues d essais de non-infériorité Document d orientation sur les allégations issues d essais de non-infériorité Février 2013 1 Liste de contrôle des essais de non-infériorité N o Liste de contrôle (les clients peuvent se servir de cette

Plus en détail

Analyses de la variance

Analyses de la variance Analyses de la variance Frédéric Bertrand et Myriam Maumy 1 Université de Strasbourg Institut de Recherche Mathématique Avancée 19 juin 011 1. Courriel : fbertran@math.unistra.fr et mmaumy@math.unistra.fr.

Plus en détail

CHAMPION Matthieu Modèles de Marché en Visual Basic ESILV S04 S6. Sommaire... 1. Introduction... 2

CHAMPION Matthieu Modèles de Marché en Visual Basic ESILV S04 S6. Sommaire... 1. Introduction... 2 Sommaire Sommaire... 1 Introduction... 2 1 Trois différentes techniques de pricing... 3 1.1 Le modèle de Cox Ross Rubinstein... 3 1.2 Le modèle de Black & Scholes... 8 1.3 Méthode de Monte Carlo.... 1

Plus en détail

MATHÉMATIQUES ET SCIENCES HUMAINES

MATHÉMATIQUES ET SCIENCES HUMAINES MATHÉMATIQUES ET SCIENCES HUMAINES B. MARCHADIER Dépendance et indépendance de deux aléas numériques images Mathématiques et sciences humaines, tome 25 (1969), p. 2534.

Plus en détail

Simulation Examen de Statistique Approfondie II **Corrigé **

Simulation Examen de Statistique Approfondie II **Corrigé ** Simulation Examen de Statistique Approfondie II **Corrigé ** Ces quatre exercices sont issus du livre d exercices de François Husson et de Jérôme Pagès intitulé Statistiques générales pour utilisateurs,

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

16. Comment introduire les valeurs prises par la variable SPORT pour les 30 premiers sujets introduits dans L2?

16. Comment introduire les valeurs prises par la variable SPORT pour les 30 premiers sujets introduits dans L2? T.P. 5 partie 1 Variable ordinale Calcul manuel de quantiles Utilisation des fonctions intégrées de la TI-84 Utilisation du programme D1 (Corrigé pour 30 cas) V. Prise en compte de 30 cas (pour éviter

Plus en détail

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur

Plus en détail

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail

Analyse de variance à mesures répétées (plan intra-sujet à un facteur) TP10

Analyse de variance à mesures répétées (plan intra-sujet à un facteur) TP10 Analyse de variance à mesures répétées (plan intra-sujet à un facteur) TP10 Jusqu à présent nous avons examiné des plans expérimentaux qui comportent des sujets différents dans les diverses cellules (par

Plus en détail

Chapitre VI Échantillonages et simulations

Chapitre VI Échantillonages et simulations Chapitre VI Commentaires : Récursivement, les commentaires ne sont pas à l attention des élèves.. Fluctuation d échantillonnage Définition : En statistiques, un échantillon de taille n est la liste des

Plus en détail

Test de Poisson à 1 échantillon et à 2 échantillons

Test de Poisson à 1 échantillon et à 2 échantillons Test de Poisson à 1 échantillon et à 2 échantillons Sous-menus de Minitab 15 : Stat>Statistiques élémentaires>test de Poisson à 1 échantillon Stat>Statistiques élémentaires>test de Poisson à 2 échantillons

Plus en détail

Analyse de la variance (ANOVA)

Analyse de la variance (ANOVA) Chapitre 7 Analyse de la variance (ANOVA) Introduction L analyse de la variance (ANOVA) a pour objectif d étudier l influence d un ou plusieurs facteurs sur une variable quantitative. Nous nous intéresserons

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

Introduction à Rcommander

Introduction à Rcommander Introduction à Rcommander Pauline Scherdel Septembre 2014 Table des matières 1 Introduction à Rcmdr sous R 2 2 Interagir avec R 3 3 Installer et charger le package Rcmdr sous R 3 4 Importation des données

Plus en détail

A propos du calcul des rentabilités des actions et des rentabilités moyennes

A propos du calcul des rentabilités des actions et des rentabilités moyennes A propos du calcul des rentabilités des actions et des rentabilités moyennes On peut calculer les rentabilités de différentes façons, sous différentes hypothèses. Cette note n a d autre prétention que

Plus en détail

L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques.

L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques. L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques 1 BUTS DU COURS : se familiariser avec le vocabulaire statistique o variable dépendante, variable indépendante o statistique descriptive,

Plus en détail

23. Interprétation clinique des mesures de l effet traitement

23. Interprétation clinique des mesures de l effet traitement 23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d

Plus en détail

CHÔMAGE ET STRATÉGIES DES FAMILLES : LES EFFETS MITIGÉS DU PASSAGE DE L ASSURANCE-CHÔMAGE À L ASSURANCE-EMPLOI

CHÔMAGE ET STRATÉGIES DES FAMILLES : LES EFFETS MITIGÉS DU PASSAGE DE L ASSURANCE-CHÔMAGE À L ASSURANCE-EMPLOI CHÔMAGE ET STRATÉGIES DES FAMILLES : LES EFFETS MITIGÉS DU PASSAGE DE L ASSURANCE-CHÔMAGE À L ASSURANCE-EMPLOI Édith Martel Université de Montréal Benoît Laplante Institut National de la Recherche Scientifique

Plus en détail

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction

Plus en détail

Savoir Faire Excel Niveau 2. 5 novembre 2007 Naomi Yamaguchi naomi.yamaguchi@univ-paris3.fr

Savoir Faire Excel Niveau 2. 5 novembre 2007 Naomi Yamaguchi naomi.yamaguchi@univ-paris3.fr Savoir Faire Excel Niveau 2 5 novembre 2007 Naomi Yamaguchi naomi.yamaguchi@univ-paris3.fr Ce qu on sait faire Entrer et recopier des données numériques Les fonctions de base (somme, moyenne, nb, si) Faire

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

Informations importantes

Informations importantes Informations importantes Dernière semaine de cours (semaine du 12 au 16 décembre) Lundi 12 décembre, cours avec T. Mout en F111 (8h30-10h30: groupe1; 10h30-12h30: groupe 2): séance sur l examen de l an

Plus en détail

Fonction polynôme du second degré : Forme canonique

Fonction polynôme du second degré : Forme canonique Fonction polynôme du second degré : Forme canonique I) Introduction. Soit g(x) = a(x - s)²+h. Toute fonction polynôme du second degré peut s écrire sous cette forme. Le passage de la forme développée à

Plus en détail

ANALYSE BIVARIÉE DE VARIABLES QUALITATIVE ET QUANTITAVIE Analyse de Variance (ANOVA)

ANALYSE BIVARIÉE DE VARIABLES QUALITATIVE ET QUANTITAVIE Analyse de Variance (ANOVA) ANALYSE BIVARIÉE DE VARIABLES QUALITATIVE ET QUANTITAVIE Analyse de Variance (ANOVA) Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS

Plus en détail

Chapitre 2 Le problème de l unicité des solutions

Chapitre 2 Le problème de l unicité des solutions Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)

Plus en détail

Ch.12 : Loi binomiale

Ch.12 : Loi binomiale 4 e - programme 2007 - mathématiques ch.12 - cours Page 1 sur 5 1 RÉPÉTITION D'EXPÉRIENCES INDÉPENDANTES Lancer plusieurs fois un dé et noter les résultats successifs. Ch.12 : Loi binomiale Prélever des

Plus en détail

Chapitre 4 : Régression linéaire

Chapitre 4 : Régression linéaire Exercice 1 Méthodes statistiques appliquées aux sciences sociales (STAT-D-203) Titulaire : Catherine Vermandele Chapitre 4 : Régression linéaire Le diplôme de Master of Business Administration ou MBA est

Plus en détail

Etude empirique de la valeur d utilité de l immobilier des entreprises : un actif associé à la gestion du risque des sociétés

Etude empirique de la valeur d utilité de l immobilier des entreprises : un actif associé à la gestion du risque des sociétés Les nouveaux enjeux et défis du marché immobilier : comment y contribuer? Chaire Ivanhoé Cambridge ESG UQÀM Etude empirique de la valeur d utilité de l immobilier des entreprises : un actif associé à la

Plus en détail

(Statistical Package for the Social Sciences)

(Statistical Package for the Social Sciences) Initiation à l utilisation de SPSS (Statistical Package for the Social Sciences) 1 SPSS 2 3 Plan de l exposé Faire une recherche (bibliographique) sur le test; Définir le test à mesurer; Expliquer les

Plus en détail

a) Il n y a pas de contre indication à utiliser la loi normale. On peut donc utiliser des tests basés sur la loi normale comme ceux vus au cours.

a) Il n y a pas de contre indication à utiliser la loi normale. On peut donc utiliser des tests basés sur la loi normale comme ceux vus au cours. Probabilités et statistique Été 2006 ELEC, MICRO, MX Dr. Diego Kuonen Corrigé du TP 2 Exercice 1. Test de Student Normal Q Q Plot Sample Quantiles 985 990 995 1000 1005 1.5 1.0 0.5 0.0 0.5 1.0 1.5 a) Il

Plus en détail

Niveau. Situation étudiée. Type d activité. Durée. Objectifs. Seconde.

Niveau. Situation étudiée. Type d activité. Durée. Objectifs. Seconde. Simuler des expériences aléatoires avec une calculatrice Niveau Seconde. Situation étudiée Différentes selon les séances : Séance 1 : Jeu de pile ou face, tirages de boule dans une urne avec des proportions

Plus en détail

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables

Plus en détail

T. D. n o 3 Analyse de données quantitatives avec le logiciel R

T. D. n o 3 Analyse de données quantitatives avec le logiciel R T. D. n o 3 Analyse de données quantitatives avec le logiciel R 1 Rappel de quelques fonctions statistiques sous R Fonction summary() cumsum() sum() mean() max() min() range() median() var() sd() Description

Plus en détail

VI. Tests non paramétriques sur un échantillon

VI. Tests non paramétriques sur un échantillon VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes

Plus en détail

+ 1. Qu est ce que cela donne pour notre calcul de 1,01? On pose x = 1,01 donc f (x) 1 + 1 0,01

+ 1. Qu est ce que cela donne pour notre calcul de 1,01? On pose x = 1,01 donc f (x) 1 + 1 0,01 Eo7 Dérivée d une fonction Vidéo partie. Définition Vidéo partie. Calculs Vidéo partie 3. Etremum local, théorème de Rolle Vidéo partie 4. Théorème des accroissements finis Eercices Fonctions dérivables

Plus en détail

Texte Agrégation limitée par diffusion interne

Texte Agrégation limitée par diffusion interne Page n 1. Texte Agrégation limitée par diffusion interne 1 Le phénomène observé Un fût de déchets radioactifs est enterré secrètement dans le Cantal. Au bout de quelques années, il devient poreux et laisse

Plus en détail

Simulation d un système d assurance automobile

Simulation d un système d assurance automobile Simulation d un système d assurance automobile DESSOUT / PLESEL / DACHI Plan 1 Introduction... 2 Méthodes et outils utilisés... 2.1 Chaines de Markov... 2.2 Méthode de Monte Carlo... 2.3 Méthode de rejet...

Plus en détail

Analyse des données - Logiciel R

Analyse des données - Logiciel R Université de Strasbourg Analyse des données Master de Sciences, Spécialité Statistique 2012/13 Master Actuariat Emmanuel Périnel Analyse des données - Logiciel R TP n 2. L Analyse en Composantes Principales

Plus en détail

ANALYSE : OUTIL D ANALYSE DE DONNEES POUR LES SCIENCES HUAMINES MANUEL DE L UTILISATEUR : PRISE EN MAIN

ANALYSE : OUTIL D ANALYSE DE DONNEES POUR LES SCIENCES HUAMINES MANUEL DE L UTILISATEUR : PRISE EN MAIN Pôle Informatique de Recherche et d Enseignement en Histoire ANALYSE : OUTIL D ANALYSE DE DONNEES POUR LES SCIENCES HUAMINES MANUEL DE L UTILISATEUR : PRISE EN MAIN A. PREMIER PAS 1. INTEGRATION DU TABLEAU

Plus en détail

Statistique de base avec R Partie 2 : Test d hypothèses et régression linéaire

Statistique de base avec R Partie 2 : Test d hypothèses et régression linéaire Statistique de base avec R Partie 2 : Test d hypothèses et régression linéaire Julien JACQUES Polytech Lille - Université Lille 1 Julien JACQUES (Polytech Lille) Statistiques de base 1 / 48 Plan 1 Tests

Plus en détail

Activité 1 : échantillonnage

Activité 1 : échantillonnage Activité échantillonnage, intervalle de fluctuation, prise de décision (à partir d un même thème) Les trois activités qui suivent s inspirent du document «ressources pour la classe de première générale

Plus en détail

- Mobiliser les résultats sur le second degré dans le cadre de la résolution d un problème.

- Mobiliser les résultats sur le second degré dans le cadre de la résolution d un problème. Mathématiques - classe de 1ère des séries STI2D et STL. 1. Analyse On dote les élèves d outils mathématiques permettant de traiter des problèmes relevant de la modélisation de phénomènes continus ou discrets.

Plus en détail

Programme de Septembre 2000

Programme de Septembre 2000 MBA DU GROUPE HEC (ISA) Programme de Septembre 000 COURS DE STATISTIQUE ETUDE DU CAS : AVALON COSMETICS, INC PP OUU O RR LL EE LL EE CC TT EE UU RR PP RR EE SS SS EE,, LL EE SS CC O NNCC LL UU SS I OONN

Plus en détail

I - Introduction à La psychologie Expérimentale

I - Introduction à La psychologie Expérimentale LA METHODE EXPERIMENTALE I - Introduction à La psychologie Expérimentale I.1. Introduction I.2. Critiques concernant l utilisation de la méthode expérimentale en psychologie I.2.A. Critiques morales I.2.A.

Plus en détail

Distributions bayésiennes nonparamétriques sur les matrices binaires triangulaires infinies : Applications aux modèles graphiques

Distributions bayésiennes nonparamétriques sur les matrices binaires triangulaires infinies : Applications aux modèles graphiques Distributions bayésiennes nonparamétriques sur les matrices binaires triangulaires infinies : Applications aux modèles graphiques Patrick Dallaire Université Laval Département d informatique et de génie

Plus en détail