Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9

Dimension: px
Commencer à balayer dès la page:

Download "Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9"

Transcription

1 Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9 L analyse de variance à un facteur permet de vérifier, moyennant certaines hypothèses, si un facteur (un critère de classification, celui qui définit les groupes ou les échantillons indépendants) a un effet significatif sur la variable X étudiée. L analyse de variance à 2 ou plusieurs facteurs généralise cette méthode lorsque nous avons plus d un critère de classification. Remarque : on présente souvent dans la littérature le problème de l analyse de variance à un facteur sous la forme d un modèle linéaire comme suit : X ij = µ + a j + e ij où X ij est le score observé du sujet i dans le traitement j, µ la moyenne de la population totale, α l effet du traitement j, et e ij la valeur de l erreur de mesure. j µ et α j sont des constantes qui garderaient les mêmes valeurs respectives si on mesurait plusieurs fois le score du sujet i dans la condition j. Par contre, la valeur de l erreur changerait à chaque nouvelle mesure du même sujet et différerait d un sujet à l autre. Pour la simplicité, nous nous limiterons au cas de deux facteurs, mais la méthode se généralise aisément à plusieurs facteurs. Prenons l exemple suivant : Nous étudions le stress (score de stress = variable X) au sein d une société. Nous repérons les employés suivant leur âge (>/< 50 ans : 1 er facteur à 2 niveaux) et leur niveau de responsabilité (techniciens, cadres inférieurs et cadres supérieurs : second facteur à 3 niveaux). Nous définissons ainsi un plan d expérience à 2 facteurs (ou deux critères de classification) ; on parle encore de plan factoriel 2 x 3 (2 niveaux sur le premier facteur et trois niveaux sur le second). Nous appellerons le premier facteur, le facteur A et le second, le facteur B. Une cellule correspond à un certain niveau du facteur A et un certain niveau du facteur B (par exemple les cadres inférieurs de moins de 50 ans). Dans chaque cellule les sujets sont différents (lorsqu il s agit des mêmes sujets on parle de plan à mesures répétées : ceci fera l objet d une prochaine séance de TP). Lorsqu il y a le même nombre de sujets dans chaque cellule on parlera d un plan balancé ou équilibré sinon nous dirons que le plan est non balancé ou non équilibré. Si nous avons 6 sujets par cellule, nous pouvons visualiser la situation de notre exemple par le tableau suivant : < 50 ans > 50 ans Techniciens XXXXXX XXXXXX Cadre Inf. XXXXXX XXXXXX Cadre Sup. XXXXXX XXXXXX 1

2 Nous allons nous intéresser à la moyenne de X dans chacune des cellules et sur les marges. Dans l exemple considéré, nous obtenons : < 50 ans > 50 ans Techniciens 15,0000 9, ,3333 Cadre Inf. 15, , ,5000 Cadre Sup. 14, , , , , ,0556 Trois types d effets, donc de sources de variation, entrent en jeu : 1. L effet principal du facteur Age (cf moyennes marginales des colonnes): compte non tenu du niveau de responsabilité, l âge a-t-il un effet sur le stress? Donc, 14,89 est-il statistiquement différent de 17,22? Si oui, nous aurons montré la présence d un effet du facteur «âge». Ceci est en fait l objet de l ANOVA à 1 facteur. 2. L effet principal du facteur Niveau responsabilité (cf moyennes marginales des lignes). Compte non tenu de l âge, le niveau de responsabilité a-t-il un effet sur le stress? Donc, 12.33, 15.5 et sont-ils statistiquement différents? Si oui, nous aurons montré la présence d un effet du facteur Niveau de responsabilité. 3. L interaction entre le facteur Age et le facteur niveau de responsabilité. Ici on ne s intéresse plus aux marges, mais aux cellules. Les 6 moyennes sont donc prises en compte. On se demande si l effet de l âge est le même quel que soit le niveau du facteur Niveau de responsabilité, ou si l effet du niveau de responsabilité est le même à chaque niveau du facteur Age. Quand un facteur n a pas les mêmes effets simples principaux à tous les niveaux de l autre facteur, les deux facteurs sont dits en interaction. Une interaction entre 2 facteurs A et B est souvent indiquée par un signe de multiplication : A X B. Les effets principaux et les interactions sont indépendants. Il est donc possible d obtenir des effets principaux significatifs sans interaction significative entre les facteurs ; il est aussi possible d obtenir une interaction significative sans aucun effet principal significatif. Graphiquement si nous représentons les moyennes à travers les niveaux de responsabilités en fixant la tranche d âge, nous obtenons les 2 trajectoires suivantes : 2

3 Estimated Marginal Means of Score de stress 25,00 Tranche d'âge <50ans >50ans Estimated Marginal Means 20,00 15,00 10,00 Techn. Cadre Inf. Niveau de responsabilité Cadre Sup. L examen de ce type de graphique permet de mettre en évidence la présence d une interaction entre les deux facteurs principaux. Sous sa forme linéaire, ce problème de l analyse de variance à deux facteurs s exprime comme suit : X ijk = µ + a j + ß k +? jk + e ijk où µ est la moyenne générale de X, a j l effet du traitement j, ß k l effet du traitement k,? jk l effet de l interaction des traitements j et k, et e ijk est un terme d erreur. Si le facteur A n a pas d effet, tous les a j sont nuls. Si le facteur B n a pas d effet, tous les ß k sont nuls et s il n y a pas d effet de l interaction, tous les? jk sont nuls. Principe de l analyse de variance à 2 facteurs. On se propose de tester trois hypothèses différentes : 1. H 0 il n y a pas d effet principal du facteur A H 1 il y a un effet principal du facteur A 2. H 0 il n y a pas d effet principal du facteur B H 1 il y a un effet principal du facteur B 3. H 0 il n y a pas d interaction entre les facteurs A et B H 1 il y a une interaction entre les facteurs A et B. Comme dans l ANOVA à un facteur pour répondre à ces questions, nous partons de la décomposition de la variabilité totale de X. SS total = SS A + SS B + SS A*B + SS within Notations : Chaque cellule du plan est repérée par deux indices j et k qui renvoient au niveau j du facteur A et au niveau k du facteur B. X ijk est le i ème individu de la cellule (j,k) M est la moyenne générale de X sur l ensemble des observations, 3

4 M j k est la moyenne de X dans la cellule (j,k) M. k est la moyenne de X dans l ensemble des cellules du niveau k du facteur B, M j. est la moyenne de X dans l ensemble des cellules du niveau j du facteur A, n jk = nombre de sujets dans la cellule (j,k) (nous noterons n dans le cas des plans balancés) n. k = le nombre de sujets dans l ensemble des cellules du niveau k du facteur B, n j. = le nombre de sujets dans l ensemble des cellules du niveau j du facteur A, N = Nombre total de sujets, J = nombre de modalités du facteur A, K = nombre de modalités du facteur B La formule de décomposition de la variation totale pour un plan équilibré est la suivante : k j i j k k n n j.. k j ( M ( M n k j i jk ( X j.. k ( X ijk M )² = M )² + M )² + ( M jk ijk M M j. jk M )². k + M )² + De manière résumée cette somme se réécrit : SS total = SS A + SS B + SS A*B + SS within A chaque somme de carrés est associée un nombre de degrés de liberté : Somme : SS total = SS A +SS B + SS A*B + SS within d.l. N-1 J-1 K-1 (J-1)(K-1) N-(J.K) N = Nombre total de sujets, J = nombre de modalités du facteur A, K = nombre de modalités du facteur B Les ratios SS/d.l. définissent les MS (carrés moyens) MS A = SS A / (J-1), MS B = SS B / (K-1), MS A*B = SS A*B / [(J-1).(K-1)], MS within = SS within / (N-1) Sous l hypothèse nulle les ratios MS A /MS within, MS B /MS within, MS A*B /MS within se distribuent suivant une loi F de Fisher-Snédecor : MS A = F J-1, N-1 MS B = F K-1, N-1 MS A*B = F (J-1)(K-1), N-1 Hypothèses : Comme dans l ANOVA à 1 facteur, nous supposerons que la variable X se distribue normalement (suivant une loi Normale) dans chaque cellule (j,k) avec la même variance s² et que les observations sont indépendantes les une des autres (on vérifiera l allure normale par un graphique «box-plot» de X dans chaque cellule). Les échantillons (de chaque cellule) sont indépendants les uns des autres. 4

5 Comparaisons multiples. Comme en analyse de variance à un facteur, on peut procéder à des comparaisons a priori et a posteriori (post hoc) lorsque l ANOVA détecte un ou des effets significatifs. Il est important de toujours contrôler le niveau global de l erreur lors de comparaisons a priori. Ce contrôle se fait automatiquement par SPSS dans le cas des comparaisons «post hoc». Notons encore que les comparaisons post hoc proposées par SPSS ne permettent pas des comparaisons entre les moyennes de deux cellules ; Seules les comparaisons des effets principaux (entre tous les niveaux d un facteur sur les marges) sont proposées au niveau des tests «post hoc». Si l on souhaite faire des comparaisons non planifiées de moyennes entre 2 cellules (à n envisager que s il y a une interaction significative), il convient de passer par un test de Tukey dans une ANOVA à 1 facteur sur la variable croisée A*B (créée par «Transform compute»). Si cette nouvelle variable possède beaucoup de modalités les tests post hoc seront fort conservateurs (et peu puissants). Il est encore possible de faire les comparaisons des moyennes aux différents niveaux d un facteur pour un niveau fixé de l autre (faire «select cases») ; c est l examen d une trajectoire dans le graphique des moyennes décrit ci-dessus. Ces comparaisons se font par un test de Tukey dans une ANOVA à 1 facteur après avoir sélectionné les sujets au niveau donné du second facteur. On peut répéter ainsi l opération pour tous les niveaux du second facteur. Ce type de test permet de déterminer à quel niveau d un facteur un autre facteur du plan exerce ses effets. On parle, dans ce cas, de tests sur les effets simples. Alternatives. L analyse de variance est une procédure robuste qui admet sans trop de problèmes des déviations légères par rapport aux conditions de normalité et d homogénéité des variances. Notons encore qu il n existe pas de test non paramétrique universellement reconnu lorsque la condition de normalité est gravement violée. Effet de taille. Dans l ANOVA 1 facteur, nous avons défini l effet de taille par η² comme la proportion de la variance de X expliquée par le facteur : η² = SS facteur / SS total Dans l ANOVA à 2 facteurs, nous pouvons définir un effet de taille (complet) pour chaque source de variation (facteur A, facteur B et interaction A*B). η² A = SS A / SS total, η² B = SS B / SS total, η² A*B = SS A*B / SS total (Ces effets de taille ne sont pas fournit par SPSS). Par contre, SPSS détermine l effet de taille partiel h² partiel (Partial eta square) η² p(a) = SS A / (SS A + SS within ), η² p(b) = SS B / (SS B + SS within ), η² A*B = SS A*B / (SS A*B + SS within ) 5

6 Exercice 1 On évalue l efficacité d un nouveau traitement ayant pour objet d améliorer le développement global des enfants atteints de trisomie 21. Pour cela, une étude a été menée auprès de 12 enfants. Six d entre eux ont reçu un produit actif alors que 6 autres ont reçu un placebo, et ce pendant 6 mois. Un indice de développement global de chaque enfant est calculé avant et après le début de l étude par un même psychologue. Cet indice de développement global résume l ensemble des capacités en termes de coordination, posture, langage et sociabilité. La nature du traitement donné n est connue ni de la famille ni du patient ni du psychologue. Deux psychologues ont participés à l étude. Les données fournies par l institut J. Lejeune sont reprises dans le fichier HP6-4.sav. Peut-on conclure à l efficacité du traitement? Observe-t-on le même résultat quel que soit le psychologue? Exercice 2 58 participants, dont 30 garçons et 28 filles, ont parcouru aussi vite que possible une distance à la nage. Le temps obtenu a été falsifié de façon à donner une performance moins bonne qu attendu. Une demi-heure plus tard les sujets ont dû re-parcourir et leurs temps ont été à nouveau enregistrés. Les auteurs avaient prédit que lors du second essai, les nageurs les plus pessimistes réaliseraient un moins bon temps et que les optimistes obtiendraient de meilleurs résultats que lors du premier essai. La variable dépendante étudiée est le rapport (ratio) temps1/temps2 ; une valeur supérieure à 1 signife que le nageur à mieux réussi au second essai. Les données sont reprises dans le fichier H13-13.sav Pouvez-vous confirmer la prédiction des auteurs? Ces résultats sont-ils indépendants du genre? Vérifiez par un graphique «box-plot» la condition de normalité ; en cas de doute pour l un ou l autre sous-groupe, effectuez un test de Kolmogorov-Smirnov. Si vous confirmez la prédiction des auteurs, déterminez les cellules présentant des résultats moyens significativement différents. Refaites les analyses sans tenir compte du facteur sexe. Exercice 3 On forme 9 groupes de volontaires qui participent chacun à l expérience suivante : pendant une semaine, les participants sont soumis à des annonces publicitaires visuelles. Selon le groupe, la masse totale de publicité (variable «taux») est nulle situation «sans» -, «moyenne» ou «forte». Les publicités ventent les qualités de trois pseudo-marques de nouilles. L une des marques est dite «dominante» (85 % des publicités), un autre est «survivante» (15 % des publicités) et la troisième est «inexistante» (pas de publicité). On mesure ensuite chez les volontaires par une variable numérique X l impact de l une des pseudo-marques de nouilles son image de marque -. Pour chaque groupe, on mesure l impact d une seule des trois marques. Les neuf groupes sont obtenus par le croisement de la situation S et de la marque M. Les données sont reprises dans le fichier NG2.sav Déterminez les facteurs qui influencent l image de marque du produit. Vérifiez par un graphique Box-plot la condition de normalité de la variable X dans chaque cellule. Tracez les 6

7 trajectoires des moyennes. Le cas échéant (lorsqu un effet est significatif) déterminez les cellules présentant des différences significatives. Interprétez vos résultats. Exercice 4 Dans une expérience on présente à chaque sujet soit oralement soit par écrit un mot qui est soit un mot familier soit un mot non familier. Après une période d attente on interroge le sujet et on calcule le nombre de syllabes non significatives mémorisées. L expérience est réalisée sur 24 sujets répartis en 4 groupes de six et les résultats sont repris dans le fichier LM7.sav Quels sont les facteurs mis en présence? Quelle est la variable étudiée? Quels sont les facteurs qui présentent un effet significatif quant à la variable étudiée? Représentez les trajectoires des moyennes. Exercice 5 Dans une étude consacrée aux processus de mémoire, des animaux ont été testés à une tâche d apprentissage de l évitement. Lors de l essai d apprentissage, les animaux recevaient un stimulus anxiogène dès qu ils franchissaient une certaine ligne. L expérimentateur a distingué trois groupes d animaux selon l endroit du cortex où il leur avait été plantés des électrodes (site neutre, zone A et zone B). Chaque groupe a encore été subdivisé selon le moment de réception de la stimulation électrique (50, 100 ou 150 millièmes de seconde après avoir franchi la ligne et avoir reçu le stimulus anxiogène). Si la zone stimulée du cerveau jouait un rôle dans la mémoire, la stimulation affecterait probablement la consolidation de la mémorisation et retarderait l apprentissage de la réponse d évitement ; l animal n hésiterait pas à franchir à nouveau la ligne. Les données relatives à la latence (temps nécessaire avant de franchir la ligne) sont reprises dans le fichier UL5-3.sav. Quelles sont les facteurs susceptibles d influencer la latence? Effectuez une analyse de variance, représentez les trajectoires des moyennes en fonction de la variable «Délai». Etudier les trois effets simples (un par «site»). Solutions Exercice 1 Les éventuels effets du traitement, du psychologue et de l interaction psy x traitement peuvent être mis en évidence par une analyse de la variance à 2 facteurs (2x2). On utilisera la procédure «Analyze General - Linear Model univariate» avec «indice» comme variable dépendante et les variables «psychologue» et «traitements» comme facteurs à effets fixes ; on sélectionnera le test d homogénéité des variances dans les options et l on choisira les graphiques des moyennes en fonction du traitement avec une trajectoire par psychologue. Au niveau du modèle, nous choisissons le modèle complet (effets principaux + interaction). Le test de Levene ne rejette pas l hypothèse d égalité des variances : 7

8 Levene's Test of Equality of Error Variances(a) Dependent Variable: Augmentation de l'indice de développement global F df1 df2 Sig., ,625 Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a Design: Intercept+Traitement+Psychologue+Traitement * Psychologue Tests of Between-Subjects Effects Dependent Variable: Augmentation de l'indice de développement global Source Type III Sum of Squares df Mean Square F Sig. Partial Eta Squared Corrected Model 2195,713(a) 3 731,904 2,658,120,499 Intercept 34518, , ,367,000,940 Psychologue 44, ,083,160,700,020 Traitement 2043, ,630 7,422,026,481 Psychologue * Traitement 108, ,000,392,549,047 Error 2202, ,339 Total 38916, Corrected Total 4398, a R Squared =,499 (Adjusted R Squared =,311) Estimated Marginal Means of Augmentation de l'indice de développement global 70,0 Psychologue 1 2 Estimated Marginal Means 60,0 50,0 40,0 placebo Traitement produit actif Nous pouvons conclure qu il y a un effet principal significatif du facteur Traitement (F(1,8) = 7,422 ; p = 0.026) ; pas d effet Psychologue significatif (F(1,8) = 0,16 ; p > 0.05) ni d interaction Psychologue x Traitement significative (F(1,8) = ; p > 0.05). Cela signifie que le traitement a un bien un effet positif sur le développement global des enfants atteints de trisomie et que les résultats ne varient pas en fonction du psychologue qui a fait passer le test (pas d effet psy) et que cet effet du traitement est identique quel que soit le psychologue qui a fait passer le test (pas d interaction). 8

9 Exercice 2 Nous sommes en présence de deux facteurs explicatifs : le facteur optimisme «optim» et le facteur «sexe». Nous effectuerons donc une Analyse de variance à 2 facteurs. Par après nous regarderons ce qu une ANOVA à 1 facteur aurait donné ou encore un test t pour échantillons indépendants. Dans un premier temps, nous vérifions la condition de normalité par un graphique «Box-plot clustered» : Nous obtenons le graphique ci-après : 1,150 Sexe garçon fille 1, ,050 1,000 ratio 0,950 0, , ,800 Optimiste optim Pessimiste Les valeurs extrêmes pour le segment «garçon-pessimiste» semble perturber la condition de normalité. Le test de Kolmogorov-Smirnov (limité à ce segment : par «select cases») ne rejette pas la condition de normalité de la variable «ratio» dans ce segment. 9

10 One-Sample Kolmogorov-Smirnov Test ratio N 13 Normal Parameters(a,b) Mean Std. Deviation Most Extreme Absolute.179 Differences Positive.158 Negative Kolmogorov-Smirnov Z.646 Asymp. Sig. (2-tailed).797 a Test distribution is Normal. b Calculated from data. La procédure «Analyze General Linear Model univariate» pour le modèle complet donne les résultats suivants : Le test de Levene ne rejette pas l hypothèse d égalité des variances : Levene's Test of Equality of Error Variances(a) Dependent Variable: ratio F df1 df2 Sig Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a Design: Intercept+Sexe+optim+Sexe * optim Dependent Variable: ratio Tests of Between-Subjects Effects Source Type III Sum of Squares df Mean Square F Sig. Corrected Model.040(a) Intercept Sexe optim Sexe * optim Error Total Corrected Total a R Squared =.174 (Adjusted R Squared =.128) Avec un risqué de 1ère espèce de 5%, nous pouvons conclure qu il y a bien un effet significatif principal du facteur Optimisme (F(1,54) = ; p = 0.035) ainsi qu une interaction Sexe x Optimisme significative (F(1,54) = ; p = 0.038) ; par contre il n y a pas d effet principal Sexe (F(1,54) = ; p >.05). Le graphique des trajectoires des moyennes permet de visualiser ce résultat : 10

11 Estimated Marginal Means of ratio Sexe garçon fille Estimated Marginal Means 1,000 0,975 0,950 Optimiste optim Pessimiste Le graphique semble indiquer qu il n y a pas de différence significative entre garçons et filles optimistes mais bien lorsqu ils sont pessimistes. Pour vérifier ceci, nous devons procéder à des comparaisons «post hoc». SPSS ne fournit ces tests que pour les effets principaux (sur les marges) et uniquement lorsqu il y a plus de 2 modalités par facteur. Dans le cas présent les deux facteurs ont chacun deux modalités donc aucun résultat de comparaison n est disponible. Pour avoir toutes les comparaisons des 4 cellules (Garçon-optimiste, Garçon-pessimiste, Filleoptimiste, Fille-pessimiste) nous créons la variable croisée (optim*sexe) dans une nouvelle variable = 10*optim + sexe : (11 = Garçon-optimiste, 12 = Fille-optimiste, 21 = Garçonpessimiste, 22 = Fille-pessimiste). On effectue ensuite une ANOVA à 1 facteur (cette nouvelle variable) en demandant le test post Hoc de Tukey. Le tableau des comparaisons montre qu il y a bien une différence significative entre les filles et les garçons pessimistes ainsi qu entre les garçons optimistes et pessimistes et qu il n y en en pas entre les filles et les garçons optimistes. Dependent Variable: ratio Tukey HSD Multiple Comparisons (I) croisem Garçon-optim Mean 95% Confidence Interval Difference (J) croisem (I-J) Std. Error Sig. Lower Bound Upper Bound Fille-optim Garçon-pessim (*) Fille-pessim Fille-optim Garçon-optim Garçon-pessim Garçon-pessim Fille-pessim Garçon-optim (*) Fille-optim Fille-pessim (*) Fille-pessim Garçon-optim Fille-optim Garçon-pessim (*) * The mean difference is significant at the.05 level. 11

12 Les garçons pessimistes semblent donc être beaucoup plus affectés par la perception d un échec que les filles pessimistes. Si nous avions effectué une analyse de variance (de la variable ratio) à 1 facteur (optim) nous n aurions pas pu établir qu il y avait une différence entre les optimistes et les pessimistes comme le montre le tableau ci-dessous (p-valeur 6,1 %) : ratio ANOVA Sum of Squares df Mean Square F Sig. Between Groups Within Groups Total Rappelons que l Anova est un test bilatéral ; si l on se rapporte à l hypothèse des auteurs : «lors du second essai, les nageurs les plus pessimistes réaliseraient un moins bon temps et les optimistes obtiendraient de meilleurs résultats» ; un test-t unilatéral est plus approprié et permet de rejeter l hypothèse nulle puisque alors la p-valeur vaut 3,05 %. Comme il n y a que 2 groupes, nous aurions aussi pu faire un test t pour échantillons indépendants et nous aurions obtenu : Independent Samples Test Independent Samples Test Levene t-test for Equality of Means F Sig. t df Sig. (2-tailed) Mean Diff Std. Error Diff 95% CI of diff ratio Equal var assumed 1,542 0,219 1, ,061 0,031 0, , , Equal var not assumed 1,95 55,08 0,056 0,031 0,016-0, ,0637 Lower Upper Exercice 3 Une représentation de la distribution de X (= Impact) dans chaque cellule s obtient par un graphique box-plot via la procédure «Graph box-plot- clustered» : 12

13 Taux Fort Moyen Sans Impact Dominante survivante Marque Inexistante Si la non-normalité de certaines cellules peut être suspectée on procédera à un test de K-S sur l échantillon en question ; c est le cas de la cellule (inexistante sans) : le tableau ci-après ne rejète pas la normalité dans cette cellule : One-Sample Kolmogorov-Smirnov Test Impact N 9 Mean 1.89 Normal Parameters(a,b) Std. Deviation.601 Most Extreme Differences Absolute.351 Positive.316 Negative Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed).217 a Test distribution is Normal. b Calculated from data. Il en va de même pour la cellule (dominante fort) : One-Sample Kolmogorov-Smirnov Test Impact N 9 Mean 8.00 Normal Parameters(a,b) Std. Deviation Most Extreme Differences Absolute.278 Positive.278 Negative Kolmogorov-Smirnov Z.833 Asymp. Sig. (2-tailed).491 a Test distribution is Normal. b Calculated from data. 13

14 Nous pouvons donc supposer que la variable «Impact» est distribuée normalement dans chacune des cellules. Nous sommes en présence de deux facteurs qui sont susceptibles d influencer l image de marque d un produit : la «marque» et le «taux» de publicité. Nous procédons donc à une analyse de variance à deux facteurs («taux» et «marque»). La procédure «Analysze General Linear Model Univariate» fournit le résultat suivant : Le test de Levene ne rejette pas, au niveau de 5 %, l homogénéité des variances dans chaque cellule : Levene's Test of Equality of Error Variances(a) Dependent Variable: Impact F df1 df2 Sig Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a Design: Intercept+Taux+Marque+Taux * Marque Le tableau de l ANOVA est le suivant : Dependent Variable: Impact Tests of Between-Subjects Effects Source Type III Sum of Squares df Mean Square F Sig. Corrected Model (a) Intercept Taux Marque Taux * Marque Error Total Corrected Total a R Squared =.815 (Adjusted R Squared =.794) Tous les facteurs et leur croisement sont très hautement significatifs. Ainsi nous notons un effet principal significatif du facteur Marque (F(2,72)= ; p = 0.000) et du facteur Taux (F(2,72) = ; p = 0.000) ainsi qu une interaction Marque x Taux significative (F(4,72) = ; p = 0.000). En ce qui concerne la marque, l examen des moyennes (via analyze - compare means- means) ainsi que le graphe nous indiquent que plus la marque est présente dans les publicités plus grand sera son impact ; la «puissance publicitaire» d une marque semble donc influencer son image de marque. Impact Impact * Marque Marque Mean N Std. Deviation Dominante 5, ,660 survivante 3, ,687 Inexistante 1,33 27,784 Total 3, ,387 14

15 En ce qui concerne le taux, l analyse des moyennes indique que plus le taux est important plus l impact est grand. Toutefois, d un point de vue descriptif, il ne semble pas y avoir une grande différence entre un taux fort et un taux moyen. Impact * Taux Impact Taux Mean N Std. Deviation Fort 3, ,281 Moyen 3, ,797 Sans 2, ,207 Total 3, ,387 L interaction (cf graphe) semble indiquer que l inégalité entre les marques augmente avec le taux général de publicité. Un test post hoc permettra d analyser plus en détails ces observations descriptives. Estimated Marginal Means of Impact 8 Taux Fort Moyen Sans Estimated Marginal Means Dominante survivante Marque Inexistante Ainsi, après avoir construit la variable croisée «Marque-taux» (croisement = 10*Taux + marque) 15

16 Un test de Tukey dans une ANOVA à un facteur («croisement») permet de mettre en évidence les paires de cellules qui ont un impact moyen statistiquement différent. Tukey HSD Impact Subset for alpha =.05 croisement N fort-inexist moy-inexist sans -inexist sans -domin sans -surviv fort-surviv moy-surviv moy-domin fort-domin Sig Means for groups in homogeneous subsets are displayed. a Uses Harmonic Mean Sample Size = Ce tableau mis en parallèle avec le graphique ci-dessus, nous permet d affirmer que l impact moyen d une marque dominante dans un contexte de publicité fort est statistiquement différent de toutes les autres situations. Dans un contexte sans publicité, il n y a pas de différence de perception des marques (groupe 3). Pour une marque «survivante», il n y a pas de différence significative de sa perception entre un contexte à fort taux publicitaire et un contexte sans publicité. En guise de conclusion, la course à la publicité semble en contradiction avec la libre concurrence puisqu un taux élevé de publicité augmente des inégalités non justifiées entre les marques. Exercice 4 La variable étudiée est le nombre de syllabes (non significatives) mémorisées. Les facteurs mis en jeu sont le caractère oral ou écrit des mots présentés (variable «orec») et le caractère familier ou non de ces mêmes mots (variable «fam»). Le tableau d analyse de variance à deux facteurs est le suivant : Tests of Between-Subjects Effects Dependent Variable: Nombre de syllabes mémorisées Source Type III Sum of Squares df Mean Square F Sig. Corrected Model (a) Intercept Fam OrEcr Fam * OrEcr Error Total Corrected Total a R Squared =.493 (Adjusted R Squared =.417) 16

17 On y observe que seul le facteur «familier-non familier» est significatif dans l explication du nombre de mots mémorisés (F (1,20) = ; p = 0.001). Le graphique des trajectoires des moyennes est le suivant : l inversion des moyennes que l on observe n est pas significative (F(1,24) = ; p >.05). Estimated Marginal Means of Nombre de syllabes mémorisées 18 OrEcr Oral Ecrit Estimated Marginal Means Familier Fam Non-familier Exercice 5 Nous sommes en présence d un plan d expérience à deux facteurs inter-sujet : le facteur «délai» entre le franchissement de la ligne et l envoi du stimulus anxiogène et le facteur zone du cerveau recevant les stimuli («site»). Le test de Levene ne rejette pas l hypothèse d égalité des variances. Test d'égalité des variances des erreurs de Levene(a) Variable dépendante: latence F ddl1 ddl2 Signification, ,996 Teste l'hypothèse nulle que la variance des erreurs de la variable dépendante est égale sur les différents groupes. a Plan : Intercept+Delai+site+Delai * site Le tableau d analyse de variance est le suivant : Tests of Between-Subjects Effects Dependent Variable: latence Source Type III Sum of Squares Df Mean Square F Sig. Corrected Model (a) Intercept site Delai site * Delai Error Total Corrected Total a R Squared =.465 (Adjusted R Squared =.346) 17

18 Il en ressort qu il n y a pas d effet principal «délai», c est à dire que toute autre chose étant égale, la latence n est pas significativement influencée par le délai entre le franchissement de la ligne et l envoi du stimulus. C est ce que montre aussi le test post hoc de Tukey. latence Tukey HSD(a,b) Subset Delai N Sig..056 Means for groups in homogeneous subsets are displayed. Based on Type III Sum of Squares The error term is Mean Square(Error) = a Uses Harmonic Mean Sample Size = b Alpha =.05. Il y a un effet principal «site» (F(2,36) = ; p = 0.005). Le test post hoc de Tukey montre qu il s agit de la zone test qui fournit une latence moyenne significativement différente de celle obtenue dans les deux autres zones. latence Tukey HSD(a,b) Subset site N 1 2 Zone A Zone B site neutre Sig Means for groups in homogeneous subsets are displayed. Based on Type III Sum of Squares The error term is Mean Square(Error) = a Uses Harmonic Mean Sample Size = b Alpha =.05. L analyse de variance décèle également une source de variation dans le croisement «site * délai» (F(4,36) = ; p = 0.025). Le graphique des trajectoires des moyennes permet de visualiser cette interaction. 18

19 Estimated Marginal Means of latence Estimated Marginal Means 30 27, ,5 20 site site neutre Zone A Zone B 17, Delai 150 Afin de vérifier les sources de variation, on effectue une analyse des effets simples. Il s agit d une ANOVA à 1 facteur, limitée à une trajectoire. Pour ce faire, on sélection dans un premier temps les données d une trajectoire (par Select cases introduire la condition : «if site = 1»). Dans le cas du site neutre, nous n observons aucune différence significative comme le confirme le tableau d analyse de variance : latence ANOVA Sum of Squares df Mean Square F Sig. Between Groups Within Groups Total Dans le cas de la zone A, il y a bien une différence significative entre les moyennes suivant le «délai» ; la latence moyenne à 50 msec est significativement plus faible que celle à 150 msec. La latence moyenne à 100 msec n est pas significativement différente de celle lorsque le délai est de 50 msec ou 150 msec. latence ANOVA Sum of Squares df Mean Square F Sig. Between Groups Within Groups Total

20 Tukey HSD latence Subset for alpha =.05 Delai N Sig Means for groups in homogeneous subsets are displayed. a Uses Harmonic Mean Sample Size = Dans le cas de la zone B, il y a bien une différence significative entre les moyennes suivant le «délai» ; la latence moyenne à 100 msec est significativement plus faible que celle à 150 msec et 50 msec. latence ANOVA Sum of Squares df Mean Square F Sig. Between Groups Within Groups Total Tukey HSD latence Subset for alpha =.05 Delai N Sig Means for groups in homogeneous subsets are displayed. a Uses Harmonic Mean Sample Size = Nous pouvons donc conclure que l effet du facteur «délai» diffère suivant les valeurs du facteur «site». Plus précisément, cet effet est significatif uniquement lorsque les stimulations sont appliquées dans les zones A et B du cerveau mais pas sur le site neutre. Une autre manière d expliquer la source de la variation introduite par le croisement des deux facteurs est de procéder à une comparaison de toutes les cellules en introduisant une nouvelle variable et en effectuant un test post hoc de Tukey dans une analyse de variance à un facteur (cette nouvelle variable). Ceci ne fait pas l objet de la présente question. Signalons encore que plus le nombre de cellules à comparer est important, moins nous aurons de chance de mettre en évidence une faible différence entre les moyennes. 20

Analyse de variance à deux facteurs

Analyse de variance à deux facteurs Analyse de variance multifactorielle Ursula Hess UQAM ANOVA à deux facteurs L'analyse de variance à deux facteurs permet d analyser l impact combiné de deux variables Chiens Sit Stay Roll over jeunes 5

Plus en détail

Analyse de la variance à deux facteurs

Analyse de la variance à deux facteurs 1 1 IRMA, Université Louis Pasteur Strasbourg, France Master 1 Psychologie du développement 06-10-2008 Contexte Nous nous proposons d analyser l influence du temps et de trois espèces ligneuses d arbre

Plus en détail

Introduction aux Statistiques et à l utilisation du logiciel R

Introduction aux Statistiques et à l utilisation du logiciel R Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil

Plus en détail

Analyse de la variance

Analyse de la variance M2 Statistiques et Econométrie Fanny MEYER Morgane CADRAN Margaux GAILLARD Plan du cours I. Introduction II. Analyse de la variance à un facteur III. Analyse de la variance à deux facteurs IV. Analyse

Plus en détail

STATISTIQUES. Cours I : Test d hypothèses. Télécom Physique Strasbourg Module 2101. Fabrice Heitz. Octobre 2014

STATISTIQUES. Cours I : Test d hypothèses. Télécom Physique Strasbourg Module 2101. Fabrice Heitz. Octobre 2014 Télécom Physique Strasbourg Module 2101 STATISTIQUES Cours I : Test d hypothèses Fabrice Heitz Octobre 2014 Fabrice Heitz (Télécom PS) Statistiques 2014 1 / 75 Cours I TESTS D HYPOTHÈSES Fabrice Heitz

Plus en détail

3. COMPARAISON DE PLUS DE DEUX GROUPES

3. COMPARAISON DE PLUS DE DEUX GROUPES 3. COMPARAISON DE PLUS DE DEUX GROUPES La comparaison de moyennes de plus de deux échantillons se fait généralement par une analyse de variance (ANOVA) L analyse de variance suppose l homogénéité des variances

Plus en détail

Comparaison entre un groupe expérimental et un groupe témoin (Corrigé) /30

Comparaison entre un groupe expérimental et un groupe témoin (Corrigé) /30 Comparaison entre un groupe expérimental et un groupe témoin (Corrigé) /30 I1 Connaissances préalables : Buts spécifiques : Outils nécessaires: Consignes générales : Test t de comparaison de moyennes pour

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

Cours 9 : Plans à plusieurs facteurs

Cours 9 : Plans à plusieurs facteurs Cours 9 : Plans à plusieurs facteurs Table des matières Section 1. Diviser pour regner, rassembler pour saisir... 3 Section 2. Définitions et notations... 3 2.1. Définitions... 3 2.2. Notations... 4 Section

Plus en détail

Cours 7 : Exemples. I- Régression linéaire simple II- Analyse de variance à 1 facteur III- Tests statistiques

Cours 7 : Exemples. I- Régression linéaire simple II- Analyse de variance à 1 facteur III- Tests statistiques Cours 7 : Exemples I- Régression linéaire simple II- Analyse de variance à 1 facteur III- Tests statistiques Exemple 1 : On cherche à expliquer les variations de y par celles d une fonction linéaire de

Plus en détail

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,

Plus en détail

Correction de l épreuve de Statistiques et Informatique appliquées à la Psychologie

Correction de l épreuve de Statistiques et Informatique appliquées à la Psychologie Université de Bretagne Occidentale Année Universitaire 2013-2014 U.F.R. de Lettres et Sciences Humaines CS 93837-29238 BREST CEDEX 3 Section : Psychologie - Licence 3è année Enseignant responsable : F.-G.

Plus en détail

TD de statistique : tests du Chi 2

TD de statistique : tests du Chi 2 TD de statistique : tests du Chi 2 Jean-Baptiste Lamy 6 octobre 2008 1 Test du Chi 2 C est l équivalent de la comparaison de moyenne, mais pour les variables qualitatives. 1.1 Cas 1 : comparer les répartitions

Plus en détail

T.P. 8 - Exercice 1 Khi-Carré d ajustement (Corrigé)

T.P. 8 - Exercice 1 Khi-Carré d ajustement (Corrigé) T.P. 8 - Exercice 1 Khi-Carré d ajustement (Corrigé) Connaissances préalables : Buts spécifiques : Outils nécessaires : Consignes générales : Distribution de fréquences, proportions. Test d ajustement.

Plus en détail

STAT2430 - Calcul statistique sur ordinateur

STAT2430 - Calcul statistique sur ordinateur STT2430 - Calcul statistique sur ordinateur SÉNCE 1 - Manipulations de données sous Excel, SPSS et JMP Objectifs de la séance Utilisation d'excel Importer des données, nettoyage et mise en forme. Formules

Plus en détail

L essentiel sur les tests statistiques

L essentiel sur les tests statistiques L essentiel sur les tests statistiques 21 septembre 2014 2 Chapitre 1 Tests statistiques Nous considérerons deux exemples au long de ce chapitre. Abondance en C, G : On considère une séquence d ADN et

Plus en détail

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. 1 Généralités sur les tests statistiques 2

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. 1 Généralités sur les tests statistiques 2 UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 Master d économie Cours de M. Desgraupes MATHS/STATS Document 4 : Les tests statistiques 1 Généralités sur les tests

Plus en détail

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences

Plus en détail

Résumé du cours [POLS1221] Analyse de données quantitatives

Résumé du cours [POLS1221] Analyse de données quantitatives Résumé du cours [POLS1221] Analyse de données quantitatives Year 2006-2007 1/58 PLAN DU COURS Les parties sont indépendantes, l ordre est indifférent! 1 Rappel variables et autre 2 Analyses uni -variées

Plus en détail

L analyse discriminante

L analyse discriminante L analyse discriminante À Propos de ce document... Introduction... La démarche à suivre sous SPSS... 2. Statistics... 2 2. Classify... 2 Analyse des résultats... 3. Vérification de l existence de différences

Plus en détail

Cours 11 : Homogénéité de la variance et transformations non linéaires

Cours 11 : Homogénéité de la variance et transformations non linéaires Cours 11 : Homogénéité de la variance et transformations non linéaires Table des matières Section 1. Régularité de la nature et effets linéaires... 2 Section 2. Homogénéité des variances... 2 Section 3.

Plus en détail

L analyse de variance à un critère de classification (ANOVA)

L analyse de variance à un critère de classification (ANOVA) Bio 041 L analyse de variance à un critère de classification (ANOVA) Pierre Legendre & Daniel Borcard, Université de Montréal Référence: Scherrer (007), section 14.1.1.1 et 14.1. 1 - Introduction Objectif:

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

REGRESSION MULTIPLE: CONSOMMATION D ELECTRICITE

REGRESSION MULTIPLE: CONSOMMATION D ELECTRICITE REGRESSION MULTIPLE: CONSOMMATION D ELECTRICITE LES DONNEES OBS KW SURFACE PERS PAVILLON AGE VOL SBAINS 1 4805 130 4 1 65 410 1 2 3783 123 4 1 5 307 2 3 2689 98 3 0 18 254 1 4 5683 178 6 1 77 570 3 5 3750

Plus en détail

Cours (8) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012. Test du Khi 2

Cours (8) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012. Test du Khi 2 Test du Khi 2 Le test du Khi 2 (khi deux ou khi carré) fournit une méthode pour déterminer la nature d'une répartition, qui peut être continue ou discrète. Domaine d application du test : Données qualitatives

Plus en détail

Programme de Septembre 2000

Programme de Septembre 2000 MBA DU GROUPE HEC (ISA) Programme de Septembre 000 COURS DE STATISTIQUE ETUDE DU CAS : AVALON COSMETICS, INC PP OUU O RR LL EE LL EE CC TT EE UU RR PP RR EE SS SS EE,, LL EE SS CC O NNCC LL UU SS I OONN

Plus en détail

Analyse de la Variance pour Plans à Mesures Répétées

Analyse de la Variance pour Plans à Mesures Répétées Analyse de la Variance pour Plans à Mesures Répétées Pr Roch Giorgi roch.giorgi@univ-amu.fr SESSTIM, Faculté de Médecine, Aix-Marseille Université, Marseille, France http://sesstim-orspaca.org http://optim-sesstim.univ-amu.fr/

Plus en détail

Économétrie - Une Étude de la Création d Entreprise entre 1994 et 2007

Économétrie - Une Étude de la Création d Entreprise entre 1994 et 2007 LESAUX Loïc MAROT Gildas TANGUY Brewal Économétrie - Une Étude de la Création d Entreprise entre 1994 et 007 Charpentier Arthur Semestre 008 Master 1 Cadoret Isabelle 1 Plan Introduction... 3 Présentation

Plus en détail

Master 1 de Psychologie du Travail et des Organisations : Recueil et analyse des données - Corrigés des T.D. ( 2014/2015) -

Master 1 de Psychologie du Travail et des Organisations : Recueil et analyse des données - Corrigés des T.D. ( 2014/2015) - Dominique Ferrieux - Université Paul Valéry - Montpellier III Master de Psychologie du Travail et des Organisations : Recueil et analyse des données - Corrigés des T.D. ( /) - Deuxième partie : Plans :

Plus en détail

Conditions d application des méthodes statistiques paramétriques :

Conditions d application des méthodes statistiques paramétriques : Conditions d application des méthodes statistiques paramétriques : applications sur ordinateur GLELE KAKAÏ R., SODJINOU E., FONTON N. Cotonou, Décembre 006 Conditions d application des méthodes statistiques

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

Enquête consommation - Tableaux croisés dynamiques

Enquête consommation - Tableaux croisés dynamiques Enquête consommation Tableaux croisés dynamiques 1. Chargement des données dans Excel Souvent les données collectées sont stockées dans un fichier au format texte, dont les informations sont séparées par

Plus en détail

Essai de répétabilité et de reproductibilité : calculs à effectuer à la main pour comprendre la démarche générale.

Essai de répétabilité et de reproductibilité : calculs à effectuer à la main pour comprendre la démarche générale. 4. EXEMPLE N 4 Essai de répétabilité et de reproductibilité : calculs à effectuer à la main pour comprendre la démarche générale. 4.1. Objectif Le calcul de la répétabilité et de la reproductibilité implique

Plus en détail

Analyse de la variance avec Excel

Analyse de la variance avec Excel Analyse de la variance avec Excel Benoît Laine (ULB) 7 mars 2005 1 Quelques rappels sur l ANOVA 1.1 Introduction L objet de l analyse de variance est de définir et d étudier par le biais d un modèle statistique

Plus en détail

Marketing Data Set: Follow-Up to Purchases of a Consumer Panel

Marketing Data Set: Follow-Up to Purchases of a Consumer Panel Marketing Data Set: Follow-Up to Purchases of a Consumer Panel Typologie des consommateurs et Mesure de la loyauté/fidélité Stéphanie Ledauphin-Menard, Sébastien Lê Face aux problèmes de pouvoir d achat

Plus en détail

Les Meta-analyses. Sibilia Quilici. Université René Descartes Paris V Faculté de Pharmacie Master Science de la vie et de la santé 28/01/2014

Les Meta-analyses. Sibilia Quilici. Université René Descartes Paris V Faculté de Pharmacie Master Science de la vie et de la santé 28/01/2014 Les Meta-analyses Sibilia Quilici Université René Descartes Paris V Faculté de Pharmacie Master Science de la vie et de la santé 28/01/2014 Nombre de publication en méta-analyses 8000 7000 6000 5000 4000

Plus en détail

Dossier / TD Econométrie. Analyse de la demande d essence aux Etats-Unis entre 1960-1995 fichier : essence.xls

Dossier / TD Econométrie. Analyse de la demande d essence aux Etats-Unis entre 1960-1995 fichier : essence.xls Dossier / TD Econométrie Analyse de la demande d essence aux Etats-Unis entre 1960-1995 fichier : essence.xls Source : Greene "Econometric Analysis" Prentice Hall International, 4 ème édition, 2000 Council

Plus en détail

Analyse des données «Hamburgers» à l aide de SPSS (v2, janvier 2011) Auteur : André Berchtold

Analyse des données «Hamburgers» à l aide de SPSS (v2, janvier 2011) Auteur : André Berchtold Analyse des données «Hamburgers» à l aide de SPSS (v2, janvier 2011) Auteur : André Berchtold Le site web «The Fast Food Explorer» (www.fatcalories.com) propose des données relatives à la composition des

Plus en détail

R i = a 0 +b 0 B i +ε i, R = Xβ +ε,

R i = a 0 +b 0 B i +ε i, R = Xβ +ε, Statistiques 2010-2011 TP sur le Modèle linéaire gaussien avec R 1 Les exercices Vous traiterez les exercices suivants avec le logiciel R. Exercice 1 Des photographies aériennes de champs d orge sont analysées

Plus en détail

MATHÉMATIQUES CYCLE TERMINAL DE LA SÉRIE ÉCONOMIQUE ET SOCIALE ET DE LA SÉRIE LITTERAIRE CLASSE DE PREMIÈRE

MATHÉMATIQUES CYCLE TERMINAL DE LA SÉRIE ÉCONOMIQUE ET SOCIALE ET DE LA SÉRIE LITTERAIRE CLASSE DE PREMIÈRE Annexe MATHÉMATIQUES CYCLE TERMINAL DE LA SÉRIE ÉCONOMIQUE ET SOCIALE ET DE LA SÉRIE LITTERAIRE CLASSE DE PREMIÈRE L enseignement des mathématiques au collège et au lycée a pour but de donner à chaque

Plus en détail

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction

Plus en détail

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons

Plus en détail

Analyses de la variance

Analyses de la variance Analyses de la variance Frédéric Bertrand et Myriam Maumy 1 Université de Strasbourg Institut de Recherche Mathématique Avancée 19 juin 011 1. Courriel : fbertran@math.unistra.fr et mmaumy@math.unistra.fr.

Plus en détail

Estimation et tests statistiques, TD 5. Solutions

Estimation et tests statistiques, TD 5. Solutions ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études

Plus en détail

TESTS STATISTIQUES: COMPARAISON, INDÉPENDANCE ET RÉGRESSION LINÉAIRE

TESTS STATISTIQUES: COMPARAISON, INDÉPENDANCE ET RÉGRESSION LINÉAIRE TESTS STATISTIQUES: COMPARAISON, INDÉPENDANCE ET RÉGRESSION LINÉAIRE Les résultats donnés par R et SAS donnent les valeurs des tests, la valeur-p ainsi que les intervalles de confiance. TEST DE COMPARAISON

Plus en détail

CHAMPION Matthieu Modèles de Marché en Visual Basic ESILV S04 S6. Sommaire... 1. Introduction... 2

CHAMPION Matthieu Modèles de Marché en Visual Basic ESILV S04 S6. Sommaire... 1. Introduction... 2 Sommaire Sommaire... 1 Introduction... 2 1 Trois différentes techniques de pricing... 3 1.1 Le modèle de Cox Ross Rubinstein... 3 1.2 Le modèle de Black & Scholes... 8 1.3 Méthode de Monte Carlo.... 1

Plus en détail

Le chi carré. Le sommaire. Approche quantitative

Le chi carré. Le sommaire. Approche quantitative Approche quantitative Le chi carré Les objectifs pédagogiques Définir le test du chi carré Déterminer la nature des données propres au chi carré Savoir calculer le chi carré Savoir déterminer les fréquences

Plus en détail

Concours de recrutement interne PLP 2009

Concours de recrutement interne PLP 2009 Concours de recrutement interne PLP 2009 Le sujet est constitué de quatre exercices indépendants. Le premier exercice, de nature pédagogique au niveau du baccalauréat professionnel, porte sur le flocon

Plus en détail

Création de typologie sous SPSS

Création de typologie sous SPSS Création de typologie sous SPSS À Propos de ce document... 1 Introduction... 1 La démarche à suivre sous SPSS... 2 1. «Iterate»... 2 2. «Save»... 2 3. «Options»... 3 Analyse des résultats... 3 1. Historique

Plus en détail

- Mobiliser les résultats sur le second degré dans le cadre de la résolution d un problème.

- Mobiliser les résultats sur le second degré dans le cadre de la résolution d un problème. Mathématiques - classe de 1ère des séries STI2D et STL. 1. Analyse On dote les élèves d outils mathématiques permettant de traiter des problèmes relevant de la modélisation de phénomènes continus ou discrets.

Plus en détail

T de Student Khi-deux Corrélation

T de Student Khi-deux Corrélation Les tests d inférence statistiques permettent d estimer le risque d inférer un résultat d un échantillon à une population et de décider si on «prend le risque» (si 0.05 ou 5 %) Une différence de moyennes

Plus en détail

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

ANOVA : analyse de variance univariée

ANOVA : analyse de variance univariée Résumé Le chapitre 3 est consacré aux plans factoriels. Il s agit de l appellation appropriée, bien qu assez peu employée, de l analyse de variance, appelée par les anglo-saxons ANalysis Of VAriance et,

Plus en détail

Le test triangulaire

Le test triangulaire Le test triangulaire Objectif : Détecter l absence ou la présence de différences sensorielles entre 2 produits. «les 2 produits sont-ils perçus comme différents?» Contexte : la différence sensorielle entre

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

Feuille de TP N 3 : Modèle log-linéaire - Travail guidé. 1 Cancers : modèle log-linéaire à deux facteurs croisés

Feuille de TP N 3 : Modèle log-linéaire - Travail guidé. 1 Cancers : modèle log-linéaire à deux facteurs croisés M1 MLG Année 2012 2013 Feuille de TP N 3 : Modèle log-linéaire - Travail guidé 1 Cancers : modèle log-linéaire à deux facteurs croisés Ce premier exercice reprend l exercice 1 de la feuille de TD n 3.

Plus en détail

Exemples d application

Exemples d application Institut National Agronomique Paris - Grignon Exemples d application du modèle linéaire E Lebarbier, S Robin Département OMIP 12 février 2007 Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations

Plus en détail

L analyse de la variance avec R commander

L analyse de la variance avec R commander L analyse de la variance avec R commander 19 mars 2014 1 Installer R Pour installer R, il vous suffit d aller sur le site http://www.r-project.org/. Choisissez un miroir pour le téléchargement. Sélectionner

Plus en détail

TABLEAU 5 Nombre moyen (et écarts types) de mots produits selon le niveau scolaire et les trois conditions de révision

TABLEAU 5 Nombre moyen (et écarts types) de mots produits selon le niveau scolaire et les trois conditions de révision Dans ce tableau, si le chercheur ne s intéresse pas aux notes item par item mais simplement à la note globale, alors il conservera seulement les première et dernière colonnes et calculera des statistiques

Plus en détail

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1 UN GROUPE D INDIVIDUS Un groupe d individus décrit par une variable qualitative binaire DÉCRIT PAR UNE VARIABLE QUALITATIVE BINAIRE ANALYSER UN SOUS-GROUPE COMPARER UN SOUS-GROUPE À UNE RÉFÉRENCE Mots-clés

Plus en détail

Université de Thessalie Département d Aménagement, D Urbanisme et Développement Régional

Université de Thessalie Département d Aménagement, D Urbanisme et Développement Régional Université de Thessalie Département d Aménagement, D Urbanisme et Développement Régional Enseignant : As. Pr. Marie-Noelle Duquenne I. Les Méthodes factorielles La question traitée dans ce document porte

Plus en détail

Louis-André Vallet (CNRS) Laboratoire de Sociologie Quantitative, CREST, UMR 2773 CNRS & INSEE

Louis-André Vallet (CNRS) Laboratoire de Sociologie Quantitative, CREST, UMR 2773 CNRS & INSEE Utiliser le modèle log-linéaire pour mettre au jour la structure du lien entre les deux variables d un tableau de contingence : un exemple d application à la mobilité sociale Louis-André Vallet (CNRS)

Plus en détail

Analyses de variance et covariance

Analyses de variance et covariance Résumé Introduction au modèle linéaire et modèle linéaire général : analyse de variance et covariance. Retour au plan du cours. 1 Introduction Les techniques dites d analyse de variance sont des outils

Plus en détail

Ch.12 : Loi binomiale

Ch.12 : Loi binomiale 4 e - programme 2007 - mathématiques ch.12 - cours Page 1 sur 5 1 RÉPÉTITION D'EXPÉRIENCES INDÉPENDANTES Lancer plusieurs fois un dé et noter les résultats successifs. Ch.12 : Loi binomiale Prélever des

Plus en détail

Probabilités et Statistiques. Chapitre 1 : Statistique descriptive

Probabilités et Statistiques. Chapitre 1 : Statistique descriptive U.P.S. I.U.T. A, Département d Informatique Année 2008-2009 Probabilités et Statistiques Emmanuel PAUL Chapitre 1 : Statistique descriptive 1 Objectifs des statistiques. Il s agit d étudier un ou plusieurs

Plus en détail

TP 1. Introduction au logiciel SAS Analyse Statistique Univariée

TP 1. Introduction au logiciel SAS Analyse Statistique Univariée IMIS : Master 1 Université Paris Est Marne la Vallée TP 1. Introduction au logiciel SAS Analyse Statistique Univariée 1. Premier contact avec SAS 1. Lancez le logiciel sas. Vous voyez apparaître les fenètres

Plus en détail

MÉTHODES ET STATISTIQUES POUR LIRE UN ARTICLE

MÉTHODES ET STATISTIQUES POUR LIRE UN ARTICLE MÉTHODES ET STATISTIQUES POUR LIRE UN ARTICLE Forum HH 05.02.2013 Ghislaine Gagnon Unité HPCI Qualitatif ou quantitatif? Les 2 méthodes peuvent être utilisées séparément ou en conjonction - le qualitatif

Plus en détail

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7 Table des matières Préface Public 1 Structure de l ouvrage 1 Caractéristiques de l ouvrage 3 Contenu 3 Pédagogie 4 Remarques sur l adaptation française 4 Ressources numériques 5 Biographie 6 PREMIÈRE PARTIE

Plus en détail

Introduction à l'analyse statistique des données

Introduction à l'analyse statistique des données INTRODUCTION À L'ANALYSE STATISTIQUE DES DONNÉES CONCEPTS DE BASE Un certain nombre de concepts, préalables indispensables à la compréhension des analyses présentées, sont définis ici. De même pour quelques

Plus en détail

Économétrie 2 : données qualitatives, probit et logit

Économétrie 2 : données qualitatives, probit et logit URCA Hugo Harari-Kermadec 2008-2009 harari@ecogest.ens-cachan.fr Économétrie 2 : données qualitatives, probit et logit I Un modèle pour données qualitatives Cette section est fortement inspirée du cours

Plus en détail

SES-Colibri. (Version 2.0)

SES-Colibri. (Version 2.0) SES-Colibri.doc 19/09/2013 1/9 SES-Colibri (Version 2.0) Vous vous intéressez à la taille des effets : - lors d une recherche personnelle, - lors de la lecture d un article, Mais vous ne disposez que du

Plus en détail

Simulation d un système d assurance automobile

Simulation d un système d assurance automobile Simulation d un système d assurance automobile DESSOUT / PLESEL / DACHI Plan 1 Introduction... 2 Méthodes et outils utilisés... 2.1 Chaines de Markov... 2.2 Méthode de Monte Carlo... 2.3 Méthode de rejet...

Plus en détail

STAT0162-1 Analyse statistique de données qualitatives et quantitatives en sciences sociales. Transparents Philippe Lambert

STAT0162-1 Analyse statistique de données qualitatives et quantitatives en sciences sociales. Transparents Philippe Lambert STAT0162-1 Analyse statistique de données qualitatives et quantitatives en sciences sociales Transparents Philippe Lambert http : //www.statsoc.ulg.ac.be/quali.html Institut des Sciences Humaines et Sociales

Plus en détail

Module Statistique-Informatique. Projet de statistique

Module Statistique-Informatique. Projet de statistique Module S.I. - Projet de Statistiques Module Statistique-Informatique Projet de statistique Ecole Nationale Vétérinaire de Toulouse Département des Sciences biologiques et fonctionnelles UP de Biométrie

Plus en détail

Test d indépendance de deux variables qualitatives (Chi2) Rapport de chances et Odds-ratio

Test d indépendance de deux variables qualitatives (Chi2) Rapport de chances et Odds-ratio Université Paris Ouest - Nanterre La Défense Master M1 SES Enquêtes et méthodes d analyses quantitatives A.K. FERMIN et C. Hardouin Test d indépendance de deux variables qualitatives (Chi2) Rapport de

Plus en détail

Normalité des rendements?

Normalité des rendements? Normalité des rendements? Daniel Herlemont 31 mars 2011 Table des matières 1 Introduction 1 2 Test de Normalité des rendements 2 3 Graphiques quantile-quantile 2 4 Estimation par maximum de vraisemblance

Plus en détail

Probabilités conditionnelles Loi binomiale

Probabilités conditionnelles Loi binomiale Exercices 23 juillet 2014 Probabilités conditionnelles Loi binomiale Équiprobabilité et variable aléatoire Exercice 1 Une urne contient 5 boules indiscernables, 3 rouges et 2 vertes. On tire au hasard

Plus en détail

Approche expérimentale en IHM

Approche expérimentale en IHM Plan Approche expérimentale en IHM Michel Beaudouin-Lafon, LRI Wendy Mackay, INRIA mbl@lri.fr mackay@lri.fr http://insitu.lri.fr Qu est-ce que l approche expérimentale Concevoir une expérience Un peu de

Plus en détail

Principe des tests statistiques

Principe des tests statistiques Principe des tests statistiques Jean Vaillant Un test de signification est une procédure permettant de choisir parmi deux hypothèses celles la plus probable au vu des observations effectuées à partir d

Plus en détail

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015 Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par

Plus en détail

Savoir Faire Excel Niveau 2. 5 novembre 2007 Naomi Yamaguchi naomi.yamaguchi@univ-paris3.fr

Savoir Faire Excel Niveau 2. 5 novembre 2007 Naomi Yamaguchi naomi.yamaguchi@univ-paris3.fr Savoir Faire Excel Niveau 2 5 novembre 2007 Naomi Yamaguchi naomi.yamaguchi@univ-paris3.fr Ce qu on sait faire Entrer et recopier des données numériques Les fonctions de base (somme, moyenne, nb, si) Faire

Plus en détail

Analyse de variance à un facteur Tests d hypothèses Analyse de variance à deux facteurs. Analyse de la variance ANOVA

Analyse de variance à un facteur Tests d hypothèses Analyse de variance à deux facteurs. Analyse de la variance ANOVA Analyse de la variance ANOVA Terminologie Modèles statistiques Estimation des paramètres 1 Analyse de variance à un facteur Terminologie Modèles statistiques Estimation des paramètres 2 3 Exemple. Analyse

Plus en détail

A propos du calcul des rentabilités des actions et des rentabilités moyennes

A propos du calcul des rentabilités des actions et des rentabilités moyennes A propos du calcul des rentabilités des actions et des rentabilités moyennes On peut calculer les rentabilités de différentes façons, sous différentes hypothèses. Cette note n a d autre prétention que

Plus en détail

X1 = Cash flow/ Dette totale. X2 = Revenu net / Total des actifs au bilan. X3 = Actif réalisable et disponible / Passif courant

X1 = Cash flow/ Dette totale. X2 = Revenu net / Total des actifs au bilan. X3 = Actif réalisable et disponible / Passif courant EXEMPLE : FAILLITE D ENTREPRISES Cet exemple a pour objectif d étudier la faillite d entreprises. Les données proviennent de l ouvrage de R.A.Johnson et D.W Wichern : Applied Multivariate Statistical Analysis»,

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2008/2009 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

La régression logistique PLS

La régression logistique PLS La régression logistique PLS Michel Tenenhaus Groupe HEC, 78351 Jouy-en-Josas 1 Introduction La régression PLS permet de relier une ou plusieurs variables de réponse y àun ensemble de variables prédictives

Plus en détail

Arbres binaires. Hélène Milhem. Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012

Arbres binaires. Hélène Milhem. Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012 Arbres binaires Hélène Milhem Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012 H. Milhem (IMT, INSA Toulouse) Arbres binaires IUP SID 2011-2012 1 / 35 PLAN Introduction Construction

Plus en détail

Données qualitatives, modèles probit et logit

Données qualitatives, modèles probit et logit Données qualitatives, modèles probit et logit I Un modèle pour données qualitatives Cette section est fortement inspirée du cours de Christophe Hurlin. On est confronté à des données qualitatives en micro-économie

Plus en détail

Biais sociaux et procédure de recrutement, l exemple de l examen d entrée à Sciences Po 1 ère année Septembre 2002. Conclusions d enquête

Biais sociaux et procédure de recrutement, l exemple de l examen d entrée à Sciences Po 1 ère année Septembre 2002. Conclusions d enquête Cécile RIOU Assistante de Recherche (CEVIPOF / IEP) Vincent TIBERJ Chargé de Recherche (CEVIPOF / FNSP) Biais sociaux et procédure de recrutement, l exemple de l examen d entrée à Sciences Po 1 ère année

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

Introduction à l analyse quantitative

Introduction à l analyse quantitative Introduction à l analyse quantitative Vue d ensemble du webinaire Le webinaire sera enregistré. Les diapositives et tous les autres documents seront envoyés aux participants après la séance. La séance

Plus en détail

Points méthodologiques Adapter les méthodes statistiques aux Big Data

Points méthodologiques Adapter les méthodes statistiques aux Big Data Points méthodologiques Adapter les méthodes statistiques aux Big Data I. Répétition de tests et inflation du risque alpha II. Significativité ou taille de l effet? 2012-12-03 Biomédecine quantitative 36

Plus en détail

Chapitre I. Probabilités. Bcpst 1 2 novembre 2015. I Exemples d expériences aléatoires

Chapitre I. Probabilités. Bcpst 1 2 novembre 2015. I Exemples d expériences aléatoires Chapitre I Probabilités Bcpst 1 2 novembre 2015 I Exemples d expériences aléatoires Une expérience aléatoire est une expérience dont on ne peut pas prédire le résultat avant de l avoir réalisée... ce qui

Plus en détail

Le raisonnement par récurrence

Le raisonnement par récurrence Le raisonnement par récurrence Nous notons N l ensemble des entiers naturels : N = {0,,, } Nous dirons naturel au lieu de entier naturel Le principe du raisonnement par récurrence Soit A une partie de

Plus en détail

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,

Plus en détail

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail

Chacune des valeurs d une variable en est une modalité particulière.

Chacune des valeurs d une variable en est une modalité particulière. Psychologie générale Jean Paschoud STATISTIQUE Sommaire Rôle de la statistique Variables Échelles de mesure Résumer, décrire Comparer Rôle de la statistique La statistique est avant tout un outil permettant

Plus en détail