Corrigé de l examen du 22/01/2007

Documents pareils
Analyse de la variance Comparaison de plusieurs moyennes

Introduction aux Statistiques et à l utilisation du logiciel R

Relation entre deux variables : estimation de la corrélation linéaire

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Principe d un test statistique

Item 169 : Évaluation thérapeutique et niveau de preuve

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Cours 9 : Plans à plusieurs facteurs

Validation probabiliste d un Système de Prévision d Ensemble

Chapitre 3. Les distributions à deux variables

Bureau : 238 Tel : dominique.muller@upmf-grenoble.fr

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen

Lire ; Compter ; Tester... avec R

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Introduction à l approche bootstrap

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Régression linéaire. Nicolas Turenne INRA

données en connaissance et en actions?

2010 Minitab, Inc. Tous droits réservés. Version Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des

TABLE DES MATIERES. C Exercices complémentaires 42

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

FORMULAIRE DE STATISTIQUES

FONCTION DE DEMANDE : REVENU ET PRIX

L approche de régression par discontinuité. Thomas Lemieux, UBC Atelier de formation du Congrès de l ASDEQ Le 18 mai 2011

ELEC2753 Electrotechnique examen du 11/06/2012

ir value.com Le Fundamental Value Indicator

Statistiques Descriptives à une dimension

23. Interprétation clinique des mesures de l effet traitement

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9

Trépier avec règle, ressort à boudin, chronomètre, 5 masses de 50 g.

Biostatistiques : Petits effectifs

Traitement des données avec Microsoft EXCEL 2010

Qu est-ce qu une probabilité?

PRIME D UNE OPTION D ACHAT OU DE VENTE

Votre Réseau est-il prêt?

Evaluation de la variabilité d'un système de mesure

INF6304 Interfaces Intelligentes

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

TS 35 Numériser. Activité introductive - Exercice et démarche expérimentale en fin d activité Notions et contenus du programme de Terminale S

STRICTEMENT CONFIDENTIEL

IBM SPSS Direct Marketing 21

Arbres binaires de décision

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Estimation et tests statistiques, TD 5. Solutions

TSTI 2D CH X : Exemples de lois à densité 1

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

SPHINX Logiciel de dépouillement d enquêtes

Window Dressing des comptes consolidés : les écarts de consolidation positifs

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

Annexe commune aux séries ES, L et S : boîtes et quantiles

L exclusion mutuelle distribuée

Gestion électronique des procurations

Systèmes de transmission

Une brique dans le cartable. Du Plan à l Ouvrage

Aide-mémoire de statistique appliquée à la biologie

Statistique Descriptive Élémentaire

Science et technique. La température et la durée de stockage sont des facteurs déterminants. Viande bovine et micro-organisme pathogène

Créer le schéma relationnel d une base de données ACCESS

TESTS D'HYPOTHESES Etude d'un exemple

CHAPITRE 5. Stratégies Mixtes

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Équations non linéaires

Exercices sur le chapitre «Probabilités»

Aucune frontière entre. Jean-Louis Aimar

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Modèles et simulations informatiques des problèmes de coopération entre agents

Logiciel XLSTAT version rue Damrémont PARIS

Rapport standard analyse des risques/stratégie d audit. Sommaire

CAPTEURS - CHAINES DE MESURES

Deuxième Licence en Informatique Data Warehousing et Data Mining La Classification - 1

Exemples d application

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Comment évaluer une banque?

Quelques rappels concernant la méthode expérimentale

Hedging delta et gamma neutre d un option digitale

TESTS D HYPOTHÈSE FONDÉS SUR LE χ².

L Equilibre Macroéconomique en Economie Ouverte

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

Value at Risk. CNAM GFN 206 Gestion d actifs et des risques. Grégory Taillard. 27 février & 13 mars 20061

1 Complément sur la projection du nuage des individus

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

1 Définition de la non stationnarité

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Évaluation de la régression bornée

afférent au projet de décret relatif aux obligations indexées sur le niveau général des prix

Précision d un résultat et calculs d incertitudes

DOCM Solutions officielles = n 2 10.

PROGRAMME (Susceptible de modifications)

Transcription:

Corrigé de l examen du 22/01/2007 Cogmaster 2006 2007 Partie 1 (5 points) 1 point par réponse(s) correcte(s) à chaque question. 1. oui 2. non 3. oui 4. 0.7 2 = 0.49, soit 49 % 5. Si on note que µ i = µ + α i, les propositions 1, 2, 4 et 5 sont correctes. Partie 2 (3 points) 1. Identifiez les facteurs expérimentaux et précisez leur statut. (0.5 Il y a deux variables (1 seul facteur expérimental) : le type de médicament administré (variable indépendante provoquée, nominale), à 3 modalités ; le score total mesuré (variable dépendante, discrète), exprimé en points. 2. L expérimentateur souhaite vérifier si l administration du produit B a un effet significatif sur les performances de conduite des sujets. Décrivez en quelques lignes comment il devrait s y prendre, en précisant toutes les caractéristiques nécessaires à la mise en pratique du test correspondant (hypothèse nulle, choix du test et statistique de test associé, seuil de significativité retenu, etc.). (1.5 Il y a deux approches possibles : on peut utiliser une ANOVA à un facteur : dans ce cas, on pose comme hypothèse nulle l absence de différences entre les 3 conditions (i.e. pas d effet du type de médicament en comparaison du témoin, ni entre les médicaments) ; le modèle formulé pour la réponse (score total) inclut donc un terme fixe, l effet du facteur, et un terme modélisant les résidus ; le test à effectuer est bien entendu un test F de Fisher-Snedecor, et la statistique de test est le rapport de la variance expliquée par le 1

facteur et de la variance résiduelle ; on fixera le risque de première espèce à 5 % ; si la statistique de test est supérieure à la valeur critique d un F(77,2) à ce seuil (ou si la p-valeur observée est inférieure à 0.05), on rejettera H 0. on peut également travailler directement avec une procédure de comparaisons multiples, adaptée à la comparaison de groupes à un témoin (e.g. test de Dunnett, non vu en cours) ; dans ce cas, on conserve le même risque de première espèce, l hypothèse nulle se décompose en sous-hypothèses liées à chacune des comparaisons d intérêt (A vs. B, A vs. C et B. vs. C). Ce test est protégé contre l inflation du risque d ensemble. 3. A votre avis, pourquoi le groupe comporte-t-il plus de sujets? (1 Si l on souhaitait réellement vérifier l effet différentiel d un médicament psychostimulant vs. relaxant, il faudrait s assurer que les deux performances mesurées dans ces deux conditions diffèrent bien des performances du groupe contrôle (effet général de l administration d un médicament non-placebo) et que les performances se distinguent clairement entre ces deux témoins (positif/négatif). On voit alors que le groupe témoin doit supporter 2 comparaisons (A vs. B et A vs. C), alors qu il n y aura qu une comparaison contrastant les groupes B et C. Il est donc souhaitable d avoir un groupe contrôle dont l effectif est plus important (on peut montrer facilement que la taille de l effectif du groupe contrôle doit être N k/(k+ k) pour k groupes de traitement et un effectif total N). Partie 3 (12 points) 1. Précisez la nature et le statut des facteurs à inclure pour l étude des performances des animaux. (1 Pour étudier les performances des animaux, seules 3 variables sont à retenir : la zone d implantation (variable indépendante provoquée, nominale), à 3 modalités ; le moment de stimulation (variable indépendante provoquée, ordinale), à 3 niveaux ; la latence (variable dépendante, continue), en secondes. La distinction entre essai d apprentissage et essai de test n est pas vraiment pertinente car elle définie le protocole de conditionnement même. Les éventuels co-facteurs (poids, âge, lignée, etc.) n étant pas explicitement mentionnés à ce stade, on les omet tout simplement. 2. Rappelez les conditions d application de l ANOVA. (1.5 En les ordonnant par importance décroissante, on distingue : l indépendance des observations (doit être contrôlée a priori, au moment de l échantillonnage aléatoire des observations) ; 2

l homoscédasticité, autrement dit l homogénéité des variances (vérifiée a posteriori de l acquisition, en calculant les variances et/ou en représentant les données sous forme de boites a moustaches notamment, mais aussi tests de Bartlett ou de Cochran non vus en cours) ; la normalité des résidus (vérifiée a posteriori par analyse graphique des résidus, droite de Henry, ou test) ; 3. Commentez les résultats (taille et degré de significativité des effets testés) du test d ANOVA qui sont reportés sur la page suivante. (2 points) La table des effets indique les écarts à la moyenne générale des moyennes calculées pour chacune des modalités ou combinaison de modalités des 2 facteurs expérimentaux. A la lecture de ces résultats, on voit que la latence est plus élevée lorsque la stimulation est administrée dans une zone neutre (+3.98) en comparaison des deux autres zones, qui diffèrent peu entre elles. La latence est également plus élevée lorsque la stimulation a lieu 150 ms après avoir franchi la ligne (+2.8), alors qu elle diminue lorsque la stimulation est administrée dans une fenêtre de 100 ms ; l effet de la stimulation est plus modéré lorsque celle-ci est effectuée dans une fenêtre de 50 ms ( 0.96). L analyse des moyennes lorsque l on croise ces deux variables est plus intéressante car elle révèle que l effet de la zone de stimulation est dépendant du moment de la stimulation : pour la zone neutre, la latence n augmente que pour les conditions 50 et 100 ms, alors que pour la zone 1, la latence augmente pour les conditions 100 et 150 ms ; quant à la zone B, la latence diminue à 100 ms uniquement. On est donc en présence d une interaction croisée. Le tableau d ANOVA indique que cette interaction entre les deux facteurs est significative (p < 0.05) et que seul l effet du facteur Site est significatif (p < 0.01). La p-valeur associée au facteur Stimulation est à la limite des 5 % retenus pour la significativité des effets testés (cf. énoncé). En conclusion, le site de stimulation exerce une forte influence sur la latence avec laquelle animaux franchissent la ligne, mais cet effet est dépendant du moment de la stimulation : la diminution de la latence s observe essentiellement lorsque les zones A et B sont stimulées 150 et 100 ms (respectivement) post-franchissement de la ligne. 4. Au vu de ces résultats, l expérimentateur teste un nouveau modèle restreint sur le facteur Site, pour chaque niveau du facteur Stimulation. Il obtient les résultats suivants : [...] Ce choix est-il justifié? Si oui, expliquez en une phrase pourquoi. (1 Comme on l a vu, l interaction est significative ce qui signifie que l effet principal du facteur Site ne peut être dissocié des variations dûes au facteur Stimulation (l effet n est pas «pur»). Il est donc préférable de travailler avec des effets simples, en étudiant l effet du facteur Site sur chacun des niveaux du facteur Stimulation, ce qui peut être réalisé grâce à 3 ANOVA à 3

un facteur. 5. L expérimentateur poursuit son analyse en effectuant des comparaisons deux à deux sur l ensemble des conditions du facteur testé à l étape précédente, pour chaque niveau du temps de stimulation. Il utilise pour cela la méthode de Tukey. Les intervalles de confiance (95 %) obtenus sont résumés dans la figure ci-dessous (de gauche à droite, les niveaux 50, 100 et 150 ms du facteur Stimulation). [...] Ces derniers résultats sont-ils compatibles avec ceux observés pour le deuxième modèle d ANOVA? Que peut-on conclure de ces nouveaux résultats. Quel autre test aurait pu être utilisé pour effectuer de telles comparaisons? (1.5 Les trois graphiques indiquent que pour la stimulation 50, seules les conditions A vs. neutre et B vs. neutre peuvent être considérées comme différentes (l intervalle ne contient pas 0) ; pour la stimulation 100, seule la différence de moyennes B vs. neutre peut être considérée non nulle ; pour la stimulation 150, aucune des différences de moyennes ne semble significativement différente de 0. S agissant de comparaisons multiples de l ensemble des paires de traitement, on aurait également pu utiliser des tests t multiples protégés (peu puissants) ou un test de type Newman-Keuls. 6. Proposez une courte interprétation de l ensemble des résultats obtenus par l expérimentateur. (1.5 point ) Il s agit essentiellement de replacer l effet d interaction dans le contexte de l étude (effet différentiel du moment et de la zone de stimulation sur l effet conditionnant)... 7. Cette approche change-t-elle la structure des données? (0.5 La structure de données est bien évidemment modifiée puisque dans ce cas on introduit une structure d appariement, soit un facteur supplémentaire (à 2 modalités) : les mêmes animaux sont comparés entre eux à deux reprises. Il n y a donc plus indépendance totale entre les observations, et on devra distinguer des sources de variation intra-individus et inter-individus, en plus de la résiduelle. 8. L expérimentateur souhaite comparer les performances globales entre les deux sessions (tous facteurs confondus). Quel test serait approprié? (0.5 Puisque l on ne tient pas compte des facteurs expérimentaux, il suffit d effectuer un test t pour échantillons appariés (à 45 1 = 44 ddl), qui permet de comparer la latence moyenne entre les deux sessions. 4

9. La latence est représentée en fonction du poids de chaque animal dans la figure ci-après. Le coefficient de corrélation estimé est de 0.09. Que suggèrent ces résultats? (0.5 Ici on introduit une variable supplémentaire (variable indépendante invoquée, continue), qui est assimilée à un co-facteur. A la lecture du graphique, on constate qu il ne semble pas y avoir d association clairement marqué entre la latence et le poids de l animal (le nuage de poids ne présente pas de forme spécifiquement étirée selon un axe particulier), ce qui est confirmé par l absence de liaison linéaire (cf. coefficient de corrélation). Les performances des animaux semblent donc relativement indépendantes de leur poids. 10. Une régression linéaire donne les résultats suivants : [...] A quel type de test statistique sont associées les valeurs de probabilité observées (p-value) figurant dans le listing? Interprétez en une phrase la p-valeur associée au coefficient Poids (pente)? Quelle est la valeur de la variance résiduelle (estimée)? (1.5 Les tests effectués sur les coefficients du modèle linéaire (ici, ordonnée à l origine et pente) sont de simples tests t de Student qui comparent la valeur estimée à 0. On constate que la pente (qui indique de combien varie la latence lorsque le poids varie de 1 unité) ne peut être considérée comme significativement différente de 0 (p = 0.576 > 0.05). La résiduelle estimée est indiquée dans le bas du listing : elle vaut 6.747 2 = 45.5. 11. Le choix d un modèle de régression est-il pertinent ou auraiton dû se limiter à une simple étude de corrélation? Justifiez. (0.5 On peut avancer deux éléments de réponse. D une part, il ne semble pas y avoir d association linéaire entre les deux variables. D autre part, un modèle de régression suppose une relation causale entre la ou les variable(s) prédictrice(s) et la réponse mesurée. Dans le cadre de cette étude, il est tout à fait justifié de considérer que le poids de l animal peut influencer la vitesse avec laquelle il se déplace, encore que l influence du poids conditionnelement aux deux autres facteurs soit sans doute plus intéressante. Les résultats précédents pourraient être utilisés pour justifier du fait que les effets analysés dans la partie a) ne sont probablement pas biaisés par ce co-facteur. 5