1 Analyse de variance
|
|
- Jean-Christophe Bourget
- il y a 7 ans
- Total affichages :
Transcription
1 UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire Master d économie Cours de M. Desgraupes MATHS/STATS Document 6 : Exemple d ANOVA 1 Analyse de variance Énoncé du problème Calcul à la main Calcul des inerties Statistique de Fisher Calcul par régression Table d analyse de la variance Test HSD de Tukey Test de Kruskal-Wallis Analyse de variance 1.1 Énoncé du problème On considère les données suivantes représentant des taux de créatinine relevés dans quatre groupes constitués de n = 5 cobayes. Le premier groupe est un groupe témoin, les trois autres ont subi l injection d un produit pharmaceutique à trois doses différentes. Les résultats se présentent sous la forme d un tableau de dimension 5 4 comme ceci : A B C D Pour stocker les données dans R, on va définir un vecteur X contenant toutes les données (parcourues en colonne) : > X <- c(11.7, 12.1, 11.6, 12.8, 12.2, 11.9, 12.5, 12.7, 12.6, 12.1, , 12.8, 12.3, 11.5, 13.2, 12.8, 12.8, 13.3, 13.2, 13.1) 1
2 Il sera utile aussi de les utiliser sous forme d une matrice x. On transforme le vecteur X en une matrice comme ceci : > n <- 5 > k <- 4 > x <- matrix(x, nrow=n, ncol=k) > colnames(x) <- LETTERS[1:4] On calcule les moyennes dans chaque groupe, c est-à-dire dans chaque colonne de la matrice, au moyen de la fonction colmeans : > moy <- colmeans(x) A B C D On cherche à déterminer si le résultats obtenus laissent apparaître une différence significative entre les quatre groupes. On peut commencer par visualiser les données de chaque groupe au moyen de boîtes à moustaches
3 1.2 Calcul à la main Calcul des inerties On commence par calculer la somme des inerties intra-groupes. > intra <- apply(x, 2, function(y) sum((y-mean(y))^2)) Leur somme, notée SCintra, vaut : > SCintra <- sum(intra) [1] L inertie inter-groupes est l inertie entre le barycentre de tous les points et les barycentres de chacun des 4 groupes. Le barycentre de tous les points est : > g <- mean(x) [1] Donc, l inertie inter-groupes est obtenue comme ceci : > SCinter <- n*sum( (moy - g)^2 ) [1] L inertie totale est la somme des carrés des écarts avec le barycentre général : > SCtotal <- sum( (X-g)^2 ) [1] > SCtotal [1] On vérifie qu elle est la somme des inerties intra et de l inertie inter : > SCintra + SCinter [1] Une autre manière d interpréter les inerties inter et intra est de considérer que l inertie inter-groupe mesure des effets et que l inertie intra-groupe est une mesure des erreurs. 3
4 1.2.2 Statistique de Fisher Le test de comparaison de toutes les moyennes vise à tester si la moyenne peut être considérée comme étant la même dans chaque groupe. Ce test est valide dans les conditions suivantes : les k groupes sont indépendants et tirés au hasard de leurs populations respectives ; les populations ont une distribution normale ; la variance est la même pour chaque groupe. Lorsque les groupes ont exactement le même nombre d individus, on dit que le test est robuste et reste valable si on s écarte un peu des conditions énoncées. En revanche, s ils n ont pas même effectif, il faut s assurer que les conditions ci-dessus sont remplies. Le test de Fisher pose l hypothèse H 0 suivante : H 0 : les moyennes de tous les groupes sont égales entre elles Le nombre de degrés de liberté pour l inertie inter-groupes est égal au nombre de groupes diminué de 1 car on a estimé un paramètre (à savoir le barycentre de l ensemble de tous les individus) : > dlinter <- 4-1 [1] 3 Le nombre de degrés de liberté pour l inertie intra-groupes est égal à n 1 pour chaque groupe car on a estimé le barycentre de chacun, ce qui fait au total 4 (n 1) = 16 : > dlintra <- 4*(n-1) [1] 16 La statistique de Fisher est la quantité (SCinter/dlinter)/(SCintra/dlintra). On trouve : > f <- (SCinter/dlinter)/(SCintra/dlintra) [1] Si l hypothèse H 0 est vraie, cette variable suit une loi de Fisher à (3, 16) degrés de liberté. La valeur critique au seuil 5% est : > qf(0.95,dlinter,dlintra) [1] Comme la valeur calculée est supérieure à la valeur critique , on rejette l hypothèse avec un risque d erreur de 5% de se tromper. On pourrait aussi calculer la p-valeur correspondant à f : 4
5 > pval <- 1-pf(f,dlinter,dlintra) [1] On voit qu elle est inférieure à 5% = 0.05 et cela confirme qu on peut rejeter l hypothèse H 0. Le coefficient de détermination R 2 est la part d inertie expliquée (inertie inter-groupes) par rapport à l inertie totale : > R2 <- SCinter/SCtotal [1] Il est effectivement assez faible et indique que la seule appartenance à un groupe particulier n explique que faiblement les différences constatées. La part expliquée de la variance totale est de 39.09%. 1.3 Calcul par régression Rappelons qu on a réuni, dans la section précédente, tous les groupes en un unique vecteur appelé X. Parallèlement, on fabrique un facteur (variable qualitative) appelé G qui indique l appartenance de chaque individu à un des 4 groupes : > G <- factor(rep(1:4,each=5)) [1] Levels: On effectue une régression pour expliquer la variable quantitative X au moyen de la variable qualitative G. La régression est faite au moyen de la fonction lm : > reg <- lm(x~g) Call: lm(formula = X ~ G) Coefficients: (Intercept) G2 G3 G La fonction summary permet d afficher les principaux résultats de la régression avec les tests de significativité sur les coefficients : > summary(reg) 5
6 Call: lm(formula = X ~ G) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) <2e-16 *** G G G ** --- Signif. codes: 0 *** ** 0.01 * Residual standard error: on 16 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 3 and 16 DF, p-value: On voit que la moyenne du premier groupe (qui joue le rôle de groupe témoin) est très significative : elle est marquée de trois astérisques. Les coefficients trouvés pour les autres groupes sont la différence entre la moyenne de ces groupes et celle du premier groupe. La moyenne du quatrième groupe est aussi considérée comme significative (avec deux astérisques). > coef <- coefficients(reg) (Intercept) G2 G3 G Par exemple, la moyenne dans le deuxième groupe vaut comme on l a vu dans la première section. On vérifie effectivement que = La manière dont sont calculés les coefficients s appelle un codage par contraste. Le contraste utilisé ici qui consiste à prendre un des groupes comme référence et à calculer les coefficients des autres groupes par différence avec le coefficient du groupe témoin est un type de codage qui s appelle contraste de traitement. On peut vérifer que c est bien le codage utilisé comme ceci : > reg$contrast $G [1] "contr.treatment" La dernière ligne du résumé contient les informations relatives au test de Fisher. On y retrouve les valeurs calculées à la section précédente : la valeur de la statistique égale à 3.422, les degrés de liberté 3 et 16 ainsi que la p-valeur. L avant-dernière ligne comporte le coefficient R 2 égal à
7 Pour mieux comprendre la représentation des variables qualitatives dans un modèle linéaire, on peut afficher la matrice du modèle : > model.matrix(reg) (Intercept) G2 G3 G attr(,"assign") [1] attr(,"contrasts") attr(,"contrasts")$g [1] "contr.treatment" 1.4 Table d analyse de la variance Il est traditionnel de rassembler les résultats des calculs d inertie inter et intra dans une table appelée table d analyse de variance. Dans le cas présent, cette table se présente sous la forme suivante : d.l. Inertie Variance Stat f p-valeur G Résidus La première colonne (appelée d.l.) contient les nombres de degrés de liberté. La deuxième colonne comporte les inerties inter et intra respectivement. La troisième colonne est obtenue en faisant le quotient de la deuxième colonne par la première : ce sont les variances, c est-à-dire les moyennes des inerties. La quatrième colonne comporte la statistique qui est le quotient des deux valeurs 7
8 trouvées dans la troisième colonne. Enfin la dernière colonne indique la p-valeur correspondant à la statistique f trouvée dans la quatrième colonne. Il existe une fonction anova qui construit la table d analyse de variance à partir de l objet produit par la régression linéaire : > anv <- anova(reg) Analysis of Variance Table Response: X Df Sum Sq Mean Sq F value Pr(>F) G * Residuals Signif. codes: 0 *** ** 0.01 * On retrouve évidemment toutes les valeurs calculées antérieurement et le fait que la p-valeur est inférieure à 5%, ce qui conduit à rejeter l hypothèse H 0 du test de Fisher. On peut aussi utiliser la fonction aov qui a une syntaxe un peu différente. Elle ne prend pas en argument le résultat de la régression mais directement la formule qui a permis de définir le modèle de régression, à savoir l expression X~G utilisée au début de la section 1.3 dans la fonction lm. La fonction aov se charge ellemême d effectuer la régression et de bâtir un résumé d analyse de variance. Par exemple, dans le cas de notre exemple, il faudrait écrire l instruction suivante : > av <- aov(x~g) Call: aov(formula = X ~ G) Terms: G Residuals Sum of Squares Deg. of Freedom 3 16 Residual standard error: Estimated effects may be unbalanced L objet renvoyé par cette fonction est de classe aov et comporte les mêmes composantes que l objet reg de classe lm. 1.5 Test HSD de Tukey Le test de comparaisons multiples de Tukey, dit test HSD (abréviation de Honestly Significant Difference) a pour but de distinguer parmi les échantillons s il y en a qui diffèrent significativement des autres. Dans le cas où le test 8
9 de Fisher a conduit à rejeter l hypothèse que les échantillons de diffèrent pas significativement, on cherche à savoir quels échantillons se distinguent des autres. Pour cela, le test HSD envisage les échantilons deux par deux et calcule dans chaque cas la statistique suivante : Q ij = M k i M kj Mintra/n où Mintra est la moyenne des inerties intra-groupes (donc le quotient de l inertie intra par le nombre de degrés de liberté intra) et n est le nombre d observations dans chaque échantillon. Lorsque les échantillons n ont pas la même taille on prend pour n la moyenne harmonique des effectifs dans chaque échantillon. Si il y a k échantillons, cela fait k(k 1)/2 paires. La quantité au dénominateur de Q ij ne dépend pas des indices i et j. Il existe des valeurs critiques pour les quantités Q en fonction du nombre k d échantillons et du nombre de degrés de liberté intra. On obtient ces valeurs critiques avec la fonction qtukey. Par exemple, si on est à 5%, la valeur critique pour 4 échantillons et 16 degrés de liberté est approximativement 4.05 : > Qc <- qtukey(.95, 4, 16) [1] Calculons par exemple la quantité Q 14 moyennes entre les échantillons 1 et 4. On a correspondant à la différence de > Q <- (abs(moy[1]-moy[4]))/sqrt(scintra/(dlintra*n)) A La quantité obtenue est à comparer à la valeur critique 4.05 et montre, puisqu elle est supérieure, que la différence entre les échantillons 1 et 4 est significative. La quantité au dénominateur de la statistique Q vaut ici > sqrt(scintra/(dlintra*n)) [1] Si on la multiplie par la valeur critique 4.05, on obtient le rayon de l intervalle de confiance autour des différences de moyennes, à savoir > dr <- Qc * sqrt(scintra/(dlintra*n)) [1]
10 Par exemple, la différence de moyennes entre les échantillons 1 et 4 est L intervalle de confiance autour de cette valeur est donc [ , ] = [0.0639, ]. La fonction TukeyHSD peut être utilisée pour effectuer le test HSD de comparaisons multiples. Elle prend en argument l objet de classe aov renvoyé par la fonction aov. Par exemple : > tuk <- TukeyHSD(av) Tukey multiple comparisons of means 95% family-wise confidence level Fit: aov(formula = X ~ G) $G diff lwr upr p adj La colonne diff donne les différences entre les moyennes observées. Les colonnes lwr et upr donnent les bornes inférieure et supérieure de l intervalle et la colonne p adj donne la p-valeur après ajustement pour les comparaisons multiples. Si la valeur 0 n est pas dans un intervalle, c est que la différence correspondante peut être considérée comme significative. Il apparaît que la comparaison entre les échantillons 1 et 4 présente une différence significative : la p-value est inférieure à 5%, ce qui implique qu on rejette l hypothèse que les moyennes sont égales. La figure suivante donne une représentation graphique de ces intervalles obtenue au moyen de la fonction plot. On voit clairement que la valeur 0 n est pas comprise dans l intervalle correspondant à Test de Kruskal-Wallis Lorsque les hypothèses du test de Fisher énoncées dans la section ne sont pas remplies, on a recours à un test non-paramétrique appelé le test de Kruskal-Wallis. Ce test repose sur la façon dont sont ordonnées les valeurs constituant les groupes et est parfois qualifié d anova sur les rangs. Il ne s agit pas à proprement parler d une analyse de variance mais la démarche est très similaire. Supposons qu on dispose des données suivantes correspondant à trois groupes de tailles différentes dans le contexte de l exemple introduit dans la section 1.1 : 10
11 > plot(tuk) 95% family wise confidence level Differences in mean levels of G A B C On peut stocker les données dans R sous forme d une liste : > k <- 3 > L <- list( + A=c(11.7, 12.1, 11.6, 12.8, 12.2, 11.6, 12.0, 12.4, 12.3), + B=c(12.1, 13.15, 12.5, 11.9, 11.2, 12.9, 13.0), + C=c(12.7, 13.2, 13.1, 13.05, 13.3) + ) On calcule les tailles et les moyennes de chaque groupe comme ceci : 11
12 > len <- sapply(l,length) A B C > N <- sum(len) [1] 21 > moy <- sapply(l,mean) A B C Le problème est de déterminer si ces moyennes diffèrent ou pas. L hypothèse H 0 est la même que pour une anova traditionnelle : H 0 : les moyennes sont égales entre elles Le principe est de remplacer les valeurs du tableau précédent par leur rang. On fusionne donc toutes les valeurs et on les remplace par leur rang, c est-à-dire la position qu elles occupent lorsqu on les trie dans l ordre croissant. Lorsqu il y a des valeurs ex-aequo, on remplace leur rang par la moyenne des rangs correspondants. On exécute les instructions suivantes : > Y <- c(l[[1]],l[[2]],l[[3]]) [1] [13] > sort(y) [1] [13] > rk <- rank(y) [1] [16] Par exemple, ici on voit que la valeur 11,6 est présente deux fois, aux rangs 2 et 3 (lorsque Y est trié). On remplace donc ces rangs par leur moyenne 2,5. Avec R, la fonction rank effectue automatiquement ces corrections pour les ex-aequos. On obtient maintenant le tableau des rangs : A B C
13 On va calculer l équivalent d une intertie inter-groupes sur les rangs. On la note SC rg. On peut l obtenir au moyen de deux formules différentes. La première utilise les moyennes : k SC rg = n j (Ȳj Ȳ )2 j=1 où Ȳj désigne la moyenne des rangs dans le groupe j et Ȳ la moyenne totale des rangs. L autre formule est : SC rg = k j=1 Sj 2 S2 n j N où S j désigne la somme des rangs dans le groupe j et S la somme totale des rangs. Cette inertie inter-groupes permet de définir la statistique de Kruskal-Wallis comme ceci : SC rg H = (1) N(N + 1)/12 Sous l hypothèse H 0, cette statistique suit une loi du χ 2 à k 1 degrés de liberté, où k est le nombre de groupes. On peut mener les calculs avec R de la manière suivante en commençant à calculer les sommes des rangs dans chaque groupe : > idx <- 0 > Srk <- vector(length=k); > for (i in 1:k) { + Srk[i] <- sum(rk[(idx+1):(idx+len[i])]) + idx <- idx+len[i] + } On obtient alors la statistique de Kruskal-Wallis : > SCrg <- sum( Srk^2/len ) - sum(rk)^2/length(rk) [1] > H <- 12*SCrg/(N*(N+1)) [1] La borne critique du χ 2 à 2 degrés de liberté est : > qchisq(0.975,k-1) [1] Puisque la valeur calculée est supérieure à la valeur critique , on rejette l hypothèse et on considère que les moyennes dans ces trois groupes diffèrent significativement les unes des autres, au risque 5% de se tromper. 13
14 Remarque : il existe une fonction kruskal.test définie dans le package stats de R qui effectue ce test automatiquement. Il faut définir un facteur permettant de distinguer les groupes et passer en arguments le vecteur de toutes les valeurs ainsi que ce facteur. On retrouve approximativement les valeurs calculées précédemment : > g <- rep(1:3,len) [1] > kw <- kruskal.test(y,g) Kruskal-Wallis rank sum test data: Y and g Kruskal-Wallis chi-squared = , df = 2, p-value = La p-valeur est inférieure à 5% et on rejette l hypothèse H 0. 14
Analyse de la variance Comparaison de plusieurs moyennes
Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction
Plus en détailIntroduction aux Statistiques et à l utilisation du logiciel R
Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil
Plus en détailLire ; Compter ; Tester... avec R
Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................
Plus en détailExercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015
Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par
Plus en détailUn exemple de régression logistique sous
Fiche TD avec le logiciel : tdr341 Un exemple de régression logistique sous A.B. Dufour & A. Viallefont Etude de l apparition ou non d une maladie cardiaque des coronaires 1 Présentation des données Les
Plus en détailMODELE A CORRECTION D ERREUR ET APPLICATIONS
MODELE A CORRECTION D ERREUR ET APPLICATIONS Hélène HAMISULTANE Bibliographie : Bourbonnais R. (2000), Econométrie, DUNOD. Lardic S. et Mignon V. (2002), Econométrie des Séries Temporelles Macroéconomiques
Plus en détailUne introduction. Lionel RIOU FRANÇA. Septembre 2008
Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4
Plus en détailAnalyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent
Plus en détailDonnées longitudinales et modèles de survie
ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan
Plus en détailChapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Plus en détailIntroduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Plus en détailExemples d application
AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif
Plus en détailAnalyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9
Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9 L analyse de variance à un facteur permet de vérifier, moyennant certaines hypothèses, si un facteur (un critère de classification,
Plus en détailIntroduction à la statistique non paramétrique
Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non
Plus en détailBiostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke
www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3
Plus en détailPrincipe d un test statistique
Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre
Plus en détailFORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
Plus en détailTests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»
Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences
Plus en détailCours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES
LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,
Plus en détailExemple PLS avec SAS
Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that
Plus en détailGestion des données avec R
Gestion des données avec R Christophe Lalanne & Bruno Falissard Table des matières 1 Introduction 1 2 Importation de fichiers CSV 1 2.1 Structure du fichier de données...................................
Plus en détailBureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr
Dominique Muller Laboratoire Inter-universitaire de Psychologie Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr Supports de cours : webcom.upmf-grenoble.fr/lip/perso/dmuller/m2r/acm/
Plus en détailExemples d Analyses de Variance avec R
Exemples d Analyses de Variance avec R Christophe Pallier 5 août 00 Résumé R est un logiciel d analyse statistique qui fournit toutes les procédures usuelles (t-tests, anova, tests non paramétriques...)
Plus en détailCours 9 : Plans à plusieurs facteurs
Cours 9 : Plans à plusieurs facteurs Table des matières Section 1. Diviser pour regner, rassembler pour saisir... 3 Section 2. Définitions et notations... 3 2.1. Définitions... 3 2.2. Notations... 4 Section
Plus en détailCalcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.
1 Définitions, notations Calcul matriciel Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes. On utilise aussi la notation m n pour le
Plus en détailProbabilités sur un univers fini
[http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur
Plus en détailDETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES
Agence fédérale pour la Sécurité de la Chaîne alimentaire Administration des Laboratoires Procédure DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES Date de mise en application
Plus en détailModèles pour données répétées
Résumé Les données répétées, ou données longitudinales, constituent un domaine à la fois important et assez particulier de la statistique. On entend par données répétées des données telles que, pour chaque
Plus en détailStatistiques Descriptives à une dimension
I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des
Plus en détailProbabilités sur un univers fini
[http://mp.cpgedupuydelome.fr] édité le 10 août 2015 Enoncés 1 Proailités sur un univers fini Evènements et langage ensemliste A quelle condition sur (a,, c, d) ]0, 1[ 4 existe-t-il une proailité P sur
Plus en détaildistribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position
Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons
Plus en détailArbres binaires de décision
1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression
Plus en détailBiostatistiques : Petits effectifs
Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l
Plus en détailLogiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS
Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailAnnexe commune aux séries ES, L et S : boîtes et quantiles
Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans
Plus en détail2010 Minitab, Inc. Tous droits réservés. Version 16.1.0 Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des
2010 Minitab, Inc. Tous droits réservés. Version 16.1.0 Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des marques déposées de Minitab, Inc. aux Etats-Unis et
Plus en détailStatistiques à une variable
Statistiques à une variable Calcul des paramètres statistiques TI-82stats.fr? Déterminer les paramètres de la série statistique : Valeurs 0 2 3 5 8 Effectifs 16 12 28 32 21? Accès au mode statistique Touche
Plus en détailDidacticiel - Études de cas. Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat.
1 Objectif Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat. Tout le monde l aura compris, je passe énormément de temps à analyser les logiciels
Plus en détailSoit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.
ANALYSE 5 points Exercice 1 : Léonie souhaite acheter un lecteur MP3. Le prix affiché (49 ) dépasse largement la somme dont elle dispose. Elle décide donc d économiser régulièrement. Elle a relevé qu elle
Plus en détailExercices Alternatifs. Une fonction continue mais dérivable nulle part
Eercices Alternatifs Une fonction continue mais dérivable nulle part c 22 Frédéric Le Rou (copleft LDL : Licence pour Documents Libres). Sources et figures: applications-continues-non-derivables/. Version
Plus en détailExercices Alternatifs. Une fonction continue mais dérivable nulle part
Eercices Alternatifs Une fonction continue mais dérivable nulle part c 22 Frédéric Le Rou (copyleft LDL : Licence pour Documents Libres). Sources et figures: applications-continues-non-derivables/. Version
Plus en détailNOTE SUR LA MODELISATION DU RISQUE D INFLATION
NOTE SUR LA MODELISATION DU RISQUE D INFLATION 1/ RESUME DE L ANALYSE Cette étude a pour objectif de modéliser l écart entre deux indices d inflation afin d appréhender le risque à très long terme qui
Plus en détailChapitre 6 Test de comparaison de pourcentages χ². José LABARERE
UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables
Plus en détailÉtude des flux d individus et des modalités de recrutement chez Formica rufa
Étude des flux d individus et des modalités de recrutement chez Formica rufa Bruno Labelle Théophile Olivier Karl Lesiourd Charles Thevenin 07 Avril 2012 1 Sommaire Remerciements I) Introduction p3 Intérêt
Plus en détailTESTS D'HYPOTHESES Etude d'un exemple
TESTS D'HYPOTHESES Etude d'un exemple Un examinateur doit faire passer une épreuve type QCM à des étudiants. Ce QCM est constitué de 20 questions indépendantes. Pour chaque question, il y a trois réponses
Plus en détailLeçon N 4 : Statistiques à deux variables
Leçon N 4 : Statistiques à deux variables En premier lieu, il te faut relire les cours de première sur les statistiques à une variable, il y a tout un langage à se remémorer : étude d un échantillon d
Plus en détailPlan du cours 2014-2015. Cours théoriques. 29 septembre 2014
numériques et Institut d Astrophysique et de Géophysique (Bât. B5c) Bureau 0/13 email:.@ulg.ac.be Tél.: 04-3669771 29 septembre 2014 Plan du cours 2014-2015 Cours théoriques 16-09-2014 numériques pour
Plus en détailExo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2.
Eo7 Calculs de déterminants Fiche corrigée par Arnaud Bodin Eercice Calculer les déterminants des matrices suivantes : Correction Vidéo ( ) 0 6 7 3 4 5 8 4 5 6 0 3 4 5 5 6 7 0 3 5 4 3 0 3 0 0 3 0 0 0 3
Plus en détailCalcul différentiel sur R n Première partie
Calcul différentiel sur R n Première partie Université De Metz 2006-2007 1 Définitions générales On note L(R n, R m ) l espace vectoriel des applications linéaires de R n dans R m. Définition 1.1 (différentiabilité
Plus en détailImputation du salaire d ego dans TeO
Imputation du salaire d ego dans TeO Objet de la note : linéariser la réponse en tranche du salaire, et imputer le salaire en cas de non réponse Champ et principe de la méthode Les individus qui se sont
Plus en détailAC AB. A B C x 1. x + 1. d où. Avec un calcul vu au lycée, on démontre que cette solution admet deux solutions dont une seule nous intéresse : x =
LE NOMBRE D OR Présentation et calcul du nombre d or Euclide avait trouvé un moyen de partager en deu un segment selon en «etrême et moyenne raison» Soit un segment [AB]. Le partage d Euclide consiste
Plus en détailVI. Tests non paramétriques sur un échantillon
VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes
Plus en détailExercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT
Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Ces exercices portent sur les items 2, 3 et 5 du programme d informatique des classes préparatoires,
Plus en détailTests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE
Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.
Plus en détailÉtude comparative sur les salaires et les échelles salariales des professeurs d université. Version finale. Présentée au
Étude comparative sur les salaires et les échelles salariales des professeurs d université Version finale Présentée au Syndicat général des professeurs et professeures de l Université de Montréal (SGPUM)
Plus en détailStatistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011
Master 1 Biologie et technologie du végétal Année 010-011 Statistiques Rappels de cours et travaux dirigés (Seul ce document sera autorisé en examen) auteur : Jean-Marc Labatte jean-marc.labatte@univ-angers.fr
Plus en détailSONDAGES RELATIFS AUX SERVICES D INFORMATION ET DE RÉFÉRENCE OFFERTS PAR LA DIRECTION GÉNÉRALE DE LA DIFFUSION DE BANQ
SONDAGES RELATIFS AUX SERVICES D INFORMATION ET DE RÉFÉRENCE OFFERTS PAR LA DIRECTION GÉNÉRALE DE LA DIFFUSION DE BANQ RÉSULTATS DE L ÉTÉ 2008 JUMELÉS À CEUX DE L HIVER 2008 RAPPORT VERSION FINALE Daniel
Plus en détailNouveau Barème W.B.F. de points de victoire 4 à 48 donnes
Nouveau Barème W.B.F. de points de victoire 4 à 48 donnes Pages 4 à 48 barèmes 4 à 48 donnes Condensé en une page: Page 2 barèmes 4 à 32 ( nombre pair de donnes ) Page 3 Tous les autres barèmes ( PV de
Plus en détailFonctions de deux variables. Mai 2011
Fonctions de deux variables Dédou Mai 2011 D une à deux variables Les fonctions modèlisent de l information dépendant d un paramètre. On a aussi besoin de modéliser de l information dépendant de plusieurs
Plus en détailL ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Plus en détailMémoire d actuariat - promotion 2010. complexité et limites du modèle actuariel, le rôle majeur des comportements humains.
Mémoire d actuariat - promotion 2010 La modélisation des avantages au personnel: complexité et limites du modèle actuariel, le rôle majeur des comportements humains. 14 décembre 2010 Stéphane MARQUETTY
Plus en détailTABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Plus en détailRappels sur les suites - Algorithme
DERNIÈRE IMPRESSION LE 14 septembre 2015 à 12:36 Rappels sur les suites - Algorithme Table des matières 1 Suite : généralités 2 1.1 Déition................................. 2 1.2 Exemples de suites............................
Plus en détailINTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES
INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détailTSTI 2D CH X : Exemples de lois à densité 1
TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun
Plus en détailINTRODUCTION À L'ENVIRONNEMENT DE PROGRAMMATION STATISTIQUE R
INTRODUCTION À L'ENVIRONNEMENT DE PROGRAMMATION STATISTIQUE R Y. BROSTAUX (1) RÉSUMÉ Cette note constitue une introduction au langage et à l'environnement de programmation 5 dans sa version 1.4.1 pour
Plus en détailFactorisation Factoriser en utilisant un facteur commun Fiche méthode
Factorisation Factoriser en utilisant un facteur commun Fiche méthode Rappel : Distributivité simple Soient les nombres, et. On a : Factoriser, c est transformer une somme ou une différence de termes en
Plus en détailINTRODUCTION AU LOGICIEL R
INTRODUCTION AU LOGICIEL R Variables et mise en jambe Anne Dubois, Julie Bertrand, Emmanuelle Comets emmanuelle.comets@inserm.fr INSERM UMR738 (UMR738) 1 / 68 Sur le site www.cran.r-project.org : Ou trouver
Plus en détailStatistique : Résumé de cours et méthodes
Statistique : Résumé de cours et méthodes 1 Vocabulaire : Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère
Plus en détailUne étude de différentes analyses réalisées par le BIT
Association internationale de la sécurité sociale Quinzième Conférence internationale des actuaires et statisticiens de la sécurité sociale Helsinki, Finlande, 23-25 mai 2007 Comparaison des hypothèses
Plus en détailI - PUISSANCE D UN POINT PAR RAPPORT A UN CERCLE CERCLES ORTHOGONAUX POLES ET POLAIRES
I - PUISSANCE D UN POINT PAR RAPPORT A UN CERCLE CERCLES ORTHOGONAUX POLES ET POLAIRES Théorème - Définition Soit un cercle (O,R) et un point. Une droite passant par coupe le cercle en deux points A et
Plus en détailExercices - Fonctions de plusieurs variables : corrigé. Pour commencer
Pour commencer Exercice 1 - Ensembles de définition - Première année - 1. Le logarithme est défini si x + y > 0. On trouve donc le demi-plan supérieur délimité par la droite d équation x + y = 0.. 1 xy
Plus en détailComparaison de fonctions Développements limités. Chapitre 10
PCSI - 4/5 www.ericreynaud.fr Chapitre Points importants 3 Questions de cours 6 Eercices corrigés Plan du cours 4 Eercices types 7 Devoir maison 5 Eercices Chap Et s il ne fallait retenir que si points?
Plus en détailAide - mémoire gnuplot 4.0
Aide - mémoire gnuplot 4.0 Nicolas Kielbasiewicz 20 juin 2008 L objet de cet aide-mémoire est de présenter les commandes de base pour faire rapidement de très jolis graphiques et courbes à l aide du logiciel
Plus en détailStatistiques avec la graph 35+
Statistiques avec la graph 35+ Enoncé : Dans une entreprise, on a dénombré 59 femmes et 130 hommes fumeurs. L entreprise souhaite proposer à ses employés plusieurs méthodes pour diminuer, voire arrêter,
Plus en détailSTAGE IREM 0- Premiers pas en Python
Université de Bordeaux 16-18 Février 2014/2015 STAGE IREM 0- Premiers pas en Python IREM de Bordeaux Affectation et expressions Le langage python permet tout d abord de faire des calculs. On peut évaluer
Plus en détailTravaux pratiques. Compression en codage de Huffman. 1.3. Organisation d un projet de programmation
Université de Savoie Module ETRS711 Travaux pratiques Compression en codage de Huffman 1. Organisation du projet 1.1. Objectifs Le but de ce projet est d'écrire un programme permettant de compresser des
Plus en détail1 Complément sur la projection du nuage des individus
TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent
Plus en détailPlus courts chemins, programmation dynamique
1 Plus courts chemins, programmation dynamique 1. Plus courts chemins à partir d un sommet 2. Plus courts chemins entre tous les sommets 3. Semi-anneau 4. Programmation dynamique 5. Applications à la bio-informatique
Plus en détailI. Cas de l équiprobabilité
I. Cas de l équiprobabilité Enoncé : On lance deux dés. L un est noir et l autre est blanc. Calculer les probabilités suivantes : A «Obtenir exactement un as» «Obtenir au moins un as» C «Obtenir au plus
Plus en détailCOMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES
J. sci. pharm. biol., Vol.9, n - 00, pp. 9-0 EDUCI 00 9 VALLEE POLNEAU S.* DIAINE C. COMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES Notre étude visait à comparer les résultats obtenus
Plus en détail1. Bases légales et réglementaires
Manuel d'administration Financière du Personnel Fin Version du 20-07-2007 Livre 2 Chapitre 1 : Données concernant l adresse et le numéro de compte du membre du personnel Table des matières 1. Bases légales
Plus en détailI. Ensemble de définition d'une fonction
Chapitre 2 Généralités sur les fonctions Fonctions de références et fonctions associées Ce que dit le programme : Étude de fonctions Fonctions de référence x x et x x Connaître les variations de ces deux
Plus en détailCours Fonctions de deux variables
Cours Fonctions de deux variables par Pierre Veuillez 1 Support théorique 1.1 Représentation Plan et espace : Grâce à un repère cartésien ( ) O, i, j du plan, les couples (x, y) de R 2 peuvent être représenté
Plus en détailESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring
ESSEC Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring Les méthodes d évaluation du risque de crédit pour les PME et les ménages Caractéristiques Comme les montants des crédits et des
Plus en détailChapitre 4 : Régression linéaire
Exercice 1 Méthodes statistiques appliquées aux sciences sociales (STAT-D-203) Titulaire : Catherine Vermandele Chapitre 4 : Régression linéaire Le diplôme de Master of Business Administration ou MBA est
Plus en détailavec des nombres entiers
Calculer avec des nombres entiers Effectuez les calculs suivants.. + 9 + 9. Calculez. 9 9 Calculez le quotient et le rest. : : : : 0 :. : : 9 : : 9 0 : 0. 9 9 0 9. Calculez. 9 0 9. : : 0 : 9 : :. : : 0
Plus en détailExercices du Cours de la programmation linéaire donné par le Dr. Ali DERBALA
75. Un plombier connaît la disposition de trois tuyaux sous des dalles ( voir figure ci dessous ) et il lui suffit de découvrir une partie de chacun d eux pour pouvoir y poser les robinets. Il cherche
Plus en détailStatistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier
Statistiques Appliquées à l Expérimentation en Sciences Humaines Christophe Lalanne, Sébastien Georges, Christophe Pallier Table des matières 1 Méthodologie expérimentale et recueil des données 6 1.1 Introduction.......................................
Plus en détailInitiation à la programmation en Python
I-Conventions Initiation à la programmation en Python Nom : Prénom : Une commande Python sera écrite en caractère gras. Exemples : print 'Bonjour' max=input("nombre maximum autorisé :") Le résultat de
Plus en détailFORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)
87 FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) Dans le cadre de la réforme pédagogique et de l intérêt que porte le Ministère de l Éducation
Plus en détailPrincipe de symétrisation pour la construction d un test adaptatif
Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université
Plus en détailSouad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/
Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation
Plus en détailSéance 0 : Linux + Octave : le compromis idéal
Séance 0 : Linux + Octave : le compromis idéal Introduction Linux est un système d'exploitation multi-tâches et multi-utilisateurs, basé sur la gratuité et développé par une communauté de passionnés. C'est
Plus en détailRésumé du Cours de Statistique Descriptive. Yves Tillé
Résumé du Cours de Statistique Descriptive Yves Tillé 15 décembre 2010 2 Objectif et moyens Objectifs du cours Apprendre les principales techniques de statistique descriptive univariée et bivariée. Être
Plus en détailCours d initiation à la programmation en C++ Johann Cuenin
Cours d initiation à la programmation en C++ Johann Cuenin 11 octobre 2014 2 Table des matières 1 Introduction 5 2 Bases de la programmation en C++ 7 3 Les types composés 9 3.1 Les tableaux.............................
Plus en détail# let rec concat l1 l2 = match l1 with [] -> l2 x::l 1 -> x::(concat l 1 l2);; val concat : a list -> a list -> a list = <fun>
94 Programmation en OCaml 5.4.8. Concaténation de deux listes Définissons maintenant la fonction concat qui met bout à bout deux listes. Ainsi, si l1 et l2 sont deux listes quelconques, concat l1 l2 constitue
Plus en détailIBM SPSS Statistics Base 20
IBM SPSS Statistics Base 20 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p. 316. Cette version s applique à IBM SPSS
Plus en détail