Pratique de la statistique avec SPSS

Dimension: px
Commencer à balayer dès la page:

Download "Pratique de la statistique avec SPSS"

Transcription

1 Pratque de la statstque avec SPSS SUPPORT Transparents ultéreurement amélorés et ms à jour sur le ste du SMCS LIENS UTILES Ste du SMCS (Support en Méthodologe et Calcul Statstque) : Documentaton Stat + SPSS : LIVRES UTILES Dscoverng Statstcs Usng Spss par Andy Feld (Sage Publcaton) Formateurs : Nathale Lefèvre et Lorse Moreau Formaton Date SMCS : : Pratque du 7 au 11 septembre de la statstque 009 avec SPSS 3 4

2 Objectfs de la formaton SPSS Objectfs de la formaton Résumer ce que peut offrr la statstque Découvrr l envronnement l SPSS Applquer quelques prncpales analyses statstques Apprendre à nterpréter les résultats r des analyses Répondre à vos questons spécfques Formaton SMCS : Pratque de la statstque avec SPSS 6 7 8

3 Contexte SPSS - Etude de cas Contexte : Un entraîneur neur souhate meux comprendre les facultés s de résstance d athld athlètes tes reprenant les entraînements nements après s une pérode p de repos forcé sute à une blessure Il voudrat savor s la résstance r des athlètes tes [mesurée e par le temps de récupératon après s un marathon (temps nécessare n pour attendre x pulsatons par mnute) et le fat que les athlètes tes ont ou non fat des arrêts durant la course (course avec arrêt ou sans arrêt)] peut être détermnd termnée e par la durée e du repos,, le sexe de l athlète te et les vtamnes prses durant le mos de préparaton. paraton. Il pense que cette étude pourra l ader l à amélorer ses entraînements nements pour être plus adaptés s aux athlètes. tes. Remarque : Il s agt s d une d étude fctve Formaton SMCS : Pratque de la statstque avec SPSS 10 Données Données es: : Pour chaque athlète, te, nous avons les nformatons suvantes : Colonne Nom SPSS Nom de varable Label Values Col1 V1 Date Date de la mesure Col V Identfant Identfant de l athlète Col3 V3 Sexe Sexe de l athlète 1=Homme =Femme Col4 V4 Vtamne Vtamne prse par l athlète 1=Vtamne A =Vtamne B 3=Vtamne C Col5 V5 Absence Nombre de jours de repos Col6 V6 Recup1 Nombre de seconde pour récupérer après le marathon 1 Col7 V7 Recup Nombre de seconde pour récupérer après le marathon Col8 V8 Recup3 Nombre de seconde pour récupérer après le marathon 3 Col9 V9 Arret1 Marathon 1 réalsé avec ou sans arrêt 1=Sans arrêt =Avec arrêts Col10 V10 Arret Marathon réalsé avec ou sans arrêt 0=Sans arrêt 1=Avec arrêts Col11 V10 Fausse_Date Date nventée 11 1

4 Face à une queston La statstque comme outl Quelles réponses r offre la statstque? Des outls descrptfs Pour résumer les données et les représenter graphquement Des outls nférentels Pour répondre r aux questons et décder à partr des données Des outls de modélsaton Pour explquer certanes varables à partr d autres d varables Formaton SMCS : Pratque de la statstque avec SPSS 14 Outls descrptfs Résumé numérque pour estmer des paramètres d une dstrbuton : moyenne, varance, médane, quantles, skewness, kurtoss, corrélaton Graphques statstques pour montrer / analyser les structures sous-jacentes aux données : dagramme en barres, hstogramme, boxplot, graphe x-y, qq-plot, densté 15 Outls nférentels Les outls nférentels permettent de répondre aux questons que nous nous posons sur une populaton à partr d un échantllon extrat de celle-c La résstance des athlètes est-elle affectée par le type de vtamnes prses durant le mos de préparaton? La résstance des athlètes est-elle lée à la durée de la pérode de convalescence des athlètes? Le sexe nterfère-t-l dans les effets observés? Les notons prncpales lées à l nférence statstque: Estmatons Intervalles de confance tests d hypothèses 16

5 Outls de modélsaton Les outls de modélsaton explquent et prédsent une ou pluseurs varables par une foncton mathématque d autres varables Quelques exemples de modélsaton : Régresson smple, multple, régresson logstque, analyse de varance

6 SPSS L envronnement SPSS SPSS pour Statstcal Package for Socal Scences Formaton SMCS : Pratque de la statstque avec SPSS SPSS Pluseurs types de fchers Data : Fcher de données Syntax : Fcher de syntaxe ncluant le code de commandes SPSS Output : Fcher ncluant les résultats r des analyses Scrpt : Fcher ncluant du langage de programmaton objet => Ces dfférents fchers peuvent être sauvés et réutlsés par la sute Deux feulles dfférentes Le fcher de données Data Vew : Vsualsaton des données permet de modfer les données Varable Vew : Vsualsaton des varables permet de modfer les caractérstques rstques des varables 3 4

7 Ouvrr un fcher de données Ouvrr un fcher de données SPSS : Fle Open Data Aller à l endrot où le fcher est enregstré Cocher cette case s la premère lgne nclut le nom des varables => Il est mportant de vsualser les données au préalable et de vérfer v que l mportatonl Chosssez le type de fcher 5 6 Découvrr les données Défnr les varables Vecteur d observatons pour un ndvdu (cas) Vecteur d observatons pour une Varable (champ) Types de varables : Dscret Quanttatf Contnu Qualtatf Nomnal Ordnal Cellule Valeurs manquantes : Varable numérque = «.» (pont) varable alphanumérque = (blanc) 7 Changer le nom des varables Défnr le type : Evter les varables «strng» (chaîne de caractères) car ça lmte certanes analyses Donner un label : nom complet des varables Indquer la sgnfcaton de chaque valeur A vous d essayer d avec les nformatons reçues Indquer le type de mesure : échelle, ordnale, nomnale ues (aller vor ce qu l est possble de fare dans chaque menu: changer l affchage l des dates, défnr d les mssng ) 8

8 Quelques menus ntéressants Découvrr les menus A vous de les découvrrd Quelques menus ntéressants Découvrr les menus Obtenr de l ade Réalser des analyses dfférentes selon les valeurs d une varable Infos générales sur un fcher Défnr des paramètres Sélectonner certanes données Donner un pods sur base d une varable Transformer ou créer des varables Réalser des analyses Obtenr un graphe A vous de les découvrrd 9 30 Ne pas se fatguer Sauver le code chaque fos qu on exécute quelque chose SPSS : chosr le menu qu nous ntéresse chosr les optons voulues dans la fenêtre clquer sur Paste au leu de OK - Le code correspondant est collé dans une fenêtre de syntaxe - Dans la fenêtre de syntaxe, on peut clquer sur Run All et le code est exécut cuté ou Run Selecton - On peut sauver le fcher contenant le code et l ouvrl pour l exécuter sur un autre fcher Se servr du journal pour avor une trace de ce qu a été fat SPSS : Edt Optons Fle Locatons : chosr un endrot accessble pour le fcher «Sesson Journal» spss.jn réalser toutes les analyses ouvrr ce fcher avec un édteur de texte On vot tout ce qu a été fat durant l ouverture l de la cesson 31 3

9 Grlles d ade à l analyse Analyses statstques Une varable d ntd ntérêt à analyser seule Varable à analyser - Varable dépendante (VD) Selon - Var. Indépendante Outl Varable quanttatve Varable qualtatve Pas d'autres varables Graphe Tableau descrptf Graphque temporel Graphe en ponts Dagramme en barres (s dscrète) Boxplot Hstogramme (s contnue) qq-plot, pp-plot Moyenne, mode, médane Varance, écart-type Dagrammes en barres Dagrammes de Pareto Médane, mode Table de fréquences Test t et IC sur la moyenne Test c² et IC sur la varance Test de Normalté Test de proportons Test d ajustement χ² Formaton SMCS : Pratque de la statstque avec SPSS 34 Grlles d ade à l analyse Une varable d ntd ntérêt en foncton d une d varable quanttatve Grlles d ade à l analyse Une varable d ntd ntérêt en foncton d une d varable qualtatve Selon - Var. Indépendante En foncton d'une / de varables quanttatve(s) Outl Graphe Tableau descrptf Graphe x-y Graphe x-y matrcel Varable à analyser - Varable dépendante (VD) Varable quanttatve Coeffcent de corrélaton de Pearson, Spearman ou autre Test et IC sur la corrélaton Régresson lnéare smple et régresson multple Varable qualtatve Graphes en ponts Boxplot par catégore Moyenne, mode, médane par catégore Varance, écart-type par catégore Régresson logstque Analyse dscrmnante Selon - Var. Indépendante En foncton d'une / de varables qualtatve(s) Outl Graphe Tableau descrptf Graphe en ponts Boxplot par catégore Varable à analyser - Varable dépendante (VD) Varable quanttatve Moyenne, mode, médane par catégore Varance, écart-type par catégore Test t de comparason des moyennes, tests de comparasons multples, test de Wlcoxon Test F de comparason des varances, test de Levene ANOVA, ANOVA à mesures répétées, GLM Varable qualtatve Dagramme en barres par catégore Tableau de contngence Test d ndépendance: χ², test exact de Fsher Test de McNemar Régresson logstque Arbre de segmentaton 35 36

10 Analyses qual Qual stat selon SPSS quant Quant Intro selon Stat qual quant Données 1qual Objectfs 1quant Canevas de la formaton Les dfférents partes de la formaton sont organsées en se basant sur le type de varables dsponbles et à analyser Que peut-on utlser comme outl statstque lorsqu on dspose de : Une seule varable quanttatve Une seule varable qualtatve Pluseurs varables quanttatves Une varable quanttatve selon au mons une varable qualtatve Une varable qualtatve selon au mons une varable quanttatve Pluseurs varables qualtatves

11 Analyse d une varable quanttatve Vsualsaton graphque Le chox du graphque dépend de la talle n de l échantllon Hstogramme (pour N > 50) : Box plot (rarement mauvas) : Dot plot (bon pour N < 15) : Dot plot Box plot Hstogramme N=15 N=30 N= Formaton SMCS : Pratque de la statstque avec SPSS 4 Graphe: Hstogramme Ex: Vsualser la forme de la dstrbuton du temps de convalescence SPSS : Graphs Legacy Dalogs Hstogram Nombre d obs par classe ou fréquence relatve Que représente l hstogramme? On défnt des classes (souvent de mêmes longueurs) et pour chacune on dessne un rectangle dont la hauteur représente le nombre d obs. appartenant à la classe. Quand N est pett, la forme peut beaucoup varer en foncton des classes choses à évter pour un N pett Par prudence, prendre envron N comme nombre de classes. Graphe: : Box plot Ex: Vsualser les dstrbutons du temps de convalescence selon le sexe SPSS : Graphs Legacy Dalogs ( Interactve ) Boxplot ou Graphs Chart Bulder Boxplot 43 44

12 Graphe: Boxplot Que représente un box-plot? On ordonne les données et on les coupe en 4 groupes de 5% Graphe: Graphque temporel Ex: Vsualser l évoluton du temps de récupératon au cours du temps SPSS : Data Sort Cases By Date or Fausse_Data Analyse Tme seres Sequence Charts % 5% 5% 5% * Maxmum (sans outlers) 75 ème percentle médane 5 ème percentle Mnmum (sans outlers) 1.5 * IQR Ecart nterquartle (IQR) 1.5 * IQR Outler (observaton < 5th percentle IQR) V a r a b l e T e m p s Graphe 1 Graphe Que représente le graphe temporel? Une représentaton de l évoluton d une varable en foncton du temps (ex: nos crtères de cotaton peuvent se modfer au cours du temps) Graphe 1: Graphe : Très mportant à contrôler Mesure non lée à la Date Phénomène cyclque avec Fausse_Date L hstogramme ne permet pas de vor cette évoluton Graphe: QQplot Ex: Vérfer s les temps de repos sont ssus d une lo Normale SPSS : Analyze Descrptve Statstcs Q-Q Plots Graphe: QQplot Que représente plus précsément un QQplot? Un QQ plot consste à comparer les données observées aux données qu on devrat avor s elles suvaent «parfatement» une certane dstrbuton, le plus souvent la dstrbuton Normale. Les valeurs observées et «déales» (les quantles) sont comparées sur un graphe X-Y qu montre une tendance lnéare en cas de normalté. Exemple avec 4 données 1/4 1/4 1/4 1/4 Que représente ce QQplot? Les données réellement observées par rapport aux données qu auraent dû être observées dans le cas d une dstrbuton parfatement Normale (ou représentaton de la dévaton de la dstrbuton Normale de chacun des ponts observés) 47 z1 z z3 z4 x1 x x3 x4 Quantles de la dstrbuton normale observatons Drote de Henry 48

13 Graphe: QQplot Quelques exemples de vérfcaton de la normalté par QQplot Tableaux: Statstques descrptves Ex: Résumer les temps de repos selon le sexe SPSS : Analyze Reports Case Summares (décocher «Dsplay cases») ou Analyze Descrptve Statstcs Explore Normale Lognormale Bmodale ou Indces de tendance centrale But : Donner une valeur centrale aux données Indces de dsperson But : Savor comment les données varent autour du centre moyenne N 1 X = X = 1 N = 1 médane Mleu=q 0.5 =13 50% of observatons 50% of obs mode Valeur (classe) la plus fréquente= s = s = 7.9 Varance 1 s = N 1 1 = N 1 N = 1 N = 1 ( ) (X X) = X Écart-type (standard devaton) Dans les untés d orgne - Centre de gravté des données - Sensble aux outlers - Effcace pour les données «propres» - Résstant aux outlers - Mons effcace pour les données «propres» - Utle pour les dstrbutons asymétrques - Facle à comprendre - Parfos pluseurs modes s = s = 7.9 Erreur type (standard error) Précson de l estmateur de la moyenne s X = s/ N 51 5

14 Indces de dsperson But : Savor comment les données varent autour du centre Étendue Étendue = max(x ) - mn(x ) IQR = q q Range Espace nterquartle IQR 5% obs 5% 5% 5% q 0.5 q 0.5 q 0.75 Box Plot : Test sur une moyenne Tester une moyenne en populaton normale Ex: Tester s la moyenne du temps de repos est dfférente de 50 Vérfer s la dstrbuton est Normale et transformer les données s nécessare SPSS : Analyze Descrptve Explore Plots (cocher «Normalty plots wth tests») La dstrbuton s écarte sgnfcatvement d une Normale Utlser une transformaton SPSS : Transform Compute Varable (essayer une transformaton logarthmque) Vérfer à nouveau la normalté Dstrbuton plus proche d une Normale Test de KS non sgnfcatf: non rejet de la normalté (P-valeur>0.05) : Test sur une moyenne Tester une moyenne en populaton normale Ex: Tester s la moyenne du temps de repos est dfférente de 50 en utlsant la varable transformée [LN(50) 5.5] SPSS : Analyze Compare Means One-Sample T test Tester une moyenne en populaton normale Test-t (1 moyenne µ par rapport à une valeur de référence µ 0 ) On veut tester H 0 : µ = µ 0 contre H 1 : µ µ 0 Sous condton que la varable X testée at une dstrbuton normale ou qu l y at un grand nombre d observatons X - µ T = 0 ~ t H n 1 sous 0 s / n Statstque de test: T X - µ = obs s / n 0 P-valeur=0.007 => P-valeur<0.05 => Mons de 5% de chance de se tromper en rejetant l hypothèse selon laquelle la moyenne=5.5 => On rejette cette hypothèse au seul de 5% => Nous sommes parvenu à montrer que le logarthme du temps de repos est sgnfcatvement dfférent de Règle de décson: on rejette H 0 s t obs < -t n-1;1-α/ ou s t obs > t n-1;1-α/ (souvent α=0.05) H 0 Accepté H 1 Accepté H 1 Accepté t df Sg. (-taled) Mean Dfference LogAbsence -, ,007 t obs Degré de lberté = N-1 P-valeur=0.007 < 0.05 DONC on rejette H 0 au seul de 5% -t n-1,1-α/ Concluson: La moyenne est sgnfcatvement de Valeur du T calculé t n-1,1-α/ 56

15 Tester une moyenne en populaton normale Intervalle de Confance à 100*(1-α)% pour la moyenne: [ X t n 1;1 α / s / n, X + t n 1;1 α / s / n ] Rmq: IC ne content pas 5.5! ou Intervalle de Confance à 100*(1-α)% pour la dfférence entre le moyenne et la moyenne théorque (5.5) [ X t s / n, X µ t s n] µ 0 n 1;1 α / 0 + n 1;1 α / / Sample Test Test Value = % Confdence Interval of the Dfference Mean Dfference Lower Upper Rmq: IC ne content pas 0!,007 -, ,41 -,

16 Analyse d une varable qualtatve Vsualsaton graphque Ex : Vsualser la répartton des 3 types de vtamnes chez les femmes Pour sélectonner les femmes : SPSS : Data Select Cases f... Dagramme en barres SPSS : Graphs Legacy Dalogs Bar (Smple) Une barre par catégore Fréquence ou pourcentage 1000 Dagramme de Pareto 1000 SPSS : Analyze Qualty Control Pareto Charts Une barre par catégore Les barres sont ordonnées selon leur hauteur Formaton SMCS : Pratque de la statstque avec SPSS 6 Tableaux: Statstques descrptves Ex: Résumer les proportons observées de la varable Arret1 Table de fréquence : SPSS : Analyze Descrptve Statstcs Frequences : Test sur une proporton Test bnomal sur une proporton Ex: Tester s la proporton «avec arrêts» versus «sans arrêt» est la même SPSS : Analyze Non Parametrc Tests Bnomal Pour caractérser une varable ordnale Utlser la médane ou le mode : SPSS : Analyze Descrptve Statstcs Frequences (Statstcs) H 0 : proportons dentques (π A = π B =0.5) H 1 : proportons dfférentes (πa πb 0.5) P-valeur=0.173 => P-valeur>0.05 => On ne rejette pas H 0 => On peut consdérer que le nombre d athlètes qu arrêtent au mons une fos durant le marathon est équvalent au nombre qu ne s arrêtent pas Ce test ne peut être applqué que lorsque la varable d ntérêt ne peut prendre que valeurs (ex: avec versus sans ) 63 64

17 : Test sur une proporton Test d ajustement d χ à un crtère re de classfcaton Ex: Tester s la proporton «avec arrêts» versus «sans arrêt» est la même SPSS : Analyze Non Parametrc Tests Ch Square H 0 : proportons dentques (π A = π B = ) H 1 : non H 0 P-valeur=0.151 => P-valeur>0.05 => On ne rejette pas H 0 => On peut consdérer que le nombre d athlètes qu arrêtent au mons une fos durant le marathon est équvalent au nombre qu ne s arrêtent pas Ce test peut être applqué sur une varable avec plus de catégores. S le test est sgnfcatf, l ndque que les données se rapartssent autrement que le hasard ou autrement que ce qu a été posé sous H 0 : Test sur une proporton Test d ajustement d χ à un crtère re de classfcaton Sot une expérence à k résultats possbles R 1,..., R k de probabltés nconnues p 1, p,, p k Soent les résultats de N expérences ndépendantes (X 1, X X k ) où X est le nombre d occurrences du résultat R (Σ X =N) Queston du test d ajustement : On se donne des valeurs théorques pour les p et se demande s les observatons peuvent émaner de cette dstrbuton R 1 R R 3 R k Résultats possbles X 1 X X 3 X k p 1 p p 3 p k Occurrences observées Probabltés théorques La statstque de test est basée sur la comparason des probabltés théorques et des proportons observées X /N : Test sur une proporton Dfférence entre test bnomal et test d ajustement d χ Test bnomal lé à la table de fréquence pour une varable qualtatve à deux nveaux Test d ajustement d ch-carr carré lé à la table de fréquence à une varable qualtatve à pluseurs nveaux Dans les deux cas,, on peut tester l égalté des proportons entre les nveaux de la varable ou tester des proportons détermnéeses 67 68

18 Analyse avec pluseurs varables quanttatves Graphe X-YX Vsualsaton graphque Ex: Vsualser le len entre le temps de repos et le temps de récupératon SPSS : Graphs Legacy Dalogs Interactve Scatterplot (Ft) Pluseurs possbltés: Scatter Plot Scatter Plot avec une drote de régresson et IC (ntervalle de confance) ou IP (ntervalle de prédcton) Formaton SMCS : Pratque de la statstque avec SPSS 70 Graphe X-YX Vsualsaton graphque Ex: Vsualser le len entre le temps de repos et le temps de récupératon en tenant compte du sexe SPSS : Graphs Legacy Dalogs Interactve Scatterplot (Ft) Autres possbltés: Scatter Plot smple avec une couleur dfférente par groupe Scatter Plot + une courbe plus ou mons lssée ρ = Stats descrptves et Coeffcent de corrélaton de Pearson = 1 N = 1 N ( x x)( y y) ( x x) ( y y) N = 1 0 < ρ <1 ρ 1 ρ 1 1 < ρ < 0 ρ 0 ρ > 0 x x x x x x x x Attenton! ρ 0 x x x x x x x x x x x 71 7

19 Stats descrptves et Coeffcent de corrélaton et test d hypothd hypothèse sur le coeffcent Il exste pluseurs coeffcents de corrélaton dans SPSS : Pearson: utlsé quand on a deux varables contnues Spearman (Pearson basé sur les rangs): utle pour les varables quanttatves non normales ou les varables qualtatves ordnales Kendall tau-b (basé sur le nombre de concordances et dscordances des rangs) : pour des varables ordnales Stats descrptves et Coeffcent de corrélaton et test d hypothd hypothèse sur le coeffcent Ex: Quantfer et tester la force du len lnéare entre le logarthme du temps de repos et le logarthme du temps de récupératon SPSS : Analyze Correlate Bvarate Coeffcent de corrélaton de Pearson P-valeur du test sur la corrélaton Il exste un test d hypothd hypothèse pour tester s le coeffcent est égal versus dfférent de 0 (= versus > 0): H 0 : ρ=0 contre H 1 : ρ 0 : lnéare La régresson r lnéare smple : Y = α + βx + ε Le prncpe est de trouver a et b mnmsant : C est le crtère des mondres carrés n = 1 ( Y a bx ) lnéare Ex: Modélser le len lnérare entre le log du temps de repos et le log du temps de récupératon : SPSS : Analyze Regresson Lnear Résdu : e =Y -a-bx Y 4000 Y 3000 Y Y =a+bx X 75 76

20 lnéare Comment juger s le modèle est bon? En regardant la p-valeur et le coeffcent R p-valeur ndquant s le modèle Y=α+βX+ε est melleur qu un modèle ayant seulement une constante Y=α+ε lnéare Comment rapporter le modèle estmé? Sous la forme d une équaton : LogRecup1 = *LogAbsence n = 1 ( Yˆ Y ) Somme des carrés explquée par le modèle n ˆ ( Y Y ) = 1 Somme des carrés résduelle Pourcentage de varablté de la réponse explquée par le modèle pondérée par le nombre de varables du modèle et le nombre d observatons Pourcentage de varablté de la réponse explquée par le modèle Ecart-type des résdus Estmatons des paramètres α et β p-valeurs assocées aux tests dont l hypothèse H 0 est la nullté du paramètre lnéare Comment juger s le modèle est valde? En analysant les résdus et les ponts nfluents Les hypothèses suvantes dovent toujours être vérfées Y = α + β + ε X α + β X lnéare Ex: Analyse graphque des résdus du modèle estmant le len lnérare entre le log du temps de repos et le log du temps de récupératon : SPSS : Analyze Regresson Lnear (Plots - Save) 10 Y 8 Modèle lnéare Termes d erreur ε ~ N(0,σ²) X Varance ± constante Résdus Normaux Quelques ponts ont un Indépendance des observatons Normalté de la dstrbuton Homogénété des varances ± 95% des r entre - et (Plots: X=ZPRED Y=ZRESID) leverage > */175=0.0 (Plots: Normal probablty plot) (Save: Préd unstand. & Leverage Scatter/Dot: X=Préd unstd. Y=Leverage) 79 80

21 lnéare Dfférents types de résdus : Termes d erreurs d du modèle ε = Y α βx Résdus observés Résdus standardsés avec ε ~ N (0, σ ) ˆ ( 0, σ (1 h )) avec h = leverage e = Y Y = Y a bx, e ~ N Y ˆ Y r = t( n p 1) ˆ (1 h ) σ ε Résdus studentsés externes et résdu r «Press» Y ˆ Y d = t( n p ) ˆ (1 h ) ( ) σ ε Most r should be n [-,] = ZRESID Drote sans le pont Résdus press Drote avec le pont e Résdus standardsés calculés en enlevant le pont du modèle 81 lnéare Recommandatons pour l analyse des résdus : Représenter par un graphe X-Y les résdus (ou les résdus standardsés) en foncton: Des Y prédts SPSS : Regresson Lnear (Plots : ZPRED-ZRESID) De l ordre de collecte des données (s cela a du sens) SPSS : Reg. Lnear (Save : Resduals Unstand.) Scatter/dot DATE-RES_1 Les graphques dovent montrer un comportement aléatore Fare un QQ-plot (ou PP-plot) pour vérfer la normalté des résdus SPSS : Regresson Lnear (Plots : Normal probablty plot) Vérfer que les résdus standardsés sont comprs dans l ntervalle [-;] et étuder ceux qu en sortent SPSS : Reg. Lnear (Plots : ZPRED ou DEPENDNT-SRESID) Comparer les r aux d et étuder ceux qu sont très dfférents 8 lnéare Ponts nfluents et outlers : S l ensemble de données dsponbles content des observatons «spécales», l est prmordal de les repérer pour qu elles n nfluencent pas à elles seules les résultats de la régresson 65 lnéare Leverage ou «force de lever» : Un pont élogné du «nuage» de ponts dans la drecton des X peut potentellement nfluencer l équaton de régresson. Le leverage h mesure le degré de sngularté d un pont dans l espace des X h =0.1 h =0.56 Y X 3 ponts sont dfférents des autres 83-5 La somme des leverages = p h =0.6 4 X p=nombre de paramètres ncluant l ntercept Un leverage > p/n sera consdéré comme élevé ex: h provenant d un modèle construt avec 5 paramètres et sur un échantllon de 50 ndvdus. Calculez le leverage maxmal 1 Les leverages sont les éléments de la «hat matrx» : H = X( X' X) X' Y

22 lnéare Influence et statstque de Cook : Un pont qu a un grand leverage et qu n est pas algné avec les autres ponts observés peut à lu seul nfluencer la drote de régresson Y Y D = X D =3.8 D =0.58 Modèle avec le pont nfluent (en rouge) Modèle sans le pont nfluent (en vert) La statstque de Cook D résume comment les réponses prédtes sont modfées quand le pont est enlevé du modèle (D >1 : nfluence anormale) ˆ ˆ ˆ ˆ ( Y Y( ) )'( Y Y( )) e h D = = F( p + 1, n p 1) ( p + 1) s ( p + 1) s (1 h ) 85 lnéare La régresson r lnéare multple : Modèle lnéare multple à varables explcatves : Y = β0 + β1x1 + β X + ε, où ε est N(0, σ ) Objectf: estmer β 0, β 1, β Équaton du modèle estmé: Y ˆ = b + b X + b X L estmaton est fate par les mondres carrés. Il s agt de mnmser la somme des carrés des écarts des ponts au plan: mn n = 1 e = n = 1 ( Y b 0 b X 1 1 b X ) e (X 1, X,Y ) 86 lnéare Dfférents modèles lnéares multples : Un modèle de régresson est dt lnéare s son équaton est lnéare par rapport aux paramètres Plane n R3 Polynomal model lnéare Ex: Modélser le temps de récupératon (LogRecup1) en foncton du temps de repos (LogAbsence) et de la température du jour Exercce nécesstant l ouverture d un nouveau fcher (Data_SPSS_): SPSS : Analyze Regresson Lnear 77,6% de varablté de la réponse peut être explquée par le modèle Y = X β + β X + β + ε Model avec nteracton Y 3 Y = β + β X + β X + β + ε Model wth qualtatve varable X X1 Modèle globalement + utle qu un modèle avec juste un ntercept Effets du nombre de jours d absence et de la température du jour sur le temps de récup Y = X β + β X + β X + β X + ε X Y = β + β X + β S + ε MALE FEMALE 87 LogRecup1 = *LogAbsence *Température 88

23 lnéare Comment juger s le modèle est valde? En analysant les résdus de la même manère que pour la régresson smple En vérfant l nfluence des ponts sur la régresson (Leverage / Cook) En s assurant qu l n y a pas de problème de «multcolnéarté» entre les varables explcatves (VI). On parle de multcolnéarté lorsque les varables explcatves évoluent ensembles. La multcolnéarté peut entraîner: - une mprécson des paramètres estmés - une nstablté des paramètres quand une donnée change lnéare Comment détecter les problèmes de multcolnéarté? En vérfant le facteur d nflaton de la varance (VIF) : ok s 1 VIF 10 On peut auss utlser la tolérance qu est défne par: 1 / VIF SPSS : Analyze Regresson Lnear (Statstcs Colnearty dagnostcs) En regardant les valeurs propres de la matrce de corrélaton des paramètres En constatant l Instablté du modèle quand une varable est enlevée ou ajoutée au précédent modèle lnéare Notre modèle de régresson multple est-l valde? SPSS : Analyze Regresson Lnear (Plots - Statstcs - Save) (Plots: X=ZPRED Y=ZRESID) (Plots: Normal probablty plot) (Save: Préd unstand. & Leverage Scatter/Dot: X=Préd unstd. Y=Leverage) Ex: Réalser la même modélsaton à partr des varables d orgne (Recup1 Absence et Température). Fare les mêmes analyses de résdus et comparer les résultats des deux analyses 91 9

24 Analyse d une varable quanttatve en foncton d au mons une varable qualtatve Vsualsaton graphque Ex : Vsualser la durée de repos (absence) en tenant compte du sexe Boxplot SPSS : Graphs Chart Bulder Boxplot 1000 Scatter/Dot 1000 SPSS : Graphs Chart Bulder Scatter/Dot Formaton SMCS : Pratque de la statstque avec SPSS 94 Tableaux: Statstques descrptves Ex: Résumer la varable temps de repos (Absence) en foncton du sexe SPSS : Analyze Descrptve Statstcs Explore ou Analyze Reports Case Summares : Test sur moyennes Tests de comparason de moyennes ndépendantes Ex: Tester s le log du temps de Recup1 dffère en moyenne selon le sexe Test-t pour échantllons ndépendants Utlsaton : Lorsque les données à comparer sont ndépendantes Condtons : Normalté des dstrbutons, égalté des varances et ndépendance des observatons (transformatons possbles pour la normalté) SPSS : Analyze Compare Means Independent-Samples T Test Tests non-paramétrque (normalté non respectée ou données ordnales) Utlsaton : Quand les données ne se dstrbuent pas normalement dans au mons un des groupes ou qu l s agt de données ordnales Tests : Test de Mann-Whtney ( Wlcoxon Rank-Sum), test de la médane SPSS : Analyze Nonparametrc Tests Independent Samples (Mann-Whtney) SPSS : Analyze Nonparametrc Tests k Independent Samples (Medan) 95 96

25 : Test sur moyennes Ex: Tester s le log du temps de Recup1 dffère en moyenne selon le sexe Test pour échantllons ndépendants Tester la Normalté SPSS : Analyze Descrptve Statstcs Explore (Plot-Normalty Plots ) : Test sur moyennes Tests de comparason de moyennes parées Ex: Comparer la moyenne du temps de récupératon 1 et Test-t paré Utlsaton : Quand les données à comparer sont lées (ex: avant-après ) Condton de Normalté respectée Test paramétrque SPSS : Analyze Compare Means Independent-Samples T Test Condtons : Normalté de la dfférence entre les groupes et ndépendance des observatons au sen de chaque groupe. En cas de Non-Normalté, l est possble de transformer les données (ex: log, 1/x, ) SPSS : Analyze Compare Means Pared Samples T Test Tests parés non-paramétrques (condton de normalté non respectée) Test de Levene : Teste l égalté des varances entre les groupes. Détermne la lgne à lre. P-valeur du test : Indque que Recup1 ne dffère pas selon le sexe 97 Utlsaton : Quand les données à comparer sont lées (ex: avant-après, pots avec plantes ) et que la dfférence entre les groupes ne se dstrbue pas normalement. Dfférents tests : Test du sgne ou test de Wlcoxon (sgned-rank) SPSS : Analyze Nonparametrc Tests Related Samples (Wlcoxon, Sgn) 98 : Test sur moyennes Ex: Comparer la moyenne du temps de récupératon 1 et Test paré Tester la Normalté de la dfférence entre les groupes SPSS : Transform Compute Varable (DfRecup=Recup1-Recup) Analyze Descrptve Statstcs Explore (Plot-Normalty Plots Wth Tests) : Test sur k moyennes Tests de comparason de k moyennes ndépendantes Ex: Tester s la moyenne du log de Recup1 dffère selon la vtamne prse ANOVA pour k échantllons ndépendants Utlsaton : Lorsque les données à comparer sont ndépendantes Condtons : Normalté des dstrbutons, égalté des varances et ndépendance des observatons (transformatons possbles pour la normalté) SPSS : Analyze Compare Means One-Way ANOVA Condton de Normalté non respectée Test Non-paramétrque SPSS : Analyze Nonparametrc Tests Related Samples (Wlcoxon, Sgn) P-valeur du test Test non-paramétrque (normalté non respectée ou données ordnales) Utlsaton : Quand les données ne se dstrbuent pas normalement dans au mons un des groupes, qu l s agt de données ordnales, ou peu de données Tests : Test de Kruskal-Walls, test de la médane SPSS : Analyze Nonparametrc Tests k Independent Samples (Kruskal Walls) Dans le cas d une dstrbuton très asymétrque Test du Sgne (Sgn)

26 : Test sur k moyennes Ex: Tester s la moyenne du log de Recup1 dffère selon la vtamne prse Test pour échantllons ndépendants Tester la Normalté SPSS : Analyze Descrptve Statstcs Explore (Plot-Normalty Plots ) : Test sur k moyennes Ex: Tester s la moyenne du log de Recup1 dffère selon la vtamne prse Test pour échantllons ndépendants Imagnons la Condton de Normalté respectée Test paramétrque SPSS : Analyze Compare Means One-Way ANOVA P-valeur du test de Levene : Indque que les varances des groupes ne peuvent être consdérées homogènes Condton de Normalté non respectée Test non paramétrque SPSS : Analyze Nonparametrc Tests k Independent Samples (Kruskal Walls) Test en cas d égalté des varances Test en cas d négalté des varances P-valeur du test : Indque que LogRecup1 dffère selon la vtamne => Le temps de récupératon est dfférent pour au mons une des vtamnes 101 P-valeur du test : Indque que LogRecup1 dffère selon la vtamne Pour obtenr la correcton de Welch : SPSS : Analyze Compare Means One-Way ANOVA (Optons) 10 : Test sur k moyennes Comparasons multples post-hoc Ex: Vor quelles vtamnes dffèrent s analyse globale sgnfcatve ANOVA pour k échantllons ndépendants Tests : Bonferron, Tuckey, Scheffé, SPSS : Analyze Compare Means One-Way ANOVA (Post Hoc) P-valeur ndquant que toutes les vtamnes dffèrent au nveau de la moyenne du LogRecup1 : Test sur k moyennes Tests de comparason de k moyennes parées Ex: Comparer la moyenne du temps de récupératon 1, et 3 ANOVA pour mesures répétées Utlsaton : Lorsque les données à comparer sont lées (ex: temps 1,, 3) Condtons : Normalté de la dfférence entre les groupes, ndépendance des observatons au sen de chaque groupe, sphércté de la matrce var/cov SPSS : Analyze General Lnear Models Repeated Measures Test non paramétrque (Kruskal-Walls) Test : Pas de comparasons multples dans SPSS. Comparer les moyennes à en adaptant la p-valeur. Prncpe de Bonferron : P-valeur adaptée=0.05/nombre de comparasons 103 Tests non-paramétrques (condton de normalté non respectée) Utlsaton : Quand les données à comparer sont lées (ex: temps 1,, 3 ), que la dfférence entre les groupes ne se dstrbue pas normalement ou que l échantllon est pett Dfférents tests : Test de Fredman, Kendall W, Cochran Q SPSS : Analyze Nonparametrc Tests k Related Samples (Fredman) 104

27 : Test sur k moyennes Comparasons multples post-hoc Ex: Vor quelles mesures (temps) dffèrent s analyse globale sgnfcatve ANOVA pour mesures répétées Tests : Bonferron, Sdak SPSS : Analyze General Lnear Models Repeated Measures (Optons) P-valeur ndquant que les tros mesures de temps de récupératon (LogRecup1 3) dffèrent en moyenne : Test sur k moyennes Ex: Comparer la moyenne du temps de récupératon 1, et 3 ANOVA pour mesures répétées (s normalté respectée) SPSS : Analyze General Lnear Models Repeated Measures Test de Mauchly : Teste la symétre composée Homogénété des varances / covarances. En cas de non-sphércté, prendre la correcton de Greenhouse-Gesser Test non paramétrque (Fredman) Test : Pas de comparasons multples dans SPSS. Comparer les moyennes à en adaptant la p-valeur Prncpe de Bonferron: P-valeur adaptée=0.05/nombre de comparasons P-valeur du test : Indque qu au mons une des mesures aux dfférents temps a une moyenne dfférente des autres : Test sur k moyennes Ex: Comparer la moyenne du temps de récupératon 1, et 3 Test pour mesures répétées (s non normalté ou peu de données) SPSS : Analyze Nonparametrc Tests k Related Samples (Fredman) P-valeur du test : Test à crtères res Tests de comparason de moyennes selon crtères res Ex: Tester la moyenne LogRecup1 selon les varables sexe et Arrêt1 ANOVA à crtères Utlsaton : Lorsque les données à comparer sont ndépendantes Condtons : Normalté des dstrbutons, égalté des varances et ndépendance des observatons (transformatons possbles pour la normalté) SPSS : Analyze General Lnear Models Unvarate Levene's Test of Equalty of Error Varances a F 1,679 df1 3 df 171,173 Sg. Tests the null hypothess that the error varance of the dependent varable s equal across groups. a. Desgn: Intercept + Sexe + Arret1 + Sexe * Arret1 P-valeur du test de Levene: Indque l égalté des varances des résdus entre les groupes. Condton nécessare pour la valdté du test Modèle non sgnfcatf Effets prncpaux et nteracton non sgnfcatfs

28 LogRecup1 : Test à crtères res Il y a un effet d nteracton entre les facteurs sexe et arrêt s l effet du facteur sexe sur la réponse dépend du nveau prs par le facteur arrêt Sans effet d nteracton Avec Arrêts Sans Arrêt LogRecup1 Avec effet d nteracton Avec Arrêts Sans Arrêt : Test à crtères res Tests de comparason de moyennes selon crtères res - 1 répétér Ex: Tester l effet du sexe sur le temps de récupératon aux 3 temps ANOVA pour mesures répétées Utlsaton : Lorsque certanes données à comparer sont lées Condtons : Normalté de la dfférence entre les groupes, ndépendance des observatons au sen de chaque groupe, sphércté de la matrce var/cov SPSS : Analyze General Lnear Models Repeated Measures Homme Sexe Femme Homme Sexe Femme Test de Mauchly : Teste la symétre composée Homogénété des varances / covarances. En cas de non-sphércté, prendre la correcton de Greenhouse-Gesser : Test à crtères res Ex: Tester l effet du sexe sur le temps de récupératon aux 3 temps Utlser préférentellement les varables transformées (dfférences mportantes ) Correcton de Greenhouse-Gesser à consdérer car non sphércté Moyenne dfférente selon les temps Pas d effet d nteracton entre le temps et le sexe : Modèle lnéare général Régresson ncluant smultanément ment des varables catégorelles et quanttatves comme varables explcatves Ex: Modélser le temps de récupératon selon le temps de convalescence et le fat que les athlètes se sont arrêtés durant le marathon Utlsaton : Test équvalent à l ANOVA s toutes les varables explcatves sont catégorelles Condtons : Identques aux condtons de la régresson lnéare SPSS : Analyze Generalzed Lnear Models Generalzed Lnear Models Pas d effet du sexe sur le temps de récupératon

29 : Modèle lnéare général Ex: Modélser le temps de récupératon selon le temps de convalescence et le fat que les athlètes se sont arrêtés durant le marathon SPSS : Analyze Generalzed Lnear Models Generalzed Lnear Models Test de la qualté d approxmaton du modèle logrecup1 = logAbsence, logAbsence, s Marathon avec Arrêts s Marathon sans Arrêt Pas d effet de la varable Arret1 sur Recup

30 Analyse d une varable qualtatve en foncton d une varable quanttatve Vsualsaton graphque Ex :Vsualser la varable Arret1 (avec versus sans arrêts) en foncton de la durée de convalescence (absence) Boxplot par catégore SPSS : Graphs Chart Bulder Boxplot 1000 Dot Plot par catégore 1000 SPSS : Graphs Chart Bulder Scatter/Dot Formaton SMCS : Pratque de la statstque avec SPSS 118 Tableaux: Statstques descrptves Ex: Résumer la varable temps de convalescence (LogAbsence) par catégore de la varable Arret1 et par catégore de la varable Arret SPSS : Analyze Descrptve Statstcs Explore ou Analyze Reports Case Summares logstque La régresson logstque permet de modélser une réponse Y dchotomque (0,1) en foncton de varables explcatves On modélse la probablté que l événement survenne P(Y=1)

31 logstque Exemples d utlsaton Modélser la probablté qu un clent rembourse son prêt selon ses caractérstques personnelles : salare, âge, emplo, Modélser la probablté de développer une malade cardaque selon l âge, le taux de cholestérol, le pods, le fat de fumer Modélser la probablté pour une personne de posséder son propre logement selon le revenu, l âge, le nombre d enfants, La régresson logstque peut être utlsée pour Décrre la relaton entre la probablté espérée et une varable Détermner les varables ndépendantes mportantes pour explquer la probablté d une réponse Prédre la probablté de la réponse à l ade de ces varables 11 logstque Pourquo ne pas utlser la régresson lnéare? La régresson lnéare multple et le modèle lnéare général permettent d explquer une varable quanttatve contnue en foncton de varables explcatves qualtatves ou quanttatves Y = β K 0 + β1x 1 + β X + + β p X p + ε, où ε est N (0, σ Lorsque Y est une varable catégorelle à ou pluseurs nveaux, le modèle de régresson classque ne peut plus s applquer. La condton d homogénété de varance des résdus n est pas possble à obtenr avec une varable dépendante dchotomque. Le modèle de régresson lnéare permettrat des valeurs estmées en dehors de l ntervalle [0,1] et ne permettrat pas de relaton non-lnéare. ) 1 logstque Prncpe de la régresson logstque La varable à explquer (Y) est une varable dchotomque dont les valeurs possbles sont 0 (échec) et 1 (succès) La probablté P(Y=1) = π, (0 π 1) π peut dépendre de la valeur des varables explcatves (X 1, X,, X p ). Le modèle logstque propose d explquer π comme une foncton de (X1, X,, Xp) Comme 0 π 1, on le transforme pour qu l prenne ses valeurs dans [-, ]. Modèle de régresson logstque (logt): π ln = β0 + β1 + β + β 1 π X 1 X... p X p + ε 13 logstque Modèle logstque bnare à une varable π Equaton du modèle : ln = β0 + β1x + ε 1 π Equaton du modèle estmé : πˆ exp(b0 + b1 X) ln = b0 + b1 X ou πˆ = 1 πˆ 1+ exp(b + b X) Représentaton graphque du modèle ( π=p(y=1) ) : Probablte P(Y=1) Varable explcatve X πˆ ln = X 1 πˆ exp( X) ou πˆ = 1+ exp( X)

32 logstque Estmaton des paramètres On veut estmer β 0 et β 1 qu détermnent π La méthode des mondres carrés n a pas de bonnes proprétés dans ce contexte. On applque dans ce cas la méthode du maxmum de vrasemblance La foncton de vrasemblance mesure la probablté d observer l échantllon récolté : L(β0,β1 ) = P(Y1 = y1 Y = y... YN = y N X 1,X,...,X N ) = π avec π ln = β + β X + ε π ( 1 π ) La méthode du maxmum de vrasemblance recherche les valeurs de β 0 et β 1 qu maxmsent la vrasemblance N = 1 y 1 y, 15 logstque Influence des paramètres sur π=p(y=1) Probablte P(Y=1) b0 = -5 b0 = 0 b0 = Varable explcatve X Probablte P(Y=1) b1 = 0.5 b1 = 1 b1 = Influence de b Varable explcatve X Influence de b 1 Probablte P(Y=1) b1 = -0.5 b1 = -1 b1 = Varable explcatve X 16 logstque Ex: L entraîneur voudrat pouvor prédre le rsque qu un athlète s arrête au mons une fos durant le ème marathon (Arret) en foncton du temps de convalescence (LogAbsence) SPSS : Analyze Regresson Bnary Logstc de la probablté de Y=1 càd d avor au mons un arrêt lors du marathon logstque Comment juger s le modèle est bon? En regardant les p-valeurs Block 0 = Modèle n ncluant que l ntercept (autres coeffcents=0) Block 1 = Modèle suvant, ncluant un ou pluseurs prédcteurs Tests de qualté d ajustement : Omnbus Tests vrasemblance sans les p varables ln ~ χ p vrasemblance avec les p varables Ils testent s le modèle ncluant les prédcteurs (modèle complet, dans le «Step» ou dans le «Block») est sgnfcatvement melleur que le modèle n ncluant que l ntercept Hosmer and Lemeshow Test Il teste s l exste une dfférence sgnfcatve entre les valeurs observées et les valeurs prédtes par le modèle 17 18

33 logstque Comment juger s le modèle est bon? En regardant les pseudo R logstque Comment teste-t-on la sgnfcatvté des paramètres? Test de Wald Mesures d ajustement Crtère d Akake : AIC = - ln(l)+*(nb de param) Crtère de Schwartz : SIC = - ln(l)+(nb de param)*ln(nb d obs) Rapport de vrasemblance: -LL = -*ln(max de vrasemblance) Mesures de la talle de l effet : Pseudo R² Cox & Snell R² : Dffcle à nterpréter (max<1) Nagelkerke R²: [0,1] = Mesure de la force d assocaton But: tester H 0 : β = 0 contre H 1 : β 0 La statstque de Wald est défne par: b = ~χ s (b ) sous H 0 On rejette H 0 s la p-valeur ( P(χ² 1 > W obs ) ) est nféreure à un seul fxé W obs 1 W obs P valeur logstque Comment rapporter le modèle estmé? Sous la forme d une équaton - catégore de référence : Y=1 : logstque Que représentent le «Odds» et le «Odds rato»? Odds (ou cotes) ˆ π ln = LogAbsence 1 ˆ π exp( LogAbsence) ˆ π = 1+ exp( LogAbsence) Ex: Le rsque pour un athlète de s arrêter durant le ème marathon (Arret) en sachant qu l a eu 18 mos de convalescence (Absence) π 1 π Probablté de s'arrêter au mons 1fos sachant le LogAbsence = Probablté de ne pas s'arrêter sachant le LogAbsence exp( Log(18*30)) ˆ π = = exp( Log(18*30)) Pour un athlète qu a eu une convalescence de 18 mos, la probablté qu l s arrête au mons une fos durant le ème marathon est estmée à 56%

34 logstque Que représentent le «Odds» et le «Odds rato»? Odds Rato (ou rapport de cotes) Ex: Le rsque relatf pour un athlète avec un temps de convalescence de X+1 de s arrêter durant le ème marathon par rapport à un athlète avec un temps de convalescence de X (LogAbsence) π1 Probablté de s'arrêter au mons 1fos sachant le temps de convalescence = X + 1 (1 π1) Probablté de ne pas s'arrêter sachant le temps de convalescence = X + 1 OR = = π Probablté de s'arrêter au mons 1fos sachant le temps de convalescence = X (1 π ) Probablté de ne pas s'arrêter sachant le temps de convalescence = X OR=exp(β 1 ) Un athlète avec un temps de convalescence d une unté en plus au nveau du LogAbsence a,019 fos plus de chance de s arrêter au mons une fos durant le marathon 133 logstque Comment se mettre dans de bonnes condtons pour obtenr un modèle qu sot valde? En repérant les outlers et ponts nfluents (va l analyse des résdus, standardzed resduals, leverage, Cook) En ncluant toutes les varables nfluentes dans le modèle et unquement celles-là En vérfant que la relaton entre VI et log odds de VD est lnéare En vérfant l absence de multcolnéarté En utlsant des échantllons de talle suffsante En s assurant que les condtons d applcaton des tests χ² sont respectées

35 Vsualsaton graphque Analyse d une varable qualtatve en foncton d une varable qualtatve Ex : Vsualser la répartton des 3 types de vtamnes selon le sexe Dagramme en barres par catégore SPSS : Graphs Legacy Dalogs Bar (Clustered/Stacked) Formaton SMCS : Pratque de la statstque avec SPSS 138 Tableaux: Statstques descrptves Ex: Résumer les proportons observées de la varable Arret1 selon le type de vtamnes prses Tableau de contngence : SPSS : Analyze Descrptve Statstcs Crosstabs : Test d ndépendance Test χ² d ndépendance de varables aléatores atores qualtatves Ex: Tester s le fat de prendre une vtamne donnée est lé au sexe χ² de Pearson, Test du rapport de vrasemblance Condtons : Toutes les observatons dovent être ndépendantes Les valeurs attendues dovent être supéreures à 5 S les valeurs attendues sont nféreures à 5 : Opérer des regroupements qu ont du sens Utlser un test exact de Fsher (pas toujours dsponble dans SPSS base) SPSS : Analyze Descrptve Statstcs Crosstabs (Statstcs:Ch-Square) P-valeur du test => Pas de len entre le sexe et le type de vtamnes prses

PREMIERS PAS en REGRESSION LINEAIRE avec SAS. Josiane Confais (UPMC-ISUP) - Monique Le Guen (CNRS-CES-MATISSE- UMR8174)

PREMIERS PAS en REGRESSION LINEAIRE avec SAS. Josiane Confais (UPMC-ISUP) - Monique Le Guen (CNRS-CES-MATISSE- UMR8174) PREMIERS PAS en REGRESSION LINEAIRE avec SAS Josane Confas (UPMC-ISUP) - Monque Le Guen (CNRS-CES-MATISSE- UMR874) e-mal : confas@ccr.jusseu.fr e-mal : monque.leguen@unv-pars.fr Résumé Ce tutorel accessble

Plus en détail

Grandeur physique, chiffres significatifs

Grandeur physique, chiffres significatifs Grandeur physque, chffres sgnfcatfs I) Donner le résultat d une mesure en correspondance avec l nstrument utlsé : S avec un nstrument, ren n est ndqué sur l ncerttude absolue X d une mesure X, on consdère

Plus en détail

STATISTIQUE AVEC EXCEL

STATISTIQUE AVEC EXCEL STATISTIQUE AVEC EXCEL Excel offre d nnombrables possbltés de recuellr des données statstques, de les classer, de les analyser et de les représenter graphquement. Ce sont prncpalement les tros éléments

Plus en détail

DOIT-ON UTILISER LA STANDARDISATION DIRECTE OU INDIRECTE DANS L ANALYSE DE

DOIT-ON UTILISER LA STANDARDISATION DIRECTE OU INDIRECTE DANS L ANALYSE DE DOIT-ON UTILISE LA STANDADISATION DIECTE OU INDIECTE DANS L ANALYSE DE LA MOTALITÉ À L ÉCHELLE DES PETITES UNITÉS GÉOGAPHIQUES? DIECTION PLANIFICATION, ECHECHE ET INNOVATION UNITÉ ÉTUDES ET ANALYSES DE

Plus en détail

Pour avoir les idées plus claires...

Pour avoir les idées plus claires... ARNET PRATIQUE Pour avor les dées plus clares...... lorsque vous développez un projet d ntérêt général. Outl produt avec le souten du rédt Mutuel accuel SOMMaRe «Je ne connas pas d entrepreneur qu n at

Plus en détail

Guide méthodologique pour le suivi des tassements des Centres de Stockage de Classe II (Déchets ménagers et assimilés) Direction Déchets et Sols

Guide méthodologique pour le suivi des tassements des Centres de Stockage de Classe II (Déchets ménagers et assimilés) Direction Déchets et Sols Gude méthodologque pour le suv des tassements des Centres de Stockage de Classe II (Déchets ménagers et assmlés) Drecton Déchets et Sols Agence de l Envronnement et de la Maîtrse de l Energe Illustraton

Plus en détail

La genèse des premiers pas

La genèse des premiers pas ZANONE, P. G. (990). Perceptuo-motor development n the chld and the adolescent : perceptuo-motor coordnaton. n C. A. Hauert (Ed.) Developmental psychology. Cogntve, perceptuo-motor, and neuropsychologcal

Plus en détail

MODÈLE D ISING À UNE ET DEUX DIMENSIONS.

MODÈLE D ISING À UNE ET DEUX DIMENSIONS. Chapter MODÈLE DISIG À UE ET DEUX DIMESIOS.. ITRODUCTIO. ous commençons, dans ce chaptre, létude dun problème de mécanque statstque de la matère condensée où leffet des nteractons est mportant. Le modèle

Plus en détail

TD 1. Statistiques à une variable.

TD 1. Statistiques à une variable. Danel Abécasss. Année unverstare 2010/2011 Prépa-L1 TD de bostatstques. Exercce 1. On consdère la sére suvante : TD 1. Statstques à une varable. 1. Calculer la moyenne et l écart type. 2. Calculer la médane

Plus en détail

L enfant qui somatise

L enfant qui somatise L A P S Y C H I A T R I E D E L E N F A N T E T D E L A D O L E S C E N T L enfant qu somatse 2 par Johanne Bovn et Genevève Teller Évelyne a 10 ans, et sa mère consulte pour la trosème fos en un mos pour

Plus en détail

Le manger, le boire et le bien-être

Le manger, le boire et le bien-être Le manger, le bore et le ben-être Gude de l almentaton sane Sommare Le meux-manger 3 Manger: tout un programme 11 Lat et produts laters 12 Qu a peur de la matère grasse? 16 L aventure du pett déjeuner

Plus en détail

Mécanique des Milieux Continus

Mécanique des Milieux Continus Mécanque des Mleux Contnus Golay Frédérc SEATECH MMC Golay MMC - - Ce cours de mécanque des mleux contnus est à la base de l ensegnement de mécanque à SEATECH. Les notons abordées c, transport de champs,

Plus en détail

La dépression réfractaire: rien ne va plus!

La dépression réfractaire: rien ne va plus! L A D É P R E S S I O N C H E Z L A D U L T E La dépresson réfractare: ren ne va plus! LORSQUE VOUS AVEZ ESSUYÉ un échec dans le tratement d une dépresson majeure après avor utlsé deux antdépresseurs de

Plus en détail

Q x2 = 1 2. est dans l ensemble plus grand des rationnels Q. Continuons ainsi, l équation x 2 = 1 2

Q x2 = 1 2. est dans l ensemble plus grand des rationnels Q. Continuons ainsi, l équation x 2 = 1 2 Exo7 Nombres complexes Vdéo parte. Les nombres complexes, défntons et opératons Vdéo parte. Racnes carrées, équaton du second degré Vdéo parte 3. Argument et trgonométre Vdéo parte 4. Nombres complexes

Plus en détail

Introduction à l analyse exploratoire des données avec SPSS

Introduction à l analyse exploratoire des données avec SPSS Introduction à l analyse exploratoire des données avec SPSS Professeurs : O. Renaud et G. Pini Assistante: K. Iglesias Moniteurs : R. Wipfli et B. Ossipow Certaines parties de ce polycopié sont basées

Plus en détail

Effets de la dépendance entre différentes branches sur le calcul des provisions

Effets de la dépendance entre différentes branches sur le calcul des provisions Effets de l dépendnce entre dfférentes brnches sur le clcul des provsons Thème ASTIN : Contrôle des rsques Gllet Antonn Commsson de Contrôle des Assurnces 54, rue de Châteudun 75009 PARIS ntonn.gllet@cc.fnnces.gouv.fr

Plus en détail

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9 Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9 L analyse de variance à un facteur permet de vérifier, moyennant certaines hypothèses, si un facteur (un critère de classification,

Plus en détail

Généralités sur les fonctions 1ES

Généralités sur les fonctions 1ES Généraltés sur les fonctons ES GENERALITES SUR LES FNCTINS I. RAPPELS a. Vocabulare Défnton Une foncton est un procédé qu permet d assocer à un nombre x appartenant à un ensemble D un nombre y n note :

Plus en détail

Tout ce que vous n avez jamais voulu savoir sur le χ 2 sans jamais avoir eu envie de le demander

Tout ce que vous n avez jamais voulu savoir sur le χ 2 sans jamais avoir eu envie de le demander Tout ce que vous n avez jamais voulu savoir sur le χ 2 sans jamais avoir eu envie de le demander Julien Barnier Centre Max Weber CNRS UMR 5283 julien.barnier@ens-lyon.fr 25 février 2013 Table des matières

Plus en détail

Initiation aux calculatrices graphiques numériques TI en français TI-82 STATS.fr TI-83 Plus TI-83 Plus SE TI-84 Plus TI-84 Plus SE

Initiation aux calculatrices graphiques numériques TI en français TI-82 STATS.fr TI-83 Plus TI-83 Plus SE TI-84 Plus TI-84 Plus SE Initiation aux calculatrices graphiques numériques TI en français TI-82 STATS.fr TI-83 Plus TI-83 Plus SE TI-84 Plus TI-84 Plus SE Introduction Nous avons conçu ce document dans le but de vous aider à

Plus en détail

MIS 102 Initiation à l Informatique

MIS 102 Initiation à l Informatique MIS 102 Initiation à l Informatique Responsables et cours : Cyril Gavoille Catherine Pannier Matthias Robine Marc Zeitoun Planning : 6 séances de cours 5 séances de TD (2h40) 4 séances de TP (2h40) + environ

Plus en détail

L analyse des données par les graphes de similitude

L analyse des données par les graphes de similitude 1 L analyse des données par les graphes de similitude Par Pierre Vergès, directeur de recherche au CNRS et Boumedienne Bouriche, maître de conférence à l IUT de Gap Juin 2001 2 A Claude FLAMENT l inventeur

Plus en détail

Pourquoi les ménages à bas revenus paient-ils des loyers de plus en plus élevés?

Pourquoi les ménages à bas revenus paient-ils des loyers de plus en plus élevés? LOGEMENT Pourquoi les ménages à bas revenus paient-ils des loyers de plus en plus élevés? L incidence des aides au logement en France (1973-2002) Gabrielle Fack* Depuis la fin des années 1970, les aides

Plus en détail

Ressources pour le lycée général et technologique

Ressources pour le lycée général et technologique éduscol Ressources pour le lycée gééral et techologque Ressources pour le cycle termal gééral et techologque Mesure et certtudes Ces documets peuvet être utlsés et modés lbremet das le cadre des actvtés

Plus en détail

Dérivation. 1. Nombre dérivé, tangente 2. Fonction dérivée 3. Fonction dérivée et variations 4. Fonction dérivée et extrema

Dérivation. 1. Nombre dérivé, tangente 2. Fonction dérivée 3. Fonction dérivée et variations 4. Fonction dérivée et extrema «À l utomne 97 le présdent Non nnoncé que le tu d ugmentton de l nflton dmnué C étt l premère fos qu un présdent en eercce utlst l dérvée terce pour ssurer s réélecton» Hugo Ross, mtémtcen, à propos d

Plus en détail

Les devoirs en Première STMG

Les devoirs en Première STMG Les devoirs en Première STMG O. Lader Table des matières Devoir sur table 1 : Proportions et inclusions....................... 2 Devoir sur table 1 : Proportions et inclusions (corrigé)..................

Plus en détail

IV. La ressemblance entre apparentés

IV. La ressemblance entre apparentés IV. La ressemblance entre apparentés La ressemblance entre apparentés est un phénomène de constatation courante chez l homme. Cependant, les proverbes «tel père, tel fils» et «à père avare, fils prodigue»

Plus en détail

THESE. présentée à L ECOLE SUPERIEURE D INGENIEURS D ANNECY (ESIA) UNIVERSITE DE SAVOIE. par. Emmanuel DUCLOS. pour obtenir le

THESE. présentée à L ECOLE SUPERIEURE D INGENIEURS D ANNECY (ESIA) UNIVERSITE DE SAVOIE. par. Emmanuel DUCLOS. pour obtenir le THESE présentée à L ECOLE SUPERIEURE D INGENIEURS D ANNECY (ESIA) UNIVERSITE DE SAVOIE par Emmanuel DUCLOS pour obtenir le DIPLÔME DE DOCTEUR DE L UNIVERSITE DE SAVOIE spécialité : Electronique - Electrotechnique

Plus en détail

Ects. Utilitaire d Économétrie Version 2. Russell Davidson

Ects. Utilitaire d Économétrie Version 2. Russell Davidson Ects Utilitaire d Économétrie Version 2 Russell Davidson Mars 1993 Ects, Version 2 c Russell Davidson, Mars 1993. Tous droits de reproduction, de traduction, d adaptation, et d exécution réservés pour

Plus en détail

Première Edition, février 2008

Première Edition, février 2008 Association des Professeurs de Mathématiques de l Enseignement Public Brochure n 183 Jacques Lubczanski, alias Tonton Lulu Isabelle Lallier Girot, alias La Grande Zaza Première Edition, février 2008 www.apmep.asso.fr

Plus en détail