Notes personnelles (à partir de BAC2)



Documents pareils
Utilisation du Logiciel de statistique SPSS 8.0

Introduction à SPSS. Guy Mélard, U.L.B. Mars 2006 Guy Mélard, ULB 1. Introduction à SPSS. Objectif de la leçon.

TABLE DES MATIERES. C Exercices complémentaires 42

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9

Biostatistiques : Petits effectifs

Lire ; Compter ; Tester... avec R

Algebra & Trigonometry High School Level Glossary English / French

Didacticiel - Études de cas. Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat.

Introduction aux Statistiques et à l utilisation du logiciel R

IBM SPSS Statistics Base 20

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

1 Objectifs. Traitement statistique des données d enquête avec introduction à SPSS. Plan

Modèles pour données répétées

Introduction à la statistique non paramétrique

La place de SAS dans l'informatique décisionnelle

Aide-mémoire de statistique appliquée à la biologie

Logiciel XLSTAT version rue Damrémont PARIS

Louis Laurencelle, a vol. 11 no. 1. Introduction

LES MODELES DE SCORE

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Tests exacts d indépendance sérielle dans les cas de distributions continues et discrètes

PAST, logiciel statistique naturaliste

Annexe commune aux séries ES, L et S : boîtes et quantiles

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Séance 11 : Typologies

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen

Guide d utilisation pour

Cahiers de l IMA. Fascicule SPSS

Exemple PLS avec SAS

SAS ENTERPRISE MINER POUR L'ACTUAIRE

Chapitre 3. Les distributions à deux variables

COMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Le chi carré. Le sommaire. Approche quantitative

Relation entre deux variables : estimation de la corrélation linéaire

Table des matières. I Mise à niveau 11. Préface

Cours 9 : Plans à plusieurs facteurs

FORMULAIRE DE STATISTIQUES

La Data Visualisation dans les organisations. Par Claude-Henri Meledo

Exemples d application

Validation probabiliste d un Système de Prévision d Ensemble

Statistiques Descriptives à une dimension

Analyse exploratoire des données

Principe de symétrisation pour la construction d un test adaptatif

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

Keywords: Probability of catastrophic events, Bivariate extreme value theory, Heavy tailed distributions, ALS methods.

Catalogue des connaissances de base en mathématiques dispensées dans les gymnases, lycées et collèges romands.

K. Ammar, F. Bachoc, JM. Martinez. Séminaire ARISTOTE - 23 octobre Palaiseau

PROBABILITES ET STATISTIQUE I&II

INITIATION AU LOGICIEL SAS

PROGRAMME (Susceptible de modifications)

Lois de probabilité. Anita Burgun

SAS de base : gestion des données et procédures élémentaires

Initiation au logiciel SAS(9) pour Windows

: seul le dossier dossier sera cherché, tous les sousdomaines

Introduction à l analyse exploratoire des données avec SPSS

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Économie, statistique, finance et actuariat

Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1)

IBM SPSS Regression 21

BIOSTATISTIQUES AVANCEES PLAN. Quelques références. Master Biologie Intégrative 1 ère année

Analyse de données linguistiques

Localisation des fonctions

COURS DE DATA MINING

Modélisation du risque opérationnel Approche Bâle avancée

Estimation et tests statistiques, TD 5. Solutions

MODELE A CORRECTION D ERREUR ET APPLICATIONS

Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1

Faire un semi variograme et une carte krigée avec surfer

Optimiser votre reporting sans déployer BW

Tests de normalité Techniques empiriques et tests statistiques

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Un logiciel de statistiques complet

Ensae-Ensai Formation Continue (Cepe)

Big Data, Data Reuse in Medicine

IDAMS. Logiciel développé internationalement pour la gestion et l analyse de données. Manuel de référence de WinIDAMS. (version 1.

Séance 0 : Linux + Octave : le compromis idéal

MANIPULATION ET VISUALISATION DE GROSSES BASES DE DONNÉES AVEC R

Cookies de session ils vous permettent de sauvegarder vos préférences d utilisation et optimiser l expérience de navigation de l Utilisateur ;

Démographie des masseurs-kinésithérapeutes

Visualisation d information

Algorithmes de recommandation, Cours Master 2, février 2011

Introduction à R. Florence Yerly. Dept. de mathématiques, Université de Fribourg (CH) SP 2011

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 24/12/2006 Stéphane Tufféry - Data Mining -

Christian BONTEMPS né le 08 juillet 1969

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

Un exemple de régression logistique sous

Exploiter les statistiques d utilisation de SQL Server 2008 R2 Reporting Services

SEMINAIRE SAS VISUAL ANALYTICS LAUSANNE, MARCH 18 : JÉRÔME BERTHIER VALERIE AMEEL

données en connaissance et en actions?

Optimisation des ressources des produits automobile première

Optimiser ses graphiques avec R

ÉLÉMENTS DE GESTION DE PROJET

Métrologie des pollens dans l air : étude intercomparative en région Languedoc- Roussillon

1 Modélisation d être mauvais payeur

RFID et visibilité des processus: ajouter de la valeur au système d information

Bureau : 238 Tel : dominique.muller@upmf-grenoble.fr

Enjeux et défis en assurance habitation Marc-Olivier Faulkner 18 novembre 2011

Transcription:

Notes personnelles (à partir de BAC2)

Commandes SPSS associées aux outils statistiques Une variable quantitative (VD) Analyse descriptive : résumé numérique o Mesures de position : Moyenne, mode, médiane Ø Analyze Reports Case Summaries (décocher «Display cases») Ø Analyze Descriptive Statistics Explore Ø Analyze Descriptive Statistics Descriptives o Mesures de dispersion : Étendue, EIQ, variance, écart- type, CV () Ø Analyze Reports Case Summaries (décocher «Display cases») Ø Analyze Descriptive Statistics Explore Ø Analyze Descriptive Statistics Descriptives o Distribution : Tableau de fréquence + cumulés (éventuellement par classes) Ø Analyze Descriptive Statistics Frequencies Analyse descriptive : graphique o Histogramme - visualiser distribution Ø Graphs Legacy Dialogs Histogram Ø Graphs Chart Builder Histogram o Box plot Ø Graphs Legacy Dialogs ( Interactive ) Boxplot Ø Graphs Chart Builder Boxplot o Diagramme en barres (si quantitative discrète) Ø Graphs Legacy Dialogs Bar (Simple) o Analyse de la normalité : QQ plot Ø Analyze Descriptive Statistics Q- Q Plots Inférence (paramétrique) o Test t et intervalle de confiance sur une moyenne Ø Analyze Compare Means One- Sample T test o Test Chi2 et intervalle de confiance sur une variance Ø Non disponible avec le module de base de SPSS Une variable qualitative (VD) Résumé descriptif : résumé numérique o Mesures de position : Mode et Médiane (qualitative ordinale) Ø Analyze Descriptive Statistics Frequencies (Statistics) Ø Analyze Reports Case Summaries (décocher «Display cases») Ø Analyze Descriptive Statistics Explore o Distribution : Tableau de fréquences (+ cumulés si ordinale) Ø Analyze Descriptive Statistics Frequencies Résumé descrive : graphique o Diagramme en barres Ø Graphs Legacy Dialogs Bar (Simple) Inférence (non- paramétrique) o Variable à deux niveaux (k=2): Test sur une proportion Ø Analyze Non Parametric Tests Binomial Ø Analyze Non Parametric Tests Chi Square o Variable à plus de deux niveaux (k 2) : Test d'ajustement chi2 Ø Analyze Non Parametric Tests Chi Square Logiciels SPSS Page 47

Notes personnelles (à partir de BAC2) Page 48 SPSS Logiciels

Une variable quantitative VD et une variable qualitative VI Analyse descrriptive : Résumé numérique o Indices de position et dispersion par catégories de la variable qualitative Ø Analyze Reports Case Summaries (décocher «Display cases») Ø Analyze Descriptive Statistics Explore Analyse descriptive : Résumé graphique o Box plot par catégories Ø Graphs Chart Builder Boxplot Inférence quand la variable qualitative (VI) a deux niveaux : k=2 o Groupes indépendants tests paramétriques Test t de comparaison de deux moyennes (variances égales ou différentes) Ø Analyze Compare Means Independent- Samples T Test Test F de comparaison de 2 variances Ø Non disponible avec le module de base de SPSS Test de Levene de comparaison de 2 variances Ø Analyze Compare Means Independent- Samples T Test o Groupes indépendants tests NON paramétriques Test de la somme des rangs de Wilcoxon et test de Mann- Whitney pour comparer deux valeurs centrales Ø Analyze Nonparametric Tests 2 Independent Samples (Mann- Whitney) o Données pairées tests paramétriques Test t de comparaison de deux moyennes pour données pairées Ø Analyze Compare Means Paired Samples T Test o Données pairées tests NON paramétriques Test des rangs de Wilcoxon pour données pairées Ø Analyze Nonparametric Tests 2 Related Samples (Wilcoxon) Test du signe Ø Analyze Nonparametric Tests 2 Related Samples (Sign) Logiciels SPSS Page 49

Notes personnelles (à partir de BAC3) Page 50 SPSS Logiciels

o Inférence quand la variable qualitative (VI) a plus de 2 niveaux : k 2 o Groupes indépendants - outils paramétriques ANOVA I pour la comparaison des moyennes des traitements Ø Analyze Compare Means One- Way ANOVA Tests de comparaisons multiples (Bonferroni, Tukey, Newman- Keuls) Ø Analyze Compare Means One- Way ANOVA (Post Hoc) Tests sur des contrates Ø Analyze Compare Means One- Way ANOVA (Contrasts) Test de Levene de comparaison de variances Ø Analyze Compare Means One- Way ANOVA (Options) o Groupes indépendants - outils NON paramétriques Analyse de la variance à un critère de classification de Kruskal- Wallis Ø Analyze Nonparametric Tests k Independent Samples (Kruskal Wallis) o Données répétées - outils paramétriques ANOVA I pour mesures répétées Ø Analyze General Linear Models Repeated Measures Tests de comparaisons multiples (Bonferroni) Ø Analyze General Linear Models Repeated Measures (Options Compare main effects)) o Données répétées - outils NON paramétriques Test des rangs de Friedman pour k échantillons dépendants Ø Analyze Nonparametric Tests k Related Samples (Friedman) Explication- modélisation L'ANOVA I peut être considérée comme un modèle où on "explique" la variable Y à partir du niveau pris par X (voir chapitre sur les modèles GLM) Deux variables qualitatives Analyse descriptive : Résumé numérique o Table de contingence Ø Analyze Descriptive Statistics Crosstabs o V et Phi de Cramer Ø Analyze Descriptive Statistics Crosstabs Analyse descriptive : graphique o Diagramme en barres par catégories Ø Graphs Legacy Dialogs Bar (Clustered/Stacked) Inférence (non paramétrique) o Test de comparaison de deux proportions ou d homogénéité Ø Analyze Descriptive Statistics Crosstabs (Statistics:Chi- Square) o Test d'indépendance Chi2 Ø Analyze Descriptive Statistics Crosstabs (Statistics:Chi- Square) Logiciels SPSS Page 51

Notes personnelles (à partir de BAC3) Page 52 SPSS Logiciels

Deux variables quantitatives Analyse descriptive : Résumé numérique (2 VD) o Coefficient de corrélation de Pearson, Spearman Ø Analyze Correlate Bivariate Analyse descriptive : graphique (2VD ou 1VD et 1VI) o Graphe X- Y - Scatter Plot Ø Graphs Legacy Dialogs Interactive Scatterplot Inférence (paramétrique) (2VD) o Test et sur un coefficient de corrélation de Pearson Ø Analyze Correlate Bivariate Explication- modélisation (1VD et 1VI) o Régression linéaire Tests et intervalles de confiance sur les coefficients d'une droite de régression Ø Analyze Regression Linear (Statistics) Prédiction et intervalle de confiance sur la réponse moyenne prédite et intervalle de prédiction Ø Analyze Regression Linear (Save Prediction intervals) Outils pour valider les hypothèses (QQ plot résidus, graphe des résidus) Ø Analyze Regression Linear (Plots) Ø (Plots: X=ZPRED Y=ZRESID) Ø (Plots: Normal probability plot) 2 variables quantitatives et une variable qualitative Résumé numérique o Coefficient de corrélation par niveau de la variable catégorielle Ø Data Split File (var catég) + Analyze Correlate Bivariate Résumé graphique o Graphe X- Y avec des symboles différents pour les niveaux de la variable qualitative Ø Graphs Legacy Dialogs Scatterplot (Simple Scatter) Inférence quand la variable qualitative a deux niveaux o Test d'égalité de deux coefficients de corrélation Ø Non disponible avec le module de base de SPSS o Test de comparaison de deux pentes de droites de régression Ø Non disponible avec le module de base de SPSS Explication- modélisation o Modélisation GLM ou analyse de covariance pour expliquer une variable quantitative à partir d une variable qualitative et une variable quantitative Logiciels SPSS Page 53

Notes personnelles (à partir de BAC3) Page 54 SPSS Logiciels

2 variables qualitatives A et B et une variable quantitative X Résumé numérique o Mesures de position et dispersion par combinaisons des niveaux de A et B Ø Analyze Reports Case Summaries (décocher «Display cases») Résumé graphique o Box plot par combinaisons des niveaux de A et B Ø Graphs Legacy Dialogs Boxplot (Clustered) Inférence - groupes indépendants o ANOVA II pour tester les effets principaux et l'effet d'interaction des deux variables qualitatives A et B sur la variable quantitative X Ø Analyze General Linear Models Univariate o Autres outils disponibles avec ANOVAI (comparaisons multiples, contrastes, test de Levene ) Ø Analyze General Linear Models Univariate (Post Hoc Contrasts Options) Inférence - plusieurs traitements par sujet o Modèle pour mesures répétées avec un facteur within et une facteur between ou avec deux facteurs within Ø Analyze General Linear Models Repeated Measures k variables quantitatives Résumé graphique o Graphe X- Y matriciel (scatter plot matrix) Ø Graphs Legacy Dialogs Scatterplot (Matrix Scatter) Explication- modélisation o Régression linéaire multiple Tests et intervalles de confiance sur les coefficients d'une droite de régression Ø Analyze Regression Linear (Statistics) Prédiction et intervalle de confiance sur la réponse moyenne prédite et intervalle de prédiction Ø Analyze Regression Linear (Save Prediction intervals) Outils pour valider les hypothèses (QQ plot résidus, graphe des résidus) Ø Analyze Regression Linear (Plots) Ø (Plots: X=ZPRED Y=ZRESID) Ø (Plots: Normal probability plot) Outils de détection d outliers et de points influents : leverage et statistique de Cook Ø Analyze Regression Linear ( Save: Préd unstd & Leverage) + Scatter/Dot: X=Préd unstd Y=Lev) Indice VIF pour mesurer la colinéarité Ø Analyze Regression Linear (Statistics) Logiciels SPSS Page 55