STATISTICA Statistique descriptive Décrire / synthétiser / mettre en forme vos données

Documents pareils
Logiciel XLSTAT version rue Damrémont PARIS

Annexe commune aux séries ES, L et S : boîtes et quantiles

Séries Statistiques Simples

Représentation d une distribution

Statistique : Résumé de cours et méthodes

Statistiques Descriptives à une dimension

Statistiques 0,14 0,11

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Statistiques avec la graph 35+

Leçon N 4 : Statistiques à deux variables

Lire ; Compter ; Tester... avec R

Statistiques à une variable

2010 Minitab, Inc. Tous droits réservés. Version Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des

Statistique Descriptive Élémentaire

1. Vocabulaire : Introduction au tableau élémentaire

4 Statistiques. Les notions abordées dans ce chapitre CHAPITRE

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

C f tracée ci- contre est la représentation graphique d une

Tout ce que vous avez toujours voulu savoir sur Les Assessment Centers.

3. Caractéristiques et fonctions d une v.a.

Calc 2 Avancé. OpenOffice.org. Guide de formation avec exercices et cas pratiques. Philippe Moreau

Evaluation de la variabilité d'un système de mesure

Fluctuation d une fréquence selon les échantillons - Probabilités

C2i Niveau 1 Enoncé Activité 1 UPJV

Chapitre 3. Les distributions à deux variables

AP1.1 : Montages électroniques élémentaires. Électricité et électronique

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

Introduction aux Statistiques et à l utilisation du logiciel R

Terminale STMG Lycée Jean Vilar 2014/2015. Terminale STMG. O. Lader

Principe d un test statistique

Localisation des fonctions

Utilisez Toucan portable pour vos sauvegardes

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

SPHINX Logiciel de dépouillement d enquêtes

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Styler un document sous OpenOffice 4.0

Note de cours. Introduction à Excel 2007

Bulletin d information statistique

Se débarrasser des s indésirables

Résumé du Cours de Statistique Descriptive. Yves Tillé

Les devoirs en Première STMG

Travaux pratiques. Compression en codage de Huffman Organisation d un projet de programmation

STATISTIQUES DESCRIPTIVES

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

Travaux pratiques avec RapidMiner

NOTICE TELESERVICES : Créer mon compte personnel

Infolettre #18 : Les graphiques avec Excel 2010

OPTION SCIENCES BELLE-ISLE-EN-TERRE

Paramètres d accessibilité des systèmes d exploitation Windows et Mac

TABLE DES MATIERES. C Exercices complémentaires 42

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/ Présentation. 1.2 Ressources

- Ressources pour les classes

Création du projet : 1 sur 13

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

Business Intelligence simple et efficace

IBM SPSS Statistics Base 20

LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION

Introduction à la statistique non paramétrique

Procédure Création : 04/05/2009 ARCHIVAGE DE LA MESSAGERIE

AMELIORATIONS DES FONCTIONNALITES DISPONIBLES

INTERCONNEXION ENT / BCDI / E - SIDOC

Matérialiser les données d une BdD : créer une carte de densité de points par maillage

8. Gestionnaire de budgets

L2T SMS RESELLER MANUEL DE CONFIGURATION ESPACE RESELLER AVERTISSEMENT

LibreOffice Calc : introduction aux tableaux croisés dynamiques

PRESENTATION DE LA SOLUTION. CybEx E_Trade

Comment sauvegarder ses documents

Analyse de la variance Comparaison de plusieurs moyennes

Traitement des données avec Microsoft EXCEL 2010

Classe de première L

Tableau récapitulatif de l analyse fréquentielle

Gouvernance des mesures de sécurité avec DCM-Manager. Présentation du 22 mai 2014

TRAITEMENTS DE FIN D ANNEE Comptabilité

«Manuel Pratique» Gestion budgétaire

1 Modélisation d être mauvais payeur

Export vers le format WAV dans ArtemiS SUITE

Les Enseignants de l Ere Technologique - Tunisie. Niveau 1

Utiliser Glary Utilities

Nettoyer Windows Vista et Windows 7

Complexité. Licence Informatique - Semestre 2 - Algorithmique et Programmation

Cours pratique Excel. Dans chacune des feuilles, les donnés sont déjà entrées afin de gagner du temps.

Logiciel Le Sphinx Plus 2 version 5. Le Sphinx Développement Chavanod

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTERE DE LA FORMATION PROFESSIONNELLE. Microsoft. Excel XP

Manuel d utilisation

données en connaissance et en actions?

Utilisation du Logiciel de statistique SPSS 8.0

Fiche descriptive de l indicateur : Tenue du dossier anesthésique (DAN)

MATHÉMATIQUES. Mat-4104

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

Créer sa première base de données Access Partie 4/4 - Création d un état

ECTS CM TD TP. 1er semestre (S3)

Livre blanc Mesure des performances sous Windows Embedded Standard 7

MESUREZ L'IMPACT DE VOS CAMPAGNES!

Séquence 4. Statistiques. Sommaire. Pré-requis Médiane, quartiles, diagramme en boîte Moyenne, écart-type Synthèse Exercices d approfondissement

La Clé informatique. Formation Internet Explorer Aide-mémoire

Gestion des applications, TI. Tout droits réservés, Marcel Aubin

Transcription:

Chapitre 2 STATISTICA Statistique descriptive Décrire / synthétiser / mettre en forme vos données Introduction Pour ceux et celles qui ont des difficultés avec les statistiques, lisez dans l aide : Concepts Élémentaires Vous pouvez vous aider du Conseiller Statistique Cours réalisé par Benjamin Putois. 1

Statistiques descriptives But: Je souhaite décrire et synthétiser mes données. Statistiques descriptives A quoi cela sert? La statistique descriptive a pour but de transformer, résumer, condenser les données en des valeurs qui ont du sens. Nous pouvons distinguer les paramètres de positions (i.e., centraux) et les paramètres de dispersions (i.e., d étendue). Les données brutes ne sont jamais lisibles directement, il convient donc de les transformer pour les exprimer dans des valeurs qui soient parlantes par la communauté. Par exemple, l emploi de fréquences aulieu d effectifs deffectifs. Résumer une multitude de valeurs numériques en une moyenne et un écart type. Nous aborderons aussi le test de normalité des données et des représentations graphiques. Cours réalisé par Benjamin Putois. 2

Statistica Statistiques descriptives Exemple sur le fichier exercice 01.xls Stat élémentaires Stat descriptives Cette fenêtre vous permet de faire de la statistique descriptive de base. Cours réalisé par Benjamin Putois. 3

Stat élémentaires Stat descriptives Base Sélectionnez la ou les variables qui vous intéressent. Ecart type d échantillon (N 1) Valeurs Manquantes Effectif Effectif cumulé Fréquence Fréquence cumulée Stat élémentaires Stat descriptives Avancé Sélectionnez les paramètres de positions, de dispersions, d étendue qui vous intéressent: Avec l aide, rechercher les définitions de : Erreur type de la moyenne Limites de confiance de la moyenne Asymétrie Aplatissement Cours réalisé par Benjamin Putois. 4

Stat élémentaires Stat descriptives Avancé Erreur type de la moyenne est l'écart type théorique de toutes les moyennes d'échantillons de taille n extraites à partir d'une population. = ÉCART TYPE / RACINE CARRÉE DE LA TAILLE DE LA POPULATION Les intervalles de confiance de la moyenne donnent un intervalle de valeurs autour de la moyenne e dans lesquelles nous pouvonso nous attendre e à toue trouver la "vraie" moyenne (celle de la population), avec un certain niveau de certitude (voir aussi la rubrique Concepts Élémentaires). Dans le module des Statistiques Élémentaires, vous pouvez demander des intervalles de confiance pour n'importe quel niveau p ; par exemple, si la moyenne de votre échantillon est 23 et si les limites inférieure et supérieure de l'intervalle de confiance à p = 0,05 sont respectivement 19 et 27, vous pouvez alors en conclure qu'il existe 95% de chances pour que la moyenne de la population soit comprise entre 19 et 27. L'asymétrie (le terme skewness a été utilisé pour la première fois par Pearson en 1895) mesure l'écart de la distribution par rapport à la symétrie. Si l'asymétrie est clairement différente de 0, la distribution est asymétrique, alors que les distributions normales sont parfaitement symétriques. L'aplatissement (le terme Kurtosis a été utilisé pour la première fois par Pearson en 1905) mesure la "hauteur" d'une distribution. Si l'aplatissement est clairement différent de 0, la distribution est soit plus plate, soit plus pointue que la distribution normale ; l'aplatissement de la distribution normale est égal à 0. Stat élémentaires Stat descriptives Normalité Test de normalité Kolmogorov Smirnov & Lilliefors Fréquence et fréquence cumulée Choisissez les intervalles pour ordonner vos variables numériques Choisissez les intervalles entiers dans le cas de variables nominales Cochez si vous voulez avoir les effectifs, fréquences et fréquences cumulées normaux D=la différence maximum entre la distribution cumulée de l échantillon et la distribution cumulée qui est testée. Si D est significative, alors rejet de la normalité. Lilliefors est la probabilité d obtenir D de cette importance ou supérieur. Test W de Shapiro Wilk Si W est significatif, rejet de normalité Cours réalisé par Benjamin Putois. 5

Stat élémentaires Stat descriptives Nuages de points/probas Demande préalablement de sélectionner 2 ou 3 variables Rechercher dans l aide la fonction des droite de Henry. Stat élémentaires Stat descriptives Nuages de points/probas Droite de Henry Ce type de graphique permet d'évaluer la normalité de la distribution d'une variable, c'est à dire si la variable suit la distribution normale et dans quelle mesure. La variable sélectionnée est représentée par un nuage de points mettant en relation les valeurs observées et les valeurs "théoriques de la distribution normale". Letracédenormalitéstandard(droitedeHenry) est construit comme suit. Tout d'abord, les écarts à la moyenne (résidus) sont classés en rangs. À partir de ces rangs, STATISTICA calcule les valeurs z (c'està dire les valeurs standardisées (centrées réduites) de la distribution normale) sous l'hypothèse que les données suivent la Loi Normale (voir la rubrique Notes Techniques). Ces valeurs z sont tracées selon l'axe Y dans le tracé. Si les résidus observés (tracés selon l'axe X) sont distribués normalement, toutes les valeurs doivent être alignées sur une droite. Si les résidus ne sont pas distribués normalement, ils s'écarteront plus ou moins de la droite. Cours réalisé par Benjamin Putois. 6

Stat élémentaires Stat descriptives Tracés catég. Dans le cas de variables croisées Stat élémentaires Stat descriptives Options Si vous avez décrit vos variables Option de la boîte à moustache Cochez l'option Effectuer les calculs en précision étendue pour effectuer des calculs en précision étendue dans vos statistiques descriptives. STATISTICA utilise des algorithmes propriétaires en précision étendue pour minimiser les risques d'erreurs d'arrondis dans les calculs. Cette option peut s'avérer utile lorsque les variables de l'analyse possèdent des variances relatives faibles (variance rapportée à la moyenne), par exemple, si toutest les valeurs d'une variable sont comprises entre 10000,000001 et 10000,000002 (notez qu'il existe une différence entre une variance faible et une variance relative faible ; par exemple, la variance relative des valeurs comprises entre 0,0000000000000001 et 0,0000000000000002 n'est pas faible). Pour les très gros fichiers de données avec de très nombreuses observations, les calculs peuvent être ralentis lorsque cette option est cochée Cours réalisé par Benjamin Putois. 7

Statistica Remarque Classeur des analyses. Extension du fichier:.stw Vous pouvez sauvegarder 2 types de fichiers: Une feuille en.sta ou des classeurs en.stw Statistica Remarque Clic droit sur vos dossiers Vous pouvez organiser, comme bon vous semble, vos fichiers et dossiers d analyse Cours réalisé par Benjamin Putois. 8

Statistica Remarque Valeurs manquantes: S il manque une valeur à l une de vos variables Nombre de valeurs manquantes Fréquence et fréquences cumulées sur N nb de valeurs manquantes Fréquence et fréquences cumulées sur N Stat élémentaire Stat descriptives ex1 Effectuez sur les variables note de psycho, MOY GEN de l exercice 01.xls: La moyenne La médiane L écart type Q1, Q2, D3 et C65 et l intervalle interquartile Limite de confiance des moyennes L étendue Graphique des effectifs avec des intervalles de 2 (i.e. [0 2] [2 4] ) Faire une boîte à moustache avec la médiane, les quartiles et l étendue Tests de normalité K S et W Effectuez sur la variable bac de lexercice 01.xls: l exercice 01 xls: Tableau des fréquences cumulées Calculez le mode, la médiane, Q1, Q3 Tracez le diagramme des fréquences Enregistrer vos analyses en.stw Cours réalisé par Benjamin Putois. 9

Stat élémentaire Stat descriptives ex2 1. Ouvrez le fichier de données IrisSNN.sta Dans cet exemple, nous utiliserons le fichier de données classique Iris, qui contient diverses informations relatives à trois différents types d'iris l'iris SETOSA, l'iris VERSICOL, et l'iris VIRGINIC. Le jeu de données contient les mesures de quatre variables (la longueur et la largeur des sépales, ainsi que la longueur et la largeur des pétales). 2. Pour chaque type de fleur et pour chaucune des 4 variables dépendantes: Calculer : Moyenne, médiane, mode, minimum, maximum, Q1, Q2, variance écart type. Réaliser le tableau des fréquences. Réaliser l'histogramme desrépartitions d'effectifs effectifs. Réaliser les droites de Henry. Explorez et aidez vous de l aide pour réaliser cet exercice et comprendre «l analyses par groupe» Analyse par groupe A quoi cela sert? L analyse par groupe permet d effectuer des analyses identiques sur chaque modalitéde variable inter sujet. Par exemple, faire des analyses séparées pour les hommes et les femmes; sur différents type de diagnostics ( anxieux, dépressifs, normaux). Cours réalisé par Benjamin Putois. 10

Stat élémentaire Stat descriptives ex2 Vous pouvez aussi réaliser des analyses par groupe: Statistiques/Analyse par groupes Sélectionner votre Variable Groupe Sélectionner les variables que vous voulez analysées Stat élémentaire Stat descriptives ex3 1. Ouvrez exercice 01.xls. 2. Menez des analyses descriptives par groupe sur la variable bac en fonction des notes de stat et psycho 3. Menez des analyses descriptives par groupe sur la variable redoublement en fonction des notes de stat et psycho NB: Ces analyses doivent comporter : Moyenne / Minimum/ Maximum/ Variance/ Ecart type/ Erreur type / distribution d effectifs / table des fréquences Cours réalisé par Benjamin Putois. 11

Stat descriptives Acquis Ce que vous devez savoir faire à l issu de ce chapitre pour des analyses univariées: Moyenne Nuage de point Médiane Histogrammes de dispersion des effectifs Mode Droite de Henry Ecart type type boîte à moustache Variance Analyse par groupe Erreur type de la moyenne Gérer et ordonner les classeurs d analyses Limites de confiance de la moyenne Asymétrie Applatissement Minimum Maximum Quantiles Intervalle inter quartiles Etendue Test de normalité Kolmogorov Smirnov & Lilliefors Test W de Shapiro Wilk Cours réalisé par Benjamin Putois. 12