Introduction aux statistiques descriptives

Documents pareils
Logiciel XLSTAT version rue Damrémont PARIS

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

La structure de la base de données et l utilisation de PAST. Musée Royal de l Afrique Centrale (MRAC Tervuren)

Statistique : Résumé de cours et méthodes

Annexe commune aux séries ES, L et S : boîtes et quantiles

La classification automatique de données quantitatives

LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION

Statistiques à une variable

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Traitement des données avec Microsoft EXCEL 2010

La place de SAS dans l'informatique décisionnelle

Lecture critique et pratique de la médecine

SPHINX Logiciel de dépouillement d enquêtes

TD d économétrie appliquée : Introduction à STATA

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Principe d un test statistique

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Statistique Descriptive Élémentaire

Biostatistiques : Petits effectifs

Cycle de formation certifiante Sphinx

Scénario: Données bancaires et segmentation de clientèle

Extraction d informations stratégiques par Analyse en Composantes Principales

Introduction aux Statistiques et à l utilisation du logiciel R

glossaire Appellation commerciale Voir nom de marque.

FORMATION EXCEL NIVEAU 2

EXCEL et base de données

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

Localisation des fonctions

Lire ; Compter ; Tester... avec R

2010 Minitab, Inc. Tous droits réservés. Version Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des

Fitted Surface; Variable: Y_REND 2 factors, 1 Blocks, 13 Runs; MS Pure Error=.053 DV: Y_REND

Solutions Décisionnelles SPAD. La maîtrise des données, l'art de la décision

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

données en connaissance et en actions?

Chapitre 3. Les distributions à deux variables

Evaluation de la typicité des vins liés au terroir : proposition de méthodes pour les professionnels de la filière

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Leçon N 4 : Statistiques à deux variables

23. Interprétation clinique des mesures de l effet traitement

Objectif. Cette formation doit permettre au client d être autonome dans la création de ses rapports avancés en utilisant la fonctionnalité Excel +.

Introduction à l approche bootstrap

FORMATION EXCEL NIVEAU 2

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Analyse et interprétation des données

1 Importer et modifier des données avec R Commander

Guide utilisateur. Cofanet

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/ Présentation. 1.2 Ressources

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

TUTORIEL Qualit Eval. Introduction :

MIEUX VIVRE AVEC SON HEMIPLEGIE

Statistiques avec la graph 35+

Microsoft Excel : tables de données

REQUEA. v PD 20 mars Mouvements d arrivée / départ de personnels Description produit

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Introduction au Data-Mining

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

LE PETIT RELATION CLIENT. Les pratiques clés en 15 fiches. Nathalie Houver

Formation Excel, Niveau initiation, module 1 DUREE DE LA FORMATION OBJECTIFS DE LA FORMATION

INTRODUCTION AU DATA MINING

Gestion d'une billeterie défilé des talents

Séries Statistiques Simples

EXCEL PERFECTIONNEMENT SERVICE INFORMATIQUE. Version /11/05

Régression linéaire. Nicolas Turenne INRA

1 Complément sur la projection du nuage des individus

IBM SPSS Statistics Base 20

Chapitre 2 Introduction aux objectifs des coûts. Pr. Zoubida SAMLAL-Doctorante en Risk Management MBA, CFA

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Un laboratoire d auto-immunité paperless : mythe ou réalité? L.Lutteri Laboratoire d auto-immunité Service de Chimie Clinique CHU Liège

Travaux pratiques avec RapidMiner

Rédiger et administrer un questionnaire

PRÉSENTATION DE L OFFRE

Classe de première L

Business Intelligence

Plan de cours. Introduction à la recherche scientifique Théorie et approche méthodologique Les principaux auteurs

de gestion de stock Inventaire, achats

Rapport. Examen des méthodes de paiement et des tendances des paiements au Canada Octobre 2012

Pour un citoyen mieux informé en transports

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes

La pratique du coaching en France. Baromètre 2010

4 Statistiques. Les notions abordées dans ce chapitre CHAPITRE

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Cours 9 : Plans à plusieurs facteurs

Optimiser les performances du mouvement de monte de l Axe Z.

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM

ACP Voitures 1- Méthode

Saisie et d analyse des questionnaires de sortie

développement innovation

Learn & Lunch 23/11/2011. Simon Opresnik / Georges Denneulin

Solution logicielle pour le pilotage et l ERM. Journées d études IARD 26 mars mars 2010

Utilisation avancée de SugarCRM Version Professional 6.5

Les outils BI du consultant métier

.ac-nice.fr. annuaires. un outil convivial et personnalisé pour mieux s informer et mieux communiquer entre services

Enquête sur les Logiciels Libres

La rémunération des concepteurs. en théâtre au Québec. de 2004 à 2006

Transcription:

Introduction aux statistiques descriptives Illustrée avec XLSTAT Jean Paul Maalouf jpmaalouf@xlstat.com 13 octobre 2016 www.xlstat.com 1

PLAN XLSTAT : qui sommes-nous? Statistiques : définition et catégories Variables, individus... Décrire une variable qualitative : mode, tri à plat, graphique en secteurs... Décrire le croisement de deux variables qualitatives : tri croisé (tableau de contingence) Décrire une variable quantitative : moyenne, écart type, médiane, quartiles, box plot Décrire le croisement entre une variable quantitative et une variable qualitative Décrire le croisement entre deux variables quantitatives : nuage de points. 1 quanti x 1 quanti x 1 quali Toutes les données de cette formation ont été inventées sauf mention contraire 2

Logiciel XLSTAT XLSTAT est un logiciel d analyse de données convivial qui s intègre à Excel 3

XLSTAT, Historique Un logiciel en pleine croissance, une équipe grandissante Première vente sur internet Nouvelle version, Interface : VBA, Calculs : C++ 7 langues Nouveaux produits Nouveau site Equipe grandissante 1993 2000 2009 2016 Thierry Fahmy développe une alternative user-friendly pour l analyse de données : Naissance d XLSTAT 1996 Création de la société Addinsoft 2006 Nouvelles offres modulaires 2015 XLSTAT 365 Version Cloud pour Excel 365 4

XLSTAT en quelques chiffres 200+ fonctionnalités statistiques Réparties dans des solutions généralistes ou orientées-métier 50k utilisateurs A travers le monde. Secteurs privé, éducation, recherche 16 salariés A l écoute des utilisateurs 120k visites/mois sur le site web Tutoriels didactiques en 5 langues 7 langues 400 téléchargements/jour 5

Statistiques : définition Ensemble des méthodes qui ont pour objet la collecte, le traitement et l'interprétation des données. 6

Statistiques : 4 catégories 7

Statistiques : 4 catégories 18 / 10 / 2016 8 / 11 / 2016 29 / 11 / 2016 Description Exploration Tests Modélisation Je veux résumer Je veux plonger Je veux accepter / Je cherche à des données grâce facilement dans un rejeter une hypothèse comprendre comment à des calculs ou gros jeu de données bien précise en évolue un phénomène des graphiques sans forcément avoir assumant des risques en fonction d un simples (moyenne, une question précise d erreur (test t, ANOVA, ensemble de écart type, box derrière la tête (ACP, khi², corrélation...) paramètres (régression, plot ) CAH...) ANCOVA, ANOVA) 8

Variables, individus 9

Quelques définitions... Variable Elément qui peut prendre différentes valeurs Variable qualitative Variable qu on ne peut pas quantifier. Exemples : catégorie socioprofessionnelle, origine géographique, type de licence, groupe sanguin... Variable quantitative Variable qu on peut quantifier. Exemples : montant d une facture, nb de j aime sur fb, concentration en sucre, taille... Individu Unité statistique élémentaire. Peut être décrit par des variables. Exemples : clients, personnes sondées, patients, souris de laboratoires... 10

Individus Tableau de données : plateforme de vente de chaussures en ligne Variables 11

Décrire une variable qualitative 12

Décrire une variable qualitative EXEMPLE : la variable marque préférée, statistiques chiffrées Modalité la plus fréquente Tri à plat 13

Décrire une variable qualitative EXEMPLE : la variable marque préférée, graphique en secteurs 14

Décrire le croisement de deux variables qualitatives Tri croisé 15

Etudier la marque préférée par Origine ou par Sexe 16

Décrire le croisement de deux variables qualitatives : Tri croisé (tableau de contingence) Effectifs Pourcentages 17

Décrire une variable quantitative 18

Décrire une variable quantitative EXEMPLE : la variable Pointure, statistiques chiffrées Pointure 19

Décrire une variable quantitative EXEMPLE : la variable Pointure, statistiques chiffrées Mesurer la tendance centrale des données Moyenne Médiane (donnée du milieu) Pointure 20

Décrire une variable quantitative EXEMPLE : la variable Pointure, statistiques chiffrées Mesurer la tendance centrale des données Moyenne Médiane (donnée du milieu) Mesurer la dispersion des données Ecart type (moyenne des flèches) Variance = Ecart type² Pointure 21

Décrire une variable quantitative EXEMPLE : la variable Pointure, box plot Maximum Limite de Tukey 25% des données 50% des données 3ème Quartile Moyenne Médiane 1er Quartile 25% des données 25% des données 25% des données 50% des données Limite de Tukey Minimum 22

Décrire le croisement entre une variable quantitative et une variable qualitative 23

Croisement entre variables quantitative et qualitative EXEMPLE marketing : montant de la facture en fonction de l origine du client Var. Qualitative Var. quantitative 24

Croisement entre variables quantitative et qualitative EXEMPLE analyse sensorielle : résumer la qualité globale de trois marques de chocolats (scores de qualité 0-10) 25

Croisement entre variables quantitative et qualitative EXEMPLE biostatistique : description de la longueur de pétales de 3 espèces d iris 26

Décrire des variables quantitatives Et si on plaçait plutôt une variable quantitative sur l axe des abscisses? 27

Décrire le croisement (lien) entre 2 variables quantitatives 28

Décrire lien entre deux variables quantitatives Nuage de points - Montant facture diminue avec temps passé sur le site 29

2 var. quanti et 1 quali : coloration des points Nuage de points - Montant facture diminue avec temps passé sur le site - Clients plutoniens passent moins de temps sur le site que les autres - Martiens et terriens forment un groupe relativement homogène -... 30

Imaginez le même raisonnement sur un nombre plus élevé de variables... Statistiques exploratoires! Prochain webinar : 18 octobre 2016 31

En somme... Description Exploration Tests Modélisation Description de jeux de données à 1-3 variables. Peut aboutir à des hypothèses. Je veux plonger facilement dans un gros jeu de données sans forcément avoir une question précise derrière la tête (ACP, CAH...) 32

En résumé Statistiques descriptives simples 1 var. quali Tri à plat, mode, graphique en camembert 1 var. quanti Tendance centrale (moyenne / médiane) ; dispersion (variance / écart type) ; box plot 1 var. quali x 1 var. quali Tri croisé (tableau de contingence) 1 var. quanti x 1 var. quanti Nuage de points 1 var. quanti x 1 var. quali Statistiques quanti par modalité quali ; graphique avec un box plot par modalité de variable quali 1 var. quanti x 1 var. quanti x 1 var. quali Nuage de point coloré en fonction des modalités de la variable quali 33

Merci pour votre attention! Tous les outils vus sont disponibles dans toutes les solutions XLSTAT Survey time 34