par Jean-François Deslandes



Documents pareils
LibreOffice Calc : introduction aux tableaux croisés dynamiques

TABLEAU CROISE DYNAMIQUE

Les tableaux croisés dynamiques

Traitement des données avec Microsoft EXCEL 2010

les Formulaires / Sous-Formulaires Présentation Créer un formulaire à partir d une table...3

Guide de l'utilisateur : Surveillance MédiaSource Analytique

La Clé informatique. Formation Excel XP Aide-mémoire

Parcours FOAD Formation EXCEL 2010

EXCEL PERFECTIONNEMENT SERVICE INFORMATIQUE. Version /11/05

Cours Excel : les bases (bases, texte)

RÉALISATION DE GRAPHIQUES AVEC OPENOFFICE.ORG 2.3

@telier d'initiation

POUR ALLER UN PEU PLUS LOIN SUR UN TABLEUR. Version EXCEL

1. Introduction Création d'une macro autonome Exécuter la macro pas à pas Modifier une macro... 5

1. Introduction Création d'une requête...2

REPUBLIQUE TUNISIENNE MINISTERE DE L EDUCATION ET DE LA FORMATION. 4 ème année de l enseignement secondaire Section : Economie et Gestion.

Guide d'utilisation. OpenOffice Calc. AUTEUR INITIAL : VINCENT MEUNIER Publié sous licence Creative Commons

INSERER DES OBJETS - LE RUBAN INSERTION... 3 TABLEAUX

AGASC / BUREAU INFORMATION JEUNESSE Saint Laurent du Var Tel : bij@agasc.fr Word: Les tableaux.

Cours Modélisation et Programmation avec tableur

Semestre3 (Licence Economie et Gestion) EXCEL : interface. Une fois lancé, Excel crée par défaut un "classeur" nommé «classeur1.xls».

Automatisation d'une Facture 4. Liste Déroulante Remises Case à cocher Calculs

TABLEAU CROISE DYNAMIQUE

Microsoft Excel. Tableur

GUIDE D UTILISATION DE L ISU SEPTEMBRE 2013 GUIDE D UTILISATION DU NAVIGATEUR UIS.STAT (VERSION BÊTA)

Valeur cible et solveur. Les calculs effectués habituellement avec Excel utilisent des valeurs numériques qui constituent les données d'un problème.

Les tests logiques avec Excel

Se Perfectionner à Excel

Le cas «BOURSE» annexe

GUIDE Excel (version débutante) Version 2013

Traitement de texte : Quelques rappels de quelques notions de base

Excel 2010 Intermediaire

RÉSOLUTION DE SYSTÈMES À DEUX INCONNUES

Access 2010 Entraînement 1 Garage Renault Dossier 24 MCD

NOS FORMATIONS EN BUREAUTIQUE

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTERE DE LA FORMATION PROFESSIONNELLE. Microsoft. Excel XP

Le cas «BOURSE» annexe

Infolettre #18 : Les graphiques avec Excel 2010

Licence de Biologie, 1ère année. Aide. [Aide 1] Comment utiliser l'explorateur Windows? Comment créer des dossiers?

Création d'un questionnaire (sondage)

LE TABLEUR OPENOFFICE CALC : CONTRÔLES DE FORMULAIRES ACCÈS AUX BASES DE DONNÉES

Utilisation de la clé USB et autres supports de stockages amovibles

Excel 2007 Niveau 3 Page 1

TRANSFERER UNE PHOTO SUR CLE USB

Excel 2010 Module 13. Comment créer un tableau d amortissement dégressif d une immobilisation. Enseignant : Christophe Malpart

Les ateliers du Resclin. Préparation des données issues d Epi-Info en utilisant le tableur Excel

Université Ibn Zohr Excel Résume de cours

CREG : versailles.fr/spip.php?article803

Comment créer un diagramme de Gantt avec OpenOffice.org

La formation informatique en ligne INFOS COURS - FORUM SUPPORT DE COURS WOR MICROSOFT

Activité 11 : Nuage de points ou diagramme de dispersion

Utiliser Access ou Excel pour gérer vos données

INITIATION A EXCEL Année

«Manuel Pratique» Gestion budgétaire

SOS Info: Traitement de textes. 1. Structurer un document. 2. Enregistrer un document

Tune Sweeper Manuel de l'utilisateur

EXCEL Les tableaux croisés dynamiques

Gérer ses comptes sur EXCEL ou sur Internet MAI 2011

BML Informatique Tableur OpenOffice.org Calc Mercredi 8 avril 2015

Publipostage avec Open Office Writer et Open Office Calc

COURS DE MS EXCEL 2010

Date de diffusion : Rédigé par : Version : Mars 2008 APEM 1.4. Sig-Artisanat : Guide de l'utilisateur 2 / 24

Créer une base de données

Date M.P Libellé Catégorie S.Catégorie Crédit Débit Solde S.B

Uniformiser la mise en forme du document. Accélère les mises à jour. Permets de générer des tables de matières automatiquement.

CRÉER UNE BASE DE DONNÉES AVEC OPEN OFFICE BASE

TUTORIAL REUTERS. Utilisation de l'utilitaire de recherche Reuters

ANNEXE 8 : Le Mailing

Le générateur d'activités

Maîtriser l'utilisation des outils bureautiques. Maîtriser le logiciel de traitement de texte - Word. Maitriser le logiciel tableur - Excel

Excel avancé. Frédéric Gava (MCF)

Si vous décidez d utiliser un autre chemin, c est ce nouveau chemin qu il faudra prendre en compte pour la sauvegarde. Cf. : Chapitre 9 Sauvegarde

Logiciel XLSTAT version rue Damrémont PARIS

Guide de démarrage rapide Centre de copies et d'impression Bureau en Gros en ligne

Alain DI MAGGIO Mise à jour sur le site 11/01/10

Utilisation de XnView

Créer un diaporama avec Open Office. Sommaire

LECON 2 : PROPRIETES DE L'AFFICHAGE Version aout 2011

MANUEL TBI - STARBOARD

Analyse tarifaire en ligne (TAO) de l'omc

Astuces_Générales1_excel.doc - bitsch.gerard@orange.fr VERTOU Page : 1 / 29

SOMMAIRE. Travailler avec les requêtes... 3

Importation des données dans Open Office Base

Guide de démarrage Janvier 2012

Pour faire réapparaitre le ruban, il suffit de taper à nouveau sur CTRL + F1

Classer et partager ses photographies numériques

Publipostage avec Calc

Excel. Identification. Informations sur vos besoins et objectifs. Notions fondamentales. Fiche de validation des besoins en formation Bureautique

WHS ProRealTime. édition

Module 1 : Tableau de bord Excel * 2010 incl.*

Guide pour la réalisation d'un document avec Open Office Writer 2.2

FANTEC DB-229US Manuel de l'utilisateur

EXCEL TUTORIEL 2012/2013

Débuter avec OOo Base

Livret Cours Microsoft office 2007 Tableur Excel Perfectionnement

Dans la série. présentés par le site FRAMASOFT

Transcription:

GUIDE EXCEL POUR LA STATISTIQUE par Jean-François Deslandes Automne 2000

2

Table des matières RAPPORT DE TABLEAU CROISÉ DYNAMIQUE 4 CONSTRUCTION D'UN TABLEAU DE FRÉQUENCE POUR UNE VARIABLE UNIQUE 4 DISTRIBUTION CONJOINTE OU CONDITIONNELLE 8 L'UTILITAIRE D'ANALYSE 12 HISTOGRAMME 12 STATISTIQUES DESCRIPTIVES 15 ANALYSE DE CORRÉLATION 16 RÉGRESSION LINÉAIRE 17 CODAGES 20 ÉDITION - REMPLACER 20 FILTRE 22 3

Rapport de tableau croisé dynamique Tous les tableaux de fréquence, de la simple distribution d'une variable unique aux différents tableaux conjoints ou conditionnels, sont effectués à l'aide de l'option Rapport de tableau croisé dynamique. Il est important de noter que le Rapport de tableau croisé dynamique est efficace uniquement lorsque les variables étudiées sont quantitatives discrètes ou qualitatives. Vous trouverez cette fonction sous le menu Données Construction d'un tableau de fréquence pour une variable unique Sélectionnez l'ensemble des données contenues dans la base de données. Sélectionnez Rapport de tableau dynamique. On vous demandera de confirmer la position de vos données 4

À l'étape suivante, on vous demandera de sélectionner la (les) variable(s) dont vous souhaitez faire le résumé numérique. Dans la nouvelle version d'excel, cette étape pourrait légèrement différer À l'aide de la souris, sélectionnez une des variables et placez-la dans le tableau. La colonne de gauche et la ligne supérieure représentent la location où les différentes modalités et les titres seront placées. Vous devez toujours placer vos titres avant vos données. 5

Placez ensuite la variable dans le rectangle DONNÉES ou seront affichées les fréquences relatives. Comme le démontre notre exemple, il se peut qu'excel vous offre un tableau dont le contenu soit la Somme des valeurs d'une variable Si vous désirez modifier ce contenu, double-cliquez sur le rectangle Somme variable. Un menu vous présentera une liste d'options de présentation. 6

En général, ce qui nous intéressera sera de présenter les résultats par leur nombre (Nb). Toutefois, en allant fouiller dans les options (rectangle situé à la droite du menu), nous pouvons même choisir de présenter les nombres sous forme de fréquence relatives (% du total). Un tableau de fréquence sera obtenu. Dans notre exemple, le tableau présente la distribution, en fréquences relatives, du nombre de pièces par maison dans l'échantillon observé. 7

NB Pièces Pièces Somme 3 0,67% 4 2,67% 5 8,67% 6 16,00% 7 26,67% 8 30,00% 9 10,00% 10 3,33% 11 1,33% 13 0,67% Total 100,00% Distribution conjointe ou conditionnelle Pour obtenir un tableau de distribution conjointe ou conditionnelle, ce qui implique le croisement de deux variables, les étapes seront à toutes fins pratiques les mêmes que celles que nous venons d'illustrer. Sélectionnez l'ensemble des données contenues dans la base de données. Sélectionnez Rapport de tableau dynamique. On vous demandera de confirmer la position de vos données À l'étape suivante, on vous demandera de sélectionner les variables dont vous souhaitez faire le résumé numérique. Dans la nouvelle version d'excel, cette étape pourrait légèrement différer 8

À l'aide de la souris, sélectionnez les variables que vous souhaitez présenter conjointement et placez-les dans le tableau. La colonne de gauche et la ligne supérieure représentent la location où les différentes modalités et les titres seront placées. Vous devez toujours placer vos titres avant vos données. L'exemple suivant illustre la préparation nécessaire pour un tableau de distribution conjointe des variables Chauffage et Condition. Remarquez que les titres ont d'abord été positionnés Placez ensuite l'une ou l'autre des variables choisies dans le rectangle intérieur où seront affichées les fréquences relatives. 9

Afin d'ajuster le contenu du tableau, double-cliquez sur le rectangle NB Chauffage. Un menu vous présentera une liste d'options de présentation. Pour un tableau de distribution conjointe, nous voudrons afficher les fréquences relatives en termes du % du total Le tableau obtenu sera le suivant : NB Chauffage Chauffage Condition ext. électrique Gaz naturel huile Total acceptable 22,00% 8,67% 8,00% 38,67% excellente 19,33% 9,33% 6,00% 34,67% pauvre 12,67% 7,33% 6,67% 26,67% Total 54,00% 25,33% 20,67% 100,00% 10

Pour obtenir un tableau de distribution conditionnelle, il faudra choisir de présenter les résultats sous forme de % de ligne ou encore % de colonne Ce qui donnera la distribution de la variable Chauffage, conditionnelle à la variable Condition NB Chauffage Chauffage Condition ext. électrique Gaz naturel huile Total acceptable 56,90% 22,41% 20,69% 100,00% excellente 55,77% 26,92% 17,31% 100,00% pauvre 47,50% 27,50% 25,00% 100,00% Total 54,00% 25,33% 20,67% 100,00% Ou encore la distribution de la variable Condition, conditionnelle à la variable Chauffage NB Chauffage Chauffage Condition ext. électrique Gaz naturel huile Total acceptable 40,74% 34,21% 38,71% 38,67% excellente 35,80% 36,84% 29,03% 34,67% pauvre 23,46% 28,95% 32,26% 26,67% Total 100,00% 100,00% 100,00% 100,00% 11

L'utilitaire d'analyse L'utilitaire d'analyse est une macro complémentaire d'excel permettant la plupart des manipulations statistiques. Cette fonction se trouve dans le menu Outils. En sélectionnant macros complémentaires, vous devrez sans doute d'abord installer l'utilitaire analyse. Cette section discutera des principales fonctions de l'utilitaire Histogramme Contrairement à la fonction Rapport de tableau croisé dynamique, l'histogramme permettra la construction d'un tableau de fréquence pour une variable quantitative continue en groupant les données. Les étapes permettant la construction d'un tel tableau sont présentées à la suite. Nous nous servirons de la variable Salaire de la feuille équité à titre d'exemple. Sur la feuille Excel, définir les classes par leurs bornes supérieures. Dans le cas de la variable Salaire, les modalités observées varient entre 23,7 et 63,4 (en milliers $). Nous avons choisi de définir les classes de salaires de la façon suivante : ]20, 25], ]25, 30], ]30, 35],, ]60, 65]. Vous remarquerez que, dans une feuille Excel, il ne suffit que de présenter la borne supérieure de ces classes. Notez que, par défaut, Excel inclut la borne supérieure dans la classe exprimée. Ouvrir l'utilitaire d'analyse (menu Outils) et sélectionner l'option Histogramme. 12

Indiquer la plage d'entrée (où sont contenues les données) et la plage des classes (cellules contenant les bornes supérieures). Si vous incluez les titres dans votre sélection, veuillez cocher la case Intitulé présent. Les options de sortie vous permettent de choisir l'endroit où le tableau sera présenté. Par défaut, celui-ci sera placé sur une nouvelle feuille. Les résultats apparaîtront sur une nouvelle feuille : 13

Bornes sup. Fréquence 25 3 30 8 35 16 40 17 45 10 50 15 55 8 60 1 65 1 ou plus... 0 La classe ou plus ne contient aucun effectif et peut être éliminée. Vous pouvez, à l'aide de calculs effectués directement sur la feuille Excel, calculer les fréquences relatives (en pourcentages). L'assistant graphique vous permettra également de représenter ces résultats. 14

Statistiques descriptives L'analyse numérique des résultats d'un sondage passe d'abord par la statistique descriptive. Les principaux indicateurs de tendance centrale, de dispersion et de position s'y retrouvent : moyenne, médiane, mode, écart-type, maximum et minimum. Voici les étapes à suivre lors de l'utilisation de cette option À nouveau, nous étudierons la variable Salaire de la feuille équité. Ouvrir l'utilitaire d'analyse (Outils) et sélectionner Statistiques descriptives : Indiquer la position (plage d'entrée) des éléments dont vous souhaitez faire l'analyse numérique. Si votre sélection contient un titre, il faudra cocher la case Intitulés en première ligne. Si vous souhaitez obtenir les statistiques descriptives de plusieurs variables, il suffira d'indiquer la plage d'entrée qui regroupe celles-ci. Notez qu'il faut également cocher la case Rapport détaillé. L'option Niveau de confiance pour la moyenne présentera également un cetain intérêt lors du cours Statistiques. 15

Les statistiques descriptives seront alors présentées sur une nouvelle feuille : Salaire (000 $) Moyenne 39,44936709 Erreur-type 0,989701717 Médiane 37,8 Mode 32 Écart-type 8,796661275 Variance de l'échantillon 77,38124959 Kurstosis (Coefficient d'applatissement) -0,665866199 Coefficient d'assymétrie 0,251595023 Plage 39,7 Minimum 23,7 Maximum 63,4 Somme 3116,5 Nombre d'échantillons 79 Analyse de corrélation Afin d'étudier la possibilité d'une dépendance linéaire entre deux variables quantitatives (étape préalable à une régression linéaire), nous procédons à une analyse de corrélation. L'option analyse de corrélation se trouve également dans l'utilitaire d'analyse d'excel. Comme la plupart des options de l'utilitaire, on vous demandera d'indiquer la position des données quantitatives. Vous pouvez sélectionner deux variables ou plus, en indiquant au besoin la présence de titres dans la plage de données. 16

Les résultats seront présentés sur une nouvelle feuille Excel sous forme de matrice. Le tableau suivant a été obtenu de la feuille maisons par l'option Analyse de corrélation : Prix Surface Acres Pièces Salle de bains Prix 1 Surface 0,69682792 1 Acres 0,485200387 0,10630453 1 Pièces 0,576506309 0,829599985 0,050384587 1 Salle de bains 0,660459721 0,770951014 0,133927855 0,657176741 1 Les éléments indiquent le coefficient de corrélation linéaire entre chaque paire de variables : le coefficient se situe toujours entre -1 et 1, ces deux valeurs indiquant une forte corrélation, alors qu'une valeur près de 0 indique peu de corrélation (indépendance?). Nous pouvons constater, à la lecture de ce tableau, que la surface d'une maison explique le plus fortement le prix de celle-ci. Régression linéaire Lorsque nous avons pu démontrer, à l'aide du coefficient de corrélation, qu'une dépendance linéaire significative pourrait exister entre deux variables, nous nous intéresserons souvent à trouver la droite de régression (aussi appelée droite des moindres carrés). En d'autres mots, nous aimerions trouver l'équation de la droite Y = a + bx qui approche le mieux possible l'ensemble des données expérimentales Considérons les variables Prix et Surface de la feuille maisons. Nous avons vérifié dans la section précédente que ces deux variables sont "fortement" correllées. Une régression linéaire entre les deux est alors justifiée. Dans le menu Outils, sélectionner l'utilitaire d'analyse et l'option Régression linéaire. 17

Il faudra identifier la plage où se trouvent les variables x et y. La variable y est appélée variable dépendante (ou variable réponse) et correspond à la variable que l'on tente d'expliquer à l'aide de la variable x. Dans le cas actuel, nous aimerions expliquer le prix (variable réponse) d'une maison par sa surface (variable explicative). Si les intitulés font partie des plages de données (suggéré), veuillez l'indiquer en cochant la case appropriée. Aussi, il est intéressant d'inclure la courbe de régression dans les options de sortie. Plusieurs informations seront obtenues de la régression linéaire. La plus importante se trouve dans la colonne identifiée Coefficients : Coefficients Constante 63745,1513 Surface 49,3747333 Nous pouvons déduire de ces valeurs que le prix peut être estimé à l'aide de la droite d'équation : Prix = 63 75,15 + 49,37 * Surface 18

La droite de régression devient du fait même un excellent outil de prévision. Pour une surface donnée, nous pourrons anticiper le prix de vente de la maison. Ce genre de prévision peut d'ailleurs se faire directement sur le graphique de la droite de régression fourni par Excel. Par exemple, pour anticiper le prix à payer pour une maison dont la surface est 3000 pi 2, il s'agit de placer le curseur sur la droite de régression à la position x = 3000. Un boîtier contenant les coordonnées du point apparaîtra. Vous pouvez constater que le prix estimé de la maison est 211 869,35 $. 19

Codages Il sera parfois nécessaire de coder les modalités d'une variable afin d'en effectuer l'analyse. Supposons que nous voulions créer un tableau de fréquence d'une variable qualitative dont l'échelle est ordinale. Excel aura tendance à placer les modalités en ordre alphabétique ce qui n'est pas habituellement ce que nous souhaiterons. Par exemple, le tableau suivant, quoiqu'il ne présente aucune erreur, pourrait laisser croire à un lecteur qu'un diplôme collégial (cégep) suit un baccalauréat. Diploma n freq.rel. (%) Bacc. 19 24,1% cégep 23 29,1% Maitrise 15 19,0% Ph.D 22 27,8% Total 79 100% Effectuer un codage des variables est une excellente façon de résoudre ce problème. Coder signifie simplement de renommer une modalité par un symbole, une lettre ou un nombre qui lui sera dorénavant synonyme. Nous discutons, dans le chapitre actuel, des différents outils dont Excel est muni pour coder les différentes modalités d'une variable. Édition - Remplacer Lorsque nous sommes intéressés à coder une variable (qualitative ou quantitative discrète) ayant peu de modalités différentes (six ou moins), l'option Remplacer du menu Édition reste la solution la plus simple et rapide. L'exemple suivant aura pour but d'illustrer le codage des diplômes que vous trouverez dans la feuille équité du fichier banque de données. Sélectionner la colonne contenant la variable à coder. Pour ce faire, il suffit d'appuyer sur le titre de la colonne. 20

Dans la barre de menus, sélectionner Édition, puis l'option Remplacer. Indiquer la modalité que vous voulez remplacer et ce par quoi vous souhaitez la renommer. Par exemple, pour remplacer la modalité cégep par la modalité A, il s'agirait de reproduire l'image suivante : Appuyer sur Remplacer tout. Répéter ces opérations pour les autres modalités que vous souhaitez coder. Le nouveau tableau de fréquence qui résulterait de ce codage serait le suivant : Diplôme n Fréq. Rel. (%) Fréq. Rel.Cum. (%) A 23 29,1% 29,1% B 19 24,1% 53,2% C 15 19,0% 72,2% D 22 27,8% 100,0% Total 79 100,0% Remarquez qu'il nous est maintenant permis d'obtenir la distribution en fréquence relative cumulée puisque l'ordre des diplômes est maintenent respecté. Pour qu'un lecteur comprenne la signification des codes, il faudra habituellement fournir, avec le tableau, la liste des codes et de leurs correspondances. 21

Filtre Le filtre d'excel est un outil permettant de cacher les valeurs ne satisfaisant pas à un critère quelconque. Le filtre est particulièrement efficace lorsque nous voudrons coder une variable quantitative continue, ou encore discrète mais possédant un nombre élevé de modalités différentes. Supposons que nous voulions identifier les maisons (feuille maisons du fichier banque de données) dont le prix se situe entre 70 000 et 99 999.99 $ pour ensuite leur imposer un code "A", par exemple. Un filtre permettra de cacher toutes les maisons ne satisfaisant pas à ce critère. Créer une nouvelle colonne "Prix codé". Sélectionner toutes les colonnes contenant les données. Sélectionner le filtre automatique dans le menu Données. 22

Des onglets apparaîtront à la base des titres de chaque colonne. Puisque notre contrainte ne vise que les prix de maison, il s'agit d'appuyer sur l'onglet de la colonne Prix et de sélectionner le filtre personnalisé : Une fenêtre vous permettant de définir vos contraintes apparaîtra. Il s'agit alors de bien indiquer que vous souhaitez ne conserver que les prix supérieurs ou égaux à 70 000 quoique inférieurs à 100 000 $ : Seules les données suivantes resteront : Prix Surface Acres Pièces Salle de bains Chauffage Condition ext. Prix codé 89900 1660 0,21 7 1 Gaz naturel pauvre 80500 922 0,3 5 1 électrique acceptable 96000 864 0,32 4 1 électrique acceptable 78000 821 2,3 4 1 électrique excellente 99500 1000 0,49 4 1 électrique acceptable 85000 875 0,26 5 1 électrique excellente 98000 1165 0,12 6 1 Gaz naturel excellente 72000 600 0,5 3 1 huile acceptable 94000 850 0,11 4 1 huile acceptable 97000 1300 0,37 5 1 électrique excellente 23

Vous pouvez maintenant identifier par un A toutes les maisons de cette catégorie de prix. En appuyant à nouveau sur l'onglet filtre de la colonne Prix, vous pourrez personnaliser vos codages pour toutes les autres gammes de prix tel que nous venons de le faire. Une fois tous les codages terminés, il faut retirer le filtre en retournant dans le menu Données. 24