SCI03 - Analyse de données expérimentales



Documents pareils
Statistiques Descriptives à une dimension

Chapitre 3 : INFERENCE

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Introduction au datamining

Qu est-ce qu une probabilité?

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Statistique Descriptive Élémentaire

LES GENERATEURS DE NOMBRES ALEATOIRES

Cours de Mécanique du point matériel

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

Structure typique d un protocole de recherche. Préparé par Johanne Desrosiers dans le cadre d une formation au réseau FORMSAV

LES DIFFERENTS TYPES DE MESURE

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Les conducteurs automobiles évaluent-ils correctement leur risque de commettre un accident?

Chapitre VIII. Les bases de données. Orientées Objet. Motivation

TABLE DES MATIERES. C Exercices complémentaires 42

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

1. Vocabulaire : Introduction au tableau élémentaire

Principe d un test statistique

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

Présentation livre Simulation for Supply Chain Management. Chapitre 1 - Supply Chain simulation: An Overview

Chapitre 1. La démarche statistique appliquée au management. Minicas. Questions :

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Introduction à la statistique descriptive

CHAPITRE 2. Les variables

Élément 424b Introduction à la statistique descriptive

Introduction à la Statistique Inférentielle

!-.!#- $'( 1&) &) (,' &*- %,!

Comment évaluer une banque?

Relation entre deux variables : estimation de la corrélation linéaire

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

Economie de l Incertain et des Incitations

Pôle de Dakar S IMUL ATIONS. 1 Utiliser un taux d accroissement pour une simulation

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Table des matières. I Mise à niveau 11. Préface

Conseil économique et social

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

L ENTRETIEN de Recherche

Le modèle de régression linéaire

Modélisation aléatoire en fiabilité des logiciels

La définition La méthode. Les échelles de mesure L ENQUETE PAR SONDAGE : LA METHODE

Partie Agir : Défis du XXI ème siècle CHAP 20-ACT EXP Convertisseur Analogique Numérique (CAN)

Aide-mémoire de statistique appliquée à la biologie

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen

Lois de probabilité. Anita Burgun

Définitions. Numéro à préciser. (Durée : )

LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE.

Rapport sur. La situation financière de l ensemble des retraités Québécois et des secteurs public et parapublic du Québec

Introduction au Data-Mining

MODÈLE CROP DE CALIBRATION DES PANELS WEB

Le chi carré. Le sommaire. Approche quantitative

BIG DATA : PASSER D UNE ANALYSE DE CORRÉLATION

Introduction aux probabilités. et à la statistique. Jean Bérard

DE L ÉVALUATION DE LA COMPRÉHENSION DE L ÉCRIT

Calculer avec Sage. Revision : 417 du 1 er juillet 2010

Développement itératif, évolutif et agile

Introduction au Data-Mining

Introduction à l approche bootstrap

Coefficients binomiaux

2.2 Objet du contrôle Il y a lieu de vérifier les points suivants de manière individuelle ou combinée.

Déroulement des enquêtes quantitatives et/ou qualitatives

Modélisation de la réforme des pensions

Directeur de la publication : André-Michel ventre, Directeur de l INHESJ Rédacteur en chef : Christophe Soullez, chef du département de l ONDRP

Théorie et Codage de l Information (IF01) exercices Paul Honeine Université de technologie de Troyes France

FPSTAT 2 í La dçecision statistique. 1. Introduction ça l'infçerence. 1

FOTO - L OMNIBUS MENSUEL DE CROP LE NOUVEAU CROP-EXPRESS

Modèle de phases FlexWork: Sondage des entreprises et administrations suisses sur la flexibilité géographique et temporelle du travail

IFT3245. Simulation et modèles

Principe de symétrisation pour la construction d un test adaptatif

CONCEPTION ET TIRAGE DE L ÉCHANTILLON

Cinzia Grassi, Loredana Ceccacci, Anna Elisa D Agostino Observatoire pour le contraste de la pédophilie et de la pornographie enfantine

La gestion intégrée des produits résiduaires organiques de la micro-régionouest de la Réunion Etat d avancement du projet

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN

ISBN-13 : Dépôt légal : Bibliothèque et Archives nationales du Québec, 2009

LES PROBLEMES D ASYMETRIE D INFORMATION AU SEIN DE L ENTREPRISE

TD 3 : suites réelles : application économique et nancière

UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE

Estimation et tests statistiques, TD 5. Solutions

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Biostatistiques : Petits effectifs

Evaluation des engagements de retraite des fonctionnaires de l Etat en France

Rédiger et administrer un questionnaire

Mise à jour juin Référentiel. normatif. des professionnels de l expertise comptable

Examen de Logiciels Statistiques

Le WACC est-il le coût du capital?

Le taux de retour au joueur, un des facteurs de risque du jeu problématique liés à l'offre de jeu

évaluations avec date de calcul à compter du 31 décembre 2014 (mais au plus tard le 30 décembre 2015).

Le produit semi-direct

COURS COLLÉGIAUX PRÉALABLES À L ADMISSION

L allocataire dans un couple : l homme ou la femme?

Transcription:

SCI03 - Analyse de données expérimentales Introduction à la statistique Thierry Denœux 1 1 Université de Technologie de Compiègne tél : 44 96 tdenoeux@hds.utc.fr Automne 2014

Qu est ce que la statistique? On peut définir la Statistique comme l activité qui consiste dans le recueil, le traitement et l interprétation de données d observation. Ces observations portent, de manière générale, sur des individus définis comme les éléments d une certaine population. C est la population, en tant qu ensemble d entités, qui est l objet de l investigation statistique, et non telle ou telle entité particulière.

Population Dans certains cas, la population de référence est finie : ses éléments peuvent être explicitement dénombrés. Souvent, une population est bien définie mais on ne peut en énumérer les éléments (ex : malades de la grippe). On parle alors de population hypothétique. Parfois, une population est définie par une procédure de génération de données (ex : mesure physique). L hypothèse fondamentale est que l expérience est répétable un nombre infini de fois.

Caractère Chaque individu d une population est typiquement décrit par un ensemble de caractéristiques appelées caractères ou variables. Un caractère peut être soit qualitatif (par exemple : le sexe, la nationalité, l état matrimonial d une personne), soit quantitatif ou numérique (taille, poids, etc.).

Caractère qualitatif Un caractère qualitatif prend valeurs (modalités) qui ne ne sont pas de nature numérique. Les modalités d un caractère qualitatif ne peuvent pas être combinées par des opérations arithmétiques, même si elles sont codées par des nombres. Parmi les caractères qualitatifs, on distingue Les caractères ordinaux, dont les modalités sont ordonnées (par exemple : le grade pour une population de militaires). Les caractères nominaux (pas de structure d ordre).

Caractère quantitatif Un caractère quantitatif peut être Discret (domaine fini ou dénombrable), ou Continu (domaine théoriquement non dénombrable). La notion de caractère continu est une abstraction commode pour modéliser des grandeurs mesurées sur des échelles possédant un très grand nombre de valeurs.

Distribution La distribution d un caractère X quantitatif dans une population Ω peut être décrite par la fonction F X : R [0, 1] qui à tout réel x associe la proportion dans Ω d individus pour lesquels on a X x. Cette fonction (appelée fonction de répartition) est parfaitement définie et observable dans le cas d une population finie. On suppose encore son existence dans le cas d une population hypothétique, même si elle n est plus observable dans ce cas.

Echantionnage L étude exhaustive (par recensement) d une population de grande taille est souvent difficile, voire impossible. Une méthode consiste alors à n étudier qu un sous-ensemble de la population totale, appelé échantillon (c est la seule méthode envisageable dans le cas d une population infinie). Le processus de sélection d un échantillon est appelé échantillonnage.

Distribution empirique vs. théorique Un ensemble de n valeurs observées x 1,..., x n d une variable (scalaire ou vectorielle) sur un échantillon de taille n est appelé une distribution empirique (ou également un échantillon). Une distribution empirique peut être considérée comme apportant une information sur la distribution de la variable correspondante dans la population totale (distribution théorique). On appelle inférence statistique le processus visant à déduire des conclusions générales relatives à la population totale, à partir d un échantillon. L inférence statistique ne conduit jamais à des certitudes, mais à des conclusions possédant un certain degré de vraisemblance (utilisation des probabilités).

Statistique descriptive vs. inférentielle L étude d une distribution empirique peut être menée dans deux buts différents, bien que souvent complémentaires : 1 Synthétiser, résumer, structurer l information contenue dans les données, à l aide de tableaux, de graphiques et de résumés numériques (statistique descriptive, ou exploratoire) ; 2 Formuler et valider des hypothèses relatives à la population totale (statistique inférentielle).

Plan du cours Prochain chapitre : statistique descriptive, une ou deux variables ; Puis statistique inférentielle (estimation, tests, régression). Deuxième partie : analyse de données (statistique descriptive avec un grand nombre de variables).