Eléments de Statistique Chapitre 1 : Introduction

Documents pareils
Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Algèbre 40 Analyse Stat. 1 - IES : Probabilités discrètes et calcul intégral 29,5 6 Stat. 2 - IES : Probabilités générales 54 8 UE1-02 M-E-IS

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Introduction au Data-Mining

Introduction aux Statistiques et à l utilisation du logiciel R

données en connaissance et en actions?

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Statistique Descriptive Élémentaire

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

MABioVis. Bio-informatique et la

Biostatistiques : Petits effectifs

Principe d un test statistique

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

Statistiques Descriptives à une dimension

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Lois de probabilité. Anita Burgun

Introduction au Data-Mining

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

Aide-mémoire de statistique appliquée à la biologie

Big Data et Prévisions. Philippe Picard, le 24 juin Page 1

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Relation entre deux variables : estimation de la corrélation linéaire

Le data mining et l assurance Mai Charles Dugas Président Marianne Lalonde Directrice, développement des affaires

Data Mining. Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

MASTER (LMD) INGENIERIE DE LA SANTE

Gènes Diffusion - EPIC 2010

La définition La méthode. Les échelles de mesure L ENQUETE PAR SONDAGE : LA METHODE

23. Interprétation clinique des mesures de l effet traitement

Publications, ressources, liens, logiciels,

Pourquoi l apprentissage?

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

PROBABILITES ET STATISTIQUE I&II

July 1, Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, / 15

Introduction à l approche bootstrap

MASTER (LMD) MANAGEMENT DE PROJET ET INNOVATION EN BIOTECHNOLOGIE

Création de procédures inter-services pour la gestion des essais de phase I à l Institut Gustave Roussy

Coheris est agréé organisme de formation, n d agrément

1. Vocabulaire : Introduction au tableau élémentaire

A PROPOS DES CRITERES D ATTRIBUTION DES EQUIVALENCES

Solutions Décisionnelles SPAD. La maîtrise des données, l'art de la décision

Essais cliniques de phase 0 : état de la littérature

L'intelligence d'affaires: la statistique dans nos vies de consommateurs

Programmes des classes préparatoires aux Grandes Ecoles

LES MODELES DE SCORE

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Optimisation des ressources des produits automobile première

GENIE DES SYSTEMES INDUSTRIELS

Changer la source d'une requête dans SAS Enterprise Guide. Ce document explique comment changer la table source de la tâche Filtre et requêtes.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Analyse de grandes bases de données en santé

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA

La recherche universitaire en sécurité routière

(Customer Relationship Management, «Gestion de la Relation Client»)

Analyse de la variance Comparaison de plusieurs moyennes

Possibilités offertes après la L2?

La pratique du coaching en France. Baromètre 2010

Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux

Présentation du Master Ingénierie Informatique et du Master Science Informatique , Année 2 Université Paris-Est Marne-la-Vallée

Traitement des données avec Microsoft EXCEL 2010

Agenda de la présentation

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 24/12/2006 Stéphane Tufféry - Data Mining -

Lecture critique et pratique de la médecine

Introduction à la Statistique Inférentielle

Filière Fouille de Données et Décisionnel FDD (Data Mining) Pierre Morizet-Mahoudeaux

1 Objectifs. Traitement statistique des données d enquête avec introduction à SPSS. Plan

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

Bases de données Outils de gestion

GEOGRAPHIE Activités économiques CM2 N 20 : Un centre tertiaire au Liban puis en France

Laboratoire d informatique Gaspard-Monge UMR Journée Labex Bézout- ANSES

Programmes des classes préparatoires aux Grandes Ecoles

Les technologies pour la santé, une discipline transversale pour la pédagogie en EEA : application aux troubles du sommeil

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

«Cours Statistique et logiciel R»

Informatique Médicale & Ingénierie des Connaissances Pour la e-santé

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

SAS ENTERPRISE MINER POUR L'ACTUAIRE

Régression linéaire. Nicolas Turenne INRA

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved.

STATISTIQUES. UE Modélisation pour la biologie

Exercices M1 SES Ana Fermin ( fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Limitations of the Playstation 3 for High Performance Cluster Computing

Master transrégional en Sciences Pharmaceutiques

L exclusion mutuelle distribuée

Formation continue. Ensae-Ensai Formation Continue (Cepe)

Arbres binaires de décision

Informatique et sciences du numérique

Table des matières. I Mise à niveau 11. Préface

Chapitre 1. La démarche statistique appliquée au management. Minicas. Questions :

Quantification Scalaire et Prédictive

La classification automatique de données quantitatives

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Transcription:

Eléments de Statistique Chapitre 1 : INSA de Toulouse - 3ICBE Statistique

Contexte Vocabulaire Environnement technologique Volume des données (600Mb séquenceur = GenBank 1982-1996) Nouveaux logiciels commerciaux, librairies R (Bioconductor) Nouveaux algorithmes Objectifs : validation, valorisation, aide à la décision, marketing, qualité...

Contexte Vocabulaire Concepts simples mais vocabulaire précis Statistique (La), discipline académique statistique (de test), quantité calculée, paramètre d un modèle statistiques (les), ou tableaux de chiffres, d observations Statistique descriptive de séries par des indicateurs, des graphiques, sans modèle probabiliste Statistique inférentielle Inférer sur une population à partir de l observation d un échantillon Population Ensemble concerné par une étude Individu ou unité statistique, élément de la population Echantillon sous-ensemble effectivement observé de la population Variable statistique { : application de Ω X E si qualitative nominale ou ordinale R si quantitative réelle ou discrète

Étapes d une étude Contenu du cours 1. Expérimentation Quelle question biologique? Quelle population et quelle hypothèse H à tester? Planification de l expérience Détermination de l échantillon Précision des conditions expérimentales Observations et mesures

Étapes d une étude Contenu du cours 2. Exploration pour objectif descriptif Valeurs manquantes, erronées ou atypiques Modalités trop rares Distributions anormales Incohérences, liaisons non linéaires Transformations, imputation, codage...

Étapes d une étude Contenu du cours 3. Modèle explicatif pour objectif décisionnel Hypothèse H0 (influence ou non d un facteur) Détermination du modèle et choix du test (Student, ANOVA, Kruskal-Wallis, régression...) Estimation des paramètres Calcul des statistiques de test et P-valeurs Prise de décision : rejet ou acceptation de H0 Conséquence pour répondre à la question biologique

Étapes d une étude Contenu du cours 4. Apprentissage pour objectif prédictif Qualité d estimation et qualité de prévision Equilibre biais / variance Modèle parcimonieux Estimer une erreur de prévision Sélection éventuelle de varaibles (i.e. biomarqueurs)

Étapes d une étude Contenu du cours Statistique descriptive ou exploratoire Unidimensionnelle (moyenne, médiane, variance...) Bidimensionnelle (covariance, corrélation...) Analyse en composantes principales (introduction) Éléments de probabilités Lois discrètes Lois continues Notion de variable aléatoire Propriétés

Étapes d une étude Contenu du cours Statistique inférentielle Échantillonnage Estimation Tests paramétriques et non paramétriques Modèle de régression Régression simple Estimation et tests à la régression multiple

Domaine de Santé Industrie Marqueting Biostatistique Expérimentation clinique Pharmacocinétique Modèles de durée de vie Modèles épidémiologiques Dynamique de population Données post génomiques (omiques)...

Domaine de Santé Industrie Marqueting Contrôle Statistique des Procédés Optimisation (plans d expérience) Contrôle (suivi de qualité) Détection de défaillance Durée de vie et fiabilité

Domaine de Santé Industrie Marqueting Data mining et marketing Fouille de données Gestion de la Relation Client (CRM) Valoriser les fichiers clients des entreprises tertiaires Banques, assurances, VPC, téléphonie... EDF GDF... Finance : couverture des risques Caractéristiques : volume et flux de données préalables Objectifs : recherche de typologie, calcul de scores

Quelles compétences? Quelle est la question? Quelle méthode utilisée? Quelles sont ses limites? Comment la mettre en œuvre? Comprendre les sorties Quelle décision?