Licence Pro Amélioration Végétale



Documents pareils
Lois de probabilité. Anita Burgun

Séries Statistiques Simples

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Représentation d une distribution

Calcul élémentaire des probabilités

Chapitre 3 : INFERENCE

TABLE DES MATIERES. C Exercices complémentaires 42

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Loi binomiale Lois normales

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Annexe commune aux séries ES, L et S : boîtes et quantiles

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Que faire lorsqu on considère plusieurs variables en même temps?

TP N 57. Déploiement et renouvellement d une constellation de satellites

Estimation et tests statistiques, TD 5. Solutions

FORMULAIRE DE STATISTIQUES

PLAN DE COURS CEGEP DU VIEUX-MONTRÉAL

VI. Tests non paramétriques sur un échantillon

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

La nouvelle planification de l échantillonnage

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.

PROBABILITES ET STATISTIQUE I&II

Statistique : Résumé de cours et méthodes

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12

Statistiques Descriptives à une dimension

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

1. Vocabulaire : Introduction au tableau élémentaire

3. Caractéristiques et fonctions d une v.a.

Programmes des classes préparatoires aux Grandes Ecoles

Biostatistiques : Petits effectifs

Table des matières. I Mise à niveau 11. Préface

Principe d un test statistique

Variables Aléatoires. Chapitre 2

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

TSTI 2D CH X : Exemples de lois à densité 1

MATHÉMATIQUES. Mat-4104

Aide-mémoire de statistique appliquée à la biologie

Introduction à l approche bootstrap

Le risque Idiosyncrasique

données en connaissance et en actions?

Statistiques avec la graph 35+

Exercices supplémentaires sur l introduction générale à la notion de probabilité

Package TestsFaciles

Analyse de la variance Comparaison de plusieurs moyennes

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

STA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

4 Distributions particulières de probabilités

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION

Statistique Descriptive Élémentaire

CNAM léments de cours Bonus-malus et Crédibilité

Cours de Tests paramétriques

Introduction à la statistique non paramétrique

ECTS CM TD TP. 1er semestre (S3)

SAS ENTERPRISE MINER POUR L'ACTUAIRE

La simulation probabiliste avec Excel

Couples de variables aléatoires discrètes

Introduction à la Statistique Inférentielle

Observatoire Economique et Statistique d Afrique Subsaharienne

Correction du baccalauréat ES/L Métropole 20 juin 2014

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Logiciel XLSTAT version rue Damrémont PARIS

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Statistique inférentielle TD 1 : Estimation

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Fiche qualité relative à l enquête Santé et Itinéraire Professionnel 2010 (SIP) Carte d identité de l enquête

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Probabilités III Introduction à l évaluation d options

MÉTHODE DE MONTE CARLO.

Classe de première L

Document d orientation sur les allégations issues d essais de non-infériorité

Introduction aux Statistiques et à l utilisation du logiciel R

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Méthodes quantitatives en sciences humaines. 2 Pratique : 2 Étude personnelle : 2. BUREAU poste courriel ou site web

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

Correction du baccalauréat STMG Polynésie 17 juin 2014

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

Comment va la vie en France?

I3, Probabilités 2014 Travaux Dirigés F BM F BM F BM F BM F B M F B M F B M F B M

1 TD1 : rappels sur les ensembles et notion de probabilité

Calculs de probabilités avec la loi normale

Incertitude et variabilité : la nécessité de les intégrer dans les modèles

Probabilités (méthodes et objectifs)

Liste des auteurs et remerciements

TESTS D HYPOTHÈSE FONDÉS SUR LE χ².

Moments des variables aléatoires réelles

Statistiques à une variable

Transcription:

Analyse de données Licence Pro Amélioration Végétale Marc Bailly-Bechet Université Claude Bernard Lyon I France marc.bailly-bechet@univ-lyon1.fr 1 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Des stats pour faire quoi? Table des matières 1 Des stats pour faire quoi? 2 Variables aléatoires et lois de probabilité 3 Statistiques descriptives, estimation et intervalles de confiance 4 Tests de comparaison de moyennes et de proportions 2 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Des stats pour faire quoi? Organisation des enseignements d analyse de données 3 cours théoriques de 1h30. 16h de TP sur ordinateur. 3 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Des stats pour faire quoi? Pourquoi faire des statistiques en biologie? Variabilité : Une expérience en biologie donne rarement un résultat tranché ou parfaitement reproductible. Quantité : Les nouvelles technologies biologiques permettent de recueillir des quantités pharamineuses de données. 4 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Des stats pour faire quoi? Les statistiques vues de loin Population Échantillon p, µ, σ 2 n individus tirés aléatoirement Tests, estimation n, x, s2 Statistique inférentielle Statistiques descriptives k 5 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Variables aléatoires et lois de probabilité Table des matières 1 Des stats pour faire quoi? 2 Variables aléatoires et lois de probabilité 3 Statistiques descriptives, estimation et intervalles de confiance 4 Tests de comparaison de moyennes et de proportions 6 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Variables aléatoires et lois de probabilité Loi binomiale La loi binomiale est la loi de probabilité décrivant le nombre de réussites parmi un ensemble de tirages aléatoires et indépendants. Elle se note B(n, p) avec n le nombre de tirages et p la probabilité de réussite à chaque tirage. Probabilité 0.0 n=100 0 5 10 20 25 30 40 Nombre de succès p = 0.01 p = 0.05 p = p = 5 7 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Variables aléatoires et lois de probabilité Loi de Poisson La loi de Poisson (de Siméon Denis Poisson, 1781-1840) est la loi de probabilité décrivant le nombre d évenements aléatoires et indépendants arrivant dans le même intervalle de temps ou d espace. Elle se note P(λ) avec λ l espérance et la variance de la loi. Probabilité 0.0 0 1 2 5 10 15 20 Nombre d'évenements λ = 1 λ = 2 λ = 5 λ = 10 8 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Variables aléatoires et lois de probabilité Probabilité absolue Pas de 10 cm Pas de 5 cm a<p(x)<b a<p(x)<b 0 0 120 160 200 120 160 200 Taille Taille Pas de 1 cm Pas de cm a<p(x)<b a<p(x)<b 0 0 120 160 200 120 160 200 9 marc.bailly-bechet@univ-lyon1.fr Taille Analyse de données Taille

Variables aléatoires et lois de probabilité Densité de probabilité Densité Densité 0.04 0.03 0.02 0.01 0.00 0.04 0.03 0.02 0.01 0.00 Pas de 10 cm 120 160 200 Taille Pas de 1 cm 120 160 200 Densité Densité 0.04 0.03 0.02 0.01 0.00 0.04 0.03 0.02 0.01 0.00 Pas de 5 cm 120 160 200 Taille Limite continue 120 160 200 10 marc.bailly-bechet@univ-lyon1.fr Taille Analyse de données Taille

Variables aléatoires et lois de probabilité Loi normale La loi normale est la loi de probabilité des variables aléatoires continues dépendantes d un grand nombre de causes indépendantes et additives. Elle se note N (µ, σ) avec µ l espérance de la loi et σ l écart-type. Densité de probabilité 0.0 µ=5 2 0 2 4 6 8 10 12 Valeur obtenue σ = 1 σ = 2 σ = 5 σ = 20 11 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Statistiques descriptives, estimation et intervalles de confiance Table des matières 1 Des stats pour faire quoi? 2 Variables aléatoires et lois de probabilité 3 Statistiques descriptives, estimation et intervalles de confiance 4 Tests de comparaison de moyennes et de proportions 12 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Statistiques descriptives, estimation et intervalles de confiance Variable discrète Le balanin est un parasite de la châtaigne. Nb. de parasites x i 0 1 2 3 4 5 6 et plus Nombre de fruits n i 1043 172 78 15 10 7 4 ayant x i parasites Fréquence f i 0.785 29 0.059 0.011 0.007 0.005 0.004 Fréquence cumulée 0.785 0.914 0.973 0.984 0.991 0.996 1 i j=1 f j 13 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Statistiques descriptives, estimation et intervalles de confiance Variable continue On observe la concentration en glucose dans plusieurs mangues. Concentration (g.l 1 ) Nb de mangues Fréquence Fréquence cumulée n X n i i j N j=1 f j [135, 150[ 7 13 13 [150, 165[ 10 61 74 [165, 180[ 23 71 0.645 [180, 195[ 14 26 0.871 [195, 210[ 5 0.080 0.951 [210, 225[ 3 0.049 1 14 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Statistiques descriptives, estimation et intervalles de confiance Moyenne observée sur des données groupées On veut la moyenne du taux de glucose dans le mélange final de nos 4 types de mangues : Concentration (g.l 1 ) Moyenne Nb de mangues X xj n j [135, 165[ 150 17 [165, 180[ 172.5 23 [180, 195[ 187.5 14 [195, 225[ 210 8 x = 1 62 (150 17 + 172.5 23 +...) = 10822.5 62 = 174.56 g.l 1 15 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Statistiques descriptives, estimation et intervalles de confiance Différence entre médiane et moyenne Revenu mensuel moyen des ménages en France : 2474 euros Revenu mensuel médian des ménages en France : 1514 euros 16 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Statistiques descriptives, estimation et intervalles de confiance Différence entre médiane et moyenne Revenu mensuel moyen des ménages en France : 2474 euros Revenu mensuel médian des ménages en France : 1514 euros Moyenne Médiane Densité de probabilité 0.00000 0.00010 0.00020 0 2000 4000 6000 8000 10000 Revenu mensuel des ménages 16 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Statistiques descriptives, estimation et intervalles de confiance Les mangues sont à la mode On observe la concentration en glucose dans plusieurs mangues. Nombre de mangues 20 15 10 5 0 140 160 180 200 220 Concentration en glucose (g/l) 17 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Statistiques descriptives, estimation et intervalles de confiance Variance et écart-type observés, données groupées La variance sur des données groupées se calcule ainsi : Concentration (g.l 1 ) Moyenne Nb de mangues X xj n j [135, 165[ 150 17 [165, 180[ 172.5 23 [180, 195[ 187.5 14 [195, 225[ 210 8 x = 174.56 g.l 1 s 2 = 1 ( 17 150 2 + 23 172.5 2 +... ) 174.56 2 62 = 365.60 s = 365.60 = 19.12 g.l 1 18 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Statistiques descriptives, estimation et intervalles de confiance Loi de la moyenne de n v.a., n grand Fréquence 0.0 0.8 Fréquence 0 1 2 3 4 5 0.0 0.6 0.8 1.0 n=1 0.0 0.6 0.8 1.0 n=20 Fréquence 0 2 4 6 8 10 Fréquence 0 10 20 30 40 0.0 0.6 0.8 1.0 n=100 0.0 0.6 0.8 1.0 n=1000 19 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Statistiques descriptives, estimation et intervalles de confiance Distribution d échantillonnage d une moyenne observée Densité de probabilité 0.0 µ Moyenne observée de l'échantillon 20 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Statistiques descriptives, estimation et intervalles de confiance Quantiles de la loi normale P(µ C α < x < µ + C α ) = 1 α Densité de probabilité 0.0 α 2 α 2 µ C α µ µ + C α Moyenne observée de l'échantillon 21 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Statistiques descriptives, estimation et intervalles de confiance Quantiles de la loi normale, α = 0 P(µ C 0 < x < µ + C 0 ) = 0.80 Densité de probabilité 0.0 µ C µ µ + C Moyenne observée de l'échantillon 22 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Statistiques descriptives, estimation et intervalles de confiance Quantiles de la loi normale, α = 0.05 P(µ C 0.05 < x < µ + C 0.05 ) = 0.95 Densité de probabilité 0.0 0.025 0.025 µ C 0.05 µ µ + C 0.05 Moyenne observée de l'échantillon 23 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Statistiques descriptives, estimation et intervalles de confiance Quantiles de la loi normale, α = 0.001 P(µ C 0.001 < x < µ + C 0.001 ) = 0.999 Densité de probabilité 0.0 5e 04 5e 04 µ C 0.001 µ µ + C 0.001 Moyenne observée de l'échantillon 24 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Statistiques descriptives, estimation et intervalles de confiance Quantiles de la loi normale centrée réduite Densité de probabilité 0.0 3.29 1.96 1.29 0 1.29 1.96 3.29 ε 0.001 ε 0.05 ε 0 ε ε 0.05 ε 0.001 z = x µ σ 2 n 25 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Tests de comparaison de moyennes et de proportions Table des matières 1 Des stats pour faire quoi? 2 Variables aléatoires et lois de probabilité 3 Statistiques descriptives, estimation et intervalles de confiance 4 Tests de comparaison de moyennes et de proportions 26 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Tests de comparaison de moyennes et de proportions Distribution d échantillonnage et moyenne observée Densité de probabilité 0.0 µ 0 x 27 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Tests de comparaison de moyennes et de proportions Distribution d échantillonnage et moyenne observée Densité de probabilité Risque α 0 0.05 0.001 0.0 µ 0 x 28 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Tests de comparaison de moyennes et de proportions Risque de deuxième espèce H 0 H 1 Densité de probabilité 0.0 4 2 0 2 4 6 x µ σ 2 n 29 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Tests de comparaison de moyennes et de proportions Risque de deuxième espèce H 0 H 1 Densité de probabilité α 2 α 2 0.0 4 2 0 2 4 6 x µ σ 2 n 30 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Tests de comparaison de moyennes et de proportions Risque de deuxième espèce H 0 H 1 Densité de probabilité α 2 β α 2 0.0 4 2 0 2 4 6 x µ σ 2 n 31 marc.bailly-bechet@univ-lyon1.fr Analyse de données

Tests de comparaison de moyennes et de proportions Test unilatéral, α = 5% H 1 : µ µ 0 H 1 : µ > µ 0 Densité de probabilité 0.0 α 2 α 2 0.0 α 4 2 0 2 4 ε 0.05 = 1.96 4 2 0 2 4 ε = 1.645 32 marc.bailly-bechet@univ-lyon1.fr Analyse de données