Validation probabiliste d un Système de Prévision d Ensemble

Dimension: px
Commencer à balayer dès la page:

Download "Validation probabiliste d un Système de Prévision d Ensemble"

Transcription

1 Validation probabiliste d un Système de Prévision d Ensemble Guillem Candille, janvier 2006 Système de Prévision d Ensemble (EPS) (ECMWF Newsletter 90, 2001)

2 Plan 1 Critères de validation probabiliste d un système de prévision d ensemble (EPS) 2 Mesures probabilistes 3 Comparaison objective de 2 EPS : méthodes bootstrap 4 Conclusions et perspectives

3 Principes probabilistes de validation d un EPS Oublier les concepts de validation déterministe 1 prévision = distribution de probabilités (PDF) vs. 1 vérification = 1 valeur numérique Validation des EPS par accumulation statistique. 2 critères : la fiabilité et la résolution. Xo

4 Critère d évaluation : Fiabilité Cohérence statistique entre les prévisions et les observations correspondantes. Xo f est la PDF prévue. f 1 et f 2 sont 2 distributions de x o quand f est prévue. L EPS est parfaitement fiable si et seulement si f = f. tout système peut être rendu fiable par une calibration statistique a posteriori. La fiabilité est un critère nécessaire mais non suffisant : cf. e.g. un système climatologique.

5 Critère d évaluation : Résolution Capacité de séparer les prévisions menant à des distributions d observations correspondantes (DOC) bien distinctes. système climatologique système déterministe Exemples DOC allant d une résolution minimale nulle pour le système climatologique à une résolution maximale pour le système déterministe. X 1 X 2 (la courbe rouge représente ici la distribution de toutes les observations : distribution climatologique)

6 Critères probabilististes : résumé La fiabilité et la résolution sont 2 propriétés qui déterminent la qualité et l utilité d un système de prévision probabiliste. Un EPS doit être capable de séparer a priori les prévisions en classes suffisamment variées afin que les observations correspondantes représentent des situations bien distinctes.

7 Continuous Ranked Probability Score (CRPS) Le CRPS mesure la qualité globale d un EPS : [ ] CRPS = E (F p (ξ) H(ξ x o )) 2 dξ Ω (1) F p est la distribution cumulative de probabilités (CDF) associée à l ensemble prévu et H est la distribution de Heaviside associée à la vérification. cas continu cas réel (discret) 1 verification CDF 1 verification CDF ε ε σ CRPS σ CRPS 0 mean ξ 0 mean ξ

8 Décomposition du CRPS Le CRPS se décompose en 2 composantes permettant de mesurer la fiabilité et la résolution. On utilise ici la décomposition proposée par H. Hersbach 1 : CRPS = Reli + CRPS pot (2) où Reli mesure la fiabilité et CRPS pot mesure la résolution. 1 Hersbach 2000 : Decomposition of the continuous ranked probability score for ensemble prediction systems, in Weather and Forecasting (15), pp

9 Composante fiabilité du CRPS : Reli A chaque réalisation du système, on définit des valeurs pour chaque intervalle [x i, x i+1 ] selon la position de la vérification et la taille de l intervalle. 1 verification CDF = Après accumulation sur l ensemble des réalisations du système, on peut définir la CDF observée correspondante et la comparer à la moyenne des CDF prévues. 1 predicted observed Reli 0 X1 X2... X(n 1) Xn 0

10 Composante résolution du CRPS : CRPS pot CRPS pot serait la valeur potentielle du CRPS si l EPS était fiable, i.e. Reli = 0. CRPS pot = uncertainty Resol 1 1 class of predicted CDF CRPS pot F(σ) σ Σ uncertainty F(Σ) 0 CDF over all observations Resol F(Σ σ) Plus σ << Σ, meilleure la résolution est.

11 Reduced Centered Random Variable (RCRV) La RCRV permet de détailler les caractéristiques de la fiabilité en terme de biais (b) et dispersion (d). A chaque réalisation, on considère la moyenne m et la dispersion σ de l ensemble, ainsi que l observation o et l erreur d observation σ o. La RCRV se définit alors : y = o m σ 2 + σ 2 o (3) On cherche ainsi à vérifier si l observation peut être considérée comme une réalisation indépendante de la loi de probabilité définie par l ensemble la moyenne de y (b) mesure le biais pondéré de l ensemble et la variance de y (d) mesure la dispersion comparée des ensembles et des observations.

12 Comment améliorer la fiabilité d un EPS? Pour un EPS fiable, on a : b = 0 et d = 1 On considère un EPS non fiable sous-dispersif et 2 corrections possibles : d Var ( ɛ σ ) > 1 verification ensemble mean members plus de dispersion verification ensemble mean members moins d erreur verification ensemble mean members ε ε σ ε σ σ

13 Méthode de comparaison Vérifications effectuées avec des observations de radio-sondages réparties sur tout le globe (Chantal Côté). Comparaison des performances de 2 EPS mesurée par les différences en terme de CRPS et RCRV. Limitation de la validation due à la taille de l échatillon sur lequel les statistiques sont calculées estimation d intervalle de confiance par des techniques de ré-échantillonnage bootstrap 2. 2 Efron and Tibshirani, 1993 : An introduction to the bootstrap

14 Technique bootstrap S : score CRPS ou RCRV X : échantillon de données X 1 = (x 5, x 3,..., x 9 ) : S(X 1 ) S(X ) : X = (x 1, x 2,..., x n ) X 2 = (x 4, x n,..., x n ) : S(X 2 ) X nb = (x 2, x 7,..., x 2 ) : S(X nb )

15 Intervalle de confiance : propriétés (1) Le ré-échantillonnage s effectue seulement parmi les jours de prévision et non aussi parmi les différentes stations d observations cela évite de donner trop de poids à des situations extrêmes journalières et d ainsi sous-évaluer la taille de l intervalle de confiance. CRPS CRPS(A) - CRPS(B) C.I. C.I. spatial correlation day. Température à 850 hpa pour la période du 12 septembre au 5 novembre 2005 EPS A = EPS opérationnel EPS B = EPS parallèle

16 Intervalle de confiance : propriétés (2) Risque de sous-évaluation de la taille des intervalles de confiance à cause de l auto-corrélation temporelle des erreurs de prévision, surtout à moyenne échéance autocorrelation ρ(t,t+1) ρ(t,t+2) ρ(t,t+3) ρ(t,t+4) ρ(t,t+5) CRPS CRPS(A) - CRPS(B) C.I. 1-day independent C.I. 2-days independent C.I. 3-days independent C.I. 4-days independent C.I. 5-days independent day day Les intervalles de confiance traduisent les incertitudes liées aux auto-corrélations des erreurs de prévision. Calcul des intervalles de confiance en ré-échantillonnant par séquences de 3 jours.

17 Comparaison : décomposition du CRPS Amélioration globale (CRPS) pour l EPS parallèle. Reli CRPS pot 0.1 Reli(A) - Reli(B) 0.1 CRPS pot (A) - CRPS pot (B) Reli 0.04 CRPS pot day day Amélioration significative de la fiabilité. Amélioration significative de la résolution jusqu au jour 6.

18 Comparaison : décomposition de la fiabilité Amélioration significative de la fiabilité pour l EPS parallèle. biais dispersion b(a) - b(b) d(A) - 1-d(B) bias day dispersion day Amélioration non significative du biais. Amélioration significative de la dispersion.

19 Comparaison : changement neutre Construction de 2 EPS thériquement équivalents : EPS A = EPS oper. jours pairs + EPS para. jours impairs EPS B = EPS oper. jours impairs + EPS para. jours pairs 0.08 CRPS(A') - CRPS(B') 0.06 CRPS Pas de différence significative day

20 Résumé Développement d outils de validation probabiliste objective pour la comparaison de la performance de 2 EPS : vérification contre observations. mesure globale CRPS avec décomposition fiabilité-résolution et caractérisation de la fiabilité par la RCRV. définition d intervalle de confiance par des techniques de ré-échantillonnage bootstrap. Amélioration significative avec l EPS parallèle, surtout en terme de fiabilité, qui est devenu l EPS opérationnel le 12 décembre 2005.

21 La suite... Transfert des outils de validation/comparaison probabiliste en mode opérationnel inclus dans une boite à outils de vérification plus générale (Barbara Casati). Développer les techniques de ré-échantillonnage pour d autres mesures probabilistes telles que le score de Brier. Prévision déterministe et prévision d ensemble : liens entre les incertitudes de prévision déterministe et la dispersion des ensembles? liens entre la discrimination (courbe ROC, valeur économique) et la fiabilité-résolution?

22 Merci Questions?

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING

CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING SÉLECTION DES RISQUES PRÉVISION DES DÉFAUTS SUIVI ET CONTRÔLE Pierre-Louis GONZALEZ Différents types de

Plus en détail

(Statistical Package for the Social Sciences)

(Statistical Package for the Social Sciences) Initiation à l utilisation de SPSS (Statistical Package for the Social Sciences) 1 SPSS 2 3 Plan de l exposé Faire une recherche (bibliographique) sur le test; Définir le test à mesurer; Expliquer les

Plus en détail

LOAD PROFILING : ESTIMATION D UNE COURBE DE CONSOMMATION ET PRECISION D ESTIMATION

LOAD PROFILING : ESTIMATION D UNE COURBE DE CONSOMMATION ET PRECISION D ESTIMATION LOAD PROFILING : ESTIMATION D UNE COURBE DE CONSOMMATION ET PRECISION D ESTIMATION Olivier Chaouy EDF R&D 1, avenue du Général de Gaulle - 92141 Clamart Cedex - France olivier.chaouy@edf.fr Résumé : Le

Plus en détail

Lecture Critique d un Article Médical - Préparation à l Examen Classant National -

Lecture Critique d un Article Médical - Préparation à l Examen Classant National - Lecture Critique d un Article Médical - Préparation à l Examen Classant National - Bases et Objectifs Pédagogiques DIU de Pédagogie Médicale Christian Funck-Brentano Pharmacologie Clinique Centre d Investigation

Plus en détail

Statistique : Résumé de cours et méthodes

Statistique : Résumé de cours et méthodes Statistique : Résumé de cours et méthodes 1 Vocabulaire : Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère

Plus en détail

Théorie des graphes. Introduction. Programme de Terminale ES Spécialité. Résolution de problèmes à l aide de graphes. Préparation CAPES UCBL

Théorie des graphes. Introduction. Programme de Terminale ES Spécialité. Résolution de problèmes à l aide de graphes. Préparation CAPES UCBL Introduction Ces quelques pages ont pour objectif de vous initier aux notions de théorie des graphes enseignées en Terminale ES. Le programme de Terminale (voir ci-après) est construit sur la résolution

Plus en détail

Le bootstrap expliqué par l exemple

Le bootstrap expliqué par l exemple Le bootstrap expliqué par l exemple 1 Le bootstrap expliqué par l exemple 1. Les concepts du bootstrap 2. Des variantes adaptées au contexte 3. Comparaison des différentes méthodes 4. Les cas sensibles

Plus en détail

Le risque Idiosyncrasique

Le risque Idiosyncrasique Le risque Idiosyncrasique -Pierre CADESTIN -Magali DRIGHES -Raphael MINATO -Mathieu SELLES 1 Introduction Risque idiosyncrasique : risque non pris en compte dans le risque de marché (indépendant des phénomènes

Plus en détail

Université René Descartes Faculté de Pharmacie - Master Professionnel Dimension Économique des Produits de Santé 14 décembre 2005

Université René Descartes Faculté de Pharmacie - Master Professionnel Dimension Économique des Produits de Santé 14 décembre 2005 Université René Descartes Faculté de Pharmacie - Master Professionnel Dimension Économique des Produits de Santé 14 décembre 2005 Prise en Compte de l Incertitude dans l Évaluation des Technologies de

Plus en détail

Introduction à l analyse quantitative

Introduction à l analyse quantitative Introduction à l analyse quantitative Vue d ensemble du webinaire Le webinaire sera enregistré. Les diapositives et tous les autres documents seront envoyés aux participants après la séance. La séance

Plus en détail

DATA MINING 2 Réseaux de Neurones, Mélanges de classifieurs, SVM avancé

DATA MINING 2 Réseaux de Neurones, Mélanges de classifieurs, SVM avancé I. Réseau Artificiel de Neurones 1. Neurone 2. Type de réseaux Feedforward Couches successives Récurrents Boucles de rétroaction Exemples de choix pour la fonction : suivant une loi de probabilité Carte

Plus en détail

partie a Introduction à la statistique 1

partie a Introduction à la statistique 1 table des matières F AVANT-PROPOS À L ÉDITION AMÉRICAINE Abréviations viii xiv partie a Introduction à la statistique 1 1. Statistique et probabilité ne sont pas intuitives 3 Nous avons tendance à passer

Plus en détail

L essentiel sur les tests statistiques

L essentiel sur les tests statistiques L essentiel sur les tests statistiques 21 septembre 2014 2 Chapitre 1 Tests statistiques Nous considérerons deux exemples au long de ce chapitre. Abondance en C, G : On considère une séquence d ADN et

Plus en détail

Modélisation prédictive et incertitudes. P. Pernot. Laboratoire de Chimie Physique, CNRS/U-PSUD, Orsay

Modélisation prédictive et incertitudes. P. Pernot. Laboratoire de Chimie Physique, CNRS/U-PSUD, Orsay Modélisation prédictive et incertitudes P. Pernot Laboratoire de Chimie Physique, CNRS/U-PSUD, Orsay Plan 1 Incertitudes des modèles empiriques 2 Identification et caractérisation des paramètres incertains

Plus en détail

46 e journées de statistique

46 e journées de statistique 46 e journées de statistique Le 5 juin 2014 à Rennes Construction et estimation des capacités d un score pronostique : intérêts de la pénalisation de LASSO et de l estimateur bootstrap 0.632+ appliqués

Plus en détail

Evaluation d un test diagnostique - Concordance

Evaluation d un test diagnostique - Concordance Evaluation d un test diagnostique - Concordance Michaël Genin Université de Lille 2 EA 2694 - Santé Publique : Epidémiologie et Qualité des soins michaelgenin@univ-lille2fr Plan 1 Introduction 2 Evaluation

Plus en détail

Synthèse théorique des méthodes de transmission binaires sur les canaux vocodés

Synthèse théorique des méthodes de transmission binaires sur les canaux vocodés Synthèse théorique des méthodes de transmission binaires sur les canaux vocodés I Introduction On cherche à moduler des données binaires dans le but de les transmettre sur des canaux vocodés. Afin de transmettre

Plus en détail

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7 Table des matières Préface Public 1 Structure de l ouvrage 1 Caractéristiques de l ouvrage 3 Contenu 3 Pédagogie 4 Remarques sur l adaptation française 4 Ressources numériques 5 Biographie 6 PREMIÈRE PARTIE

Plus en détail

SÉRIES STATISTIQUES A UNE VARIABLE PARAMÈTRES DE POSITION ET DE DISPERSION

SÉRIES STATISTIQUES A UNE VARIABLE PARAMÈTRES DE POSITION ET DE DISPERSION SÉRIES STATISTIQUES A UNE VARIABLE PARAMÈTRES DE POSITION ET DE DISPERSION Eemple Le responsable d une maison de retraite a réalisé une enquête concernant les résidents de son établissement : - L activité

Plus en détail

- Mobiliser les résultats sur le second degré dans le cadre de la résolution d un problème.

- Mobiliser les résultats sur le second degré dans le cadre de la résolution d un problème. Mathématiques - classe de 1ère des séries STI2D et STL. 1. Analyse On dote les élèves d outils mathématiques permettant de traiter des problèmes relevant de la modélisation de phénomènes continus ou discrets.

Plus en détail

Estimation et tests statistiques, TD 5. Solutions

Estimation et tests statistiques, TD 5. Solutions ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études

Plus en détail

Observation statistique

Observation statistique 2. APERÇU DES RÉSULTATS DU RENDEMENT Observation statistique s. Les résultats présentés dans ce rapport sont fondés sur des échantillons. Des échantillons distincts ont été sélectionnés pour chaque instance

Plus en détail

Compétitivité Climatique dans l'entreprise. Outils - Usages - Problématiques

Compétitivité Climatique dans l'entreprise. Outils - Usages - Problématiques "Atmosphère et prévisions météorologiques : nouveaux outils numériques, nouveaux usages" INRIA, 27 septembre 2012 Compétitivité Climatique dans l'entreprise Impacts météo et activités des entreprises Outils

Plus en détail

Estimateur et Estimation Prof Franck Bonnetain Unité de méthodologie & de qualité de vie en cancérologie (EA3181) CHRU Besançon

Estimateur et Estimation Prof Franck Bonnetain Unité de méthodologie & de qualité de vie en cancérologie (EA3181) CHRU Besançon PACES - APEMK UE 4 Evaluation des méthodes d analyses appliquées aux sciences de la vie et de la santé Estimateur et Estimation Prof Franck Bonnetain Unité de méthodologie & de qualité de vie en cancérologie

Plus en détail

Statistique. Jean-Yves Tourneret (1) (1) Université of Toulouse, ENSEEIHT-IRIT-TéSA Thème 1 : Analyse et Synthèse de l Information jyt@n7.

Statistique. Jean-Yves Tourneret (1) (1) Université of Toulouse, ENSEEIHT-IRIT-TéSA Thème 1 : Analyse et Synthèse de l Information jyt@n7. Statistique Jean-Yves Tourneret (1) (1) Université of Toulouse, ENSEEIHT-IRIT-TéSA Thème 1 : Analyse et Synthèse de l Information jyt@n7.fr Cours Statistique, 2010 p. 1/52 Plan du cours Chapitre 1 : Estimation

Plus en détail

Stratégie de vérification pour la prévision des éléments du temps avec le système de prévision d ensemble canadien

Stratégie de vérification pour la prévision des éléments du temps avec le système de prévision d ensemble canadien Stratégie de vérification pour la prévision des éléments du temps avec le système de prévision d ensemble canadien Jacques Montpetit et Laurence J. Wilson Recherche en prévision numérique Service météorologique

Plus en détail

TABLEAU 5 Nombre moyen (et écarts types) de mots produits selon le niveau scolaire et les trois conditions de révision

TABLEAU 5 Nombre moyen (et écarts types) de mots produits selon le niveau scolaire et les trois conditions de révision Dans ce tableau, si le chercheur ne s intéresse pas aux notes item par item mais simplement à la note globale, alors il conservera seulement les première et dernière colonnes et calculera des statistiques

Plus en détail

Analyse de la variance à deux facteurs

Analyse de la variance à deux facteurs 1 1 IRMA, Université Louis Pasteur Strasbourg, France Master 1 Psychologie du développement 06-10-2008 Contexte Nous nous proposons d analyser l influence du temps et de trois espèces ligneuses d arbre

Plus en détail

Cours de spécialité mathématiques en Terminale ES

Cours de spécialité mathématiques en Terminale ES Cours de spécialité mathématiques en Terminale ES O. Lader 2014/2015 Lycée Jean Vilar Spé math terminale ES 2014/2015 1 / 51 Systèmes linéaires Deux exemples de systèmes linéaires à deux équations et deux

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

Arbres de décisions et forêts aléatoires.

Arbres de décisions et forêts aléatoires. Arbres de décisions et forêts aléatoires. Pierre Gaillard 7 janvier 2014 1 Plan 1 Arbre de décision 2 Les méthodes d ensembles et les forêts aléatoires 2 Introduction 3 Introduction Jeu de données (ex

Plus en détail

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé EXERCICE 1 5 points Commun à tous les candidats 1. Réponse c : ln(10)+2 ln ( 10e 2) = ln(10)+ln ( e 2) = ln(10)+2 2. Réponse b : n 13 0,7 n 0,01

Plus en détail

Méthodologie d échantillonnage et Échantillonneur ASDE

Méthodologie d échantillonnage et Échantillonneur ASDE Méthodologie d échantillonnage et Échantillonneur ASDE Par Michel Rochon L énoncé suivant définit de façon générale la méthodologie utilisée par Échantillonneur ASDE pour tirer des échantillons téléphoniques.

Plus en détail

Mortalité observée et mortalité attendue au cours de la vague de chaleur de juillet 2006 en France métropolitaine

Mortalité observée et mortalité attendue au cours de la vague de chaleur de juillet 2006 en France métropolitaine Mortalité observée et mortalité attendue au cours de la vague de chaleur de uillet en France métropolitaine FOUILLET A 1, REY G 1, JOUGLA E, HÉMON D 1 1 Inserm, U75, Villeuif, France. Inserm CépiDc, IFR9,

Plus en détail

Première STMG1 2014-2015 progression. - 1. Séquence : Proportion d une sous population dans une population.

Première STMG1 2014-2015 progression. - 1. Séquence : Proportion d une sous population dans une population. Première STMG1 2014-2015 progression. - 1 Table des matières Fil rouge. 3 Axes du programme. 3 Séquence : Proportion d une sous population dans une population. 3 Information chiffrée : connaître et exploiter

Plus en détail

Introduction au cours STA 102 Analyse des données : Méthodes explicatives

Introduction au cours STA 102 Analyse des données : Méthodes explicatives Analyse des données - Méthodes explicatives (STA102) Introduction au cours STA 102 Analyse des données : Méthodes explicatives Giorgio Russolillo giorgio.russolillo@cnam.fr Infos et support du cours Slide

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

L analyse discriminante

L analyse discriminante L analyse discriminante À Propos de ce document... Introduction... La démarche à suivre sous SPSS... 2. Statistics... 2 2. Classify... 2 Analyse des résultats... 3. Vérification de l existence de différences

Plus en détail

TP 1 M1 Informatique Apprentissage Automatique. Premières classifications : apprentissage et évaluation

TP 1 M1 Informatique Apprentissage Automatique. Premières classifications : apprentissage et évaluation Premières classifications : apprentissage et évaluation L objectif de ce TP est double : prise en main de la bibliothèque scikit-learn de Python, dédiée à l apprentissage automatique, sensibilisation à

Plus en détail

Gestion des liquidités Rapport de vérification final Rapport n o 2/13 25 juin 2013

Gestion des liquidités Rapport de vérification final Rapport n o 2/13 25 juin 2013 Gestion des liquidités Rapport de vérification final Rapport n o 2/13 25 juin 2013 Diffusion Destinataires : Président et chef de la direction par intérim Premier vice-président et chef de la direction

Plus en détail

11. Tests d hypothèses (partie 1/2)

11. Tests d hypothèses (partie 1/2) 11. Tests d hypothèses (partie 1/2) MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v1) MTH2302D: tests d hypothèses 1/30 Plan 1. Introduction 2. Hypothèses et erreurs 3. Tests d hypothèses

Plus en détail

Chapitre 3 : INFERENCE

Chapitre 3 : INFERENCE Chapitre 3 : INFERENCE 3.1 L ÉCHANTILLONNAGE 3.1.1 Introduction 3.1.2 L échantillonnage aléatoire 3.1.3 Estimation ponctuelle 3.1.4 Distributions d échantillonnage 3.1.5 Intervalles de probabilité L échantillonnage

Plus en détail

Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6

Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6 Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6 Ludovic Denoyer 21 septembre 2015 Ludovic Denoyer () FDMS 21 septembre 2015 1 / 1 Contexte Observation La plupart des bonnes

Plus en détail

Séance 12: Algorithmes de Support Vector Machines

Séance 12: Algorithmes de Support Vector Machines Séance 12: Algorithmes de Support Vector Machines Laboratoire de Statistique et Probabilités UMR 5583 CNRS-UPS www.lsp.ups-tlse.fr/gadat Douzième partie XII Algorithmes de Support Vector Machines Principe

Plus en détail

L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques.

L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques. L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques 1 BUTS DU COURS : se familiariser avec le vocabulaire statistique o variable dépendante, variable indépendante o statistique descriptive,

Plus en détail

Livraison de colis pour des clients du e-commerce : modèles de Wardrop, et Logit simple ou imbriqué

Livraison de colis pour des clients du e-commerce : modèles de Wardrop, et Logit simple ou imbriqué Séminaire du LGI Centrale Paris Livraison de colis pour des clients du e-commerce : modèles de Wardrop, et Logit simple ou imbriqué Y. Hayel 1, D. Quadri 2, T. Jimenez 1, L. Brotcorne 3, B. Tousni 3 LGI,

Plus en détail

Approche hybride De la correction des erreurs à la sélection de variables

Approche hybride De la correction des erreurs à la sélection de variables Approche hybride De la correction des erreurs à la sélection de variables G.M. Saulnier 1, W. Castaing 2 1 Laboratoire EDYTEM (UMR 5204, CNRS, Université de Savoie) 2 TENEVIA (http://www.tenevia.com) Projet

Plus en détail

SY09 Rapport TP4 : Analyse discriminante, régression logistique

SY09 Rapport TP4 : Analyse discriminante, régression logistique UNIVERSITÉ DE TECHNOLOGIE DE COMPIÈGNE SY09 Rapport TP4 : Analyse discriminante, régression logistique CUNI Frédéric 15 juin 2015 Objectifs du TP : Le but de ce TP est l application de l analyse discriminante

Plus en détail

Statistique Descriptive I (M1102)

Statistique Descriptive I (M1102) Illustration du cours de Statistique Descriptive I (M1102) Année scolaire 2013/2014 Université de Perpignan Via Domitia, IUT STatistique et Informatique Décisionnelle (STID) Table des matières 1 Généralités

Plus en détail

Real-time Monitoring and forecast of IntraSeasonal Variability over Africa (MISVA)

Real-time Monitoring and forecast of IntraSeasonal Variability over Africa (MISVA) Real-time Monitoring and forecast of IntraSeasonal Variability over Africa (MISVA) R. Roehrig 1,*, F. Couvreux 1, E. Poan 1, P. Peyrillé 1, J.-P. Lafore 1, O. Ndiaye 2, A. Diongue-Niang 2, F. Favot 1,

Plus en détail

Support du cours de Probabilités IUT d Orléans, Département d informatique

Support du cours de Probabilités IUT d Orléans, Département d informatique Support du cours de Probabilités IUT d Orléans, Département d informatique Pierre Andreoletti IUT d Orléans Laboratoire MAPMO (Bât. de Mathématiques UFR Sciences) - Bureau 126 email: pierre.andreoletti@univ-orleans.fr

Plus en détail

Intérêt du découpage en sous-bandes pour l analyse spectrale

Intérêt du découpage en sous-bandes pour l analyse spectrale Intérêt du découpage en sous-bandes pour l analyse spectrale David BONACCI Institut National Polytechnique de Toulouse (INP) École Nationale Supérieure d Électrotechnique, d Électronique, d Informatique,

Plus en détail

Master IAD Module PS. Reconnaissance de la parole (suite) Modèles de Markov et bases de données. Gaël RICHARD Février 2008

Master IAD Module PS. Reconnaissance de la parole (suite) Modèles de Markov et bases de données. Gaël RICHARD Février 2008 Master IAD Module PS Reconnaissance de la parole (suite) Modèles de Markov et bases de données Gaël RICHARD Février 2008 1 Reconnaissance de la parole Introduction Approches pour la reconnaissance vocale

Plus en détail

Arbres binaires. Hélène Milhem. Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012

Arbres binaires. Hélène Milhem. Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012 Arbres binaires Hélène Milhem Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012 H. Milhem (IMT, INSA Toulouse) Arbres binaires IUP SID 2011-2012 1 / 35 PLAN Introduction Construction

Plus en détail

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur

Plus en détail

Qualité de la mesure en production

Qualité de la mesure en production Daniel DURET Qualité de la mesure en production, 2008 ISBN : 978-2-212-54140-3 Sommaire Introduction... 5 Chapitre 1 Système d unités... 13 Le besoin d étalons... 15 Un peu d histoire métrologique... 16

Plus en détail

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies Régis Boulet Charlie Demené Alexis Guyot Balthazar Neveu Guillaume Tartavel Sommaire Sommaire... 1 Structure

Plus en détail

Évaluation de la classification et segmentation d'images en environnement incertain

Évaluation de la classification et segmentation d'images en environnement incertain Évaluation de la classification et segmentation d'images en environnement incertain EXTRACTION ET EXPLOITATION DE L INFORMATION EN ENVIRONNEMENTS INCERTAINS / E3I2 EA3876 2, rue F. Verny 29806 Brest cedex

Plus en détail

GUIDE D AIDE STATISTIQUE A LA PREPARATION DE LA THESE

GUIDE D AIDE STATISTIQUE A LA PREPARATION DE LA THESE Département Universitaire de Recherche et d Enseignement en Médecine Générale GUIDE D AIDE STATISTIQUE A LA PREPARATION DE LA THESE Enseignants : Esther GUERY, Julien LE BRETON, Emilie FERRAT, Jacques

Plus en détail

Lot Quality Assurance Sampling. Elise Naoufal EVARISQ 15 septembre 2011

Lot Quality Assurance Sampling. Elise Naoufal EVARISQ 15 septembre 2011 Lot Quality Assurance Sampling LQAS Elise Naoufal EVARISQ 15 septembre 2011 1 LQAS Une question d efficacité? LQAS et santé Méthode et Fondements théoriques Détermination du couple (n,d n,d) Conclusion

Plus en détail

Méthodes avancées en décision

Méthodes avancées en décision Méthodes avancées en décision Support vector machines - Chapitre 2 - Principes MRE et MRS Principe MRE. Il s agit de minimiser la fonctionnelle de risque 1 P e (d) = y d(x;w, b) p(x, y) dxdy. 2 La densité

Plus en détail

Value at Risk - étude de cas

Value at Risk - étude de cas Value at Risk - étude de cas Daniel Herlemont 17 juin 2011 Table des matières 1 Introduction 1 2 La Value at Risk 1 2.1 La VaR historique................................. 2 2.2 La VaR normale..................................

Plus en détail

Prévision de la demande

Prévision de la demande But : Pour prendre des décisions relatives à la structure et au fonctionnement opérationnel de tout système logistique; il faut s appuyer sur un système de prévision fiable. Concerne le long, moyen et

Plus en détail

Hélène Desmier ab, Pascale Kuntz a & Ivan Kojadinovic a. Pauc, 44306 Nantes. {prenom.nom}@polytech.univ-nantes.fr

Hélène Desmier ab, Pascale Kuntz a & Ivan Kojadinovic a. Pauc, 44306 Nantes. {prenom.nom}@polytech.univ-nantes.fr Une classification hiérarchique de variables discrètes basée sur l information mutuelle en pré-traitement d un algorithme de sélection de variables pertinentes. Hélène Desmier ab, Pascale Kuntz a & Ivan

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

Impact de la configuration du traitement sur l estimation troposphérique par GNSS

Impact de la configuration du traitement sur l estimation troposphérique par GNSS Impact de la configuration du traitement sur l estimation troposphérique par GNSS Anne-Lise LAVAUX (L2G) Laurent MOREL (L2G) François FUND (CNES) Frédéric DURAND (L2G) Contexte Stratégie de traitement

Plus en détail

MIXMOD. Un ensemble logiciel de classification des données par modèles de mélanges MIXMOD. F. Langrognet () MIXMOD Avril 2012 1 / 28

MIXMOD. Un ensemble logiciel de classification des données par modèles de mélanges MIXMOD. F. Langrognet () MIXMOD Avril 2012 1 / 28 MIXMOD Un ensemble logiciel de classification des données par modèles de mélanges MIXMOD F. Langrognet () MIXMOD Avril 2012 1 / 28 PLAN 1 La classification des données 2 MIXMOD, ensemble logiciel de classification

Plus en détail

Analyse discriminante

Analyse discriminante Analyse discriminante Christine Decaestecker & Marco Saerens ULB & UCL LINF2275 1 Analyse Discriminante Particularités: 2 formes/utilisations complémentaires: méthode factorielle: description "géométrique"

Plus en détail

L espace virtuel de La Branche Cochrane-Québec

L espace virtuel de La Branche Cochrane-Québec L espace virtuel de La Branche Cochrane-Québec Bonjour cher(ère)s auditeurs et auditrices web! SVP prendre quelques secondes pour tester vos paramètres audio via l assistant situé au haut de la page: Outils

Plus en détail

Cours de statistique descriptive

Cours de statistique descriptive Cours de statistique descriptive Séance 1 : Les caractères et la mise en forme des données Lætitia Perrier Bruslé Cours de statistique descriptive Les statistiques et la géographie La géographie est une

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

Leçon 6. Savoir compter

Leçon 6. Savoir compter Leçon 6. Savoir compter Cette leçon est une introduction aux questions de dénombrements. Il s agit, d une part, de compter certains objets mathématiques (éléments, parties, applications,...) et, d autre

Plus en détail

Enquête mensuelle de conjoncture auprès des ménages

Enquête mensuelle de conjoncture auprès des ménages Note Méthodologique Dernière mise à jour : 27-1-214 Enquête mensuelle de conjoncture auprès des ménages Présentation de l enquête L Insee réalise depuis janvier 1987 l enquête mensuelle de conjoncture

Plus en détail

Conditions d application des méthodes statistiques paramétriques :

Conditions d application des méthodes statistiques paramétriques : Conditions d application des méthodes statistiques paramétriques : applications sur ordinateur GLELE KAKAÏ R., SODJINOU E., FONTON N. Cotonou, Décembre 006 Conditions d application des méthodes statistiques

Plus en détail

Protocole d étude de l évaluation des résultats des centres de FIV 2011 1. -Activité 2011-

Protocole d étude de l évaluation des résultats des centres de FIV 2011 1. -Activité 2011- Protocole d étude Evaluation des résultats des centres de FIV -Activité 2011- Contexte Depuis 2005, l Agence de la biomédecine a pour mission de suivre et d évaluer les activités cliniques et biologiques

Plus en détail

TD1 Signaux, énergie et puissance, signaux aléatoires

TD1 Signaux, énergie et puissance, signaux aléatoires TD1 Signaux, énergie et puissance, signaux aléatoires I ) Ecrire l'expression analytique des signaux représentés sur les figures suivantes à l'aide de signaux particuliers. Dans le cas du signal y(t) trouver

Plus en détail

Partie I : Séries statistiques descriptives univariées (SSDU)... 1

Partie I : Séries statistiques descriptives univariées (SSDU)... 1 Table des matières Préface Avant-propos Pourquoi un tel ouvrage?... À propos de l ouvrage... À propos de la statistique................................................................ Remerciements....

Plus en détail

Comment calculer les contributions de chaque mois à la mortalité annuelle par accident?

Comment calculer les contributions de chaque mois à la mortalité annuelle par accident? Comment calculer les contributions de chaque mois à la mortalité annuelle par accident? Le débat sur les conséquences de l affaiblissement du permis à points par un amendement à la LOPPSI2, qui double

Plus en détail

Distributions bayésiennes nonparamétriques sur les matrices binaires triangulaires infinies : Applications aux modèles graphiques

Distributions bayésiennes nonparamétriques sur les matrices binaires triangulaires infinies : Applications aux modèles graphiques Distributions bayésiennes nonparamétriques sur les matrices binaires triangulaires infinies : Applications aux modèles graphiques Patrick Dallaire Université Laval Département d informatique et de génie

Plus en détail

ASI (L2) : TP3 Calculs probabilistes avec Excel et Rstat

ASI (L2) : TP3 Calculs probabilistes avec Excel et Rstat ASI (L2) : TP3 Calculs probabilistes avec Excel et Rstat Objectifs du TP : Savoir utiliser Excel et Rstat pour calculer des moyennes pondérées, des variances pondérées et savoir faire des approximations

Plus en détail

EIE P ARC ÉOLIEN DE SPY EDF LUMINUS ANNEXE 7

EIE P ARC ÉOLIEN DE SPY EDF LUMINUS ANNEXE 7 EIE P ARC ÉOLIEN DE SPY EDF LUMINUS Edition: MARS 2014 Révision: RAPPORT FINAL ANNEXE 7 Note technique relative aux critères à considérer (P50, P90, facteur de capacité et productions électriques nettes)

Plus en détail

DOCUMENT 2.1 : INFORMATIONS COMPLEMENTAIRES SUR LA METHODE D ENQUETE

DOCUMENT 2.1 : INFORMATIONS COMPLEMENTAIRES SUR LA METHODE D ENQUETE DOCUMENT 2.1 : INFORMATIONS COMPLEMENTAIRES SUR LA METHODE D ENQUETE 1 Définir le type de variable Dans notre cas, la variable est quantitative nominale. Note : Une variable est qualitative nominale quand

Plus en détail

Etude empirique de la valeur d utilité de l immobilier des entreprises : un actif associé à la gestion du risque des sociétés

Etude empirique de la valeur d utilité de l immobilier des entreprises : un actif associé à la gestion du risque des sociétés Les nouveaux enjeux et défis du marché immobilier : comment y contribuer? Chaire Ivanhoé Cambridge ESG UQÀM Etude empirique de la valeur d utilité de l immobilier des entreprises : un actif associé à la

Plus en détail

Chapitre 2. Caractéristiques des distributions à une variable quantitative

Chapitre 2. Caractéristiques des distributions à une variable quantitative Chapitre 2. Caractéristiques des distributions à une variable quantitative Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University

Plus en détail

Épreuve de mathématiques Terminale ES 200 minutes

Épreuve de mathématiques Terminale ES 200 minutes Examen 2 Épreuve de mathématiques Terminale ES 200 minutes L usage de la calculatrice programmable est autorisé. La bonne présentation de la copie est de rigueur. Cet examen comporte 7 pages et 5 exercices.

Plus en détail

Classification des risques Rapport d audit Rapport n o 7/14 20 novembre 2014

Classification des risques Rapport d audit Rapport n o 7/14 20 novembre 2014 Classification des risques Rapport d audit Rapport n o 7/14 20 novembre 2014 Diffusion Destinataires : Président et chef de la direction Premier vice-président et chef de la direction financière Premier

Plus en détail

Méthodes Statistiques Appliquées à la Qualité et à la Gestion des Risques - Le Contrôle Statistique

Méthodes Statistiques Appliquées à la Qualité et à la Gestion des Risques - Le Contrôle Statistique Méthodes Statistiques Appliquées à la Qualité et à la Gestion des Risques - Le Contrôle Statistique Jean Gaudart Laboratoire d Enseignement et de Recherche sur le Traitement de l Information Médicale jean.gaudart@univmed.fr

Plus en détail

Test de Poisson à 1 échantillon et à 2 échantillons

Test de Poisson à 1 échantillon et à 2 échantillons Test de Poisson à 1 échantillon et à 2 échantillons Sous-menus de Minitab 15 : Stat>Statistiques élémentaires>test de Poisson à 1 échantillon Stat>Statistiques élémentaires>test de Poisson à 2 échantillons

Plus en détail

La régression logistique. Par Sonia NEJI et Anne-Hélène JIGOREL

La régression logistique. Par Sonia NEJI et Anne-Hélène JIGOREL La régression logistique Par Sonia NEJI et Anne-Hélène JIGOREL Introduction La régression logistique s applique au cas où: Y est qualitative à 2 modalités Xk qualitatives ou quantitatives Le plus souvent

Plus en détail

Eléments de statistique Introduction - Analyse de données exploratoire

Eléments de statistique Introduction - Analyse de données exploratoire Eléments de statistique Introduction - Louis Wehenkel Département d Electricité, Electronique et Informatique - Université de Liège B24/II.93 - L.Wehenkel@ulg.ac.be MATH0487-2 : 3BacIng, 3BacInf - 16/9/2014

Plus en détail

Tâche 03 Approche hybride De la correction des erreurs à la sélection de variables

Tâche 03 Approche hybride De la correction des erreurs à la sélection de variables 31 décembre 2013 Georges-Marie Saulnier, William Castaings, Anne Johannet, Gérard Dreyfus Tâche 03 Approche hybride De la correction des erreurs à la sélection de variables Sommaire 1. INTRODUCTION...

Plus en détail

Activité Intitulé de l'activité Volume horaire

Activité Intitulé de l'activité Volume horaire Informations de l'unité d'enseignement Implantation IPL Cursus de Bachelier en chimie Introduction à la statistique C1110 Cycle 1 Bloc 1 Quadrimestre 2 Pondération 1 Nombre de crédits 4 Nombre d heures

Plus en détail

Licence Pro Amélioration Végétale

Licence Pro Amélioration Végétale Analyse de données Licence Pro Amélioration Végétale Marc Bailly-Bechet Université Claude Bernard Lyon I France marc.bailly-bechet@univ-lyon1.fr 1 marc.bailly-bechet@univ-lyon1.fr Analyse de données Des

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

Machine de Turing. Informatique II Algorithmique 1

Machine de Turing. Informatique II Algorithmique 1 Machine de Turing Nous avons vu qu un programme peut être considéré comme la décomposition de la tâche à réaliser en une séquence d instructions élémentaires (manipulant des données élémentaires) compréhensibles

Plus en détail

Reconnaissance des formes : Classement d ensembles d objets

Reconnaissance des formes : Classement d ensembles d objets Reconnaissance des formes : Classement d ensembles d objets Données Méthodes Extraction de connaissances Applications Expertise Apprentissage Bernard FERTIL Directeur de Recherche CNRS Équipe LXAO, UMR

Plus en détail

UML Diagramme de classes (class diagram) pour le recueil et l analyse des besoins. Emmanuel Pichon 2013 V1.1

UML Diagramme de classes (class diagram) pour le recueil et l analyse des besoins. Emmanuel Pichon 2013 V1.1 UML Diagramme de classes (class diagram) pour le recueil et l analyse des besoins 2013 V1.1 Objectif Diagramme de classes (class diagram) pour le recueil des besoins et l analyse Présenter un ensemble

Plus en détail

Plateforme de Recherche de Mutations

Plateforme de Recherche de Mutations Plateforme de Recherche de Mutations Jean-Marc Aury contact: pfm@genoscope.cns.fr 29 janvier 2009 Introduction Présentation des données produites par le GSFLX : type, qualité, Méthodes de détection de

Plus en détail

Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires

Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires Julien Jorge julien.jorge@univ-nantes.fr Laboratoire d Informatique de Nantes Atlantique,

Plus en détail