ISE: Introduction à la statistique et à l économétrie. E. Le Pennec École Polytechnique
|
|
|
- Yolande Colette Larouche
- il y a 10 ans
- Total affichages :
Transcription
1 ISE: Introduction à la statistique et à l économétrie E. Le Pennec École Polytechnique 2014
2 Menu du jour Organisation Objectifs du cours Les statistiques sont partout! Modélisation statistique Plan du cours Brève histoire des statistiques Modélisation d un sondage simple
3 Organisation Enseignants Cours : Erwan Le Pennec (École Polytechnique) : [email protected] Assistant : Victor-Emmanuel Brunel (ENSAE) 5 Chargés de TDs...
4 Organisation Support et évaluation Support de cours : mis en ligne au fur et à mesure sur la page dans la rubrique Enseignement. Évaluation : Contrôle final : note Exam sur 20 Contrôle continu : note CC sur 20 (1/4 présence, 1/4 participation et 1/2 rendu de TP ou mi-parcours) Exam + CC Note finale : (à confirmer) 2
5 Objectifs du cours Comprendre la problématique statistique à travers des problèmes simples. Modèles statistiques classiques : modèles linéaires et leurs extensions, modèles multinomiaux Modèles non paramétriques : estimation de densité. Culture générale minimale en statistique : Statistical thinking will one day be as necessary for efficient citizenship as the ability to read and write. H. G. Wells (écrivain britannique, )
6 Les statistiques sont partout! INSEE Les chiffres du travail Taux d activité par tranche d âge hommes vs. femmes
7 Les statistiques sont partout! Politique Sondage
8 Les statistiques sont partout! Santé Étude sur les OGM
9 Les statistiques sont partout! Économétrie Étude du coût en fonction du C.A.
10 Les statistiques sont partout! Finance FGBL, Apr. 99 à Dec. 05, 1 donnée par jour. (Source : BNP Paribas) Bund Time
11 Les statistiques sont partout! Biologie Biopuces et analyse d ADN
12 Les statistiques sont partout! E-Marketing Réseau d achat de livres
13 Les statistiques sont partout Big Data Volume de donnée tellement grand que cela implique une évolution forte des statistiques...
14 Inférence statistique Question sur des données. Quantité mesurée : variable X et covariable Y. Modélisation : Collection de modèles probabiliste P θ avec θ Θ. Probabilité : Étude du comportement de (X, Y ) sous la loi P θ à θ fixé. Statistique : Inférence sur θ à partir de l observation de (X, Y ). Questions statistiques : Ajustement (Estimation de θ) Précision (Zone de confiance pour θ) Décision (Test sur θ) Prédiction de X pour un autre Y
15 Un exemple historique John Arbuthnot et la divine providence 1712, Arbuthnot (médecin de la Reine Anne) examine le nombre de baptêmes de filles et de garçons à Londres, entre 1629 et Sur les 82 années étudiés, le nombre de naissances masculines est toujours supérieur au nombre de naissance féminines. Arbuthnott fait l hypothèse que les naissances masculines et féminines sont équi-probables et calcule, toujours sous cette hypothèse, la probabilité que les naissances masculines soient 82 fois de suite plus grande que celles féminines (= (1/2) 82 ), which will be found easily by the Table of Logarithms to be 1/ Il en déduit que cette hypothèse est fausse. Il vérifie ensuite que la proportion de naissance masculine reste constant de l ordre de Il en déduit que seule la divine providence peut expliquer ceci.
16 Un exemple historique Modèle statistique associé Formulation moderne Question sur le ratio naiss. masculines/naiss. féminines. Observation : variable X = (X 1,..., X 82 ) et covariable Y = (Y 1,..., Y 82 ) avec X i le ratio naissa. masculines/naiss. féminines et Y i le nombre totale de naiss. l année i. Modélisation : Les années sont indépendantes. Les naissances à l année i sont indépendantes les unes des autres et le sexe du bébé est masculin avec une probabilité ρ i et féminin avec une probabilité 1 ρ i. Pas de modélisation du nombre de naissance Y i. Paramètre θ = (ρ 1,..., ρ 82 ) et Θ = [0, 1] 82.
17 Un exemple historique Modèle statistique associé Formulation moderne Rappel : Les années sont indépendantes, les naissances à l année i sont indépendantes les unes des autres et le sexe du bébé est masculin avec une probabilité ρ i et féminin avec une probabilité 1 ρ i tandis qu il n y a pas de modélisation du nombre de naissance Y i. Probabilité : La loi de G Y avec G i = X i Y i est simple à exprimer : sous P θ c est un produit de loi binomiale : 82 ( ) yi P θ {G = g Y = y} = ρ g i (1 ρ) y i g i Loi de X Y est plus complexe : i=1 P θ {X = x Y = y} = P θ {YX = xy Y = y} = g i 82 ( yi i=1 x i y i Attention : définition de la mesure de référence (mesure de type comptage) dépend de Y dans le second cas! ) ρ y i x i (1 ρ) y i (1 x i )
18 Un exemple historique Modèle statistique associé Formulation moderne Modèle plutôt complexe! Mais un raisonnement simple montre que P 1/2 {X i >= 1 Y i } = 1/2! C est le raisonnement utilisé par Arbuthnot pour monter que P 1/2 { ix i 1 Y } = i P 1/2 {X i 1 Y i } = (1/2) 82 Artbuthnot trouve cette probabilité trop faible sans justifier pourquoi... Pour le caractère constant des ρ i, là encore il se contente de le justifier heuristiquement. Objectif de ce cours : développer les outils pour justifier ces assertions!
19 Plan du cours Introduction à la statistique : modèle statistique, estimateur, rappel sur les convergences et zone de confiance, construction d estimateur, tests Modèle linéaire : moindres carrés, le cas gaussien, test dans le modèle gaussien, sélection de variables, généralisation du modèle linéaire Modèle multinomial : maximum de vraisemblance, test(s) du chi-deux Initiation au non-paramétrique : le cas de l estimation de densité par une méthode à noyau
20 Brève histoire des statistiques Statistik Mesure et représentation de données Antiquité / Moyen-âge : existence de registre : Vauban propose une méthodologie du recensement : Statistik (dérivé du latin Statisticum). Achenval (Allemagne). Ensemble de mesures et recueil de données nécessaires au fonctionnement et à l organisation de l état : Priestley propose les premières méthodes de représentation graphiques : Playfair propose le premier camembert 1800 : Bonaparte institue un bureau de la statistique de la République : Minard combine des informations sur les pertes de l armée napoléonienne avec des informations géographiques : Pearson justifie les ACP : Spearman les utilise pour les analyses factorielles. Renouveau actuel avec les pbs de visualisation Big Data!
21 Brève histoire des statistiques Probabilités 1 Comportement d objets aléatoires Antiquité/Moyen âge : utilisation de principe probabiliste (répétition de mesures, extension d une mesure sur une sous-population à la population complète) : Fermat et Pascal étudie des jeux de hasard : Hughens formalise le traitement des jeux de dès et définit l espérance : Leibnitz étend le calcul des probabilités à tous les concepts : Bernoulli formalise le concept de variable aléatoire et démontre une loi des grands nombres : de Moivre généralise l usage de la combinatoire : Simpson applique une théorie des erreurs sur des observations : Laplace donne une première version du TCL.
22 Brève histoire des statistiques Probabilités 2 Comportement d objets aléatoires 1897 : Borel propose une théorie de la mesure complétée avec la théorie de l intégration de Lebesgue : Lyapounov propose une première version rigoureuse du TCL : Markov introduit les chaînes de Markov : Levy propose une preuve rigoureuse du TCL : Kolmogorov axiomatise les probabilités. XXème -XXIème : explosion des probabilités comme discipline mathématique.
23 Brève histoire des statistiques Inférence Estimation des paramètres d un modèle Antiquité/Moyen âge : utilisation de principe probabiliste (répétition de mesures, extension d une mesure sur une sous-population à la population complète) : Graunt estime la population de Londres à partir du nombre total d enterrement et des informations partielles sur la taille et le nombre de décès des familles : Arbuthnott étudie le fait que le nombre de naissance de garçons soit supérieur au nombre de filles 82 années consécutives : Mayer propose un estimateur autre que la moyenne empirique : le théorème de Bayes est publié : Bernoulli introduit un principe de maximum de vraisemblance : Legendre, Adrain et Gauss proposent indépendamment la méthode des moindres carrés : Galton étudie des régressions : Pearson propose le test du Chi-deux.
24 Brève histoire des statistiques Statistique mathématique Étude théorique des estimateurs 1908 : Gosset justifie l utilisation de la loi de Student : Fischer étude les estimateurs du maximum de vraisemblance : Neyman et Pearson (fils...) construisent une théorie des tests : Wald formalise la théorie de la décision statistique : Wolfowitz introduit le terme modèle non paramétrique pour une modèle de dimension infinie. XXème -XXIème : explosion des statistique comme discipline mathématique.
25 Brève histoire des statistiques Apprentissage Au delà du modèle 1950 : Turing lance le principe d une machine imitant un comportement intelligent à partir d exemples : Hebbs propose un modèle d assemblée de neurone et des règles d apprentissage : Séminaire Session on learning machines : Block et Novikoff démontrent des résultats de consistance en temps finis pour le perceptron de Rosenblatt. 1960s : Approche bayésienne : Vapnik et Chernovenkis se placent dans un cadre probabiliste et soulignent le compromis biais-complexité d un bon modèle : Schapire propose de combiner des mauvais algorithmes pour en faire un bon : Vapnik et Cortes propose les SVMs. XXIème : explosion de l apprentissage comme discipline à la frontière math/info.
26 Modélisation d un sondage Approche combinatoire Question : on souhaite estimer la proportion de la population donnant une certaine réponse à une certaine question. On suppose qu il s agit d une réponse binaire... Données : Réponses R = (R 1,..., R n ) d un sous-ens. de la pop. Modélisation : Il existe une proportion ρ d individus répondant 0 et donc une proportion 1 ρ d individus répondant 1. La population totale est de N individus. Le sous-ensemble est obtenu en tirant successivement au hasard n individus. Paramètre θ = ρ Θ = [0, 1]. Loi de R sous P θ : ( n Nρ ) ( i 1 k=1 P θ {R = r} = 1 1ri =0 r k =0 N(1 ρ) ) i 1 k=1 1 1ri =1 r k =1 N (i 1) N (i 1) i=1
27 Modélisation d un sondage Approche combinatoire Loi de R sous P θ : P θ {R = r} = = n i=1 ( Nρ ) ( i 1 k=1 1 1ri =0 r k =0 N(1 ρ) i 1 k=1 1 r k =1 N (i 1) N (i 1) ( n i=1 ρ + (i 1) i 1 k=1 1 r k =0 N (i 1) ( ) 1ri =0 (1 ρ) + (i 1) i 1 k=1 1 r k =1 N (i 1) Loi compliquée du fait de la dépendance des réponses... Simplification drastique si N = +... ) 1ri =1 ) 1ri =1
28 Modélisation d un sondage Approche population Modélisation : Chaque individu se comporte de manière indépendante. La réponse R i d un individu pris au hasard est 0 avec une probabilité ρ et 1 avec une probabilité 1 ρ (Bernoulli de paramètre ρ). Paramètre θ = ρ Θ = [0, 1]. Loi de R sous P θ : n P θ {R = r} = ρ 1 r i =0 (1 ρ) 1 r i =1 Loi de N 0 = n i=1 1 r i =0 : P θ {N 0 = n 0 } = i=1 = (ρ) n i=1 1 r i =0 (1 ρ) n i=1 1 r i =1 r, n i=1 1 r i =0=n 0 P θ {R = r} = N 0 suit une loi binomiale de paramètre (n, ρ)! ( ) n ρ n 0 (1 ρ) n n 0 n 0
29 Modélisation d un sondage Rappel sur la loi binomiale X v.a. à valeur entière suit une loi binomiale de paramètres (n, ρ) si et seulement si ( ) n P {X = k} = ρ k (1 ρ) n k k On sait qu alors E [X ] = nρ V [X ] = nρ(1 ρ) Idée naturelle : estimer ρ par ρ = X /n... On a immédiatement E [ ρ] = ρ V [ ρ] = ρ(1 ρ) n
30 Modélisation d un sondage Application On estime ρ par ρ = N 0 /n... i.e. la proportion empirique... Propriétés de l estimateur : Sans biais : E θ [ ρ] = ρ. Erreur quadratique : E θ [ ρ ρ 2 ] = V θ [ ρ] = ρ(1 ρ) n Propriétés asymptotiques : Convergence en probabilité (via Markov) : P θ { ˆρ ρ > ɛ} ρ(1 ρ) nɛ 2 0 Convergence forte (en utilisant la LFGN pour les variables de Bernoulli R i ) : ρ ρ p.s. Convergence en loi (TCL) : n ( ρ ρ) N (0, ρ(1 ρ))
31 Modélisation d un sondage Intervalle(s) de confiance Quelle confiance avoir sur l estimée p? ρ(1 ρ) Markov : P θ { ˆρ ρ > ɛ} nɛ 2 1 4nɛ 2 Intervalle de confiance de niveau α : pour δ α = 1/ 1 α [ P θ {ρ ρ δ α 2 n, ρ + δ ]} α 2 α n Zone de confiance de niveau α : P θ {ρ, (ˆρ ρ) 2 δ 2 α } ρ(1 ρ) α n TCL : P θ { n ρ ρ > δ ρ(1 ρ) } P { N (0, 1) > ɛ} 2e δ2 /2 IC asymptotiquement de niveau α : pour δ α = 2 log(2/(1 α)) P θ { ρ [ ρ δ α ρ(1 ρ)/ n, ρ δα ρ(1 ρ)/ n] } α
32 Modélisation d un sondage Test et IC Peut-on vérifier l hypothèse ρ = ρ 0? Pb : impossible de distinguer ρ 0 de ρ 0 + ɛ si n n est pas assez grand! Test statistique = test de non incompatibilité avec l hypothèse! Approche classique : on se fixe un niveau de confiance α, on détermine une zone de confiance de ˆρ pour ce niveau sous l hypothèse ρ = ρ 0, on rejette l hypothèse si ˆρ n est pas dans la zone et on ne rejette pas l hypothèse sinon... Une expérience statistique (comme les expériences des sciences expérimentales) ne permet pas d accepter une hypothèse mais uniquement de vérifier son apparente non contradiction avec les observations!
TABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
PROBABILITES ET STATISTIQUE I&II
PROBABILITES ET STATISTIQUE I&II TABLE DES MATIERES CHAPITRE I - COMBINATOIRE ELEMENTAIRE I.1. Rappel des notations de la théorie des ensemble I.1.a. Ensembles et sous-ensembles I.1.b. Diagrammes (dits
Table des matières. I Mise à niveau 11. Préface
Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Licence MASS 2000-2001. (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7
Feuilles de 1 à 7 Ces feuilles avec 25 exercices et quelques rappels historiques furent distribuées à des étudiants de troisième année, dans le cadre d un cours intensif sur deux semaines, en début d année,
Modélisation aléatoire en fiabilité des logiciels
collection Méthodes stochastiques appliquées dirigée par Nikolaos Limnios et Jacques Janssen La sûreté de fonctionnement des systèmes informatiques est aujourd hui un enjeu économique et sociétal majeur.
UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES
Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,
Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.
Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences
Coup de Projecteur sur les Réseaux de Neurones
Coup de Projecteur sur les Réseaux de Neurones Les réseaux de neurones peuvent être utilisés pour des problèmes de prévision ou de classification. La représentation la plus populaire est le réseau multicouche
La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites
La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur
Chapitre 3 : INFERENCE
Chapitre 3 : INFERENCE 3.1 L ÉCHANTILLONNAGE 3.1.1 Introduction 3.1.2 L échantillonnage aléatoire 3.1.3 Estimation ponctuelle 3.1.4 Distributions d échantillonnage 3.1.5 Intervalles de probabilité L échantillonnage
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Que faire lorsqu on considère plusieurs variables en même temps?
Chapitre 3 Que faire lorsqu on considère plusieurs variables en même temps? On va la plupart du temps se limiter à l étude de couple de variables aléatoires, on peut bien sûr étendre les notions introduites
Refonte du cours de statistique dans une école de commerce
Refonte du cours de statistique dans une école de commerce Expérience commentée Gilles Stoltz CNRS HEC Paris Contenu et déroulement du cours Contextes interne et externe lors de la refonte Contenu Essentiellement
Programmes des classes préparatoires aux Grandes Ecoles
Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme
L'intelligence d'affaires: la statistique dans nos vies de consommateurs
L'intelligence d'affaires: la statistique dans nos vies de consommateurs Jean-François Plante, HEC Montréal Marc Fredette, HEC Montréal Congrès de l ACFAS, Université Laval, 6 mai 2013 Intelligence d affaires
TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.
STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,
Théorie des probabilités
Théorie des probabilités LAVOISIER, 2008 LAVOISIER 11, rue Lavoisier 75008 Paris www.hermes-science.com www.lavoisier.fr ISBN 978-2-7462-1720-1 ISSN 1952 2401 Le Code de la propriété intellectuelle n'autorisant,
Température corporelle d un castor (une petite introduction aux séries temporelles)
Température corporelle d un castor (une petite introduction aux séries temporelles) GMMA 106 GMMA 106 2014 2015 1 / 32 Cas d étude Temperature (C) 37.0 37.5 38.0 0 20 40 60 80 100 Figure 1: Temperature
TESTS D HYPOTHÈSE FONDÉS SUR LE χ². http://fr.wikipedia.org/wiki/eugénisme
TESTS D HYPOTHÈSE FONDÉS SUR LE χ² http://fr.wikipedia.org/wiki/eugénisme Logo du Second International Congress of Eugenics 1921. «Comme un arbre, l eugénisme tire ses constituants de nombreuses sources
Estimation: intervalle de fluctuation et de confiance. Mars 2012. IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison
Estimation: intervalle de fluctuation et de confiance Mars 2012 IREM: groupe Proba-Stat Estimation Term.1 Intervalle de fluctuation connu : probabilité p, taille de l échantillon n but : estimer une fréquence
La survie nette actuelle à long terme Qualités de sept méthodes d estimation
La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg
Filtrage stochastique non linéaire par la théorie de représentation des martingales
Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de
La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1
La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La licence Mathématiques et Economie-MASS de l Université des Sciences Sociales de Toulouse propose sur les trois
4.2 Unités d enseignement du M1
88 CHAPITRE 4. DESCRIPTION DES UNITÉS D ENSEIGNEMENT 4.2 Unités d enseignement du M1 Tous les cours sont de 6 ECTS. Modélisation, optimisation et complexité des algorithmes (code RCP106) Objectif : Présenter
Baccalauréat ES/L Amérique du Sud 21 novembre 2013
Baccalauréat ES/L Amérique du Sud 21 novembre 2013 A. P. M. E. P. EXERCICE 1 Commun à tous les candidats 5 points Une entreprise informatique produit et vend des clés USB. La vente de ces clés est réalisée
UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE
UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE MÉMOIRE PRÉSENTÉ COMME EXIGENCE PARTIELLE DE LA MAÎTRISE EN ÉCONOMIE PAR MATHIEU SISTO NOVEMBRE
Intelligence Artificielle et Robotique
Intelligence Artificielle et Robotique Introduction à l intelligence artificielle David Janiszek [email protected] http://www.math-info.univ-paris5.fr/~janiszek/ PRES Sorbonne Paris Cité
Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1
UN GROUPE D INDIVIDUS Un groupe d individus décrit par une variable qualitative binaire DÉCRIT PAR UNE VARIABLE QUALITATIVE BINAIRE ANALYSER UN SOUS-GROUPE COMPARER UN SOUS-GROUPE À UNE RÉFÉRENCE Mots-clés
Résumé des communications des Intervenants
Enseignements de la 1ere semaine (du 01 au 07 décembre 2014) I. Titre du cours : Introduction au calcul stochastique pour la finance Intervenante : Prof. M hamed EDDAHBI Dans le calcul différentiel dit
Méthodes de quadrature. Polytech Paris-UPMC. - p. 1/48
Méthodes de Polytech Paris-UPMC - p. 1/48 Polynôme d interpolation de Preuve et polynôme de Calcul de l erreur d interpolation Étude de la formule d erreur Autres méthodes - p. 2/48 Polynôme d interpolation
Dunod, Paris, 2014 ISBN 978-2-10-059615-7
Illustration de couverture : Federo-istock.com Dunod, Paris, 2014 ISBN 978-2-10-059615-7 1.1 Symétrie du hasard et probabilité uniforme 3 1.2 Loi de probabilité sur un ensemble fini 6 1.3 Probabilité sur
Estimation et tests statistiques, TD 5. Solutions
ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études
Une comparaison de méthodes de discrimination des masses de véhicules automobiles
p.1/34 Une comparaison de méthodes de discrimination des masses de véhicules automobiles A. Rakotomamonjy, R. Le Riche et D. Gualandris INSA de Rouen / CNRS 1884 et SMS / PSA Enquêtes en clientèle dans
Qu est-ce qu une probabilité?
Chapitre 1 Qu est-ce qu une probabilité? 1 Modéliser une expérience dont on ne peut prédire le résultat 1.1 Ensemble fondamental d une expérience aléatoire Une expérience aléatoire est une expérience dont
Introduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Méthodes de Simulation
Méthodes de Simulation JEAN-YVES TOURNERET Institut de recherche en informatique de Toulouse (IRIT) ENSEEIHT, Toulouse, France Peyresq06 p. 1/41 Remerciements Christian Robert : pour ses excellents transparents
Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé
Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé EXERCICE 1 5 points Commun à tous les candidats 1. Réponse c : ln(10)+2 ln ( 10e 2) = ln(10)+ln ( e 2) = ln(10)+2 2. Réponse b : n 13 0,7 n 0,01
Probabilités et Statistique
Probabilités et Statistique Y. Velenik Version du 24 mai 2012 Dernière version téléchargeable à l adresse http://www.unige.ch/math/folks/velenik/cours.html 2011-2012 2 Table des matières Table des matières
Introduction au Data-Mining
Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane
Principe d un test statistique
Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre
Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes
IUT HSE Probabilités et Statistiques Feuille : variables aléatoires discrètes 1 Exercices Dénombrements Exercice 1. On souhaite ranger sur une étagère 4 livres de mathématiques (distincts), 6 livres de
Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens
Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques
Introduction au datamining
Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des
Cours de Tests paramétriques
Cours de Tests paramétriques F. Muri-Majoube et P. Cénac 2006-2007 Licence Ce document est sous licence ALC TYPE 2. Le texte de cette licence est également consultable en ligne à l adresse http://www.librecours.org/cgi-bin/main?callback=licencetype2.
TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie
PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats Pierre Dagnelie TABLE DES MATIÈRES 2012 Presses agronomiques de Gembloux [email protected] www.pressesagro.be
BIG DATA : PASSER D UNE ANALYSE DE CORRÉLATION
BIG DATA : PASSER D UNE ANALYSE DE CORRÉLATION À UNE INTERPRÉTATION CAUSALE Arthur Charpentier Professeur d actuariat à l Université du Québec, Montréal Amadou Diogo Barry Chercheur à l Institut de santé
Calculs de probabilités conditionelles
Calculs de probabilités conditionelles Mathématiques Générales B Université de Genève Sylvain Sardy 20 mars 2008 1. Indépendance 1 Exemple : On lance deux pièces. Soit A l évènement la première est Pile
Aide-mémoire de statistique appliquée à la biologie
Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela
Probabilités (méthodes et objectifs)
Probabilités (méthodes et objectifs) G. Petitjean Lycée de Toucy 10 juin 2007 G. Petitjean (Lycée de Toucy) Probabilités (méthodes et objectifs) 10 juin 2007 1 / 19 1 Déterminer la loi de probabilité d
Séminaire TEST. 1 Présentation du sujet. October 18th, 2013
Séminaire ES Andrés SÁNCHEZ PÉREZ October 8th, 03 Présentation du sujet Le problème de régression non-paramétrique se pose de la façon suivante : Supposons que l on dispose de n couples indépendantes de
CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité
1 CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité Une situation fréquente en pratique est de disposer non pas d un résultat mais de plusieurs. Le cas se présente en assurance, par exemple :
3 Approximation de solutions d équations
3 Approximation de solutions d équations Une équation scalaire a la forme générale f(x) =0où f est une fonction de IR dans IR. Un système de n équations à n inconnues peut aussi se mettre sous une telle
Débouchés professionnels
Master Domaine Droit, Economie, Gestion Mention : Monnaie, Banque, Finance, Assurance Spécialité : Risque, Assurance, Décision Année universitaire 2014/2015 DIRECTEUR de la spécialité : Monsieur Kouroche
Probabilités conditionnelles Loi binomiale
Exercices 23 juillet 2014 Probabilités conditionnelles Loi binomiale Équiprobabilité et variable aléatoire Exercice 1 Une urne contient 5 boules indiscernables, 3 rouges et 2 vertes. On tire au hasard
Probabilités sur un univers fini
[http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur
Le Data Mining au service du Scoring ou notation statistique des emprunteurs!
France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative
Biostatistiques : Petits effectifs
Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 [email protected] Plan Données Générales : Définition des statistiques Principe de l
FICHE UE Licence/Master Sciences, Technologies, Santé Mention Informatique
NOM DE L'UE : Algorithmique et programmation C++ LICENCE INFORMATIQUE Non Alt Alt S1 S2 S3 S4 S5 S6 Parcours : IL (Ingénierie Logicielle) SRI (Systèmes et Réseaux Informatiques) MASTER INFORMATIQUE Non
IFT3245. Simulation et modèles
IFT 3245 Simulation et modèles DIRO Université de Montréal Automne 2012 Tests statistiques L étude des propriétés théoriques d un générateur ne suffit; il estindispensable de recourir à des tests statistiques
IBM SPSS Regression 21
IBM SPSS Regression 21 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p. 46. Cette version s applique à IBM SPSS Statistics
MASTER de sciences et technologies, Mention MATHÉMATIQUES ET APPLICATIONS Université Pierre et Marie Curie (Paris VI) Année 2012-2013
MASTER de sciences et technologies, Mention MATHÉMATIQUES ET APPLICATIONS Université Pierre et Marie Curie (Paris VI) Année 2012-2013 [version du 29 juin 2012] 2 Table des matières 1 Master 2, Spécialité
Une méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données
Une méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données Marc Boullé Orange Labs 2 avenue Pierre Marzin 22300 Lannion [email protected],
«Cours Statistique et logiciel R»
«Cours Statistique et logiciel R» Rémy Drouilhet (1), Adeline Leclercq-Samson (1), Frédérique Letué (1), Laurence Viry (2) (1) Laboratoire Jean Kuntzmann, Dép. Probabilites et Statistique, (2) Laboratoire
Loi binomiale Lois normales
Loi binomiale Lois normales Christophe ROSSIGNOL Année scolaire 204/205 Table des matières Rappels sur la loi binomiale 2. Loi de Bernoulli............................................ 2.2 Schéma de Bernoulli
Probabilités III Introduction à l évaluation d options
Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un
Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage
Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage Journées de Méthodologie Statistique Eric Lesage Crest-Ensai 25 janvier 2012 Introduction et contexte 2/27 1 Introduction
Chapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Chaînes de Markov au lycée
Journées APMEP Metz Atelier P1-32 du dimanche 28 octobre 2012 Louis-Marie BONNEVAL Chaînes de Markov au lycée Andreï Markov (1856-1922) , série S Problème 1 Bonus et malus en assurance automobile Un contrat
Introduction à la statistique non paramétrique
Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non
K. Ammar, F. Bachoc, JM. Martinez. Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau
Apport des modèles de krigeage à la simulation numérique K Ammar, F Bachoc, JM Martinez CEA-Saclay, DEN, DM2S, F-91191 Gif-sur-Yvette, France Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau Apport des
Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier
Statistiques Appliquées à l Expérimentation en Sciences Humaines Christophe Lalanne, Sébastien Georges, Christophe Pallier Table des matières 1 Méthodologie expérimentale et recueil des données 6 1.1 Introduction.......................................
Calculer avec Sage. Revision : 417 du 1 er juillet 2010
Calculer avec Sage Alexandre Casamayou Guillaume Connan Thierry Dumont Laurent Fousse François Maltey Matthias Meulien Marc Mezzarobba Clément Pernet Nicolas Thiéry Paul Zimmermann Revision : 417 du 1
Introduction à la théorie des files d'attente. Claude Chaudet [email protected]
Introduction à la théorie des files d'attente Claude Chaudet [email protected] La théorie des files d'attente... Principe: modélisation mathématique de l accès à une ressource partagée Exemples réseaux
$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU
$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU Fabien FIGUERES [email protected] 0RWVFOpV : Krigeage, plans d expériences space-filling, points de validations, calibration moteur. 5pVXPp Dans le
LES MODELES DE SCORE
LES MODELES DE SCORE Stéphane TUFFERY CONFERENCE GENDER DIRECTIVE 31 mai 2012 31/05/2012 ActuariaCnam Conférence Gender Directive Stéphane Tufféry 1 Plan Le scoring et ses applications L élaboration d
Evaluation générale de la qualité des données par âge et sexe
Analyse démographique pour la prise des décisions. Tendances, et inégalités de mortalité et de fécondité en Afrique francophone : les outils en ligne de l UNFPA / UIESP pour l'estimation démographique.
Feuille d exercices 2 : Espaces probabilisés
Feuille d exercices 2 : Espaces probabilisés Cours de Licence 2 Année 07/08 1 Espaces de probabilité Exercice 1.1 (Une inégalité). Montrer que P (A B) min(p (A), P (B)) Exercice 1.2 (Alphabet). On a un
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA
Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R
Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences
Emploi du temps prévisionnel
1 Emploi du temps prévisionnel 1. Séances de cours et d exercices Nous aurons cours ensemble : tous les mercredis matins du 28 septembre au 7 décembre inclus, à l exception du mercredi 2 novembre, libéré
Probabilités conditionnelles
Probabilités conditionnelles Exercice Dans une usine, on utilise conjointement deux machines M et M 2 pour fabriquer des pièces cylindriques en série. Pour une période donnée, leurs probabilités de tomber
Théorie des sondages : cours 5
Théorie des sondages : cours 5 Camelia Goga IMB, Université de Bourgogne e-mail : [email protected] Master Besançon-2010 Chapitre 5 : Techniques de redressement 1. poststratification 2. l estimateur
Etude d un cas industriel : Optimisation de la modélisation de paramètre de production
Revue des Sciences et de la Technologie RST- Volume 4 N 1 /janvier 2013 Etude d un cas industriel : Optimisation de la modélisation de paramètre de production A.F. Bernate Lara 1, F. Entzmann 2, F. Yalaoui
Calculs de probabilités
Calculs de probabilités Mathématiques Générales B Université de Genève Sylvain Sardy 13 mars 2008 1. Définitions et notations 1 L origine des probabilités est l analyse de jeux de hasard, tels que pile
Introduction à la Statistique Inférentielle
UNIVERSITE MOHAMMED V-AGDAL SCIENCES FACULTE DES DEPARTEMENT DE MATHEMATIQUES SMI semestre 4 : Probabilités - Statistique Introduction à la Statistique Inférentielle Prinemps 2013 0 INTRODUCTION La statistique
Cours de méthodes de scoring
UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-
Théorie et Codage de l Information (IF01) exercices 2013-2014. Paul Honeine Université de technologie de Troyes France
Théorie et Codage de l Information (IF01) exercices 2013-2014 Paul Honeine Université de technologie de Troyes France TD-1 Rappels de calculs de probabilités Exercice 1. On dispose d un jeu de 52 cartes
Analyse de la variance Comparaison de plusieurs moyennes
Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction
Christophe CANDILLIER Cours de DataMining mars 2004 Page 1
Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe
FORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
I Stabilité, Commandabilité et Observabilité 11. 1 Introduction 13 1.1 Un exemple emprunté à la robotique... 13 1.2 Le plan... 18 1.3 Problème...
TABLE DES MATIÈRES 5 Table des matières I Stabilité, Commandabilité et Observabilité 11 1 Introduction 13 1.1 Un exemple emprunté à la robotique................... 13 1.2 Le plan...................................
Annexe commune aux séries ES, L et S : boîtes et quantiles
Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans
Intégration et probabilités TD1 Espaces mesurés
Intégration et probabilités TD1 Espaces mesurés 2012-2013 1 Petites questions 1) Est-ce que l ensemble des ouverts de R est une tribu? 2) Si F et G sont deux tribus, est-ce que F G est toujours une tribu?
Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014
Tests du χ 2 Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014 A. Lourme http://alexandrelourme.free.fr Outline
Probabilités sur un univers fini
[http://mp.cpgedupuydelome.fr] édité le 10 août 2015 Enoncés 1 Proailités sur un univers fini Evènements et langage ensemliste A quelle condition sur (a,, c, d) ]0, 1[ 4 existe-t-il une proailité P sur
Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.
2 jours : Mardi 15 et mercredi 16 novembre 2005 de 9 heures 30 à 17 heures 30 Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining. Madame, Monsieur, On parle
CMI ECONOMIE, FINANCE QUANTITATIVE ET STATISTIQUES - PARCOURS FORMATION EN APPRENTISSAGE
Université de PARIS 2 - ASSAS 1/3 PARCOURS FORMATION EN APPRENTISSAGE L1 S1 Mathématiques 1 4 L1 S1 Statistiques 1 4 L1 S1 Fondemants de l'informatique 4 L1 S1 Compléments Maths 2 L1 S1 Compléments Stats
Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision
Page n 1. Tests du χ 2 une des fonctions des statistiques est de proposer, à partir d observations d un phénomène aléatoire (ou modélisé comme tel) une estimation de la loi de ce phénomène. C est que nous
Calcul élémentaire des probabilités
Myriam Maumy-Bertrand 1 et Thomas Delzant 1 1 IRMA, Université Louis Pasteur Strasbourg, France Licence 1ère Année 16-02-2006 Sommaire La loi de Poisson. Définition. Exemple. 1 La loi de Poisson. 2 3 4
