ISE: Introduction à la statistique et à l économétrie. E. Le Pennec École Polytechnique
|
|
- Yolande Colette Larouche
- il y a 8 ans
- Total affichages :
Transcription
1 ISE: Introduction à la statistique et à l économétrie E. Le Pennec École Polytechnique 2014
2 Menu du jour Organisation Objectifs du cours Les statistiques sont partout! Modélisation statistique Plan du cours Brève histoire des statistiques Modélisation d un sondage simple
3 Organisation Enseignants Cours : Erwan Le Pennec (École Polytechnique) : Erwan.Le-Pennec@polytechnique.edu Assistant : Victor-Emmanuel Brunel (ENSAE) 5 Chargés de TDs...
4 Organisation Support et évaluation Support de cours : mis en ligne au fur et à mesure sur la page dans la rubrique Enseignement. Évaluation : Contrôle final : note Exam sur 20 Contrôle continu : note CC sur 20 (1/4 présence, 1/4 participation et 1/2 rendu de TP ou mi-parcours) Exam + CC Note finale : (à confirmer) 2
5 Objectifs du cours Comprendre la problématique statistique à travers des problèmes simples. Modèles statistiques classiques : modèles linéaires et leurs extensions, modèles multinomiaux Modèles non paramétriques : estimation de densité. Culture générale minimale en statistique : Statistical thinking will one day be as necessary for efficient citizenship as the ability to read and write. H. G. Wells (écrivain britannique, )
6 Les statistiques sont partout! INSEE Les chiffres du travail Taux d activité par tranche d âge hommes vs. femmes
7 Les statistiques sont partout! Politique Sondage
8 Les statistiques sont partout! Santé Étude sur les OGM
9 Les statistiques sont partout! Économétrie Étude du coût en fonction du C.A.
10 Les statistiques sont partout! Finance FGBL, Apr. 99 à Dec. 05, 1 donnée par jour. (Source : BNP Paribas) Bund Time
11 Les statistiques sont partout! Biologie Biopuces et analyse d ADN
12 Les statistiques sont partout! E-Marketing Réseau d achat de livres
13 Les statistiques sont partout Big Data Volume de donnée tellement grand que cela implique une évolution forte des statistiques...
14 Inférence statistique Question sur des données. Quantité mesurée : variable X et covariable Y. Modélisation : Collection de modèles probabiliste P θ avec θ Θ. Probabilité : Étude du comportement de (X, Y ) sous la loi P θ à θ fixé. Statistique : Inférence sur θ à partir de l observation de (X, Y ). Questions statistiques : Ajustement (Estimation de θ) Précision (Zone de confiance pour θ) Décision (Test sur θ) Prédiction de X pour un autre Y
15 Un exemple historique John Arbuthnot et la divine providence 1712, Arbuthnot (médecin de la Reine Anne) examine le nombre de baptêmes de filles et de garçons à Londres, entre 1629 et Sur les 82 années étudiés, le nombre de naissances masculines est toujours supérieur au nombre de naissance féminines. Arbuthnott fait l hypothèse que les naissances masculines et féminines sont équi-probables et calcule, toujours sous cette hypothèse, la probabilité que les naissances masculines soient 82 fois de suite plus grande que celles féminines (= (1/2) 82 ), which will be found easily by the Table of Logarithms to be 1/ Il en déduit que cette hypothèse est fausse. Il vérifie ensuite que la proportion de naissance masculine reste constant de l ordre de Il en déduit que seule la divine providence peut expliquer ceci.
16 Un exemple historique Modèle statistique associé Formulation moderne Question sur le ratio naiss. masculines/naiss. féminines. Observation : variable X = (X 1,..., X 82 ) et covariable Y = (Y 1,..., Y 82 ) avec X i le ratio naissa. masculines/naiss. féminines et Y i le nombre totale de naiss. l année i. Modélisation : Les années sont indépendantes. Les naissances à l année i sont indépendantes les unes des autres et le sexe du bébé est masculin avec une probabilité ρ i et féminin avec une probabilité 1 ρ i. Pas de modélisation du nombre de naissance Y i. Paramètre θ = (ρ 1,..., ρ 82 ) et Θ = [0, 1] 82.
17 Un exemple historique Modèle statistique associé Formulation moderne Rappel : Les années sont indépendantes, les naissances à l année i sont indépendantes les unes des autres et le sexe du bébé est masculin avec une probabilité ρ i et féminin avec une probabilité 1 ρ i tandis qu il n y a pas de modélisation du nombre de naissance Y i. Probabilité : La loi de G Y avec G i = X i Y i est simple à exprimer : sous P θ c est un produit de loi binomiale : 82 ( ) yi P θ {G = g Y = y} = ρ g i (1 ρ) y i g i Loi de X Y est plus complexe : i=1 P θ {X = x Y = y} = P θ {YX = xy Y = y} = g i 82 ( yi i=1 x i y i Attention : définition de la mesure de référence (mesure de type comptage) dépend de Y dans le second cas! ) ρ y i x i (1 ρ) y i (1 x i )
18 Un exemple historique Modèle statistique associé Formulation moderne Modèle plutôt complexe! Mais un raisonnement simple montre que P 1/2 {X i >= 1 Y i } = 1/2! C est le raisonnement utilisé par Arbuthnot pour monter que P 1/2 { ix i 1 Y } = i P 1/2 {X i 1 Y i } = (1/2) 82 Artbuthnot trouve cette probabilité trop faible sans justifier pourquoi... Pour le caractère constant des ρ i, là encore il se contente de le justifier heuristiquement. Objectif de ce cours : développer les outils pour justifier ces assertions!
19 Plan du cours Introduction à la statistique : modèle statistique, estimateur, rappel sur les convergences et zone de confiance, construction d estimateur, tests Modèle linéaire : moindres carrés, le cas gaussien, test dans le modèle gaussien, sélection de variables, généralisation du modèle linéaire Modèle multinomial : maximum de vraisemblance, test(s) du chi-deux Initiation au non-paramétrique : le cas de l estimation de densité par une méthode à noyau
20 Brève histoire des statistiques Statistik Mesure et représentation de données Antiquité / Moyen-âge : existence de registre : Vauban propose une méthodologie du recensement : Statistik (dérivé du latin Statisticum). Achenval (Allemagne). Ensemble de mesures et recueil de données nécessaires au fonctionnement et à l organisation de l état : Priestley propose les premières méthodes de représentation graphiques : Playfair propose le premier camembert 1800 : Bonaparte institue un bureau de la statistique de la République : Minard combine des informations sur les pertes de l armée napoléonienne avec des informations géographiques : Pearson justifie les ACP : Spearman les utilise pour les analyses factorielles. Renouveau actuel avec les pbs de visualisation Big Data!
21 Brève histoire des statistiques Probabilités 1 Comportement d objets aléatoires Antiquité/Moyen âge : utilisation de principe probabiliste (répétition de mesures, extension d une mesure sur une sous-population à la population complète) : Fermat et Pascal étudie des jeux de hasard : Hughens formalise le traitement des jeux de dès et définit l espérance : Leibnitz étend le calcul des probabilités à tous les concepts : Bernoulli formalise le concept de variable aléatoire et démontre une loi des grands nombres : de Moivre généralise l usage de la combinatoire : Simpson applique une théorie des erreurs sur des observations : Laplace donne une première version du TCL.
22 Brève histoire des statistiques Probabilités 2 Comportement d objets aléatoires 1897 : Borel propose une théorie de la mesure complétée avec la théorie de l intégration de Lebesgue : Lyapounov propose une première version rigoureuse du TCL : Markov introduit les chaînes de Markov : Levy propose une preuve rigoureuse du TCL : Kolmogorov axiomatise les probabilités. XXème -XXIème : explosion des probabilités comme discipline mathématique.
23 Brève histoire des statistiques Inférence Estimation des paramètres d un modèle Antiquité/Moyen âge : utilisation de principe probabiliste (répétition de mesures, extension d une mesure sur une sous-population à la population complète) : Graunt estime la population de Londres à partir du nombre total d enterrement et des informations partielles sur la taille et le nombre de décès des familles : Arbuthnott étudie le fait que le nombre de naissance de garçons soit supérieur au nombre de filles 82 années consécutives : Mayer propose un estimateur autre que la moyenne empirique : le théorème de Bayes est publié : Bernoulli introduit un principe de maximum de vraisemblance : Legendre, Adrain et Gauss proposent indépendamment la méthode des moindres carrés : Galton étudie des régressions : Pearson propose le test du Chi-deux.
24 Brève histoire des statistiques Statistique mathématique Étude théorique des estimateurs 1908 : Gosset justifie l utilisation de la loi de Student : Fischer étude les estimateurs du maximum de vraisemblance : Neyman et Pearson (fils...) construisent une théorie des tests : Wald formalise la théorie de la décision statistique : Wolfowitz introduit le terme modèle non paramétrique pour une modèle de dimension infinie. XXème -XXIème : explosion des statistique comme discipline mathématique.
25 Brève histoire des statistiques Apprentissage Au delà du modèle 1950 : Turing lance le principe d une machine imitant un comportement intelligent à partir d exemples : Hebbs propose un modèle d assemblée de neurone et des règles d apprentissage : Séminaire Session on learning machines : Block et Novikoff démontrent des résultats de consistance en temps finis pour le perceptron de Rosenblatt. 1960s : Approche bayésienne : Vapnik et Chernovenkis se placent dans un cadre probabiliste et soulignent le compromis biais-complexité d un bon modèle : Schapire propose de combiner des mauvais algorithmes pour en faire un bon : Vapnik et Cortes propose les SVMs. XXIème : explosion de l apprentissage comme discipline à la frontière math/info.
26 Modélisation d un sondage Approche combinatoire Question : on souhaite estimer la proportion de la population donnant une certaine réponse à une certaine question. On suppose qu il s agit d une réponse binaire... Données : Réponses R = (R 1,..., R n ) d un sous-ens. de la pop. Modélisation : Il existe une proportion ρ d individus répondant 0 et donc une proportion 1 ρ d individus répondant 1. La population totale est de N individus. Le sous-ensemble est obtenu en tirant successivement au hasard n individus. Paramètre θ = ρ Θ = [0, 1]. Loi de R sous P θ : ( n Nρ ) ( i 1 k=1 P θ {R = r} = 1 1ri =0 r k =0 N(1 ρ) ) i 1 k=1 1 1ri =1 r k =1 N (i 1) N (i 1) i=1
27 Modélisation d un sondage Approche combinatoire Loi de R sous P θ : P θ {R = r} = = n i=1 ( Nρ ) ( i 1 k=1 1 1ri =0 r k =0 N(1 ρ) i 1 k=1 1 r k =1 N (i 1) N (i 1) ( n i=1 ρ + (i 1) i 1 k=1 1 r k =0 N (i 1) ( ) 1ri =0 (1 ρ) + (i 1) i 1 k=1 1 r k =1 N (i 1) Loi compliquée du fait de la dépendance des réponses... Simplification drastique si N = +... ) 1ri =1 ) 1ri =1
28 Modélisation d un sondage Approche population Modélisation : Chaque individu se comporte de manière indépendante. La réponse R i d un individu pris au hasard est 0 avec une probabilité ρ et 1 avec une probabilité 1 ρ (Bernoulli de paramètre ρ). Paramètre θ = ρ Θ = [0, 1]. Loi de R sous P θ : n P θ {R = r} = ρ 1 r i =0 (1 ρ) 1 r i =1 Loi de N 0 = n i=1 1 r i =0 : P θ {N 0 = n 0 } = i=1 = (ρ) n i=1 1 r i =0 (1 ρ) n i=1 1 r i =1 r, n i=1 1 r i =0=n 0 P θ {R = r} = N 0 suit une loi binomiale de paramètre (n, ρ)! ( ) n ρ n 0 (1 ρ) n n 0 n 0
29 Modélisation d un sondage Rappel sur la loi binomiale X v.a. à valeur entière suit une loi binomiale de paramètres (n, ρ) si et seulement si ( ) n P {X = k} = ρ k (1 ρ) n k k On sait qu alors E [X ] = nρ V [X ] = nρ(1 ρ) Idée naturelle : estimer ρ par ρ = X /n... On a immédiatement E [ ρ] = ρ V [ ρ] = ρ(1 ρ) n
30 Modélisation d un sondage Application On estime ρ par ρ = N 0 /n... i.e. la proportion empirique... Propriétés de l estimateur : Sans biais : E θ [ ρ] = ρ. Erreur quadratique : E θ [ ρ ρ 2 ] = V θ [ ρ] = ρ(1 ρ) n Propriétés asymptotiques : Convergence en probabilité (via Markov) : P θ { ˆρ ρ > ɛ} ρ(1 ρ) nɛ 2 0 Convergence forte (en utilisant la LFGN pour les variables de Bernoulli R i ) : ρ ρ p.s. Convergence en loi (TCL) : n ( ρ ρ) N (0, ρ(1 ρ))
31 Modélisation d un sondage Intervalle(s) de confiance Quelle confiance avoir sur l estimée p? ρ(1 ρ) Markov : P θ { ˆρ ρ > ɛ} nɛ 2 1 4nɛ 2 Intervalle de confiance de niveau α : pour δ α = 1/ 1 α [ P θ {ρ ρ δ α 2 n, ρ + δ ]} α 2 α n Zone de confiance de niveau α : P θ {ρ, (ˆρ ρ) 2 δ 2 α } ρ(1 ρ) α n TCL : P θ { n ρ ρ > δ ρ(1 ρ) } P { N (0, 1) > ɛ} 2e δ2 /2 IC asymptotiquement de niveau α : pour δ α = 2 log(2/(1 α)) P θ { ρ [ ρ δ α ρ(1 ρ)/ n, ρ δα ρ(1 ρ)/ n] } α
32 Modélisation d un sondage Test et IC Peut-on vérifier l hypothèse ρ = ρ 0? Pb : impossible de distinguer ρ 0 de ρ 0 + ɛ si n n est pas assez grand! Test statistique = test de non incompatibilité avec l hypothèse! Approche classique : on se fixe un niveau de confiance α, on détermine une zone de confiance de ˆρ pour ce niveau sous l hypothèse ρ = ρ 0, on rejette l hypothèse si ˆρ n est pas dans la zone et on ne rejette pas l hypothèse sinon... Une expérience statistique (comme les expériences des sciences expérimentales) ne permet pas d accepter une hypothèse mais uniquement de vérifier son apparente non contradiction avec les observations!
TABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Plus en détailPROBABILITES ET STATISTIQUE I&II
PROBABILITES ET STATISTIQUE I&II TABLE DES MATIERES CHAPITRE I - COMBINATOIRE ELEMENTAIRE I.1. Rappel des notations de la théorie des ensemble I.1.a. Ensembles et sous-ensembles I.1.b. Diagrammes (dits
Plus en détailTable des matières. I Mise à niveau 11. Préface
Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3
Plus en détailCONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Plus en détailLicence MASS 2000-2001. (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7
Feuilles de 1 à 7 Ces feuilles avec 25 exercices et quelques rappels historiques furent distribuées à des étudiants de troisième année, dans le cadre d un cours intensif sur deux semaines, en début d année,
Plus en détailModélisation aléatoire en fiabilité des logiciels
collection Méthodes stochastiques appliquées dirigée par Nikolaos Limnios et Jacques Janssen La sûreté de fonctionnement des systèmes informatiques est aujourd hui un enjeu économique et sociétal majeur.
Plus en détailUFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES
Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,
Plus en détailFeuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.
Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences
Plus en détailCoup de Projecteur sur les Réseaux de Neurones
Coup de Projecteur sur les Réseaux de Neurones Les réseaux de neurones peuvent être utilisés pour des problèmes de prévision ou de classification. La représentation la plus populaire est le réseau multicouche
Plus en détailLa problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites
La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur
Plus en détailChapitre 3 : INFERENCE
Chapitre 3 : INFERENCE 3.1 L ÉCHANTILLONNAGE 3.1.1 Introduction 3.1.2 L échantillonnage aléatoire 3.1.3 Estimation ponctuelle 3.1.4 Distributions d échantillonnage 3.1.5 Intervalles de probabilité L échantillonnage
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailQue faire lorsqu on considère plusieurs variables en même temps?
Chapitre 3 Que faire lorsqu on considère plusieurs variables en même temps? On va la plupart du temps se limiter à l étude de couple de variables aléatoires, on peut bien sûr étendre les notions introduites
Plus en détailRefonte du cours de statistique dans une école de commerce
Refonte du cours de statistique dans une école de commerce Expérience commentée Gilles Stoltz CNRS HEC Paris Contenu et déroulement du cours Contextes interne et externe lors de la refonte Contenu Essentiellement
Plus en détailProgrammes des classes préparatoires aux Grandes Ecoles
Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme
Plus en détailL'intelligence d'affaires: la statistique dans nos vies de consommateurs
L'intelligence d'affaires: la statistique dans nos vies de consommateurs Jean-François Plante, HEC Montréal Marc Fredette, HEC Montréal Congrès de l ACFAS, Université Laval, 6 mai 2013 Intelligence d affaires
Plus en détailTABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.
STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,
Plus en détailThéorie des probabilités
Théorie des probabilités LAVOISIER, 2008 LAVOISIER 11, rue Lavoisier 75008 Paris www.hermes-science.com www.lavoisier.fr ISBN 978-2-7462-1720-1 ISSN 1952 2401 Le Code de la propriété intellectuelle n'autorisant,
Plus en détailTempérature corporelle d un castor (une petite introduction aux séries temporelles)
Température corporelle d un castor (une petite introduction aux séries temporelles) GMMA 106 GMMA 106 2014 2015 1 / 32 Cas d étude Temperature (C) 37.0 37.5 38.0 0 20 40 60 80 100 Figure 1: Temperature
Plus en détailTESTS D HYPOTHÈSE FONDÉS SUR LE χ². http://fr.wikipedia.org/wiki/eugénisme
TESTS D HYPOTHÈSE FONDÉS SUR LE χ² http://fr.wikipedia.org/wiki/eugénisme Logo du Second International Congress of Eugenics 1921. «Comme un arbre, l eugénisme tire ses constituants de nombreuses sources
Plus en détailEstimation: intervalle de fluctuation et de confiance. Mars 2012. IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison
Estimation: intervalle de fluctuation et de confiance Mars 2012 IREM: groupe Proba-Stat Estimation Term.1 Intervalle de fluctuation connu : probabilité p, taille de l échantillon n but : estimer une fréquence
Plus en détailLa survie nette actuelle à long terme Qualités de sept méthodes d estimation
La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg
Plus en détailFiltrage stochastique non linéaire par la théorie de représentation des martingales
Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de
Plus en détailLa Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1
La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La licence Mathématiques et Economie-MASS de l Université des Sciences Sociales de Toulouse propose sur les trois
Plus en détail4.2 Unités d enseignement du M1
88 CHAPITRE 4. DESCRIPTION DES UNITÉS D ENSEIGNEMENT 4.2 Unités d enseignement du M1 Tous les cours sont de 6 ECTS. Modélisation, optimisation et complexité des algorithmes (code RCP106) Objectif : Présenter
Plus en détailBaccalauréat ES/L Amérique du Sud 21 novembre 2013
Baccalauréat ES/L Amérique du Sud 21 novembre 2013 A. P. M. E. P. EXERCICE 1 Commun à tous les candidats 5 points Une entreprise informatique produit et vend des clés USB. La vente de ces clés est réalisée
Plus en détailUNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE
UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE MÉMOIRE PRÉSENTÉ COMME EXIGENCE PARTIELLE DE LA MAÎTRISE EN ÉCONOMIE PAR MATHIEU SISTO NOVEMBRE
Plus en détailIntelligence Artificielle et Robotique
Intelligence Artificielle et Robotique Introduction à l intelligence artificielle David Janiszek david.janiszek@parisdescartes.fr http://www.math-info.univ-paris5.fr/~janiszek/ PRES Sorbonne Paris Cité
Plus en détailTableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1
UN GROUPE D INDIVIDUS Un groupe d individus décrit par une variable qualitative binaire DÉCRIT PAR UNE VARIABLE QUALITATIVE BINAIRE ANALYSER UN SOUS-GROUPE COMPARER UN SOUS-GROUPE À UNE RÉFÉRENCE Mots-clés
Plus en détailRésumé des communications des Intervenants
Enseignements de la 1ere semaine (du 01 au 07 décembre 2014) I. Titre du cours : Introduction au calcul stochastique pour la finance Intervenante : Prof. M hamed EDDAHBI Dans le calcul différentiel dit
Plus en détailMéthodes de quadrature. Polytech Paris-UPMC. - p. 1/48
Méthodes de Polytech Paris-UPMC - p. 1/48 Polynôme d interpolation de Preuve et polynôme de Calcul de l erreur d interpolation Étude de la formule d erreur Autres méthodes - p. 2/48 Polynôme d interpolation
Plus en détailDunod, Paris, 2014 ISBN 978-2-10-059615-7
Illustration de couverture : Federo-istock.com Dunod, Paris, 2014 ISBN 978-2-10-059615-7 1.1 Symétrie du hasard et probabilité uniforme 3 1.2 Loi de probabilité sur un ensemble fini 6 1.3 Probabilité sur
Plus en détailEstimation et tests statistiques, TD 5. Solutions
ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études
Plus en détailUne comparaison de méthodes de discrimination des masses de véhicules automobiles
p.1/34 Une comparaison de méthodes de discrimination des masses de véhicules automobiles A. Rakotomamonjy, R. Le Riche et D. Gualandris INSA de Rouen / CNRS 1884 et SMS / PSA Enquêtes en clientèle dans
Plus en détailQu est-ce qu une probabilité?
Chapitre 1 Qu est-ce qu une probabilité? 1 Modéliser une expérience dont on ne peut prédire le résultat 1.1 Ensemble fondamental d une expérience aléatoire Une expérience aléatoire est une expérience dont
Plus en détailIntroduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Plus en détailMéthodes de Simulation
Méthodes de Simulation JEAN-YVES TOURNERET Institut de recherche en informatique de Toulouse (IRIT) ENSEEIHT, Toulouse, France Peyresq06 p. 1/41 Remerciements Christian Robert : pour ses excellents transparents
Plus en détailBaccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé
Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé EXERCICE 1 5 points Commun à tous les candidats 1. Réponse c : ln(10)+2 ln ( 10e 2) = ln(10)+ln ( e 2) = ln(10)+2 2. Réponse b : n 13 0,7 n 0,01
Plus en détailProbabilités et Statistique
Probabilités et Statistique Y. Velenik Version du 24 mai 2012 Dernière version téléchargeable à l adresse http://www.unige.ch/math/folks/velenik/cours.html 2011-2012 2 Table des matières Table des matières
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane
Plus en détailPrincipe d un test statistique
Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre
Plus en détailProbabilités et Statistiques. Feuille 2 : variables aléatoires discrètes
IUT HSE Probabilités et Statistiques Feuille : variables aléatoires discrètes 1 Exercices Dénombrements Exercice 1. On souhaite ranger sur une étagère 4 livres de mathématiques (distincts), 6 livres de
Plus en détailChapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens
Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques
Plus en détailIntroduction au datamining
Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des
Plus en détailCours de Tests paramétriques
Cours de Tests paramétriques F. Muri-Majoube et P. Cénac 2006-2007 Licence Ce document est sous licence ALC TYPE 2. Le texte de cette licence est également consultable en ligne à l adresse http://www.librecours.org/cgi-bin/main?callback=licencetype2.
Plus en détailTABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie
PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats Pierre Dagnelie TABLE DES MATIÈRES 2012 Presses agronomiques de Gembloux pressesagro.gembloux@ulg.ac.be www.pressesagro.be
Plus en détailBIG DATA : PASSER D UNE ANALYSE DE CORRÉLATION
BIG DATA : PASSER D UNE ANALYSE DE CORRÉLATION À UNE INTERPRÉTATION CAUSALE Arthur Charpentier Professeur d actuariat à l Université du Québec, Montréal Amadou Diogo Barry Chercheur à l Institut de santé
Plus en détailCalculs de probabilités conditionelles
Calculs de probabilités conditionelles Mathématiques Générales B Université de Genève Sylvain Sardy 20 mars 2008 1. Indépendance 1 Exemple : On lance deux pièces. Soit A l évènement la première est Pile
Plus en détailAide-mémoire de statistique appliquée à la biologie
Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela
Plus en détailProbabilités (méthodes et objectifs)
Probabilités (méthodes et objectifs) G. Petitjean Lycée de Toucy 10 juin 2007 G. Petitjean (Lycée de Toucy) Probabilités (méthodes et objectifs) 10 juin 2007 1 / 19 1 Déterminer la loi de probabilité d
Plus en détailSéminaire TEST. 1 Présentation du sujet. October 18th, 2013
Séminaire ES Andrés SÁNCHEZ PÉREZ October 8th, 03 Présentation du sujet Le problème de régression non-paramétrique se pose de la façon suivante : Supposons que l on dispose de n couples indépendantes de
Plus en détailCNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité
1 CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité Une situation fréquente en pratique est de disposer non pas d un résultat mais de plusieurs. Le cas se présente en assurance, par exemple :
Plus en détail3 Approximation de solutions d équations
3 Approximation de solutions d équations Une équation scalaire a la forme générale f(x) =0où f est une fonction de IR dans IR. Un système de n équations à n inconnues peut aussi se mettre sous une telle
Plus en détailDébouchés professionnels
Master Domaine Droit, Economie, Gestion Mention : Monnaie, Banque, Finance, Assurance Spécialité : Risque, Assurance, Décision Année universitaire 2014/2015 DIRECTEUR de la spécialité : Monsieur Kouroche
Plus en détailProbabilités conditionnelles Loi binomiale
Exercices 23 juillet 2014 Probabilités conditionnelles Loi binomiale Équiprobabilité et variable aléatoire Exercice 1 Une urne contient 5 boules indiscernables, 3 rouges et 2 vertes. On tire au hasard
Plus en détailProbabilités sur un univers fini
[http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur
Plus en détailLe Data Mining au service du Scoring ou notation statistique des emprunteurs!
France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative
Plus en détailBiostatistiques : Petits effectifs
Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l
Plus en détailFICHE UE Licence/Master Sciences, Technologies, Santé Mention Informatique
NOM DE L'UE : Algorithmique et programmation C++ LICENCE INFORMATIQUE Non Alt Alt S1 S2 S3 S4 S5 S6 Parcours : IL (Ingénierie Logicielle) SRI (Systèmes et Réseaux Informatiques) MASTER INFORMATIQUE Non
Plus en détailIFT3245. Simulation et modèles
IFT 3245 Simulation et modèles DIRO Université de Montréal Automne 2012 Tests statistiques L étude des propriétés théoriques d un générateur ne suffit; il estindispensable de recourir à des tests statistiques
Plus en détailIBM SPSS Regression 21
IBM SPSS Regression 21 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p. 46. Cette version s applique à IBM SPSS Statistics
Plus en détailMASTER de sciences et technologies, Mention MATHÉMATIQUES ET APPLICATIONS Université Pierre et Marie Curie (Paris VI) Année 2012-2013
MASTER de sciences et technologies, Mention MATHÉMATIQUES ET APPLICATIONS Université Pierre et Marie Curie (Paris VI) Année 2012-2013 [version du 29 juin 2012] 2 Table des matières 1 Master 2, Spécialité
Plus en détailUne méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données
Une méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données Marc Boullé Orange Labs 2 avenue Pierre Marzin 22300 Lannion marc.boulle@orange-ftgroup.com,
Plus en détail«Cours Statistique et logiciel R»
«Cours Statistique et logiciel R» Rémy Drouilhet (1), Adeline Leclercq-Samson (1), Frédérique Letué (1), Laurence Viry (2) (1) Laboratoire Jean Kuntzmann, Dép. Probabilites et Statistique, (2) Laboratoire
Plus en détailLoi binomiale Lois normales
Loi binomiale Lois normales Christophe ROSSIGNOL Année scolaire 204/205 Table des matières Rappels sur la loi binomiale 2. Loi de Bernoulli............................................ 2.2 Schéma de Bernoulli
Plus en détailProbabilités III Introduction à l évaluation d options
Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un
Plus en détailApproche modèle pour l estimation en présence de non-réponse non-ignorable en sondage
Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage Journées de Méthodologie Statistique Eric Lesage Crest-Ensai 25 janvier 2012 Introduction et contexte 2/27 1 Introduction
Plus en détailChapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Plus en détailChaînes de Markov au lycée
Journées APMEP Metz Atelier P1-32 du dimanche 28 octobre 2012 Louis-Marie BONNEVAL Chaînes de Markov au lycée Andreï Markov (1856-1922) , série S Problème 1 Bonus et malus en assurance automobile Un contrat
Plus en détailIntroduction à la statistique non paramétrique
Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non
Plus en détailK. Ammar, F. Bachoc, JM. Martinez. Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau
Apport des modèles de krigeage à la simulation numérique K Ammar, F Bachoc, JM Martinez CEA-Saclay, DEN, DM2S, F-91191 Gif-sur-Yvette, France Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau Apport des
Plus en détailStatistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier
Statistiques Appliquées à l Expérimentation en Sciences Humaines Christophe Lalanne, Sébastien Georges, Christophe Pallier Table des matières 1 Méthodologie expérimentale et recueil des données 6 1.1 Introduction.......................................
Plus en détailCalculer avec Sage. Revision : 417 du 1 er juillet 2010
Calculer avec Sage Alexandre Casamayou Guillaume Connan Thierry Dumont Laurent Fousse François Maltey Matthias Meulien Marc Mezzarobba Clément Pernet Nicolas Thiéry Paul Zimmermann Revision : 417 du 1
Plus en détailIntroduction à la théorie des files d'attente. Claude Chaudet Claude.Chaudet@enst.fr
Introduction à la théorie des files d'attente Claude Chaudet Claude.Chaudet@enst.fr La théorie des files d'attente... Principe: modélisation mathématique de l accès à une ressource partagée Exemples réseaux
Plus en détail$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU
$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU Fabien FIGUERES fabien.figueres@mpsa.com 0RWVFOpV : Krigeage, plans d expériences space-filling, points de validations, calibration moteur. 5pVXPp Dans le
Plus en détailLES MODELES DE SCORE
LES MODELES DE SCORE Stéphane TUFFERY CONFERENCE GENDER DIRECTIVE 31 mai 2012 31/05/2012 ActuariaCnam Conférence Gender Directive Stéphane Tufféry 1 Plan Le scoring et ses applications L élaboration d
Plus en détailEvaluation générale de la qualité des données par âge et sexe
Analyse démographique pour la prise des décisions. Tendances, et inégalités de mortalité et de fécondité en Afrique francophone : les outils en ligne de l UNFPA / UIESP pour l'estimation démographique.
Plus en détailFeuille d exercices 2 : Espaces probabilisés
Feuille d exercices 2 : Espaces probabilisés Cours de Licence 2 Année 07/08 1 Espaces de probabilité Exercice 1.1 (Une inégalité). Montrer que P (A B) min(p (A), P (B)) Exercice 1.2 (Alphabet). On a un
Plus en détailTests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA
Plus en détailLes simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R
Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences
Plus en détailEmploi du temps prévisionnel
1 Emploi du temps prévisionnel 1. Séances de cours et d exercices Nous aurons cours ensemble : tous les mercredis matins du 28 septembre au 7 décembre inclus, à l exception du mercredi 2 novembre, libéré
Plus en détailProbabilités conditionnelles
Probabilités conditionnelles Exercice Dans une usine, on utilise conjointement deux machines M et M 2 pour fabriquer des pièces cylindriques en série. Pour une période donnée, leurs probabilités de tomber
Plus en détailThéorie des sondages : cours 5
Théorie des sondages : cours 5 Camelia Goga IMB, Université de Bourgogne e-mail : camelia.goga@u-bourgogne.fr Master Besançon-2010 Chapitre 5 : Techniques de redressement 1. poststratification 2. l estimateur
Plus en détailEtude d un cas industriel : Optimisation de la modélisation de paramètre de production
Revue des Sciences et de la Technologie RST- Volume 4 N 1 /janvier 2013 Etude d un cas industriel : Optimisation de la modélisation de paramètre de production A.F. Bernate Lara 1, F. Entzmann 2, F. Yalaoui
Plus en détailCalculs de probabilités
Calculs de probabilités Mathématiques Générales B Université de Genève Sylvain Sardy 13 mars 2008 1. Définitions et notations 1 L origine des probabilités est l analyse de jeux de hasard, tels que pile
Plus en détailIntroduction à la Statistique Inférentielle
UNIVERSITE MOHAMMED V-AGDAL SCIENCES FACULTE DES DEPARTEMENT DE MATHEMATIQUES SMI semestre 4 : Probabilités - Statistique Introduction à la Statistique Inférentielle Prinemps 2013 0 INTRODUCTION La statistique
Plus en détailCours de méthodes de scoring
UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-
Plus en détailThéorie et Codage de l Information (IF01) exercices 2013-2014. Paul Honeine Université de technologie de Troyes France
Théorie et Codage de l Information (IF01) exercices 2013-2014 Paul Honeine Université de technologie de Troyes France TD-1 Rappels de calculs de probabilités Exercice 1. On dispose d un jeu de 52 cartes
Plus en détailAnalyse de la variance Comparaison de plusieurs moyennes
Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction
Plus en détailChristophe CANDILLIER Cours de DataMining mars 2004 Page 1
Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe
Plus en détailFORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
Plus en détailI Stabilité, Commandabilité et Observabilité 11. 1 Introduction 13 1.1 Un exemple emprunté à la robotique... 13 1.2 Le plan... 18 1.3 Problème...
TABLE DES MATIÈRES 5 Table des matières I Stabilité, Commandabilité et Observabilité 11 1 Introduction 13 1.1 Un exemple emprunté à la robotique................... 13 1.2 Le plan...................................
Plus en détailAnnexe commune aux séries ES, L et S : boîtes et quantiles
Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans
Plus en détailIntégration et probabilités TD1 Espaces mesurés
Intégration et probabilités TD1 Espaces mesurés 2012-2013 1 Petites questions 1) Est-ce que l ensemble des ouverts de R est une tribu? 2) Si F et G sont deux tribus, est-ce que F G est toujours une tribu?
Plus en détailStatistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014
Tests du χ 2 Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014 A. Lourme http://alexandrelourme.free.fr Outline
Plus en détailProbabilités sur un univers fini
[http://mp.cpgedupuydelome.fr] édité le 10 août 2015 Enoncés 1 Proailités sur un univers fini Evènements et langage ensemliste A quelle condition sur (a,, c, d) ]0, 1[ 4 existe-t-il une proailité P sur
Plus en détailOrganisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.
2 jours : Mardi 15 et mercredi 16 novembre 2005 de 9 heures 30 à 17 heures 30 Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining. Madame, Monsieur, On parle
Plus en détailCMI ECONOMIE, FINANCE QUANTITATIVE ET STATISTIQUES - PARCOURS FORMATION EN APPRENTISSAGE
Université de PARIS 2 - ASSAS 1/3 PARCOURS FORMATION EN APPRENTISSAGE L1 S1 Mathématiques 1 4 L1 S1 Statistiques 1 4 L1 S1 Fondemants de l'informatique 4 L1 S1 Compléments Maths 2 L1 S1 Compléments Stats
Plus en détailTests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision
Page n 1. Tests du χ 2 une des fonctions des statistiques est de proposer, à partir d observations d un phénomène aléatoire (ou modélisé comme tel) une estimation de la loi de ce phénomène. C est que nous
Plus en détailCalcul élémentaire des probabilités
Myriam Maumy-Bertrand 1 et Thomas Delzant 1 1 IRMA, Université Louis Pasteur Strasbourg, France Licence 1ère Année 16-02-2006 Sommaire La loi de Poisson. Définition. Exemple. 1 La loi de Poisson. 2 3 4
Plus en détail