Introduction à la Statistique Inférentielle

Dimension: px
Commencer à balayer dès la page:

Download "Introduction à la Statistique Inférentielle"

Transcription

1 UNIVERSITE MOHAMMED V-AGDAL SCIENCES FACULTE DES DEPARTEMENT DE MATHEMATIQUES SMI semestre 4 : Probabilités - Statistique Introduction à la Statistique Inférentielle Prinemps 2013

2 0 INTRODUCTION La statistique est la science dont l'objet est de recueillir, de traiter et d'analyser des données issues de l'observation de phénomènes aléatoires, c'est-à-dire dans lesquels le hasard intervient. L'analyse des données est utilisée pour décrire les phénoménes étudiés, faire des prévisions et prendre des décisions à leur sujet. En cela, la statistique est un outil essentiel pour la compréhension et la gestion des phénomènes complexes. Les données étudiées peuvent être de toute nature, ce qui rend la statistique utile dans tous les champs disciplinaires et explique pourquoi elle est enseignée dans toutes les filières universitaires, de l'économie à la biologie en passant par la psychologie, et bien sûr les sciences de l'ingénieur. Les méthodes statistiques se répartissent en deux classes : - La statistique descriptive, statistique exploratoire ou analyse des données, a pour but de résumer l'information contenue dans les données de façon efficace. Elle utilise pour cela des représentations de données sous forme de graphiques, de tableaux et d'indicateurs numériques (par exemple des moyennes). Elle permet de dégager les caractéristiques essentielles du phénomène étudié et de suggérer des hypothèses pour une étude ultèrieure plus sophistiquée. Les probabilités n'ont ici qu'un rôle mineur. - La statistique inférentielle va au delà de la simple description des données. Elle a pour but de faire des prévisions et de prendre des décisions au vu des observations. Les probabilités jouent ici un rôle fondamental. L'objet de ce cours est de décrire les techniques de la statistique inférentielle utilisées pour recueillir de l'information et prendre des décisions à partir des données observées. 2

3 1 - ECHANTILLONNAGE Tout, dans la statistique inférentielle, repose sur l'étude des distributions des échantillons Généralités Le terme d'échantillon est souvent associé à un sous-ensemble de cardinal n tiré d'une population finie ou infinie selon certaines règles: il s'agit alors d'un échantillon d'individus. Dans cette partie, on s'intéresse plutôt aux échantillons de variables que l'on relie aux échantillons d'individus par la considération élémentaire suivante: Sur chaque individu tiré, on mesure une certaine grandeur X et on note observées. Le n-uplet x = ( ) est un échantillon de valeurs. les valeurs Exemple 1: On prélève au hasad n ampoules électriques dans une production et on mesure leur durée de fonctionnement. Si les caractéristiques de fabrication n'ont pas varié d'une ampoule à l'autre, les différences entre les (x i ) peuvent être considérées comme des fluctuations de nature aléatoire. Cette dernière remarque justifie l'hypothèse fondamentale de la théorie de l'échantillonnage: Les valeurs observées x i sont des réalisations d'une même variable aléatoire X, appelée variable parente ou de population. Dans notre exemple, ceci revient à postuler l'existence d'une variable abstraîte, la durée de vie d'une ampoule de type donné, fabriquée dans des conditions données. On peut cependant introduire aussi le modèle suivant: À chaque individu tiré, on associe une variable aléatoire X i dont on observe une seule réalisation x i. L'hypothèse formulée plus haut revient alors à dire que les X i sont des variables aléatoires réelles ayant toutes la même distribution, celle de X. On supposera également que les X i sont indépendantes (dire qu'elles sont indépendantes sous entend qu'elles sont définies sur le même espace de probabilit ). Définition 1: Les variables aléatoires forment un échantillon aléatoire de taille n (on dit aussi un n-échantillon) si les v.a. sont indépendantes et identiquement distribuées (i.i.d. en abrégé). On dit que ( ) est un échantillon de taille n (ou aussi un n-échantillon),si pour tout i, x i est une réalisation de X i. Dans toute la suite on notera les variables aléatoires par des lettres capitales, et leurs réalisations (non aléatoires ou déterministes) par des lettres minuscules. En convenant de noter par f X (.) aussi bien la masse de probabilité dans le cas discret que la densité marginale dans le cas continu de la v.a. X, c'est-à-dire:, La densité conjointe du n-uplet (X 1,..., X n ) est donnée par: 3

4 Cette densité conjointe peut être utilisée pour calculer diverses probabilités relatives à l échantillon. En particulier, si f X (x) appartient à une famille paramétrique de densités de probabilités { (x), } où l'espace des paramètres est contenu dans IR k, k 1, nous avons: avec inconnu. En considérant différentes valeurs possibles de, on peut étudier le comportement de notre échantillon pour différentes distributions appartenant à la famille considérée. Exemple 2 : Soit un n-échantillon représentant les n durées de fonctionnement (en mois) de n ampoules issues d'une population exponentielle de paramètre : n n f(x 1,...,x n ) = f (x i ) = (1/ ) e -x i / = (1/ n ) e - n x i / i 1, x 1,...,x n 0. i 1 i 1 Quelle est la probabilité que toutes les ampoules admettent une durée de fonctionnement d'au moins 2 mois? P(X 1 > 2,..., X n > 2) = f(x1,...,x n )dx 1 dx 2...dx n n = (1/ ) e -x i / dx 1 dx 2...dx n i 1 = e -2/ n {i 1/ e -x i / }dx 2...dx n (intégration p.r. à x 1 ) 1 =... (intégration p.r. à x i ) = (e -2/ ) n = e -2n/. On peut retrouver ce résultat en utilisant l'indépendance des v.a. X 1,...,X n : P(X 1 > 2,..., X n >2) = P(X 1 >2)... P(X n >2) (indépendance) = (P[X 1 > 2]) n (lois identiques) Remarques: = e-2n / (loi exp( )) 1) Le modèle d'échantillonnage décrit dans la définition 1 est aussi appelé échantillonnage à partir d'une population infinie. 2) Echantillonnage d'une population finie: dans ce cas, les hypothèses d'indépendance peuvent ne pas être vérifiées selon que le tirage est avec ou sans remise. Considérons en effet une population finie dont les N mesures ou observations possibles de X sont {x 1,..., x N }. Un échantillon est à constituer à partir de cette population. On peut procéder de deux manières: i) tirage avec remise: dans ce cas, chaque X i est une variable discrète prenant chaque valeur x i avec la même probabilité 1/N : P(X i =x i ) = 1 N, i=1,...,n 4

5 Les (X i ) sont indépendantes car le processus de choix de toute variable X i est le même indépendamment de la valeur obtenue. ii) tirage exhaustif ou sans remise: l'indépendance est en défaut car par exemple, si x et y sont deux éléments distincts de l'ensemble {x 1,...,x N }, on a P(X 2 =y/x 1 =y)=0 car y ne peut être choisi à l'étape suivante, alors que P(X 2 =y/x 1 =x) = 1/(N-1) et donc la loi de X 2 dépend de celle de X 1. Cependant, si N est grand comparativement à n, les variables aléatoires peuvent être considérées comme presque indépendantes. Ceci est illustré par l'exemple suivant. Exemple 3: P = {1,...,1000} est notre population de taille N=1000. Un échantillon de taille n=10 est tiré sans remise. Quelle est la probabilité que toutes les 10 valeurs échantillonnées soient > 200? Si X 1,..., X 10 sont indépendantes et, puisque P(X i > 200) = 800/1000, i, on a: 10 P(X 1 > 200,..., X 10 > 200) = P(X 1 >200) = ( ) 10 = 0, i 1 Calcul exact: Soit la v.a. Y = nombre de X i > 200 parmi n. Alors, Y suit la loi hypergéométrique H(N,n,r) avec N=1000, n=10, r=800, et donc P (Y=10) = P(X 1 >200,..., X 10 >200) = C 800C200 / C 1000 = 0,106164, valeur qui est très proche de celle obtenue sous l'hypothèse d'indépendance Dans la suite du cours, nous utilisons la définition 1 comme définition d'un échantillon aléatoire Statistiques basées sur un échantillon aléatoire Il est d'usage dans la pratique de résumer les n valeurs x 1,..., x n observées d'un échantillon X = ( ) par quelques caractéristiques simples telles que la moyenne, la variance, l'étendue, la plus grande valeur, etc. Ces caractéristiques sont elles-mêmes des réalisations ou observations de variables aléatoires qui sont fonctions de l'échantillon aléatoire X. Définition 2: Soit un échantillon de taille n de X et soit T( ) une fonction vectorielle définie sur l'espace image du vecteur X=( ). Alors la variable aléatoire ou vecteur aléatoire défini par T=T(X) est appelée statistique. La distribution de probabilité de la statistique est appelée distribution échantillonnale de T. Exemple4 : Remarque: est une statistique est sa valeur observée a) La définition d'une statistique est assez large, mais il est sous-entendu qu'une statistique ne peut dépendre d'un paramètre. 5

6 b) Une statistique peut être à valeurs dans IR ou dans IR p. Dans ce dernier cas, on parlera de statistique vectorielle. Les résumés empiriques par une statistique peuvent contenir diverses informations. La plus petite et la plus grande de ces valeurs ainsi que leur valeur moyenne constituent des exemples courants de tels résumés. Définition 3: 1) La moyenne échantillonnale est la variable aléatoire définie par: 2) La variance échantillonnale est la variable aléatoire définie par: S 2 = 1 n (X i X) 2. n -1 i 1 L'écart-type échantillonal est la racine carrée S de la variance échantionnale. 3) La statistique d'ordre de l'échantillon X 1,..., X n est l'échantillon ordonné dans l'ordre croissant et noté X (1),..., X (n) avec : X (1) = min X 1 i n i, X (2) = seconde plus petite observation,.., X (n) = max X 1 i n i. 4) L'étendue échantillonnale R est la variable aléatoire : R = X (n) - X (1). Remarques: a) Dans cette définition, on devrait écrire: X = X( ), S = S(X 1,...,X n ), R = R(X 1,...,X n ), etc. b) La variance et l'écart-type échantillonnaux sont deux mesures de la variabilité dans l'échantillon. Ces deux caractéristiques sont liées à la variance et l écart-type inconnus de la population comme nous le verrons plus loin Propriétés de X et S2 Lemme 1: Soit X = ( ) un échantillon aléatoire et x une observation ou réalisation de X. Soit x la moyenne empirique des x i. Alors: a) Min n n (x i 1 i ) 2 = (x i x) 2 i 1 b) (n-1) s 2 n = (x i x) 2 n 2 = x i 1 i 1 i - n x 2 n n Preuve : (x i 1 i ) 2 = (x i 1 i x + x - ) 2 n = (x i x) 2 n n + (x ) (x i 1 i 1 i 1 i x)(x - ) n = (x i x) 2 n + (x ) 2. i 1 i 1 Cette dernière expression résulte du fait que 6

7 Elle montre clairement que est minimisée par =x, d'où a). L'identité b) se déduit par un calcul analogue au précédent Commentaires: Pour résumer les n valeurs observées d'un échantillon, il ne faut jamais perdre de vue qu'un resumé par une seule caractéristique n'a aucun sens: la statistique commence précisement là où il y a variabilité et on ne peut évidemment pas se contenter d'une valeur unique telle que la moyenne. Il convient donc de définir à la fois une valeur centrale et une mesure de dispersion autour de cette valeur. La recherche de cette valeur centrale répond à la préoccupation suivante: "Résumer les n valeurs par une valeur unique aussi voisine que possible des (x i )". Nous commençons par étudier les distributions échantillonnales de X et de S 2 en considérant d'abord l'espérance de ces statistiques. En utilisant la linéarité de l'espérance mathématique ainsi que l'indépendance, on peut établir le théorème suivant: Théorème 1: Soit X un n-échantillon d'une population de moyenne et de variance 2 finie. Alors on a : a) E[X] = b) Var[X] = 2 n c) E[S 2 ] = 2. Preuve: a) E[X] = = ; (Car X 1,..., X n sont de même loi) = b) étant indépendantes et de même loi, donc Var(X) = n var( 1 X 1 ) n = n 2 n2 = 2 n. c) Puisque:, on a: X X 7

8 Commentaires: les deux relations a) et c) du théorème précédent sont des relations entre une statistique ( X ou S 2 ) et un paramètre de la population ( ou 2 ). Ce sont deux exemples de statistiques sans biais (à voir plus loin en détail). Théorème 2: (Théorème central limite) Soit un n-échantillon de X. On pose =E(X) et 2 =var(x). On considère la variable aléatoire centrée réduite Z n définie par: Alors, pour n grand, la distribution de Z n est approximativement (0,1): P (Z n x) P (Z x) pour n grand, avec Z de loi (0,1). Ainsi, lorsque n est suffisamment grand, la moyenne X est assimilée à une v.a. normale quelque soit la distribution de l'échantillon X Echantillonnage à partir d'une distribution normale Le théorème central limite est souvent utile lorsque la distribution échantillonnale de X ou de S 2 est inconnue ou difficile à déterminer. Dans le cas où X 1,..., X n est issu d'une population de loi normale, il est facile de déduire plusieurs propriétés échantillonnales intéressantes. En particulier, nous avons: Théorème 3: (Théorème de Fisher). Soit ( ) un n-échantillon issu d'une population normale (, 2 ). Soient X et S 2 sa moyenne et sa variance échantillonnales. Alors: a) X et S 2 sont deux variables aléatoires indépendantes; b) ; c) la loi Khi-deux à (n-1) degrés de libertés d.d.l. d) la loi de Student à (n-1) d.d.l. La détermination des lois de X et S 2 est une des premières étapes dans l'analyse statistique. En particulier, la variance 2 est inconnue dans la plupart des cas pratiques et, pour avoir une idée précise de la variablilité de X (considérée comme estimateur de ), il est nécessaire d'estimer cette variance. Si suit la loi (, 2 ), alors la variable aléatoire. Si on connait et on observe X, on peut utiliser Z pour faire de l'inférence concernant car ce paramètre est le seul inconnu dans ce cas. Cependant, lorsque est inconnu, l'utilisation de Z devient impossible. Student (pseudonyme de W.S Gosset, 1900) a proposé dans ce cas d'utiliser plutôt la statistique. 8

9 2 ESTIMATION PONCTUELLE On observe un échantillon issu d'une variable aléatoire X dont la loi de probabilité dépend d'un paramètre inconnu. Le problème qui se pose est celui de l'estimation du paramètre. L estimation statistique consiste à donner, à partir des observations, une approximation ou une évaluation de que l'on espère la plus proche possible de la vraie valeur inconnue. On pourra proposer une unique valeur vraisemblable pour (estimation ponctuelle), ou un ensemble de valeurs vraisemblables (estimation ensembliste ou région de confiance). Exemple5 : Supposons qu'on fabrique des pièces sur une machine, chaque pièce ayant une probabilité inconnue (mais la même pour chaque pièce) d'être défectueuse. On cherche, à l'aide d'un échantillon de n pièces, à obtenir des renseignements sur. Pour cela, on dispose de l'observation, constituée du nombre X de pièces défectueuses parmi les N pièces fabriquées. Il est "naturel" de prendre comme valeur de la proportion X N de pièces défectueuses. Il est "vraisemblable" que la valeur exacte de soit proche de X/N, mais tout-à-fait invraisemblable qu'elle soit égale à X N exactement Méthodes d'estimation ponctuelle Dans cette section, nous présentons deux méthodes classiques qui permettent de sélectionner des estimateurs raisonnables pour le paramètre inconnu (ou encore une fonction de ce paramètre). Mais il faut d'abord définir précisement ce que sont une estimation et surtout un estimateur. Pour estimer on ne dispose que des données, donc une estimation de sera une fonction de ces observations. Définition4 : Soit un échantillon issu d une loi de paramètre. On appelle estimateur de toute staistique T(X)=T à valeurs dans l'ensemble des valeurs possibles de. Une estimation de est une réalisation t de l'estimateur T. Un estimateur est donc une variable aléatoire, alors qu'une estimation est une valeur déterministe Méthode des moments Soit X un échantillon d'une distribution dépendant de k paramètres 1,..., k. Soient les k moments d'ordre j ( ) de la v.a X. On définit les moments échantillonnaux d'ordre j correspondants par : Pour pouvoir appliquer la méthode des moments, supposons pouvoir exprimer les k premiers moments en fonction des k paramètres 1,..., k : On remplace ensuite les moments système : par leurs estimateurs respectifs m j puis on résout le 9

10 Les k solutions paramètres. Exemple6: Soit paramètre à estimer est On a dans ce cas: de ce système, constituent les estimateurs des moments des k un échantillon issu d une v.a aléatoire X. Supposons que le, où est la moyenne de X et 2 est sa variance. le système à résoudre est: D'où : Et l estimateur des moments pour est Méthode du maximum de vraisemblance Soit un échantillon aléatoire issu d une loi inconnue appartenant à la famille de lois paramétriques { }, et soit x = la valeur observée correspondante. Définition 5: On appelle fonction de vraisemblance, la fonction définie sur par. Les va étant indépendantes, donc N.B: Dans la suite de ce cours on notera par la loi de probabilité d une v.a discrète ( et la densité de probabilité d une v.a continue(. Définition 6: Soit un échantillon aléatoire issu d une loi inconnue appartenant à la famille de lois paramétriques { }, et soit x = une valeur observée de X. pour x fixé on note de qui maximise, la fonction de 10

11 La statistique vraisemblace (EMV) de est appelée l estimateur du maximum de La méthode du maximum de vraisemblance (M.M.V) consiste, étant donné un échantillon de valeurs, à estimer le paramétre par la valeur qui rend maximale la fonction de vraisemblance : Pour déterminer la valeur, il est souvent commode d'utiliser car cette dernière fonction atteint son maximum au même point que la fonction et se prète mieux aux calculs. En effet, si et est différentiable en les candidats possibles pour l E. M.V sont les valeurs de 1,..., k solutions du système Exemple7: Contrôle de qualité par sondage: Une machine fabrique une proportion inconnue de pièces défectueuses. On désire estimer. Pour cela, on effectue un sondage: On prélève n pièces avec remise et on observe les v.a où X i = 1 si la pièce tirée est défectueuse et 0 sinon. Les données x i sont les valeurs observées des n variables aléatoires indépendantes de même loi : La fonction de vraisemblance est donnée par:. En dérivant la fonction et en résolvant par rapport à l'équation: nous obtenons l'estimateur de M.V. de suivant: Exemple8: Fiabilité: Considérons la v.a. continue à valeurs positives X représentant la durée de fonctionnement sans panne d'un système. Sa densité de probabilité f est celle d'une distribution exponentielle de moyenne 1/. On désire estimer par la méthode du M.V le paramètre. Pour celà, on considère n systèmes identiques et on observe leur durée de vie. Ce sont des observations des v.a. qui sont i.i.d. de loi exp ( ) où est inconnu. La fonction de vraisemblance est donnée par: L(x, ) = 11

12 et la fonction logarithme de la vraisemblance L(x, ) est:. En déterminant le zéro de la dérivée de cette fonction par rapport à, on obtient: L'estimateur du maximum de vraisemblance du paramètre est donc: Exemple9: Dans le cas d'un échantillon aléatoire de loi Uniforme sur, la fonction de vraisemblance est donnée par : Cette fonction est maximale en. L'estimateur de M.V de est donc: Méthode d'évaluation d'estimateurs Dans la section précédente, nous avons présenté deux méthodes de construction d'estimateurs raisonnables d'un paramètre ou d'une fonction de celui-ci. Ces techniques d'estimation conduisent généralement à différents estimateurs et la question qui se pose tout naturellement est celle du choix entre ces derniers. Soit X = ( ) un n-échantillon dont la distribution est spécifiée grace à un paramètre inconnu, et soit T=T(X) un estimateur de la fonction de ce paramètre. T sera un bon estimateur de s'il est suffisamment proche, en un certain sens, de. Il faut donc définir une mesure de l'écart entre et T. On appelle cette mesure le risque de l'estimateur. On a intérêt à ce que le risque d'un estimateur soit le plus petit possible. Parmi les critères qui permettent d'optimiser le choix d'un estimateur, nous avons: Définition 7: Le risque moyen quadratique où erreur moyenne quadratique (EMQ en abrégé) d'un estimateur T=T(X) de est la fonction de définie par: Où désigne l'espérance mathématique relativement à. Remarque : En écrivant, il est facile d'exprimer l'emq en fonction de la moyenne et la variance de l'estimateur T. On a:, 12

13 où. La fonction désigne le biais de l'estimateur T. Définition 8: Soient T = T(X) et S=S(X) deux estimateurs de On dit que T est meilleur que S (au sens de l EMQ) si, pour tout, Il est dit strictement meilleur si de plus il existe au moins une valeur de l'inégalité précédente est stricte. pour laquelle Exemple10: Soit X un n-échantillon de loi. Un estimateur raisonnable de est la moyenne échantillonnale. Comme et, on a: La dernière égalité résulte du fait que suit une loi (d'après le théorème 3). D'autre part, la statistique peut aussi bien être considérée comme estimateur de. Sa moyenne est égale à et son EMQ vaut. Donc l'estimateur est strictement meilleur que (si n>1). L'exemple précédent montre que est strictement meilleur que lorsqu'on veut estimer la moyenne d'une loi normale Estimateurs sans biais. Le biais mesure une erreur systématique d'estimation de par T. Par exemple, si, cela signifie que T aura tendance à sous-estimer. Définition 9: On appelle estimateur sans biais de toute statistique T=T(X) telle que : Remarque: a) Si T est un estimateur sans biais, son EMQ est égale à sa variance. On en déduit immédiatement que de deux estimateurs sans biais, le meilleur est celui qui a la plus petite variance. On a donc intérêt à ce qu'un estimateur soit sans biais et de faible variance. b) La définition précédente signifie que l'estimateur sans biais T n'a tendance ni à sousestimer ni à sur-estimer le paramètre : en moyenne il vise juste. Exemples11: Contrôle de qualité par sondage (suite): dans cet exemple, l'estimateur de M.V du paramètre est donné parx. Il s'agit là d'un estimateur sans biais puisque: Exemples12: Fiabilité: L'estimateur du MV de est. Est-il sans biais? 13

14 loi Suit la loi gamma, car c est la somme de n variables aléatoires i.i.d de sa densité de probabilité est: et alors, Et n'est pas un estimateur sans biais de. Par contre, l'estimateur est sans biais. Nous avons vu précédemment que le critère d'emq n'est autre que la variance d'un estimateur sans biais. Par conséquent, la comparaison d'estimateurs sans biais selon la définition 8 revient à comparer leurs variances respectives. Exemple13: Estimation du paramètre d'une distribution uniforme. Soit un échantillon d'une v.a. de loi Uniforme sur, où est un paramètre réel positif inconnu. Puisque: il est "naturel" d'utiliser l'estimateur sans biais (estimateur des moments) T=T(X)=2X. Un second estimateur de est l'estimateur du MV obtenu précédemment: S Un tel estimateur est-il sans biais? Pour calculer E[S], nous avons besoin de déterminer la densité de probabilité de la v.a. S. Soit sa fonction de répartition:. Il en résulte, en dérivant par rapport à x: 14

15 Par suite, on a:. et S n'est donc pas sans biais. Par contre, l'estimateur est sans biais et on peut vérifier que :. Par conséquent, l'estimateur U fonction de l'estimateur du MV est meilleur que l'estimateur naturel des moments T=2 X puisque var(u) var(t) pour tout et tout n >1. Définition 10: On dit qu'un estimateur T=T(X) de la fonction g( ) du paramètre est un estimateur sans biais de variance minimale s'il est sans biais pour g( ) et si, pour tout autre estimateur S=S(X) sans biais de g( ), on a: R(,T) = var (T) var (S) = R(,S),. La recherche du meilleur estimateur sans biais de variance minimale (s'il en existe un!) n'est pas une tache facile en général. La difficulté réside d'abord dans l'évaluation de la variance d'estimateurs potentiels. Une autre difficulté réside dans la détermination du meilleur estimateur sans biais au sens de la définition précédente: même si on montre par exemple que var (T) var (S), rien ne permet d'affirmer qu'il n'existe pas d'autres estimateurs sans biais de variance inférieure à celle de T. 15

16 3 - ESTIMATION ENSEMBLISTE Introduction Il peut parfois être intéressant de chercher à approcher le paramètre inconnu non pas par un point T(X) mais par un sous-ensemble de l'espace des paramètres. Autrement dit, au lieu d'un estimateur ponctuel, on cherche un estimateur ensembliste de appelé aussi intervalle ou domaine de confiance. Note: Comme celà était convenu précédemment, nous notons par T(x) la valeur de la statistique observée pour T(X). Définition 10: Un intervalle de confiance d un paramètre réel est un intervalle où R(x) et S(x) est une paire de fonctions telle que. L'intervalle aléatoire est appelé estimateur ensembliste de. Exemple14: Soit un échantillon de loi (,1). Lorsqu on estime le paramètre parx, la probabilité, P(X= ), que cette estimation soit exacte, est nulle. Cependant, avec un intervalle de confiance on peut évaluer la probabilité que soit dans un intervalle I(X). Un estimateur ensembliste possible pour est par exemple l'intervalle I(X) = [X-1,X+1]. Prenons pour illustrer notre échantillon gaussien, n=4. Puisque la statistique X (,1/n), nous pouvons écrire en utilisant la table de la fonction de répartition (.) de la loi normale centrée et réduite: 0,9544. Ainsi, nous avons plus de 95% de "chance" que notre paramètre soit dans l'intervalle aléatoire I(X) Intervalle de confiance de niveau (1- ) Pour déterminer un intervalle de confiance pour un paramètre inconnu, nous devons connaître la distribution échantillonnale d'un estimateur ponctuel de ce dernier. Définition 11: Soient R(X) et S(X) deux statistiques. L intervalle aléatoire intervalle de confiance de niveau 1- pour le parrmètre si : est un Les statistiques R(X) et S(X) sont respectivement les limites de confiance inférieure et supérieure pour. Notre objectif est donc de les déterminer. 16

17 est la probabilité que le paramètre n'appartienne pas à l intervalle, c'est à dire la probabilité que l'on se trompe en affirmant que. C'est donc une probabilité d'erreur, qui doit être assez petite. Les valeurs usuelles de sont 10%, 5%, 1%, etc. Nous allons illustrer la procédure générale par des exemples, en déterminant des intervalles de confiance pour la moyenne et la variance dans un échantillon de loi normale Intervalle de confiance pour la moyenne d une loi normale Soit un n-échantillon d'une population gaussienne. Intervalle de confiance pour la moyenne lorsque la variance est connue La loi normale standard étant tabulée, il est alors possible de déterminer pour tout appelé le -fractile de la loi (0,1) qui vérifie : Compte tenu de la symétrie de la densité de la loi (0,1), on a: D'après le théorème de Fisher, nous savons que Donc Ainsi un intervalle de confiance de niveau 1- pour, quand est connue, est donné par : Exemple14: Supposons que lorsqu'un signal ayant la valeur est transmis d'un endroit A, le signal reçu en B est normalement distribué avec moyenne et variance. Supposons que la même valeur est transmise 9 fois. Les valeurs reçues succéssivement en B sont : 5; 8,5 ; 12 ; 15 ; 7; 9 ; 7,5 ; 6,5 ; 10,5. Puisque x=81/9=9 et z /2 =1,96 si =0,05, un intervalle de niveau 1- =95% pour la moyenne est alors: 17

18 = [7,69 ; 10,31]. La vraie valeur du message sera comprise entre 7,69 et 10,31 avec 95% de confiance. Intervalle de confiance pour la moyenne lorsque la variance inconnue Dans ce qui a précédé, nous avons supposé que est connue. Cette hypothèse est souvent non vérifiée dans la pratique et dans un tel cas, on pense à remplacer le paramètre inconnu dans la v.a. par son estimateur S. Nous savons que la v.a. est distribuée selon la loi de student t à n-1 d.d.l. Soit donc le -fractile de la loi de Student t à n-1 d.d.l, c'est-à-dire le réel tel que: La loi de Student étant symétrique, donc Donc Ainsi un intervalle de niveau 1- pour lorsque est inconnu est donné par: Exemple15: Avec les valeurs utilisées dans l'exemple précédent, nous avons: x=9 et s=3,08. La table de la loi de student donne la valeur Un intervalle de confiance de niveau 95% pour la moyenne est alors: lorsque =0,05 et n=9. Un tel intervalle est bien sûr moins précis que celui obtenu lorsque la variance supposée connue. est Intervalle de confiance pour la variance d une loi normale Intervalle de confiance pour la variance lorsque la moyenne est connue 18

19 La statistique est un estimateur sans biais pour Nous savons que la v.a. est distribuée selon la loi khi deux à n d.d.l car (0,1) et indépendantes. Soit donc le -fractile de la loi à n d.d.l. c'est-à-dire le réel tel que: Avec ces notations, nous avons : Donc Alors, un intervalle de niveau 1- pour lorsque est connu, est donné par: Intervalle de confiance pour la variance lorsque la moyenne est inconnue Dans le cas où et sont inconus on a : Où est un estimateur sans biais pour. Avec les mêmes notations ci-dessus, nous avons : où désigne -fractile de la loi à (n-1) d.d.l. Ainsi, un intervalle de confiance de niveau 1- pour lorsque est inconnu est donné par: Remarque : Dans le cas ou X n'est pas gaussienne et l échantillon est de grande taille (n > 30), d après le théorème limite centrale on peut approcher la loi de par et donc la loi de par. On a alors la même définition de l'intervalle de confiance que dans le cas où X est gaussienne et connue (si est inconnue, on lui attribue la valeur de son estimation ponctuelle). 19

20 Exemple16 : Intervalle de confiance pour une proportion Soit une population dont les individus possèdent un caractère A avec une probabilité p. On cherche à déterminer cette probabilité inconnue en prélevant un échantillon de taille n (n > 30) dans cette population. Soit x est le nombre d individus possèdant le caractère A dans l échantillon. est une estimation de p. La v.a. ( nombre d individus possèdant le caractère A dans la population) est la somme de n variables aléatoires indépendantes de même loi de bernouilli de paramètre p. C est donc, d après le théorème central limite, une variable aléatoire dont la loi de probabilité peut être approchée par une loi normale de moyenne np et de variance, donc la loi de peut être approchée par. Ainsi un intervalle de confiance de niveau 1- pour la proportion p est :. 20

21 Résumé Intervalle de confiance de niveau pour la moyenne d une loi normale connue inconnue Intervalle de confiance de niveau pour la variance d une loi normale connue inconnue Intervalle de confiance de niveau pour la moyenne d une loi inconnue (n grand) connue inconnue Intervalle de confiance de niveau pour une proportion p (n grand) 21

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,

Plus en détail

TESTS D'HYPOTHESES Etude d'un exemple

TESTS D'HYPOTHESES Etude d'un exemple TESTS D'HYPOTHESES Etude d'un exemple Un examinateur doit faire passer une épreuve type QCM à des étudiants. Ce QCM est constitué de 20 questions indépendantes. Pour chaque question, il y a trois réponses

Plus en détail

Précision d un résultat et calculs d incertitudes

Précision d un résultat et calculs d incertitudes Précision d un résultat et calculs d incertitudes PSI* 2012-2013 Lycée Chaptal 3 Table des matières Table des matières 1. Présentation d un résultat numérique................................ 4 1.1 Notations.........................................................

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

PROBABILITES ET STATISTIQUE I&II

PROBABILITES ET STATISTIQUE I&II PROBABILITES ET STATISTIQUE I&II TABLE DES MATIERES CHAPITRE I - COMBINATOIRE ELEMENTAIRE I.1. Rappel des notations de la théorie des ensemble I.1.a. Ensembles et sous-ensembles I.1.b. Diagrammes (dits

Plus en détail

Cours de Tests paramétriques

Cours de Tests paramétriques Cours de Tests paramétriques F. Muri-Majoube et P. Cénac 2006-2007 Licence Ce document est sous licence ALC TYPE 2. Le texte de cette licence est également consultable en ligne à l adresse http://www.librecours.org/cgi-bin/main?callback=licencetype2.

Plus en détail

CAPTEURS - CHAINES DE MESURES

CAPTEURS - CHAINES DE MESURES CAPTEURS - CHAINES DE MESURES Pierre BONNET Pierre Bonnet Master GSI - Capteurs Chaînes de Mesures 1 Plan du Cours Propriétés générales des capteurs Notion de mesure Notion de capteur: principes, classes,

Plus en détail

NOTIONS DE PROBABILITÉS

NOTIONS DE PROBABILITÉS NOTIONS DE PROBABILITÉS Sommaire 1. Expérience aléatoire... 1 2. Espace échantillonnal... 2 3. Événement... 2 4. Calcul des probabilités... 3 4.1. Ensemble fondamental... 3 4.2. Calcul de la probabilité...

Plus en détail

Algorithmes d'apprentissage

Algorithmes d'apprentissage Algorithmes d'apprentissage 1 Agents qui apprennent à partir d'exemples La problématique : prise de décision automatisée à partir d'un ensemble d'exemples Diagnostic médical Réponse à une demande de prêt

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

LES GENERATEURS DE NOMBRES ALEATOIRES

LES GENERATEURS DE NOMBRES ALEATOIRES LES GENERATEURS DE NOMBRES ALEATOIRES 1 Ce travail a deux objectifs : ====================================================================== 1. Comprendre ce que font les générateurs de nombres aléatoires

Plus en détail

Evaluation de la variabilité d'un système de mesure

Evaluation de la variabilité d'un système de mesure Evaluation de la variabilité d'un système de mesure Exemple 1: Diamètres des injecteurs de carburant Problème Un fabricant d'injecteurs de carburant installe un nouveau système de mesure numérique. Les

Plus en détail

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

1. Vocabulaire : Introduction au tableau élémentaire

1. Vocabulaire : Introduction au tableau élémentaire L1-S1 Lire et caractériser l'information géographique - Le traitement statistique univarié Statistique : le terme statistique désigne à la fois : 1) l'ensemble des données numériques concernant une catégorie

Plus en détail

Cours 02 : Problème général de la programmation linéaire

Cours 02 : Problème général de la programmation linéaire Cours 02 : Problème général de la programmation linéaire Cours 02 : Problème général de la Programmation Linéaire. 5 . Introduction Un programme linéaire s'écrit sous la forme suivante. MinZ(ou maxw) =

Plus en détail

CHAPITRE VIII : Les circuits avec résistances ohmiques

CHAPITRE VIII : Les circuits avec résistances ohmiques CHAPITRE VIII : Les circuits avec résistances ohmiques VIII. 1 Ce chapitre porte sur les courants et les différences de potentiel dans les circuits. VIII.1 : Les résistances en série et en parallèle On

Plus en détail

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre. Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences

Plus en détail

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Table des matières. Introduction....3 Mesures et incertitudes en sciences physiques

Plus en détail

Moments des variables aléatoires réelles

Moments des variables aléatoires réelles Chapter 6 Moments des variables aléatoires réelles Sommaire 6.1 Espérance des variables aléatoires réelles................................ 46 6.1.1 Définition et calcul........................................

Plus en détail

3. Caractéristiques et fonctions d une v.a.

3. Caractéristiques et fonctions d une v.a. 3. Caractéristiques et fonctions d une v.a. MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v2) MTH2302D: fonctions d une v.a. 1/32 Plan 1. Caractéristiques d une distribution 2. Fonctions

Plus en détail

Complément d information concernant la fiche de concordance

Complément d information concernant la fiche de concordance Sommaire SAMEDI 0 DÉCEMBRE 20 Vous trouverez dans ce dossier les documents correspondants à ce que nous allons travailler aujourd hui : La fiche de concordance pour le DAEU ; Page 2 Un rappel de cours

Plus en détail

Programmes des classes préparatoires aux Grandes Ecoles

Programmes des classes préparatoires aux Grandes Ecoles Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme

Plus en détail

3 Approximation de solutions d équations

3 Approximation de solutions d équations 3 Approximation de solutions d équations Une équation scalaire a la forme générale f(x) =0où f est une fonction de IR dans IR. Un système de n équations à n inconnues peut aussi se mettre sous une telle

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

a) La technique de l analyse discriminante linéaire : une brève présentation. 3 étapes de la méthode doivent être distinguées :

a) La technique de l analyse discriminante linéaire : une brève présentation. 3 étapes de la méthode doivent être distinguées : a) La technique de l analyse discriminante linéaire : une brève présentation. Nous nous limiterons ici à l'analyse discriminante linéaire et à deux groupes : - linéaire, la variante utilisée par ALTMAN

Plus en détail

Les indices à surplus constant

Les indices à surplus constant Les indices à surplus constant Une tentative de généralisation des indices à utilité constante On cherche ici en s inspirant des indices à utilité constante à définir un indice de prix de référence adapté

Plus en détail

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

Simulation de variables aléatoires

Simulation de variables aléatoires Chapter 1 Simulation de variables aléatoires Références: [F] Fishman, A first course in Monte Carlo, chap 3. [B] Bouleau, Probabilités de l ingénieur, chap 4. [R] Rubinstein, Simulation and Monte Carlo

Plus en détail

Régression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr

Régression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr Régression linéaire Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr 2005 Plan Régression linéaire simple Régression multiple Compréhension de la sortie de la régression Coefficient de détermination R

Plus en détail

Le modèle de Black et Scholes

Le modèle de Black et Scholes Le modèle de Black et Scholes Alexandre Popier février 21 1 Introduction : exemple très simple de modèle financier On considère un marché avec une seule action cotée, sur une période donnée T. Dans un

Plus en détail

I. Ensemble de définition d'une fonction

I. Ensemble de définition d'une fonction Chapitre 2 Généralités sur les fonctions Fonctions de références et fonctions associées Ce que dit le programme : Étude de fonctions Fonctions de référence x x et x x Connaître les variations de ces deux

Plus en détail

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,

Plus en détail

Chapitre 3 : INFERENCE

Chapitre 3 : INFERENCE Chapitre 3 : INFERENCE 3.1 L ÉCHANTILLONNAGE 3.1.1 Introduction 3.1.2 L échantillonnage aléatoire 3.1.3 Estimation ponctuelle 3.1.4 Distributions d échantillonnage 3.1.5 Intervalles de probabilité L échantillonnage

Plus en détail

2. RAPPEL DES TECHNIQUES DE CALCUL DANS R

2. RAPPEL DES TECHNIQUES DE CALCUL DANS R 2. RAPPEL DES TECHNIQUES DE CALCUL DANS R Dans la mesure où les résultats de ce chapitre devraient normalement être bien connus, il n'est rappelé que les formules les plus intéressantes; les justications

Plus en détail

LE PROBLEME DU PLUS COURT CHEMIN

LE PROBLEME DU PLUS COURT CHEMIN LE PROBLEME DU PLUS COURT CHEMIN Dans cette leçon nous définissons le modèle de plus court chemin, présentons des exemples d'application et proposons un algorithme de résolution dans le cas où les longueurs

Plus en détail

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que Introduction. On suppose connus les ensembles N (des entiers naturels), Z des entiers relatifs et Q (des nombres rationnels). On s est rendu compte, depuis l antiquité, que l on ne peut pas tout mesurer

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options Université de Lorraine Modélisation Stochastique Master 2 IMOI 2014-2015 TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options 1 Les options Le but de ce

Plus en détail

Texte Agrégation limitée par diffusion interne

Texte Agrégation limitée par diffusion interne Page n 1. Texte Agrégation limitée par diffusion interne 1 Le phénomène observé Un fût de déchets radioactifs est enterré secrètement dans le Cantal. Au bout de quelques années, il devient poreux et laisse

Plus en détail

Structures algébriques

Structures algébriques Structures algébriques 1. Lois de composition s Soit E un ensemble. Une loi de composition interne sur E est une application de E E dans E. Soient E et F deux ensembles. Une loi de composition externe

Plus en détail

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA

Plus en détail

I. Introduction. 1. Objectifs. 2. Les options. a. Présentation du problème.

I. Introduction. 1. Objectifs. 2. Les options. a. Présentation du problème. I. Introduction. 1. Objectifs. Le but de ces quelques séances est d introduire les outils mathématiques, plus précisément ceux de nature probabiliste, qui interviennent dans les modèles financiers ; nous

Plus en détail

OPTIMISATION À UNE VARIABLE

OPTIMISATION À UNE VARIABLE OPTIMISATION À UNE VARIABLE Sommaire 1. Optimum locaux d'une fonction... 1 1.1. Maximum local... 1 1.2. Minimum local... 1 1.3. Points stationnaires et points critiques... 2 1.4. Recherche d'un optimum

Plus en détail

Résolution d équations non linéaires

Résolution d équations non linéaires Analyse Numérique Résolution d équations non linéaires Said EL HAJJI et Touria GHEMIRES Université Mohammed V - Agdal. Faculté des Sciences Département de Mathématiques. Laboratoire de Mathématiques, Informatique

Plus en détail

LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION

LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION Sylvie Gervais Service des enseignements généraux École de technologie supérieure (sylvie.gervais@etsmtl.ca) Le laboratoire des condensateurs

Plus en détail

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. 14-3- 214 J.F.C. p. 1 I Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. Exercice 1 Densité de probabilité. F { ln x si x ], 1] UN OVNI... On pose x R,

Plus en détail

M2 IAD UE MODE Notes de cours (3)

M2 IAD UE MODE Notes de cours (3) M2 IAD UE MODE Notes de cours (3) Jean-Yves Jaffray Patrice Perny 16 mars 2006 ATTITUDE PAR RAPPORT AU RISQUE 1 Attitude par rapport au risque Nousn avons pas encore fait d hypothèse sur la structure de

Plus en détail

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur

Plus en détail

Une réponse (très) partielle à la deuxième question : Calcul des exposants critiques en champ moyen

Une réponse (très) partielle à la deuxième question : Calcul des exposants critiques en champ moyen Une réponse (très) partielle à la deuxième question : Calcul des exposants critiques en champ moyen Manière heuristique d'introduire l'approximation de champ moyen : on néglige les termes de fluctuations

Plus en détail

choisir H 1 quand H 0 est vraie - fausse alarme

choisir H 1 quand H 0 est vraie - fausse alarme étection et Estimation GEL-64943 Hiver 5 Tests Neyman-Pearson Règles de Bayes: coûts connus min π R ( ) + ( π ) R ( ) { } Règles Minimax: coûts connus min max R ( ), R ( ) Règles Neyman Pearson: coûts

Plus en détail

4 Distributions particulières de probabilités

4 Distributions particulières de probabilités 4 Distributions particulières de probabilités 4.1 Distributions discrètes usuelles Les variables aléatoires discrètes sont réparties en catégories selon le type de leur loi. 4.1.1 Variable de Bernoulli

Plus en détail

Probabilités sur un univers fini

Probabilités sur un univers fini [http://mp.cpgedupuydelome.fr] édité le 10 août 2015 Enoncés 1 Proailités sur un univers fini Evènements et langage ensemliste A quelle condition sur (a,, c, d) ]0, 1[ 4 existe-t-il une proailité P sur

Plus en détail

Capacité d un canal Second Théorème de Shannon. Théorie de l information 1/34

Capacité d un canal Second Théorème de Shannon. Théorie de l information 1/34 Capacité d un canal Second Théorème de Shannon Théorie de l information 1/34 Plan du cours 1. Canaux discrets sans mémoire, exemples ; 2. Capacité ; 3. Canaux symétriques ; 4. Codage de canal ; 5. Second

Plus en détail

I3, Probabilités 2014 Travaux Dirigés F BM F BM F BM F BM F B M F B M F B M F B M 20 20 80 80 100 100 300 300

I3, Probabilités 2014 Travaux Dirigés F BM F BM F BM F BM F B M F B M F B M F B M 20 20 80 80 100 100 300 300 I3, Probabilités 2014 Travaux Dirigés TD 1 : rappels. Exercice 1 Poker simplié On tire 3 cartes d'un jeu de 52 cartes. Quelles sont les probabilités d'obtenir un brelan, une couleur, une paire, une suite,

Plus en détail

TSTI 2D CH X : Exemples de lois à densité 1

TSTI 2D CH X : Exemples de lois à densité 1 TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun

Plus en détail

Raisonnement par récurrence Suites numériques

Raisonnement par récurrence Suites numériques Chapitre 1 Raisonnement par récurrence Suites numériques Terminale S Ce que dit le programme : CONTENUS CAPACITÉS ATTENDUES COMMENTAIRES Raisonnement par récurrence. Limite finie ou infinie d une suite.

Plus en détail

PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES

PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES Leçon 11 PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES Dans cette leçon, nous retrouvons le problème d ordonnancement déjà vu mais en ajoutant la prise en compte de contraintes portant sur les ressources.

Plus en détail

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux.

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux. UEO11 COURS/TD 1 Contenu du semestre Cours et TDs sont intégrés L objectif de ce cours équivalent a 6h de cours, 10h de TD et 8h de TP est le suivant : - initiation à l algorithmique - notions de bases

Plus en détail

Probabilités sur un univers fini

Probabilités sur un univers fini [http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur

Plus en détail

Couples de variables aléatoires discrètes

Couples de variables aléatoires discrètes Couples de variables aléatoires discrètes ECE Lycée Carnot mai Dans ce dernier chapitre de probabilités de l'année, nous allons introduire l'étude de couples de variables aléatoires, c'est-à-dire l'étude

Plus en détail

NOTATIONS PRÉLIMINAIRES

NOTATIONS PRÉLIMINAIRES Pour le Jeudi 14 Octobre 2010 NOTATIONS Soit V un espace vectoriel réel ; l'espace vectoriel des endomorphismes de l'espace vectoriel V est désigné par L(V ). Soit f un endomorphisme de l'espace vectoriel

Plus en détail

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La licence Mathématiques et Economie-MASS de l Université des Sciences Sociales de Toulouse propose sur les trois

Plus en détail

Dualité dans les espaces de Lebesgue et mesures de Radon finies

Dualité dans les espaces de Lebesgue et mesures de Radon finies Chapitre 6 Dualité dans les espaces de Lebesgue et mesures de Radon finies Nous allons maintenant revenir sur les espaces L p du Chapitre 4, à la lumière de certains résultats du Chapitre 5. Sauf mention

Plus en détail

Cours de méthodes de scoring

Cours de méthodes de scoring UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-

Plus en détail

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Roxane Duroux 1 Cadre de l étude Cette étude s inscrit dans le cadre de recherche de doses pour des essais cliniques

Plus en détail

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences

Plus en détail

Loi binomiale Lois normales

Loi binomiale Lois normales Loi binomiale Lois normales Christophe ROSSIGNOL Année scolaire 204/205 Table des matières Rappels sur la loi binomiale 2. Loi de Bernoulli............................................ 2.2 Schéma de Bernoulli

Plus en détail

Lois de probabilité. Anita Burgun

Lois de probabilité. Anita Burgun Lois de probabilité Anita Burgun Problème posé Le problème posé en statistique: On s intéresse à une population On extrait un échantillon On se demande quelle sera la composition de l échantillon (pourcentage

Plus en détail

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé Baccalauréat S ntilles-guyane 11 septembre 14 Corrigé EXERCICE 1 6 points Commun à tous les candidats Une entreprise de jouets en peluche souhaite commercialiser un nouveau produit et à cette fin, effectue

Plus en détail

6. Les différents types de démonstrations

6. Les différents types de démonstrations LES DIFFÉRENTS TYPES DE DÉMONSTRATIONS 33 6. Les différents types de démonstrations 6.1. Un peu de logique En mathématiques, une démonstration est un raisonnement qui permet, à partir de certains axiomes,

Plus en détail

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Baccalauréat ES/L Amérique du Sud 21 novembre 2013 Baccalauréat ES/L Amérique du Sud 21 novembre 2013 A. P. M. E. P. EXERCICE 1 Commun à tous les candidats 5 points Une entreprise informatique produit et vend des clés USB. La vente de ces clés est réalisée

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

La correction des erreurs d'enregistrement et de traitement comptables

La correction des erreurs d'enregistrement et de traitement comptables La correction des erreurs d'enregistrement et de traitement comptables Après l'étude des différents types d'erreurs en comptabilité (Section 1) nous étudierons la cause des erreurs (Section 2) et les techniques

Plus en détail

Estimation et tests statistiques, TD 5. Solutions

Estimation et tests statistiques, TD 5. Solutions ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études

Plus en détail

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

La survie nette actuelle à long terme Qualités de sept méthodes d estimation La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg

Plus en détail

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes. Introduction L'objectif de mon TIPE est la reconnaissance de sons ou de notes de musique à l'aide d'un réseau de neurones. Ce réseau doit être capable d'apprendre à distinguer les exemples présentés puis

Plus en détail

Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de

Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de l espérance d utilité Olivier Bos olivier.bos@u-paris2.fr

Plus en détail

Fonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre

Fonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre IUFM du Limousin 2009-10 PLC1 Mathématiques S. Vinatier Rappels de cours Fonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre 1 Fonctions de plusieurs variables

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

Perrothon Sandrine UV Visible. Spectrophotométrie d'absorption moléculaire Étude et dosage de la vitamine B 6

Perrothon Sandrine UV Visible. Spectrophotométrie d'absorption moléculaire Étude et dosage de la vitamine B 6 Spectrophotométrie d'absorption moléculaire Étude et dosage de la vitamine B 6 1 1.But et théorie: Le but de cette expérience est de comprendre l'intérêt de la spectrophotométrie d'absorption moléculaire

Plus en détail

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme? Exercices Alternatifs Quelqu un aurait-il vu passer un polynôme? c 2004 Frédéric Le Roux, François Béguin (copyleft LDL : Licence pour Documents Libres). Sources et figures: polynome-lagrange/. Version

Plus en détail

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme? Exercices Alternatifs Quelqu un aurait-il vu passer un polynôme? c 2004 Frédéric Le Roux, François Béguin (copyleft LDL : Licence pour Documents Libres). Sources et figures: polynome-lagrange/. Version

Plus en détail

Université Paris-Dauphine DUMI2E 1ère année, 2009-2010. Applications

Université Paris-Dauphine DUMI2E 1ère année, 2009-2010. Applications Université Paris-Dauphine DUMI2E 1ère année, 2009-2010 Applications 1 Introduction Une fonction f (plus précisément, une fonction réelle d une variable réelle) est une règle qui associe à tout réel x au

Plus en détail

La conversion de données : Convertisseur Analogique Numérique (CAN) Convertisseur Numérique Analogique (CNA)

La conversion de données : Convertisseur Analogique Numérique (CAN) Convertisseur Numérique Analogique (CNA) La conversion de données : Convertisseur Analogique Numérique (CAN) Convertisseur Numérique Analogique (CNA) I. L'intérêt de la conversion de données, problèmes et définitions associés. I.1. Définitions:

Plus en détail

Table des matières. I Mise à niveau 11. Préface

Table des matières. I Mise à niveau 11. Préface Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3

Plus en détail

LE PROBLÈME DE RECHERCHE ET LA PROBLÉMATIQUE

LE PROBLÈME DE RECHERCHE ET LA PROBLÉMATIQUE LE PROBLÈME DE RECHERCHE ET LA PROBLÉMATIQUE Un problème de recherche est l écart qui existe entre ce que nous savons et ce que nous voudrions savoir à propos d un phénomène donné. Tout problème de recherche

Plus en détail

I. Polynômes de Tchebychev

I. Polynômes de Tchebychev Première épreuve CCP filière MP I. Polynômes de Tchebychev ( ) 1.a) Tout réel θ vérifie cos(nθ) = Re ((cos θ + i sin θ) n ) = Re Cn k (cos θ) n k i k (sin θ) k Or i k est réel quand k est pair et imaginaire

Plus en détail

Commun à tous les candidats

Commun à tous les candidats EXERCICE 3 (9 points ) Commun à tous les candidats On s intéresse à des courbes servant de modèle à la distribution de la masse salariale d une entreprise. Les fonctions f associées définies sur l intervalle

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

Chapitre 1 Régime transitoire dans les systèmes physiques

Chapitre 1 Régime transitoire dans les systèmes physiques Chapitre 1 Régime transitoire dans les systèmes physiques Savoir-faire théoriques (T) : Écrire l équation différentielle associée à un système physique ; Faire apparaître la constante de temps ; Tracer

Plus en détail

Statistique Descriptive Élémentaire

Statistique Descriptive Élémentaire Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier

Plus en détail

Master Modélisation Aléatoire Paris VII, Cours Méthodes de Monte Carlo en nance et C++, TP n 2.

Master Modélisation Aléatoire Paris VII, Cours Méthodes de Monte Carlo en nance et C++, TP n 2. Master Modélisation Aléatoire Paris VII, Cours Méthodes de Monte Carlo en nance et C++, TP n 2. Techniques de correction pour les options barrières 25 janvier 2007 Exercice à rendre individuellement lors

Plus en détail

Estimation: intervalle de fluctuation et de confiance. Mars 2012. IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Estimation: intervalle de fluctuation et de confiance. Mars 2012. IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison Estimation: intervalle de fluctuation et de confiance Mars 2012 IREM: groupe Proba-Stat Estimation Term.1 Intervalle de fluctuation connu : probabilité p, taille de l échantillon n but : estimer une fréquence

Plus en détail

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies Régis Boulet Charlie Demené Alexis Guyot Balthazar Neveu Guillaume Tartavel Sommaire Sommaire... 1 Structure

Plus en détail

Principe de symétrisation pour la construction d un test adaptatif

Principe de symétrisation pour la construction d un test adaptatif Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université

Plus en détail

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision Page n 1. Tests du χ 2 une des fonctions des statistiques est de proposer, à partir d observations d un phénomène aléatoire (ou modélisé comme tel) une estimation de la loi de ce phénomène. C est que nous

Plus en détail

Date : 18.11.2013 Tangram en carré page

Date : 18.11.2013 Tangram en carré page Date : 18.11.2013 Tangram en carré page Titre : Tangram en carré Numéro de la dernière page : 14 Degrés : 1 e 4 e du Collège Durée : 90 minutes Résumé : Le jeu de Tangram (appelé en chinois les sept planches

Plus en détail

Variables Aléatoires. Chapitre 2

Variables Aléatoires. Chapitre 2 Chapitre 2 Variables Aléatoires Après avoir réalisé une expérience, on ne s intéresse bien souvent à une certaine fonction du résultat et non au résultat en lui-même. Lorsqu on regarde une portion d ADN,

Plus en détail