L estimation du modèle a priori Décompter les ddl ------------ François Cheptou Juin 004 Dans le programme de mathématiques BTS Chimiste, trois modèles a priori sont étudiés. ) = µ (modèle simple) ) = α x + β (modèle affine droite des moindres carrés) 3) = α 0 + α x + α x + α x x (modèle polnomial du premier degré plans d expérience) L objectif est toujours le même ; à partir de n mesures ou expériences :,,, n il s agit d estimer au mieux le modèle théorique et si possible l erreur expérimentale. Ce dernier point nécessite un savoir-faire : décompter les ddl (degrés de liberté) Rappelons que seule la variable est à étudier ou à expliquer, les valeurs de la variable x ou des variables x, x, x sont données (variables explicatives). Le principe est simple : estimer le ou les coefficients du modèle théorique, recalculer la réponse à partir du modèle estimé, faire l examen des écarts entre la réponse observée d une part et la réponse recalculée d autre part. Remarque : dans un souci de clarté, les lettres grecques désignent les paramètres inconnus.
Partie A Les degrés de liberté ou ddl I- Une approche intuitive, la dimension d un ensemble de points Le vocabulaire D, 3D étant suffisamment vulgarisé, intuitivement on précise la dimension des ensembles de points usuels : le plan, l espace, la droite, le point... Ensuite, la démarche est simple. Etape : Un point O et un vecteur unitaire i r L ensemble des points M d abscisse x est une droite. M (x) de dimension Soit un ensemble { } Introduisons une équation ie une «contrainte» par exemple x = L ensemble des points M d abscisse x vérifiant x = se réduit à un point. M ( x) et x = de dimension 0, plus précisément de dimension -=0 Soit un ensemble { } Etape : Un point O et deux vecteurs unitaires ( i r ; j r ) non colinéaires ie le repère d un plan ) L ensemble des points M de coordonnées (x ; x ) est un plan. Soit un ensemble de dimension Un point M (x ) d une droite, donc de dimension «plus» un point M (x ) d une autre droite «indépendante» de la première de dimension également, définissent un point M (x ; x ) unique du plan de dimension et réciproquement, d où l intérêt de la formule snoptique : += c est une addition vectorielle L espace, le plan, la droite, le point, et pourquoi pas l ensemble vide, logiquement de dimension -
Snoptique += X M (x ) M (x ; x ) O M (x ) X x + x ) Introduisons une équation ie une «contrainte» par exemple = 0, 5 x + x L ensemble des points M de coordonnées (x ; x ) vérifiant = 0, 5 est une droite. x + x Soit un ensemble M ( x; x ) et = 0,5 de dimension plus précisément +-= 3) Introduisons une autre équation «indépendante de la première» par exemple x + x = 5 L ensemble des points M de coordonnées (x ; x ) vérifiant x + x = 0,5 est le point d intersection de deux droites de dimension 0. x + x = 5 x + x L ensemble M ( x; x) et = 0,5 et x + x = 5 est de dimension +--=0 Question : quelle est la dimension des ensembles de points suivants { M ( x ; x ) et 4x + x = 0 et x + x = 5} rep M x ; x ; x ) et x + x 5 rep { ( 3 = } { M ( x ; x; x3) et x + x = 5 et x + x + x3 = 5}? rep Autre question : quelle est la dimension de { x ; x ) et x + x = 6 et x + x 5} M? rep - ( =
II- Une mesure Etape Soit Y la variable aléatoire qui, à une expérience associe la mesure observée. L ensemble des «possibles» ou univers est un ensemble de dimension. Y Etape Soit (Y ; Y ) le couple de variables aléatoires qui, à deux expériences indépendantes associe le couple de mesures ( ; ) observées. L ensemble des «possibles» ou univers est un ensemble de dimension. Snoptique += Y ( ; ) Y Etape 3 Soit (Y ; Y ; Y 3 ; ; Y n ) une suite de n variables aléatoires indépendantes. L ensemble des «possibles» { ( ; ; 3 ; ; n ) } est un ensemble de dimension +++..+=n Etape 4 Imposons une contrainte ou une relation entre les n mesures observées par exemple le calcul préalable + +... + de la moenne : n = n
L ensemble des «possibles» { ( ; ; 3 ; ; n ) et dimension +++..+-=n - + +... + n = } est un ensemble de n Etape 5 La dimension de l ensemble des «possibles» est appelée le nombre de ddl Pour décompter les ddl associés à un calcul statistique, il suffit de repérer le nombre n de mesures indépendantes effectuées et le nombre p de relations indépendantes liant ces mesures. Exemple Le calcul de la somme S de n mesures ddl = ++ +=n S = + +... + n Exemple Le calcul de la somme Q des carrés des écarts à la moenne ddl = ++ +-=n Q = ( ) +... + ( n ) Exemple 3 Le calcul de la somme Q des carrés des écarts à la droite des moindres carrés Q = ( ax b) +... + ( n axn b) a et b sont des calculs préalables et donc, des contraintes liant les n observations ( ; ; 3 ; ; n ) ddl = ++ +--=n Conclusion : l ensemble des «possibles» de la mesure est de dimension, d où la nécessité de diviser ces sommes par le nombre de ddl. Ainsi, une estimation s de l écart entre la mesure observée et la mesure «théorique» est donnée par la célèbre expression : s = Q ddl (estimation de l erreur expérimentale)
Partie B L estimation d un modèle a priori I- = µ (modèle simple) On veut estimer une grandeur µ à partir de n mesures indépendantes et répétées : ( ; ; 3 ; ; n ) La valeur moenne est la mieux placée. (Ce qui se démontre aisément en statistiques) D où, = est une estimation du modèle théorique = µ L estimation s de l erreur expérimentale. Disposition des calculs. Réponse observée i Réponse recalculée i Carré de l écart i ( ) ( ). n ( n ) ( ) i =... s =... Q =... ddl = Remarque : on retrouve un résultat connu ( i ) s = n
II- = α x + β ( modèle affine) On cherche à expliquer l évolution d une réponse à partir d une variable x dite explicative. Le modèle supposé est affine : = α x + β On dispose de n mesures i obtenues de la manière suivante : à x=x, on obtient à x=x, on obtient... à x=x n, on obtient n La droite des moindres carrés = a x + b est la mieux placée pour estimer la droite théorique = α x + β (ce qui se démontre aisément en statistiques) variable à expliquer =αx+β n =ax+b x variable explicative x x x n L estimation s de l erreur expérimentale. Disposition des calculs. Réponse observée i Variable explicative x i Réponse recalculée i Carré de l écart x = ax + b ( x = ax + b (. n x n = ax b ( ) i i ) ) n n + ( n n ) a =... b =... Q =... ddl = s =... Remarque : on retrouve un résultat connu s = ( i axi b) n sous Excel : ERREUR.TYPE.XY (estimation de l écart résiduel moen entre les points et la droite théorique)
III- = α 0 + α x + α x + α x x (modèle polnomial du premier degré) On cherche à expliquer l évolution d une réponse à partir de deux variables x et x dites explicatives. x (resp. x ) = - au niveau bas du facteur F (resp. F ) x (resp. x ) = + au niveau haut du facteur F (resp. F ) Le modèle supposé est un polnôme du premier degré : = α 0 + α x + α x + α x x trois variables peuvent être envisagées (cf programme) Plan initial On dispose de 4 réponses i obtenues de la manière suivante (Yates): à x = - et x = -, on obtient à x = + et x = -, on obtient à x = - et x = +, on obtient 3 à x = + et x = +, on obtient 4 permettant de calculer a 0, a, a, et a (estimations des effets α 0, α, α, et α ) L équation ainsi obtenu = a 0 + a x + a x + a x x estime le modèle théorique = α 0 + α x + α x + α x x Y variable à expliquer = α 0 + α x + α x + α x x = a 0 + a x + a x + a x x - - 3 4 X variable explicative X variable explicative L ensemble des «possibles» { ( ; ; ; et a et a = et a = et a = } 3 4 ) 0 =
est de dimension +++----=0 ddl = 0, il n est pas possible d estimer l erreur expérimentale. Effets négligeables et mesures au «centre» Pour estimer l erreur expérimentale, il est donc nécessaire de retenir un modèle renfermant un nombre moins important de paramètres inconnus et/ou d ajouter des mesures complémentaires (au centre par exemple). L estimation s de l erreur expérimentale. Disposition des calculs. PLAN INITIAL AUTRES Réponse observée i Variables Réponse recalculée i Carré de l écart explicatives - - = a0 +... ( + - = a0 +... ( 3 - + 3 = a0 +... 4 + + = a... 4 0 + 5 = a0 5 0 0... n = a +... n 0 ) ) ( ) n n ( ) i i a 0 =... a =... a =... a =... Q =... ddl = s =... F.Cheptou Professeur de mathématiques ETSCO francois.cheptou@uco.fr