Chapitre 15 Variables Dépendantes Limitées et Qualitatives

Dimension: px
Commencer à balayer dès la page:

Download "Chapitre 15 Variables Dépendantes Limitées et Qualitatives"

Transcription

1 Chapitre 15 Variables Dépendantes Limitées et Qualitatives 15.1 Introduction Les modèles de régression supposent de manière implicite que la variable dépendante, peut-être après une transformation logarithmique ou autre, peut prendre n importe quelle valeur sur la droite des réels. Bien que cette supposition ne soit pas strictement correcte pour les données économiques, elle est assez souvent raisonnable. Cependant, il s agit d une hypothèse acceptable lorsque la variable dépendante peut prendre n importe quelle valeur spécifique de probabilité signifacativement supérieure à zéro. Les économistes ont fréquemment à faire à de tels cas. Les plus communément rencontrés sont les cas pour lesquels la variable dépendante peut prendre seulement deux valeurs. Par exemple, une personne peut faire partie de la population active ou non, un ménage peut être propriétaire ou locataire du logis où il vit, un débiteur peut faire défaut ou non à un prêt, un conducteur peut se déplacer pour son travail ou pour son loisir, et ainsi de suite. Ces cas constituent des exemples de variables binaires dépendantes. Si nous désirons expliquer des variables économiques comme celles-ci dans un modèle économétrique, nous devons tenir compte de leur nature discrète. Les modèles de la sorte sont appelés modèles à réponses qualitatives, et sont habituellement estimés par la méthode du maximum de vraisemblance. Dans le cas le plus simple et le plus fréquent, la variable dépendante représente une ou deux alternatives. Elles sont codées de façon conventinnelle par 0 et 1, une convention qui se révèle être très pratique. Les modèles qui tentent d expliquer les variables 0-1 sont souvent appelés modèles à réponse binaire ou, moins souvent, modèles à choix binaire. Ils sont très fréquemment employés en économie appliquée et dans de nombreux autres domaines où s applique l économétrie, comme les exemples précédents servent à l illustrer. Les modèles de régression sont aussi inappropriés pour traiter les modèles comprenant des variables dépendantes limitées, pour lesquels il existe une grande quantité de variétés. Parfois une variable dépendante peut être continue sur un ou plusieurs intervalles de la droite des réels mais peut prendre une ou plusieurs valeurs avec une probabilité finie. Par exemple, les 511

2 512 Variables Dépendantes Limitées et Qualitatives dépenses de consommation portant sur certaines catégories de biens et services sont généralement contraintes à être non négatives. Ainsi, si nous observons les dépenses portant sur une certaine catégorie pour un échantillon de biens ménagers, il est très probable que ces dépenses seront nulles pour certains biens ménagers et positives pour d autres. Comme il existe une probabilité positive qu une valeur particulière, zéro, se présente dans les données les modèles de régression ne sont pas appropriés pour ce type de données. Un autre type de modèle à variables dépendantes limitées survient quand seulement certains résultats (tels que les résultats positifs dans cet exemple) sont observés. Ceci signifie que l échantillon ne sera pas aléatoire. Dans ce chapitre, nous traitons à la fois les modèles à réponse qualitative et les modèles à variables dépendantes limitées. Il s agit d un domaine dans lequel il y a eu une énorme quantité de recherche durant les 20 dernières années, et c est pourquoi notre traitement couvre seulement quelques uns des modèles les plus basiques. Nous nous concentrerons tout d abord sur les modèles à réponse binaire, parce qu ils sont à la fois les modèles les plus simples et les plus fréquents. Ils seront discutés dans les trois prochaines sections. Ensuite, dans la Section 15.5, nous discuterons brièvement des modèles à réponses qualitatives pour les cas comprenant plus de deux réponses différentes. Finalement, dans les trois dernières sections, nous portons notre attention sur certains des modèles les plus simples qui concernent les variables dépendantes limitées Les Modèles à Réponse Binaire Dans un modèle à réponse binaire, la valeur de la variable dépendante y t peut prendre seulement deux valeurs, 1 et 0, qui indiquent si un certain événement se produit ou pas. Nous pouvons proposer que y t = 1 indique que l événement s est produit pour l observation t et que y t = 0 indique que l événement ne s est pas produit. Soit P t la probabilité (conditionnelle) que l événement se soit produit. Ainsi un modèle à réponse binaire essaie vraiment de modéliser la probabilité P t conditionnelle à un certain ensemble d informations, disons Ω t, qui se compose de variables prédéterminées et exogènes. Ainsi la spécification de y t qui est soit 0 soit 1 est très commode, parce que la probabilité P t constitue alors simplement l espérance de y t conditionnelle à l ensemble d information Ω t : P t Pr(y t = 1 Ω t ) = E(y t Ω t ). L objectif d un modèle à réponse binaire est de modéliser cette espérance conditionnelle. Partant de cette perspective, il est clair qu un modèle de régression linéaire est moins bien adapté qu un modèle à réponse binaire. Supposons que X t désigne un vecteur ligne de dimension k des variables qui appartiennent à l ensemble d information Ω t, qui inclut un terme constant ou l équivalent.

3 15.2 Les Modèles à Réponse Binaire 513 Alors un modèle de régression linéaire spécifirait E(y t Ω t ) pour X t β. Mais E(y t Ω t ) est une probabilité, et les probabilités doivent être comprises entre 0 et 1. La quantité X t β n est pas contrainte de la sorte et par conséquent, elle ne peut pas être interprétée comme une probabilité. Néanmoins, beaucoup de travaux empiriques (pour la plupart plus anciens) utilisent simplement les OLS pour estimer ce qui est appelé (plutôt de manière maladroite) le modèle de probabilité linéaire, 1 qui est le modèle y t = X t β + u t. Etant donné que des modèles bien meilleurs sont disponibles et qu il est facile de les estimer en utilisant la technologie informatique moderne, ce type de modèle n est presque pas recommandable. Même s il arrive que X t β soit compris entre 0 et 1 pour un β quelconque et toutes les observations dans un échantillon particulier, il est impossible de contraindre X t β à rester dans cet intervalle pour toutes les valeurs possibles de X t, à moins que les valeurs prises par les variables indépendantes soient limitées d une certaine manière (par exemple, elles peuvent toutes être des variables muettes). Ainsi le modèle de probabilité linéaire ne constitue pas un moyen judicieux pour modéliser les probabilités conditionnelles. Plusieurs modèles à réponse binaire pertinents sont disponibles et sont très faciles à traiter. La subtilité consiste à utiliser une fonction de transformation F (x) qui comporte les propriétés F ( ) = 0, F ( ) = 1, et (15.01) f(x) F (x) x > 0. (15.02) Ainsi F (x) est une fonction monotone croissante qui s applique de la droite des réels vers l intervalle 0-1. Certaines fonctions de distribution cumulées comportent ces propriétés, et nous discuterons brièvement de certains exemples spécifiques. En utilisant des spécifications variées pour la fonction de transformation, nous pouvons modéliser l espérance conditionnelle de y t de plusieurs manières. Les modèles à réponse binaire dont nous discuterons se composent d une fonction de transformation F (x) appliquée à une fonction indice qui dépend des variables indépendantes et des paramètres du modèle. Une fonction indice est simplement une fonction qui comporte les propriétés d une fonction de régression, soit linéaire soit non linéaire. Ainsi une spécification très générale d un modèle à réponse binaire est E(y t Ω t ) = F ( h(x t, β) ), 1 Consulter, par exemple, Bowen et Finegan (1969).

4 514 Variables Dépendantes Limitées et Qualitatives où h(x t, β) est la fonction indice. Une spécification plus restrictive, mais plus fréquente, est E(y t Ω t ) = F (X t β). (15.03) Dans ce cas, la fonction indice X t β est linéaire et E(y t Ω t ) est simplement une transformation non linéaire. Bien que X t β puisse en principe prendre n importe quelle valeur sur la droite des réels, F (X t β) doit être comprise entre 0 et 1 d après la propriété (15.01). Parce que F ( ) est une fonction non linéaire, les changements dans les valeurs de X ti, qui sont les éléments de X t, affectent nécessairement E(y t Ω t ) d une manière non linéaire. De façon plus spécifique, quand P t E(y t Ω t ) est fournie par (15.03), sa dérivée par rapport à X ti est P t X ti = F (X tβ) X ti = f(x t β)β i. (15.04) Pour les fonctions de transformation qui sont presque toujours employées, f(x t β) atteint son maximum en zéro et décroit ensuite quand X t β s éloigne de zéro. Ainsi, (15.04) nous indique que l effet sur P t d un changement d une des variables dépendantes est maximum lorsque P t =.5 et minimum lorsque P t est proche de 0 ou 1. Quand les modèles à réponse binaire sont utilisés dans un travail appliqué, la fonction indice linéaire X t β est presque toujours employée, parmi une des deux spécifications pour F ( ). Les modèles qui en résultent sont appelés modèle probit et modèle logit. Pour le modèle probit, la fonction de transformation F (x) est la fonction de distribution cumulée de la loi normale standard Φ(x) x 1 2π exp ( 1 2 X2) dx. Comme Φ(x) est une fonction de répartition, elle satisfait automatiquement les conditions (15.01) et (15.02). Le modèle probit peut être écrit comme P t E(y t Ω t ) = Φ(X t β). Bien qu il n existe aucune expression bornée pour Φ(x), elle est facilement évaluée numériquement, et sa dérivée première est naturellement la fonction de densité de la loi normale standard φ(x) = 1 2π exp ( 1 2 x2). Le modèle probit peut provenir d un modèle comprenant une variable y t non observée, ou latente. Supposons que y t = X t β + u t, u t NID(0, 1). (15.05)

5 15.2 Les Modèles à Réponse Binaire 515 Nous observons seulement le signe de y t, qui détermine la valeur de la variable binaire observée y t selon la relation y t = 1 si y t > 0 et y t = 0 si y t 0. (15.06) Par exemple, nous pourrions imaginer que y t est un indice de l utilité (nette) obtenue de certaine action. Si l action fournit une utilité positive, elle sera retenue; et ne le sera pas si l action fournit une utilité négative ou nulle. Comme nous observons seulement si l action est ou n est pas retenue, nous observons seulement le signe de y t. De ca fait, nous pouvons normaliser la variance de u t à l unité. Si u t avait réellement une autre variance quelconque, disons σ 2, la division de y t, β, et u t par σ fournirait un modèle d observation identique à celui d origine. Maintenant, nous pouvons nous demander à quoi correspond la probabilité y t = 1. Certaines manipulations simples fournissent Pr(y t = 1) = Pr(y t > 0) = Pr(X t β + u t > 0) = 1 Pr(u t X t β) = 1 Φ( X t β) = Φ(X t β). (15.07) La dernière égalité dans (15.07) utilise le fait que la fonction de densité normale est symétrique par rapport à zéro. Le résultat final, Φ(X t β), est simplement la probabilité que nous obtiendrions en remplaçant F ( ) par Φ( ) dans (15.03). Ainsi nous avons dérivé le modèle probit à partir du modèle à variable latente composé de (15.05) et (15.06). Le fait que le modèle probit puisse être dérivé de cette manière constitue une de ses caractéristiques les plus attrayantes. Le modèle logit est très similaire au modèle probit mais possède un nombre de caractéristiques qui le rendent plus facile à utiliser. Pour le modèle logit, la fonction F (x) est la fonction logistique qui a comme dérivée première Λ(x) (1 + e x ) 1 = λ(x) ex 1 + e x, e x (1 + e x ) 2 = Λ(x)Λ( x). La seconde égalité se révèlera très utile plus tard. Le modèle est plus facilement dérivé en supposant que ( ) Pt log = X t β, 1 P t qui indique que le logarithme des probabilités est égal à X t β. En résolvant par rapport à P t, nous trouvons que P t = exp(x tβ) 1 + exp(x t β) = ( 1 + exp( X t β) ) 1 = Λ(Xt β).

6 516 Variables Dépendantes Limitées et Qualitatives Il est aussi possible de dériver le modèle logit à partir d un modèle à variable latente comme (15.05) et (15.06) mais avec des erreurs qui suivent une distribution à valeur extrême au lieu d une normale; consulter, parmi d autres, Domencich et McFadden (1975), McFadden (1984), et Train (1986). Dans la pratique, les modèles logit et probit tendent à fournir des résultats assez similaires. Dans la plupart des cas, la seule différence réelle entre eux réside dans la manière dont les éléments de β sont gradués. Cette différence dans la graduation survient parce que la variance de la distribution lorsque la fonction logistique est la fonction de répartition est π 2 /3, tandis que celle de la loi normale standard est naturellement égale à l unité. Ainsi les estimations logit tendent toutes à être supérieures aux estimations probit, habituellement d un facteur juste inférieur à π/ 3. 2 La Figure 15.1 illustre les fonctions de répartition des loi normale standard, logistique, et logistique regraduée pour obtenir une variance unitaire. La similitude entre la fonction de répartition de la loi normale et la fonction logistique regraduée est frappante. Au vu de leurs propriétés similaires, il est peut-être curieux qu à la fois les modèles logit et probit continuent à être largement employés, tandis que des modèles véritablement différents des deux précédents sont très rarement rencontrés. Il existe autant de manières de spécifier de tels modèles qu il existe de choix plausibles pour la fonction de transformation F (x). Par exemple, un tel choix est F (x) = π 1 arctan(x) (15.08) Comme il s agit de la fonction de répartition de Cauchy, sa dérivée est f(x) = 1 π(1 + x 2 ), qui est la densité de Cauchy (consulter la Section 4.6). Comme le comportement de la fonction de distribution de Cauchy dans les queues est très différent de celui d autres fonctions de distribution comme Φ(x) ou Λ(x), il existe au moins la possibilité qu un modèle à réponse binaire basé sur (15.08) soit plus ou moins performant qu un modèle logit ou probit. D un autre côté, il existe une infime probabilité pour que ces deux modèles fournissent des résultats qui diffèrent de manière significative, à moins que la taille de l échantillon soit en fait très importante. 2 Amemiya (1981) suggère que 1.6, plutôt que π/ 3 = 1.81 peut être une meilleure estimation du facteur par lequel les estimations logit tendent à excéder les estimations probit. Greene (1990a) remarque aussi qu une justification pour cette régularité est que φ(0)/λ(0) = 1.6. Souvenons-nous de (15.04) que les dérivées de P t par rapport à X ti sont égales à f(x t β)β i. Si X t β est approximativement nul en moyenne et que les modèles logit et probit prédisent le même effet sur P t pour une variation donnée des X ti, alors les coefficients pour le modèle logit doivent être approximativement 1.6 fois ceux du modèle probit. On peut s attendre à ce que cette approximation s adapte moins bien quand la valeur moyenne de P t est loin de.5.

7 15.3 Estimation des Modèles à Réponse Binaire F (x) 0.8 Logistique regraduée.... Normale standard Logistique Figure 15.1 Trois choix possibles de F (x) x Les trois choix pour F ( ) que nous avons discutés sont symétriques par rapport à zéro. Cela signifie qu elles ont la propriété que 1 F (x) = F ( x), qui implique que f(x) = f( x). Il s agit parfois d une propriété commode, mais il n existe pas de raison a priori pour s y tenir. Les choix pour F ( ) qui ne possèdent pas cette propriété fourniront potentiellement des résultats très différents de ceux produits par les modèles logit et probit. Une manière d obtenir le même effet consiste à spécifier le modèle comme E(y t Ω t ) = F ( h(x t β) ), où F ( ) est Φ( ) ou Λ( ), et h( ) est une transformation non linéaire. Ceci suggère une façon de tester la validité de l hypothèse de symétrie oblique, sujet que nous aborderons dans la Section Estimation des Modèles à Réponse Binaire A présent, le moyen de loin le plus communément employé pour estimer les modèles à réponse binaire est l utilisation de la méthode du maximum de vraisemblance. Nous limiterons notre attention à cette méthode et supposerons, pour simplifier, que la fonction indice est simplement X t β. Ensuite, selon le modèle à réponse binaire (15.03), F (X t β) est la probabilité que y t = 1 et 1 F (X t β) est la probabilité que y t = 0. Ainsi, si y t = 1, la contribution au logarithme de la fonction de vraisemblance pour l observation t est

8 518 Variables Dépendantes Limitées et Qualitatives log ( F (X t β) ), tandis que si y t = 0, la contribution est log ( 1 F (X t β) ). En conséquence, la fonction de vraisemblance est l(y, β) = n ( y t log ( F (X t β) ) + (1 y t ) log ( 1 F (X t β) )). (15.09) t=1 Cette fonction est globalement concave à chaque fois que log ( F (x) ) et log ( 1 F (x) ) sont des fonctions concaves de l argument x; consulter Pratt (1981). Cette condition est satisfaite par de nombreux modèles à réponse binaire, incluant les modèles logit et probit. Par conséquent, les fonctions de logvraisemblance pour ces modèles sont très faciles à maximiser numériquement. 3 Les conditions du premier ordre pour un maximum de (15.09) sont n t=1 (y t ˆF t ) ˆf t X ti ˆF t (1 ˆF t ) = 0, i = 1,..., k, (15.10) où ˆF t F (X t ˆβ) et ˆft f(x t ˆβ), avec ˆβ qui désigne le vecteur des estimations ML. Toutes les fois que la fonction de logvraisemblance est globalement concave, ces conditions du premier ordre définissent un maximum unique si elles sont tout à fait satisfaites. Nous pouvons vérifier que les modèles logit, probit, et de nombreux autres modèles à réponse binaire satisfont les conditions de régularité nécessaires pour que les estimations ˆβ soient convergentes et asymptotiquement normales, avec une matrice de covariance asymptotique donnée par l inverse de la matrice d information selon la façon habituelle. Consulter, par exemple, Gouriéroux et Monfort (1981). Dans le cas du modèle logit, les conditions du premier ordre (15.10) se simplifient n ( ) yt Λ(X t ˆβ) Xti = 0, i = 1,..., k, t=1 parce que λ(x) = Λ(x) ( 1 Λ(x) ). Notons que les conditions (15.10) ressemblent aux conditions du premier ordre de l estimation par moindres carrés pondérés du modèle de régression non linéaire y t = F (X t β) + e t, (15.11) avec des poids donnés par ( F (X t β) ( 1 F (X t β) )) 1/2. 3 Dans le cas usuel, où F ( ) est symétrique-oblique, il est plus judicieux d évaluer log(f ( X t β)) plutôt que log(1 F (X t β)) lors de l écriture de programmes informatiques. Ceci évite le risque que 1 F (X t β) soit évalué de manière très imprécise lorsque F (X t β) est très proche de l unité. Bien que F ( ) ne nécessite pas d être symétrique-oblique, nous retiendrons la notation la plus générale.

9 15.3 Estimation des Modèles à Réponse Binaire 519 Cela est logique du fait que la variance de l aléa dans (15.11) est E(e 2 t ) = E ( y t F (X t β) ) 2 = F (X t β) ( 1 F (X t β) ) 2 + ( 1 F (Xt β) )( F (X t β) ) 2 = F (X t β) ( 1 F (X t β) ). Ainsi, une manière d obtenir des estimations ML de n importe quel modèle à réponse binaire consiste à appliquer par itérations les moindres carrés non linéaires repondérés à (15.11) ou à tout modèle de régression non linéaire approprié si la fonction indice n est pas X t β. Cependant, pour la plupart des modèles, cette stratégie ne constitue pas la meilleure approche. Une approche adéquate est exposée dans la prochaine section. Comme le ML est équivalent à une forme de NLS pondérés pour les modèles à réponse binaire, il est évident que la matrice de covariance asymptotique pour n 1/2 ( ˆβ β 0 ) doit être ( ) 1 n 1, X Ψ(β 0 )X où X est une matrice de dimension n k avec comme ligne type X t et comme élément type X ti, et Ψ(β) est une matrice diagonale avec comme élément diagonal type f 2 (X t β) Ψ(X t β) = F (X t β) ( ). (15.12) 1 F (X t β) Le numérateur reflète le fait que la dérivée de F (X t β) par rapport à β i est f(x t β)x ti, et le dénominateur est simplement la variance de e t dans (15.11). Dans le cas du modèle logit, Ψ(X t β) se simplifie en λ(x t β). Cette matrice de covariance asymptotique peut aussi être obtenue en prenant l inverse de la matrice d information. Comme d habitude, celle-ci est égale à l espérance de l opposé de n 1 fois la matrice Hessienne mais également à l espérance du produit extérieur du gradient. La matrice d information est simplement I(β) 1 n X Ψ(β)X, (15.13) où Ψ(β) est définie par (15.12). Par exemple, à partir de (15.10) il est aisé de voir que l élément type de la matrice n 1 G (β)g(β), où G(β) est la matrice CG, est 1 n n t=1 (( yt F (X t β) ) f(x t β) F (X t β) ( 1 F (X t β) ) ) 2 X tix tj. Montrer que l espérance de cette expression est un élément type de la matrice d information (15.13) constitue un bon exercice.

10 520 Variables Dépendantes Limitées et Qualitatives 1.0 Ψ(X t β) 0.8 Logit regradué Probit X t β Figure 15.2 Les poids pour les modèles probit et logit regradué Décéler l analogie entre les estimations provenant d un modèle à réponse binaire et les estimations par moindres carrés pondérés est très révélateur. Dans le cas des moindres carrés, chaque observation est pondérée par un poids égal quand la matrice d information est formée. Dans le cas à réponse binaire, d un autre côté, certaines observations sont pondérées beaucoup plus que d autres, parce que les poids Ψ(X t β) définis dans (15.12) peuvent différer fortement. Si on graphe ces pondérations comme une fonction de X t β pour les modèles probit ou logit, nous trouvons que le poids maximum sera associé aux observations pour lesquelles X t β = 0, ce qui implique que P t =.5, tandis qu un poids relativement faible sera associé aux observations pour lesquelles P t est proche de 0 ou 1. Ceci est logique car lorsque P t est proche de 0 ou 1, un changement dans β aura un faible impact sur P t, tandis que lorsque P t est proche de.5, un changement aura un effet beaucoup plus important. Par conséquent les observations du dernier type fournissent beaucoup plus d information que les observations du premier type. Dans la Figure 15.2, les pondérations (15.12) sont graphées pour les cas probit et logit, (la dernière a été regraduée pour avoir une variance unitaire) comme des fonctions de l indice X t β. Notons que les différences entre ces deux modèles sont plus frappantes qu elles ne le furent dans la Figure Le modèle logit associe plus de poids aux observations pour lesquelles X t β est proche ou loin de zéro, tandis que le modèle probit associe des poids plus importants aux observations pour lesquelles X t β prend des valeurs intermédiaires (approximativement, entre 0.8 et 3.0). Cependant, les

11 15.3 Estimation des Modèles à Réponse Binaire 521 différences qui sont apparentes dans la figure semblent rarement prendre plus d importance dans la pratique. Comme nous l avons vu, nous pouvons penser qu une variable dépendante binaire provienne d un modèle à variable latente tel que celui donné par (15.05) et (15.06). Il est intéressant de se demander quel est le degré d efficacité perdu par la variable latente non observable. Manifestement, quelque chose doit être perdu, parce qu une variable binaire telle que y t doit fournir moins d information qu une variable continue telle que yt. La matrice de covariance pour les estimations OLS de β dans (15.05) est (X X) 1 ; rappelons que la variance d erreur est normalisée à l unité. Par contraste, la matrice de covariance pour les estimations probit de β est ( X Ψ(β)X ) 1, où Ψ(β) était définie par (15.12). La valeur maximale pour Ψ(X t β) est atteinte quand P t =.5. Dans le cas probit, cette valeur est Par conséquent, dans le meilleur cas possible, lorsque les données sont telles que P t =.5 pour tout t, la matrice de covariance pour les estimations probit sera égale à 1.57 ( = 1/0.6366) fois la matrice de covariance des OLS. Dans la pratique, naturellement, cette borne supérieure n est probablement pas atteinte, et les estimations probit peuvent être beaucoup moins efficaces que ne le seraient les estimations OLS, qui utilisent la variable latente, en particulier lorsque P t est proche de 0 ou 1 pour une partie importante de l échantillon. Un problème pratique avec les modèles à réponse binaire est que les conditions du premier ordre (15.10) n ont pas nécessairement de solution finie. Ceci peut survenir quand l ensemble des données ne fournit pas suffisamment d information pour identifier tous les paramètres. Supposons qu il existe une quelconque combinaison linéaire des variables indépendantes, disons z t X t β, telle que y t = 0 pour z t 0, et y t = 1 pour z t > 0. Alors il sera possible de faire tendre l(y, β) vers zéro en posant β = αβ et en laissant α. Ceci garantira que F (X t β) 0 pour toutes les observations où y t = 0 et F (X t β) 1 pour toutes les observations où y t = 1. La valeur de la fonction de logvraisemblance (15.09) tendra donc vers zéro quand α. Mais zéro est évidemment une borne supérieure pour cette valeur. Donc, dans de telles circonstances, les paramètres β ne sont pas identifiés sur l espace paramétrique non compact R k au sens de la Définition 8.1, et nous ne pouvons pas obtenir des estimations pertinentes de β; consulter Albert et Anderson (1984). Quand z t est simplement une combinaison linéaire du terme constant et d une seule variable indépendante, cette dernière est souvent appelée classificatrice parfaite, parce que les y t peuvent être classées en 0 ou 1, une fois la valeur de la variable connue. Par exemple, considérons le DGP y t = x t + u t, u t NID(0, 1); y t = 1 si y t > 0 et y t = 0 si y t 0. (15.14)

12 522 Variables Dépendantes Limitées et Qualitatives Pour ce DGP, il semblerait judicieux d estimer le modèle probit E(y t x t ) = Φ(β 0 + β 1 x t ). (15.15) Mais supposons que, dans l exemple, x t soit toujours un nombre inférieur à 4 ou supérieur à +4. Quand x t est inférieur à 4, il est presque certain (la probabilité est supérieure à ) que y t sera 0, et quand x t est supérieure à +4, il est presque certain que y t sera 1. Ainsi, à moins que la taille de l échantillon soit très grande, il est peu probable qu il y ait des observations pour lesquelles x t < 0 et y t = 1 ou des observations pour lesquelles x t > 0 et y t = 0. En l absence de telles observations, la variable x t sera une classificatrice parfaite, et il sera impossible d obtenir des estimations correctes des paramètres de (15.14). Quel que soit l algorithme de maximisation utilisé, il essaiera simplement de rendre ˆβ 1 aussi grand que possible. Bien que cet exemple soit extrême, des problèmes similaires sont susceptibles de survenir lorsque l ajustement du modèle est très bon et la taille de l échantillon est petite. Il existera une classificatrice parfaite quand il y a un hyperplan séparateur dans l espace des explicatives tel que toutes les observations pour lesquelles y t = 0 se situent de l un côté et toutes celles pour lesquelles y t = 1 de l autre. Ce cas de figure est probable si l ajustement est bon et il n y a que peu d observations avec y t = 0, ou peu avec y t = 1. Il se peut néanmoins que des estimations ML puissent se calculer même quand n n est pas plus grand que k + 1 et il n y a qu une seule observation avec soit y t = 0 soit y t = 1. Dans les modèles de régression, il est commun de tester l hypothèse que toutes les pentes sont nulles en utilisant un test en F. Pour les modèles à réponse binaire, la même hypothèse peut facilement être testée en utilisant un test du ratio de vraisemblance. Un modèle avec un terme constant peut être écrit comme E(y t Ω t ) = F ( β 1 + X 2t β 2 ), (15.16) où X 2t se compose de X t sans le terme constant et β 2 est un vecteur de dimension (k 1). Sous l hypothèse nulle que β 2 = 0, (15.16) devient E(y t Ω t ) = F ( β 1 ) = E(yt ). Ceci indique simplement que l espérance conditionnelle de y t est égale à son espérence non conditionnelle, qui peut être estimée par ȳ. Par conséquent, si β 1 désigne l estimation de β 1, ȳ = F ( β 1 ). A partir de (15.09), il est aisé de voir que la valeur de la fonction de logvraisemblance sous l hypothèse nulle est l(y, β 1, 0) = n ȳ log(ȳ) + n(1 ȳ) log(1 ȳ). (15.17) Le double de la différence entre la valeur non contrainte l(y, ˆβ 1, ˆβ 2 ) et la valeur contrainte l(y, β 1, 0) constitue une statistique de test LR qui sera asymptotiquement distribuée suivant une χ 2 (k 1). Comme le membre de droite de

13 15.3 Estimation des Modèles à Réponse Binaire 523 (15.17) est très facile à calculer, la statistique de test l est également. Cependant, nous discuterons dans la prochaine section d une statistique de test encore plus facile à calculer. De nombreuses mesures de bonne qualité de l ajustement, comparables au R 2 pour les modèles de régression, ont été proposées pour les modèles à réponse binaire, et de nombreuses applications statistiques reportent certaines d entre elles. Consulter, parmi d autres, Cragg et Uhler (1970), McFadden (1974a), Hauser (1977), Efron (1978), Amemiya (1981), et Maddala (1983). Le plus simple de ces pseudo R 2 est celui suggéré par McFadden. Il est simplement défini comme 1 l U l R, (15.18) où l U est la valeur non contrainte l(y, ˆβ 1, ˆβ 2 ), et l R est la valeur contrainte l(y, β 1, 0). L expression (15.18) représente une possible mesure de bonne qualité de l ajustement parce qu elle doit être comprise entre 0 et 1. Nous avons vu auparavant que la fonction de logvraisemblance (15.09) pour les modèles à choix binaires est bornée supérieurement par 0, ce qui implique que l U et l R sont toujours de même signe à moins que l U soit nulle. Mais l U peut être nulle seulement si le modèle non contraint s ajuste parfaitement, ce qui survient s il existe une classificatrice parfaite. Ainsi nous voyons que l expression (15.18) sera égale à 1 dans ce cas, égale à 0 quand les valeurs contrainte et non contrainte de la logvraisemblance seront identiques, et comprise entre 0 et 1 dans tous les autres cas. Bien que (15.18) et d autres mesures de bonne qualité d ajustement puissent être utiles pour obtenir une idée approximative sur les performances d un modèle à réponse binaire particulier, il n est pas nécessaire de les utiliser si l objectif est de comparer la performance de deux ou plusieurs modèles à réponse binaire différents estimés sur le même ensemble de données. Le meilleur moyen d y parvenir consiste simplement à comparer les valeurs des fonctions de logvraisemblance, en utilisant le fait que les valeurs pour n importe quel modèle à réponse binaire de la forme (15.03) sont directement comparables. Parfois, nous pouvons même rejeter un modèle sur la base d une telle comparaison. Par exemple, supposons que, sur un ensemble de données particulier, la valeur de la logvraisemblance pour un modèle logit donné excède de plus de 1.92 celle d un modèle probit avec la même fonction indice, ce qui représente la moitié de 3.84, la valeur critique à 5% pour une statistique de test qui est distribuée suivant une χ 2 (1). Il est clairement possible d englober les logit et probit dans un modèle plus général ayant plus d un paramètre. Le dernier modèle s ajusterait au moins aussi bien que le modèle logit; consulter la discussion dans la Section Ainsi, dans cet exemple, nous pourrions rejeter à un niveau de 5% l hypothèse selon laquelle le modèle probit a généré les observations. Naturellement, il est rare que la différence entre l ajustement des modèles probit et logit, qui ne diffèrent d aucune autre manière, soit aussi importante, à moins que la taille de l échantillon ne soit extrêmement grande.

14 524 Variables Dépendantes Limitées et Qualitatives 15.4 Une Régression Artificielle Il existe une régression à la fois très simple et très utile pour les modèles à réponse binaire. Comme pour d autres régressions artificielles, elle peut êrte utilisée pour une variété d usages, incluant l estimation paramétrique, l estimation de la matrice de covariance, et le test d hypothèse. Cette régression artificielle a été suggérée par Engle (1984) et Davidson et MacKinnon (1984b). Elle peut être dérivée de plusieurs manières, parmi lesquelles la plus facile consiste à la traiter comme une version modifiée de la régression de Gauss-Newton. Comme nous l avons vu, le modèle à réponse binaire (15.03) peut être écrit sous la forme du modèle de régression non linéaire (15.11), soit y t = F (X t β) + e t. Nous avons également vu que l aléa e t est de variance V (X t β) F (X t β) ( 1 F (X t β) ), (15.19) qui implique que (15.11) doit être estimée par GNLS. La GNR ordinaire correspondant à (15.11) serait y t F (X t β) = f(x t β)x t b + résidu, (15.20) mais celle-ci est clairement inappropriée en raison de l hétéroscédasticité des e t. En effet, nous devons multiplier les deux membres de (15.20) par la racine carrée de l inverse de (15.19). Ceci fournit la régression artificielle ( V (Xt β) ) 1/2( yt F (X t β) ) = ( V (X t β) ) 1/2 f(xt β)x t b + résidu, (15.21) qui ressemble à la GNR pour un modèle de régression non linéaire estimé par moindres carrés pondérés (consulter la Section 9.4). La régression (15.21) est un cas particulier de ce que nous appelerrons régression pour modèle à réponse binaire, ou BRMR. Cette forme de la BRMR demeure valable pour n importe quel modèle à réponse binaire de la forme de (15.03). 4 Dans le cas du modèle logit, celle-ci se simplifie en ( λ(xt β) ) 1/2( yt Λ(X t β) ) = ( λ(x t β) ) 1/2 Xt b + résidu. La BRMR satisfait les propriétés générales des régressions artificielles dont nous avons discuté dans la Section En particulier, celle-ci est très 4 Certains auteurs écrivent la BRMR de manières quelque peu différentes. Par exemple, chez Davidson et MacKinnon (1984b), la régressande a été définie comme ( ) 1/2 ( ) 1/2 1 F (Xt β) F (Xt β) y t + (y t 1). F (X t β) 1 F (X t β) Vérifier qu il s agit juste d une autre manière d écrire la régressande de (15.21) constitue un bon exercice.

15 15.4 Une Régression Artificielle 525 étroitement reliée à la fois au gradient de la fonction de vraisemblance (15.09) et à la matrice d information. Le produit de la transposée de la régressande par la matrice des régresseurs fournit un vecteur d élément type ( n yt F (X t β) ) f(x t β)x ti F (X t β) ( 1 F (X t β) ), t=1 qui est un élément type du vecteur gradient pour la fonction de logvraisemblance (15.09). La transposée de la matrice des régresseurs multipliée par elle-même fournit une matrice d élément type n t=1 f 2 (X t β) F (X t β) ( 1 F (X t β) )X tix tj. (15.22) La limite en probabilité de n 1 fois (15.22) est un élément type de la matrice d information (15.13). Toutes les fois que la fonction de logvraisemblance est globalement concave, comme pour les modèles logit et probit, il existe de nombreuses manières différentes d estimer facilement les modèles à réponse binaire. Une approche qui fonctionne généralement bien consiste à utiliser un algorithme similaire à ceux décrits dans la Section 6.8. Dans un tel algorithme, la BRMR est utilisée pour déterminer la direction dans laquelle β varie à chaque étape. Les valeurs de β aux itérations j + 1 et j sont reliées par β (j+1) = β (j) + α (j) b (j), où b (j) désigne le vecteur des estimations OLS à partir de la BRMR (15.21) évaluée en β (j), et α (j) est un scalaire déterminé par l algorithme. On pourrait choisir les estimations initiales β (1) de différentes façons. Une de ces façons facile à utiliser et qui semble bien fonctionner dans la pratique consiste simplement à initialiser le terme constant à F 1 (ȳ) et les autres coefficients à zéro. Les valeurs de départ correspondent alors aux estimations du modèle contraint avec des pentes nulles. En évaluant la BRMR avec les estimations ML ˆβ, celle-ci peut aussi être utilisée pour obtenir une matrice de covariance estimée pour les paramètres estimés. La matrice de covariance estimée à partir de l estimation OLS de la régression (15.21) évaluée en ˆβ sera s 2( X ˆΨX ) 1, (15.23) où s est l écart type de la régression. Cet écart type tendra asymptotiquement vers 1, mais il ne sera pas vraiment égal à 1 dans les échantillons finis. La matrice ˆΨ est une matrice diagonale avec comme élément type diagonal ˆΨ tt = f 2 (X t ˆβ) F (X t ˆβ) ( 1 F (Xt ˆβ) ).

16 526 Variables Dépendantes Limitées et Qualitatives Il s agit simplement de l expression (15.12) avec β remplacé par ˆβ. Ainsi, la matrice de covariance OLS estimée (15.23) fournit une estimation valable de la matrice de covariance de ˆβ. C est aussi le cas de la matrice (X ˆΨX) 1, qui correspond simplement à (15.23) divisée par s 2, et que l on préfèrera probablement utiliser puisque le facteur de s 2 dans (15.23) introduit simplement un aléa additionnel dans l estimation de la matrice de covariance. Comme d habitude, nous pouvons également estimer la matrice de covariance de ˆβ par l opposée de l inverse de la matrice Hessienne numérique ou par le produit extérieur du gradient de la matrice CG, Ĝ Ĝ. Dans le cas du modèle logit, l opposée de la matrice Hessienne numérique est véritablement égale à la matrice d information estimée X ˆΨX, parce que 2 l(β) β i β j = ( n ( yt Λ(X t β) ) ) X ti = β j t=1 n λ(x t β)x ti X tj. Cependant, dans le cas de la plupart des modèles à réponse binaire, incluant le modèle probit, l opposée de la matrice Hessienne différera et sera généralement plus compliquée que la matrice d information. Comme toutes les régressions artificielles, la BRMR est particulièrement utile pour les tests d hypothèse. Suppossons que β soit partitionné comme [β 1. β 2 ], où β 1 est un vecteur de dimension (k r) et β 2 est un vecteur de dimension r. Si β désigne le vecteur des estimations ML soumises à la contrainte β 2 = 0, nous pouvons tester cette contrainte en exécutant à la BRMR Ṽ 1/2 t (y t F t ) = Ṽ 1/2 t f t X t1 b 1 + Ṽ 1/2 t f t X t2 b 2 + résidu, (15.24) où F t F (X t β), ft f(x t β), et Ṽ t V (X t β). Ici Xt a été partitionnée en deux vecteurs, X t1 et X t2, correspondant à la partition de β. Les régresseurs qui correspondent à β 1 sont orthogonaux à la régressande, tandis que ceux qui correspondent à β 2 ne le sont pas. Toutes les statistiques de test usuelles pour b 2 = 0 sont valables. Cependant, par contraste avec le cas de la régression de Gauss-Newton, il n existe pas de raison particulière d utiliser un test en F, parce qu il n y a pas de paramètre de variance à estimer. La meilleure statistique de test à utiliser en échantillons finis, selon les résultats Monte Carlo obtenus par Davidson et MacKinnon (1984b), est probablement la somme des carrés expliqués à partir de la régression (15.24). Elle sera asymptotiquement distribuée suivant une χ 2 (r) sous l hypothèse nulle. Notons que le nr 2 ne sera pas égal à la somme des carrés expliqués dans ce cas, parce que la somme des carrés totaux ne sera pas égale à n. Dans un cas très spécial, la BRMR (15.24) devient extrêmement simple. Supposons que l hypothèse nulle corresponde à la nullité de tous les coefficients de pentes. Dans ce cas, X t1 est unitaire, X t β = β1 = F 1 (ȳ), et, dans une notation évidente, la régression (15.24) devient t=1 V 1/2 (y t F ) = V 1/2 f b1 + V 1/2 f Xt2 b 2 + résidu.

17 15.4 Une Régression Artificielle 527 La statistique de test en F pour b 2 = 0 est invariante à la soustraction d une constante à la régressande, ou à la multiplication de la régressande et des régresseurs par une constante. Ainsi, il est clair que nous pouvons tester l hypothèse que toutes les pentes sont nulles en calculant simplement une statistique en F pour c 2 = 0 dans la régression linéaire y = c 1 + X 2 c 2 + résidus. Ainsi, nous avons rencontré une situation dans laquelle le modèle de probabilité linéaire est utile. Si nous voulons tester l hypothèse nulle selon laquelle aucun des régresseurs n explique la variation de la variable dépendante, alors il est parfaitement pertinent d employer la statistique de test ordinaire en F pour toutes les pentes nulles dans une régression OLS de y sur X. Naturellement, nous pouvons utiliser la BRMR pour calculer les tests C(α) et les tests pseudo-wald aussi bien que des tests LM. L essentiel de ce que nous avons dit concernant de tels tests dans les Sections 6.7 et 13.7 reste valable dans le contexte des modèles à réponse binaire. Nous ne pouvons pas utiliser la somme des carrés expliqués comme statistique de test, mais plutôt la réduction dans la somme des carrés expliqués consécutive à l addition des régresseurs de test. Les tests pseudo-wald peuvent être particulièrement utiles quand la fonction indice est linéaire sous l hypothèse alternative mais non linéaire sous l hypothèse nulle, parce que l hypothèse alternative peut être estimée au moyen d un programme standard logit ou probit. S il apparaît que les contraintes s ajustent bien aux données, nous pouvons employer une BRMR différente pour obtenir des estimations en une étape. La BRMR est utile pour tester tous les aspects de la spécification des modèles à réponse binaire. Avant même d accepter un quelconque modèle de la sorte, nous devons savoir si F (X t β) représente une spécification correcte pour la probabilité y t = 1 conditionnellement à l ensemble d information Ω t. Les tests de variables appartenant à l ensemble Ω t potentiellement omises constitue une part importante de ce processus, et nous avons déjà vu comment procéder à l aide de la BRMR (15.24). Mais même si X t est spécifiée de façon correcte, le reste du modèle peut ne pas l être. Considérons le modèle à variable latente donné par (15.05) et (15.06). Parce que les modèles à réponse binaire sont typiquement estimés en utilisant les données en coupe transversale, et que de telles données présentent fréquemment de l hétéroscédasticité, il est fort possible que les aléas dans l équation pour y t soient hétéroscédastiques. S ils étaient effectivement hétéroscédastiques, le modèle probit ne serait plus approprié, et les estimations de β basées sur ce modèle seraient non convergentes; consulter Yatchew et Griliches (1984). Puisque nous pouvons considérer que tout modèle modèle à réponse binaire peut provenir d un modèle à variable latente, il est clairement important de tester l hétéroscédasticité de tels modèles. Nous discutons à présent de la manière de procéder.

18 528 Variables Dépendantes Limitées et Qualitatives Une spécification plus générale que l équation (15.05) qui tient compte des erreurs hétéroscédastiques est y t = X t β + u t, u t N ( 0, exp(2z t γ) ), (15.25) où Z t est un vecteur ligne de longueur q des observations sur les variables qui appartiennent à l ensemble d information Ω t. Pour s assurer qu à la fois β et γ sont identifiables, Z t ne doit pas comprendre un terme constant ou l équivalent. La combinaison de (15.25) avec (15.06) fournit le modèle ( ) Xt β E(y t Ω t ) = Φ. (15.26) exp(z t γ) Quand γ = 0, (15.25) se réduit à (15.05) et (15.26) se réduit au modèle probit ordinaire. Même quand un modèle à réponse binaire autre que le modèle probit est utilisé, il semble encore très raisonnable de considérer l hypothèse alternative ( ) Xt β E(y t Ω t ) = F. exp(z t γ) Nous pouvons tester γ = 0 contre cette forme d hétéroscédasticité. La BRMR appropriée est ˆV 1/2 t (y t ˆF t ) = ˆV 1/2 t ˆf t X t b + ˆV 1/2 t ˆf t Z t ( X t ˆβ)c + résidu, (15.27) où ˆF t, ˆf t, et ˆV t sont évalués avec les estimations ML ˆβ en supposant que γ = 0. La somme expliquée des carrés de (15.27) sera distribuée asymptotiquement suivant une χ 2 (q) sous l hypothèse nulle. Il est également important de tester la spécification de la fonction de transformation F ( ). Comme nous l avons noté plus tôt, une manière naturelle de procéder de la sorte consiste à considérer un modèle alternatif de la forme E(y t Ω t ) = F ( h(x t β, α) ), (15.28) où h(x, α) est une fonction non linéaire de x, et α est soit un paramètre soit un vecteur de paramètres tel que h(x t β, α) = X t β pour une certaine valeur de α. Stukel (1988) suggère une famille plus compliquée de fonctions à deux paramètres h(x, α) qui mène à une famille très générale de modèles. Cette famille comprend le modèle logit comme un cas particulier quand α = 0, et permet d imposer ou non l hypothèse de symétrie-oblique. On peut aisément utiliser la BRMR pour tester l hypothèse nulle que α = 0 contre cette alternative. Un test plus simple peut être basé sur la famille de modèles ( ) τ(αxt β) E(y t Ω t ) = F, α

19 15.4 Une Régression Artificielle 529 qui est un cas particulier de (15.28). Ici τ( ) peut être n importe quelle fonction monotone croissante en son argument satisfaisant les conditions τ(0) = 0, τ (0) = 1, et τ (0) 0. En utilisant la Règle de l Hôpital, MacKinnon et Magee (1990) montrent que ( ) ( ( )) τ(αx) τ(αx)/α lim = x et lim = α 0 α 1 α 0 α 2 x2 τ (0). (15.29) Ainsi pour tester l hypothèse nulle que α = 0, la BRMR est ˆV 1/2 t (y t ˆF t ) = ˆV 1/2 t 1/2 2 ˆf t X t b + a ˆV t (X t ˆβ) ˆft + résidu, (15.30) où le terme constant τ (0)/2 qui provient de (15.29) est non pertinent pour le test et a été omis. Par conséquent, la régression (15.30) traite simplement les valeurs au carré de la fonction indice évaluée en ˆβ comme s il y avait des observations sur un régresseur potentiellement omis. Ce test comporte une forte ressemblance avec le test RESET pour les modèles de régression, dont nous avons discuté dans la Section 6.5. Nous pouvons utiliser comme statistique de test la statistique ordinaire t pour a = 0, mais nous préfèrerons employer la somme expliquée des carrés. Une très grande variété de tests de spécification peut être basée sur la BRMR. En réalité, presque tous les tests de spécification pour les modèles de régression basés sur une régression artificielle comportent un analogue pour les modèles à réponse binaire. En général, nous pouvons écrire la régression artificielle pour la réalisation d un tel test comme ˆV 1/2 t (y t ˆF t ) = ˆV 1/2 t ˆf t X t b + Ẑtc + résidu, (15.31) où Ẑt est un vecteur de dimension 1 r qui peut dépendre des estimations ML ˆβ et d un élément quelconque dans l ensemble d information Ω t. L intuition pour (15.31) est très simple. Si F (X t β) est la spécification correcte de E(y t Ω t ), alors (15.31) sans les régresseurs Z t est la régression artificielle qui correspond au DGP. Aucun régresseurs additionnels Z t dépendant de Ω t ne doit avoir de pouvoir explicatif significatif lorsqu il est ajouté à cette régression. Il est même possible d utiliser la BRMR pour calculer les tests non emboîtés très similaires au test en P (consulter la Section 11.3). Supposons que nous avons deux modèles en compétition: H 1 : E(y t Ω t ) = F 1 (X 1t β 1 ) et H 2 : E(y t Ω t ) = F 2 (X 2t β 2 ), qui peuvent différer soit parce que F 1 ( ) n est pas la même que F 2 ( ) soit parce que X 1t n est pas la même que X 2t soit pour les deux raisons à la

20 530 Variables Dépendantes Limitées et Qualitatives fois. Il existe de nombreuses manières d emboîter H 1 et H 2 dans un modèle composite artificiel. Une des plus simples est H C : E(y t Ω t ) = (1 α)f 1 (X 1t β 1 ) + αf 2 (X 2t β 2 ), bien que ce modèle artificiel ne soit pas vraiment un modèle à réponse binaire. Nous pouvons tester H 1 contre H C essentiellement de la manière dont nous l avons fait pour les modèles de régression. Tout d abord, nous remplaçons β 2 par son estimation ML ˆβ 2 et construisons ensuite une régression artificielle pour tester l hypothèse nulle que α = 0. Cette régression artificielle est ˆV 1/2 t (y t ˆF 1t ) = ˆV 1/2 t ˆf 1t X 1t b + a 1/2 ˆV t ( ˆF 2t ˆF 1t ) + résidu. Le régresseur de test est simplement la différence entre les probabilités que 1/2 y t = 1 selon les deux modèles, multipliée par ˆV t, le facteur de pondération qui est aussi utilisé pour la régressande et pour les autres régresseurs. L estimation des deux modèles standards à réponse binaire, c est-à-dire les modèles probit et logit avec des fonctions indice linéaires, est extrêmement facile avec la plupart des applications de régression, et l estimation des modèles qui impliquent des fonctions de transformation non standards et/ou des fonctions indice non linéaires n est généralement pas très difficile. Comme les tests de tels modèles au moyen de la BRMR sont également très faciles, il n existe absolument aucune excuse pour tester de façon moins complète les spécifications des modèles à réponse binaire que celles des modèles de régression Les Modèles à Plus de Deux Réponses Discrètes Bien que de nombreuses variables dépendantes discrètes soient binaires, des variables discrètes qui peuvent prendre trois ou plusieurs valeurs différentes sont assez fréquentes en économie. Une variété de modèles à réponse qualitative a été inventée pour traiter de tels cas. Ceux-ci se répartissent en deux catégories: les modèles conçus pour traiter des réponses ordonnées et ceux conçus pour traiter des réponses non ordonnées. Un exemple de données à réponse ordonnée serait les résultats provenant d une enquête où il a été demandé aux personnes interrogées de dire si elles sont entièrement d accord, d accord, sans opinion, en désaccord, ou entièrement en désaccord avec un quelconque sujet. Ici, il y a cinq réponses possibles, qui peuvent bien évidemment être ordonnées de manière graduée. Un exemple de données à réponse non ordonnée serait les résultats provenant d une enquête sur le moyen de transport que choisissent les gens pour faire la navette entre leur résidence et leur travail. Les réponses possibles peuvent être: marche, vélo, prendre le bus, usage commun d un véhicule, et usage individuel d un véhicule. Bien qu il puisse exister plusieurs manières d ordonner ces réponses, aucune ne s impose naturellement.

21 15.5 Les Modèles à Plus de Deux Réponses Discrètes y t 1 0 γ 1 γ Figure 15.3 Relation entre y t et y t dans un modèle probit ordonné y t La manière la plus commune de traiter les données à réponse ordonnée consiste à utiliser un modèle à réponse qualitative ordonnée, habituellement soit le modèle probit ordonné soit le modèle logit ordonné. Comme exemple, considérons le modèle à variable latente y t = X t β + u t, u t NID(0, 1), (15.32) où, pour une raison qui deviendra bientôt évidente, X t ne comprend aucun terme constant. Nous observons réellement une variable discrète y t qui peut prendre seulement trois valeurs: y t = 0 si y t < γ 1 y t = 1 si γ 1 y t < γ 2 y t = 2 si γ 2 y t. (15.33) Les paramètres de ce modèle sont β et γ [γ 1. γ 2 ]. Les γ i sont des seuils qui déterminent quelle valeur de y t va correspondre à une valeur donnée de y t. Ceci est illustré dans la Figure Le vecteur γ comporte toujours un élément de moins qu il y a de choix. Quand il existe seulement deux choix, ce modèle se confond avec le modèle à réponse binaire ordinaire, l unique élément de γ jouant le rôle du terme constant. La probabilité que y t = 0 est Pr(y t = 0) = Pr(y t < γ 1 ) = Pr(X t β + u t < γ 1 ) = Pr(u t < γ 1 X t β) = Φ(γ 1 X t β).

Chapitre 2 Le problème de l unicité des solutions

Chapitre 2 Le problème de l unicité des solutions Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)

Plus en détail

NON-LINEARITE ET RESEAUX NEURONAUX

NON-LINEARITE ET RESEAUX NEURONAUX NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail

Plus en détail

Limites finies en un point

Limites finies en un point 8 Limites finies en un point Pour ce chapitre, sauf précision contraire, I désigne une partie non vide de R et f une fonction définie sur I et à valeurs réelles ou complees. Là encore, les fonctions usuelles,

Plus en détail

Correction de l examen de la première session

Correction de l examen de la première session de l examen de la première session Julian Tugaut, Franck Licini, Didier Vincent Si vous trouvez des erreurs de Français ou de mathématiques ou bien si vous avez des questions et/ou des suggestions, envoyez-moi

Plus en détail

Représentation des Nombres

Représentation des Nombres Chapitre 5 Représentation des Nombres 5. Representation des entiers 5.. Principe des représentations en base b Base L entier écrit 344 correspond a 3 mille + 4 cent + dix + 4. Plus généralement a n a n...

Plus en détail

I. Polynômes de Tchebychev

I. Polynômes de Tchebychev Première épreuve CCP filière MP I. Polynômes de Tchebychev ( ) 1.a) Tout réel θ vérifie cos(nθ) = Re ((cos θ + i sin θ) n ) = Re Cn k (cos θ) n k i k (sin θ) k Or i k est réel quand k est pair et imaginaire

Plus en détail

Cours d Analyse. Fonctions de plusieurs variables

Cours d Analyse. Fonctions de plusieurs variables Cours d Analyse Fonctions de plusieurs variables Licence 1ère année 2007/2008 Nicolas Prioux Université de Marne-la-Vallée Table des matières 1 Notions de géométrie dans l espace et fonctions à deux variables........

Plus en détail

3. Conditionnement P (B)

3. Conditionnement P (B) Conditionnement 16 3. Conditionnement Dans cette section, nous allons rappeler un certain nombre de définitions et de propriétés liées au problème du conditionnement, c est à dire à la prise en compte

Plus en détail

3 Approximation de solutions d équations

3 Approximation de solutions d équations 3 Approximation de solutions d équations Une équation scalaire a la forme générale f(x) =0où f est une fonction de IR dans IR. Un système de n équations à n inconnues peut aussi se mettre sous une telle

Plus en détail

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications A. Optimisation sans contrainte.... Généralités.... Condition nécessaire et condition suffisante

Plus en détail

Programmation linéaire

Programmation linéaire 1 Programmation linéaire 1. Le problème, un exemple. 2. Le cas b = 0 3. Théorème de dualité 4. L algorithme du simplexe 5. Problèmes équivalents 6. Complexité de l Algorithme 2 Position du problème Soit

Plus en détail

Fonctions de plusieurs variables

Fonctions de plusieurs variables Module : Analyse 03 Chapitre 00 : Fonctions de plusieurs variables Généralités et Rappels des notions topologiques dans : Qu est- ce que?: Mathématiquement, n étant un entier non nul, on définit comme

Plus en détail

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Roxane Duroux 1 Cadre de l étude Cette étude s inscrit dans le cadre de recherche de doses pour des essais cliniques

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer Pour commencer Exercice 1 - Ensembles de définition - Première année - 1. Le logarithme est défini si x + y > 0. On trouve donc le demi-plan supérieur délimité par la droite d équation x + y = 0.. 1 xy

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

F411 - Courbes Paramétrées, Polaires

F411 - Courbes Paramétrées, Polaires 1/43 Courbes Paramétrées Courbes polaires Longueur d un arc, Courbure F411 - Courbes Paramétrées, Polaires Michel Fournié michel.fournie@iut-tlse3.fr http://www.math.univ-toulouse.fr/ fournie/ Année 2012/2013

Plus en détail

Les indices à surplus constant

Les indices à surplus constant Les indices à surplus constant Une tentative de généralisation des indices à utilité constante On cherche ici en s inspirant des indices à utilité constante à définir un indice de prix de référence adapté

Plus en détail

ÉPREUVE COMMUNE DE TIPE 2008 - Partie D

ÉPREUVE COMMUNE DE TIPE 2008 - Partie D ÉPREUVE COMMUNE DE TIPE 2008 - Partie D TITRE : Les Fonctions de Hachage Temps de préparation :.. 2 h 15 minutes Temps de présentation devant le jury :.10 minutes Entretien avec le jury :..10 minutes GUIDE

Plus en détail

Méthodes de Simulation

Méthodes de Simulation Méthodes de Simulation JEAN-YVES TOURNERET Institut de recherche en informatique de Toulouse (IRIT) ENSEEIHT, Toulouse, France Peyresq06 p. 1/41 Remerciements Christian Robert : pour ses excellents transparents

Plus en détail

Précision d un résultat et calculs d incertitudes

Précision d un résultat et calculs d incertitudes Précision d un résultat et calculs d incertitudes PSI* 2012-2013 Lycée Chaptal 3 Table des matières Table des matières 1. Présentation d un résultat numérique................................ 4 1.1 Notations.........................................................

Plus en détail

Fonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre

Fonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre IUFM du Limousin 2009-10 PLC1 Mathématiques S. Vinatier Rappels de cours Fonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre 1 Fonctions de plusieurs variables

Plus en détail

I. Ensemble de définition d'une fonction

I. Ensemble de définition d'une fonction Chapitre 2 Généralités sur les fonctions Fonctions de références et fonctions associées Ce que dit le programme : Étude de fonctions Fonctions de référence x x et x x Connaître les variations de ces deux

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées

Plus en détail

Rappels sur les suites - Algorithme

Rappels sur les suites - Algorithme DERNIÈRE IMPRESSION LE 14 septembre 2015 à 12:36 Rappels sur les suites - Algorithme Table des matières 1 Suite : généralités 2 1.1 Déition................................. 2 1.2 Exemples de suites............................

Plus en détail

Le théorème des deux fonds et la gestion indicielle

Le théorème des deux fonds et la gestion indicielle Le théorème des deux fonds et la gestion indicielle Philippe Bernard Ingénierie Economique& Financière Université Paris-Dauphine mars 2013 Les premiers fonds indiciels futent lancés aux Etats-Unis par

Plus en détail

Chapitre 0 Introduction à la cinématique

Chapitre 0 Introduction à la cinématique Chapitre 0 Introduction à la cinématique Plan Vitesse, accélération Coordonnées polaires Exercices corrigés Vitesse, Accélération La cinématique est l étude du mouvement Elle suppose donc l existence à

Plus en détail

Simulation de variables aléatoires

Simulation de variables aléatoires Chapter 1 Simulation de variables aléatoires Références: [F] Fishman, A first course in Monte Carlo, chap 3. [B] Bouleau, Probabilités de l ingénieur, chap 4. [R] Rubinstein, Simulation and Monte Carlo

Plus en détail

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. 14-3- 214 J.F.C. p. 1 I Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. Exercice 1 Densité de probabilité. F { ln x si x ], 1] UN OVNI... On pose x R,

Plus en détail

Texte Agrégation limitée par diffusion interne

Texte Agrégation limitée par diffusion interne Page n 1. Texte Agrégation limitée par diffusion interne 1 Le phénomène observé Un fût de déchets radioactifs est enterré secrètement dans le Cantal. Au bout de quelques années, il devient poreux et laisse

Plus en détail

Université Paris-Dauphine DUMI2E 1ère année, 2009-2010. Applications

Université Paris-Dauphine DUMI2E 1ère année, 2009-2010. Applications Université Paris-Dauphine DUMI2E 1ère année, 2009-2010 Applications 1 Introduction Une fonction f (plus précisément, une fonction réelle d une variable réelle) est une règle qui associe à tout réel x au

Plus en détail

CCP PSI - 2010 Mathématiques 1 : un corrigé

CCP PSI - 2010 Mathématiques 1 : un corrigé CCP PSI - 00 Mathématiques : un corrigé Première partie. Définition d une structure euclidienne sur R n [X]... B est clairement symétrique et linéaire par rapport à sa seconde variable. De plus B(P, P

Plus en détail

Suites numériques 3. 1 Convergence et limite d une suite

Suites numériques 3. 1 Convergence et limite d une suite Suites numériques 3 1 Convergence et limite d une suite Nous savons que les termes de certaines suites s approchent de plus en plus d une certaine valeur quand n augmente : par exemple, les nombres u n

Plus en détail

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA

Plus en détail

La programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique

La programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique La programmation linéaire : une introduction Qu est-ce qu un programme linéaire? Qu est-ce qu un programme linéaire? Exemples : allocation de ressources problème de recouvrement Hypothèses de la programmation

Plus en détail

Arithmétique binaire. Chapitre. 5.1 Notions. 5.1.1 Bit. 5.1.2 Mot

Arithmétique binaire. Chapitre. 5.1 Notions. 5.1.1 Bit. 5.1.2 Mot Chapitre 5 Arithmétique binaire L es codes sont manipulés au quotidien sans qu on s en rende compte, et leur compréhension est quasi instinctive. Le seul fait de lire fait appel au codage alphabétique,

Plus en détail

Moments des variables aléatoires réelles

Moments des variables aléatoires réelles Chapter 6 Moments des variables aléatoires réelles Sommaire 6.1 Espérance des variables aléatoires réelles................................ 46 6.1.1 Définition et calcul........................................

Plus en détail

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La licence Mathématiques et Economie-MASS de l Université des Sciences Sociales de Toulouse propose sur les trois

Plus en détail

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Table des matières. Introduction....3 Mesures et incertitudes en sciences physiques

Plus en détail

Programmes des classes préparatoires aux Grandes Ecoles

Programmes des classes préparatoires aux Grandes Ecoles Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

Théorème du point fixe - Théorème de l inversion locale

Théorème du point fixe - Théorème de l inversion locale Chapitre 7 Théorème du point fixe - Théorème de l inversion locale Dans ce chapitre et le suivant, on montre deux applications importantes de la notion de différentiabilité : le théorème de l inversion

Plus en détail

Image d un intervalle par une fonction continue

Image d un intervalle par une fonction continue DOCUMENT 27 Image d un intervalle par une fonction continue La continuité d une fonction en un point est une propriété locale : une fonction est continue en un point x 0 si et seulement si sa restriction

Plus en détail

Etude de fonctions: procédure et exemple

Etude de fonctions: procédure et exemple Etude de fonctions: procédure et exemple Yves Delhaye 8 juillet 2007 Résumé Dans ce court travail, nous présentons les différentes étapes d une étude de fonction à travers un exemple. Nous nous limitons

Plus en détail

La fonction exponentielle

La fonction exponentielle DERNIÈRE IMPRESSION LE 2 novembre 204 à :07 La fonction exponentielle Table des matières La fonction exponentielle 2. Définition et théorèmes.......................... 2.2 Approche graphique de la fonction

Plus en détail

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques

Plus en détail

Coup de Projecteur sur les Réseaux de Neurones

Coup de Projecteur sur les Réseaux de Neurones Coup de Projecteur sur les Réseaux de Neurones Les réseaux de neurones peuvent être utilisés pour des problèmes de prévision ou de classification. La représentation la plus populaire est le réseau multicouche

Plus en détail

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre : Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant

Plus en détail

Attitude des ménages face au risque. M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2014

Attitude des ménages face au risque. M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2014 Attitude des ménages face au risque - M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2014 Plan du cours 1. Introduction : demande de couverture et comportements induits pa 2. Représentations

Plus en détail

TSTI 2D CH X : Exemples de lois à densité 1

TSTI 2D CH X : Exemples de lois à densité 1 TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun

Plus en détail

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine

Plus en détail

Capes 2002 - Première épreuve

Capes 2002 - Première épreuve Cette correction a été rédigée par Frédéric Bayart. Si vous avez des remarques à faire, ou pour signaler des erreurs, n hésitez pas à écrire à : mathweb@free.fr Mots-clés : équation fonctionnelle, série

Plus en détail

Correction du Baccalauréat S Amérique du Nord mai 2007

Correction du Baccalauréat S Amérique du Nord mai 2007 Correction du Baccalauréat S Amérique du Nord mai 7 EXERCICE points. Le plan (P) a une pour équation cartésienne : x+y z+ =. Les coordonnées de H vérifient cette équation donc H appartient à (P) et A n

Plus en détail

LES TYPES DE DONNÉES DU LANGAGE PASCAL

LES TYPES DE DONNÉES DU LANGAGE PASCAL LES TYPES DE DONNÉES DU LANGAGE PASCAL 75 LES TYPES DE DONNÉES DU LANGAGE PASCAL CHAPITRE 4 OBJECTIFS PRÉSENTER LES NOTIONS D ÉTIQUETTE, DE CONS- TANTE ET DE IABLE DANS LE CONTEXTE DU LAN- GAGE PASCAL.

Plus en détail

Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples,

Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples, Non-linéarité Contexte Pour permettre aux algorithmes de cryptographie d être sûrs, les fonctions booléennes qu ils utilisent ne doivent pas être inversées facilement. Pour cela, elles doivent être très

Plus en détail

DÉRIVÉES. I Nombre dérivé - Tangente. Exercice 01 (voir réponses et correction) ( voir animation )

DÉRIVÉES. I Nombre dérivé - Tangente. Exercice 01 (voir réponses et correction) ( voir animation ) DÉRIVÉES I Nombre dérivé - Tangente Eercice 0 ( voir animation ) On considère la fonction f définie par f() = - 2 + 6 pour [-4 ; 4]. ) Tracer la représentation graphique (C) de f dans un repère d'unité

Plus en détail

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur

Plus en détail

IBM SPSS Regression 21

IBM SPSS Regression 21 IBM SPSS Regression 21 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p. 46. Cette version s applique à IBM SPSS Statistics

Plus en détail

Le modèle de régression linéaire

Le modèle de régression linéaire Chapitre 2 Le modèle de régression linéaire 2.1 Introduction L économétrie traite de la construction de modèles. Le premier point de l analyse consiste à se poser la question : «Quel est le modèle?». Le

Plus en détail

Principe de symétrisation pour la construction d un test adaptatif

Principe de symétrisation pour la construction d un test adaptatif Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

Circuits RL et RC. Chapitre 5. 5.1 Inductance

Circuits RL et RC. Chapitre 5. 5.1 Inductance Chapitre 5 Circuits RL et RC Ce chapitre présente les deux autres éléments linéaires des circuits électriques : l inductance et la capacitance. On verra le comportement de ces deux éléments, et ensuite

Plus en détail

Python - introduction à la programmation et calcul scientifique

Python - introduction à la programmation et calcul scientifique Université de Strasbourg Environnements Informatique Python - introduction à la programmation et calcul scientifique Feuille de TP 1 Avant de commencer Le but de ce TP est de vous montrer les bases de

Plus en détail

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision Page n 1. Tests du χ 2 une des fonctions des statistiques est de proposer, à partir d observations d un phénomène aléatoire (ou modélisé comme tel) une estimation de la loi de ce phénomène. C est que nous

Plus en détail

PROJET DE GESTION PORTEFEUILLE. Evaluation d une Stratégie de Trading

PROJET DE GESTION PORTEFEUILLE. Evaluation d une Stratégie de Trading PROJET DE GESTION PORTEFEUILLE Evaluation d une Stratégie de Trading Encadré par M. Philippe Bernard Master 1 Economie Appliquée-Ingénierie Economique et Financière Taylan Kunal 2011-2012 Sommaire 1) Introduction

Plus en détail

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57 Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation

Plus en détail

Chapitre 7. Récurrences

Chapitre 7. Récurrences Chapitre 7 Récurrences 333 Plan 1. Introduction 2. Applications 3. Classification des récurrences 4. Résolution de récurrences 5. Résumé et comparaisons Lectures conseillées : I MCS, chapitre 20. I Rosen,

Plus en détail

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories : La vision nous permet de percevoir et d interpreter le monde qui nous entoure. La vision artificielle a pour but de reproduire certaines fonctionnalités de la vision humaine au travers de l analyse d images.

Plus en détail

Continuité et dérivabilité d une fonction

Continuité et dérivabilité d une fonction DERNIÈRE IMPRESSIN LE 7 novembre 014 à 10:3 Continuité et dérivabilité d une fonction Table des matières 1 Continuité d une fonction 1.1 Limite finie en un point.......................... 1. Continuité

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que Introduction. On suppose connus les ensembles N (des entiers naturels), Z des entiers relatifs et Q (des nombres rationnels). On s est rendu compte, depuis l antiquité, que l on ne peut pas tout mesurer

Plus en détail

Introduction à l étude des Corps Finis

Introduction à l étude des Corps Finis Introduction à l étude des Corps Finis Robert Rolland (Résumé) 1 Introduction La structure de corps fini intervient dans divers domaines des mathématiques, en particulier dans la théorie de Galois sur

Plus en détail

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Filtrage stochastique non linéaire par la théorie de représentation des martingales Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de

Plus en détail

PROJET MODELE DE TAUX

PROJET MODELE DE TAUX MASTER 272 INGENIERIE ECONOMIQUE ET FINANCIERE PROJET MODELE DE TAUX Pricing du taux d intérêt des caplets avec le modèle de taux G2++ Professeur : Christophe LUNVEN 29 Fevrier 2012 Taylan KUNAL - Dinh

Plus en détail

Quantification Scalaire et Prédictive

Quantification Scalaire et Prédictive Quantification Scalaire et Prédictive Marco Cagnazzo Département Traitement du Signal et des Images TELECOM ParisTech 7 Décembre 2012 M. Cagnazzo Quantification Scalaire et Prédictive 1/64 Plan Introduction

Plus en détail

Intégration et probabilités TD1 Espaces mesurés Corrigé

Intégration et probabilités TD1 Espaces mesurés Corrigé Intégration et probabilités TD1 Espaces mesurés Corrigé 2012-2013 1 Petites questions 1 Est-ce que l ensemble des ouverts de R est une tribu? Réponse : Non, car le complémentaire de ], 0[ n est pas ouvert.

Plus en détail

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes. Promotion X 004 COURS D ANALYSE DES STRUCTURES MÉCANIQUES PAR LA MÉTHODE DES ELEMENTS FINIS (MEC 568) contrôle non classant (7 mars 007, heures) Documents autorisés : polycopié ; documents et notes de

Plus en détail

Programmation linéaire et Optimisation. Didier Smets

Programmation linéaire et Optimisation. Didier Smets Programmation linéaire et Optimisation Didier Smets Chapitre 1 Un problème d optimisation linéaire en dimension 2 On considère le cas d un fabricant d automobiles qui propose deux modèles à la vente, des

Plus en détail

Théorèmes de Point Fixe et Applications 1

Théorèmes de Point Fixe et Applications 1 Théorèmes de Point Fixe et Applications 1 Victor Ginsburgh Université Libre de Bruxelles et CORE, Louvain-la-Neuve Janvier 1999 Published in C. Jessua, C. Labrousse et D. Vitry, eds., Dictionnaire des

Plus en détail

Cours 9 : Plans à plusieurs facteurs

Cours 9 : Plans à plusieurs facteurs Cours 9 : Plans à plusieurs facteurs Table des matières Section 1. Diviser pour regner, rassembler pour saisir... 3 Section 2. Définitions et notations... 3 2.1. Définitions... 3 2.2. Notations... 4 Section

Plus en détail

Le modèle de Black et Scholes

Le modèle de Black et Scholes Le modèle de Black et Scholes Alexandre Popier février 21 1 Introduction : exemple très simple de modèle financier On considère un marché avec une seule action cotée, sur une période donnée T. Dans un

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

Chapitre 1 Régime transitoire dans les systèmes physiques

Chapitre 1 Régime transitoire dans les systèmes physiques Chapitre 1 Régime transitoire dans les systèmes physiques Savoir-faire théoriques (T) : Écrire l équation différentielle associée à un système physique ; Faire apparaître la constante de temps ; Tracer

Plus en détail

Évaluation de la régression bornée

Évaluation de la régression bornée Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement

Plus en détail

Table des matières. I Mise à niveau 11. Préface

Table des matières. I Mise à niveau 11. Préface Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3

Plus en détail

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé Baccalauréat S/L Métropole La Réunion 13 septembre 2013 Corrigé A. P. M.. P. XRCIC 1 Commun à tous les candidats Partie A 1. L arbre de probabilité correspondant aux données du problème est : 0,3 0,6 H

Plus en détail

Les modèles de choix binaire

Les modèles de choix binaire Chapitre 4 Les modèles de choix binaire Les modèles de régression linéaire développés ci-dessus concernent une variable dépendante continue (comme par exemple le salaire ou le taux de chômage). Ce chapitre

Plus en détail

4 Distributions particulières de probabilités

4 Distributions particulières de probabilités 4 Distributions particulières de probabilités 4.1 Distributions discrètes usuelles Les variables aléatoires discrètes sont réparties en catégories selon le type de leur loi. 4.1.1 Variable de Bernoulli

Plus en détail

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé Baccalauréat S ntilles-guyane 11 septembre 14 Corrigé EXERCICE 1 6 points Commun à tous les candidats Une entreprise de jouets en peluche souhaite commercialiser un nouveau produit et à cette fin, effectue

Plus en détail

avec des nombres entiers

avec des nombres entiers Calculer avec des nombres entiers Effectuez les calculs suivants.. + 9 + 9. Calculez. 9 9 Calculez le quotient et le rest. : : : : 0 :. : : 9 : : 9 0 : 0. 9 9 0 9. Calculez. 9 0 9. : : 0 : 9 : :. : : 0

Plus en détail

Exo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2.

Exo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2. Eo7 Calculs de déterminants Fiche corrigée par Arnaud Bodin Eercice Calculer les déterminants des matrices suivantes : Correction Vidéo ( ) 0 6 7 3 4 5 8 4 5 6 0 3 4 5 5 6 7 0 3 5 4 3 0 3 0 0 3 0 0 0 3

Plus en détail

Chp. 4. Minimisation d une fonction d une variable

Chp. 4. Minimisation d une fonction d une variable Chp. 4. Minimisation d une fonction d une variable Avertissement! Dans tout ce chapître, I désigne un intervalle de IR. 4.1 Fonctions convexes d une variable Définition 9 Une fonction ϕ, partout définie

Plus en détail

1 Complément sur la projection du nuage des individus

1 Complément sur la projection du nuage des individus TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent

Plus en détail

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme Chapitre 3 Quelques fonctions usuelles 1 Fonctions logarithme et eponentielle 1.1 La fonction logarithme Définition 1.1 La fonction 7! 1/ est continue sur ]0, +1[. Elle admet donc des primitives sur cet

Plus en détail

LES MÉTHODES DE POINT INTÉRIEUR 1

LES MÉTHODES DE POINT INTÉRIEUR 1 Chapitre XIII LES MÉTHODES DE POINT INTÉRIEUR 1 XIII.1 Introduction Nous débutons par un rappel de la formulation standard d un problème d optimisation 2 linéaire et donnons un bref aperçu des différences

Plus en détail

EXERCICES - ANALYSE GÉNÉRALE

EXERCICES - ANALYSE GÉNÉRALE EXERCICES - ANALYSE GÉNÉRALE OLIVIER COLLIER Exercice 1 (2012) Une entreprise veut faire un prêt de S euros auprès d une banque au taux annuel composé r. Le remboursement sera effectué en n années par

Plus en détail

M2 IAD UE MODE Notes de cours (3)

M2 IAD UE MODE Notes de cours (3) M2 IAD UE MODE Notes de cours (3) Jean-Yves Jaffray Patrice Perny 16 mars 2006 ATTITUDE PAR RAPPORT AU RISQUE 1 Attitude par rapport au risque Nousn avons pas encore fait d hypothèse sur la structure de

Plus en détail

FONCTION DE DEMANDE : REVENU ET PRIX

FONCTION DE DEMANDE : REVENU ET PRIX FONCTION DE DEMANDE : REVENU ET PRIX 1. L effet d une variation du revenu. Les lois d Engel a. Conditions du raisonnement : prix et goûts inchangés, variation du revenu (statique comparative) b. Partie

Plus en détail

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures) Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures) Eercice 1 (5 points) pour les candidats n ayant pas choisi la spécialité MATH Le tableau suivant donne l évolution du chiffre

Plus en détail

Cours3. Applications continues et homéomorphismes. 1 Rappel sur les images réciproques

Cours3. Applications continues et homéomorphismes. 1 Rappel sur les images réciproques Université de Provence Topologie 2 Cours3. Applications continues et homéomorphismes 1 Rappel sur les images réciproques Soit une application f d un ensemble X vers un ensemble Y et soit une partie P de

Plus en détail