Propriétés asymptotiques de quelques estimateurs non-paramétriques pour des variables vectorielles et fonctionnelles.

Dimension: px
Commencer à balayer dès la page:

Download "Propriétés asymptotiques de quelques estimateurs non-paramétriques pour des variables vectorielles et fonctionnelles."

Transcription

1 THÈSE DE DOCTORAT DE l'université PARIS 6 Spécialité : Mathématiques Option : Statistique présentée par Bertrand Maillot pour obtenir le grade de DOCTEUR DE l'université PARIS 6 Sujet de la thèse : Propriétés asymptotiques de quelques estimateurs non-paramétriques pour des variables vectorielles et fonctionnelles. Soutenue le 03/2/2008 devant le jury composé de Directeur de thèse Djamal Louani Université Paris VI Rapporteurs Hervé Cardot Université de Bourgogne Marc Hoffmann Université de Marne-la-Vallée Examinateurs Denis Bosq Université Paris VI Paul Deheuvels Université Paris VI Elias Ould-Saïd Université du Littoral

2 2

3 Remerciements Mes premiers remerciements vont naturellement à Djamal Louani qui m'a encadré durant ces années de thèse. Je voudrais lui exprimer ma gratitude pour sa grande disponibilité, pour le temps qu'il a passé à m'aider à améliorer et compléter mes travaux, pour ses conseils avisés qui m'ont permis de mener à bien cette entreprise. Je voudrais remercier Hervé Cardot et Marc Homann pour avoir accepté d'être mes rapporteurs, ainsi que les membres de mon jury, Denis Bosq, Paul Deheuvels et Elias Ould-Saïd. Je tiens aussi à remercier Louise Lamart pour avoir toujours réglé ecacement les problèmes administratifs et pratiques avec le sourire et une bonne humeur communicative. J'adresse un remerciement aux doctorants du L.S.T.A. pour leur aide ainsi que l'ambiance décontractée et studieuse qu'ils ont su instaurer dans le bureau, avec un merci tout spécial à Mohammed, dont la gentillesse, la patience et la compétence ont rendu cette première expérience de collaboration aussi agréable qu'instructive. Je voudrais aussi exprimer ma reconnaissance, bien au delà du cadre de la co-rédaction, à Vivian. Je tiens évidemment à remercier mes amis pour les moments moins sérieux, dans l'ordre approximatif de proximité géographique : Julien, Jib malgré qui j'ai pu terminer cette thèse, Vivian encore et Virginie, Philippe et Solenne, Gabriel et Juliette, Alex et Viviane, Philippe et Claire, et Raoul. Ceux qui n'y sont pas apprendront par ces lignes que nous ne sommes pas amis, ou que je les ai oubliés... Même si son aide fut très réduite au niveau mathématiques, que seraient ces lignes si je ne remerciais pas Ségolen? Je prote d'être hors du contexte académique pour inclure ici Michel, Jean-Mi, Cédric, Karine, Kian et Ushane. Finalement, je voudrais terminer avec quelques lignes, sans doute trop courtes, pour exprimer toute ma gratitude à ma famille, et plus particulièrement mes parents, mon frère Vincent et Olivia ainsi que mémé Dédée. i

4 ii

5 Liste des travaux [] Debbarh, M. et Maillot, B Additive regression model for continuous time processes, Comm. Statist. Theory Methods 375, [2] Debbarh, M. et Maillot, B.2008 Asymptotic normality of the additive regression components for continuous time processes. C. R. Acad. Sci. Paris Sér. I Math., 346, [3] Maillot, B. Regression estimation for continuous time processes with values in functional spaces. Soumis. [4] Maillot, B. Conditional density estimation for continuous time processes with values in functional spaces, with applications to the conditional mode and the regression function estimators. Soumis. [5] Maillot, B. et Viallon, V. Uniform limit laws of the logarithm for nonparametric estimators of the regression function in presence of censored data. Soumis. iii

6 iv

7 Table des matières Introduction 0. L'estimation non paramétrique par la méthode du noyau Présentation des estimateurs et du cadre de travail Les modèles additifs, une solution au éau de la dimension Les variables aléatoires fonctionnelles Les variables aléatoires censurées à droite Présentation des résultats Le modèle additif pour des processus à temps continu Estimation de la densité pour des processus non stationnaires Variables fonctionnelles en temps continu Modèle de censure aléatoire à droite Additive regression model for continuous time processes 5. Introduction and motivations Notations and results Proofs Proof of Theorem Proof of Theorem Asymptotic normality of the additive regression components for continuous time processes Version française abrégée Introduction Hypotheses and Notations Results Proof Proof of Lemma Proof of Theorem Proof of Theorem Proof of Proposition : v

8 TABLE DES MATIÈRES TABLE DES MATIÈRES 3 Estimation de la densité par la méthode du noyau pour des processus non stationnaires 5 3. Introduction Hypothèses et résultats Démonstrations Preuve du Théorème Preuve du Théorème Regression estimation for continuous time processes with values in functional spaces Introduction Hypotheses and results Proofs Conditional density estimation for continuous time processes with values in functional spaces, with applications to the conditional mode and the regression function estimators Introduction Hypotheses and results Proofs Uniform limit laws of the logarithm for nonparametric estimators of the regression function in presence of censored data Introduction-Motivations Notations and hypotheses Main result Corollaries-Applications Corollaries Almost sure asymptotic simultaneous condence bands for the true regression function Proofs The uncensored case Proof of Theorem A useful technical result Proof of Theorem Proof of Theorem Proofs of corollaries 6.4., and Appendix A Perspectives de recherche 35 Bibliographie 36 vi

9 Introduction L'objet de cette thèse est d'établir des résultats limites consistance, vitesses de convergence, normalité asymptotique et loi du logarithme pour des estimateurs de fonctions et de fonctionnelles liées à divers modèles. Ainsi, notre cadre de travail est multiple, regroupant le modèle additif de régression et l'estimation de la densité pour des processus à temps continu, mais aussi l'étude de la fonction de régression, du mode conditionnel, de la fonction de répartition conditionnelle et des quantiles conditionnels pour des variables fonctionnelles observées en temps continu. Enn, nous considérons l'estimation de la fonction de régression pour des variables censurées. Les estimateurs étudiés sont construits sur la base de méthodes nonparamétriques. Ils sont présentés, ainsi que la nature des données et les modèles étudiés, dans le paragraphe de cette introduction. Le paragraphe 2 présente quant à lui de façon succincte les résultats obtenus. 0. L'estimation non paramétrique par la méthode du noyau Depuis les travaux de Rosenblatt 956 et Parzen 962 portant sur l'estimation non-paramétrique de la densité de probabilité, la méthode du noyau a été très largement utilisée pour l'estimation de diverses fonctions et fonctionnelles, et de nombreux travaux ont été consacrés à l'étude des propriétés des estimateurs sousjacents. Vu l'étendu de la littérature disponible dans ce domaine, nous ne pouvons faire un exposé exhaustif et nous nous limitons donc ici à présenter les fonctions et fonctionnelles qui ont été l'objet d'une étude dans le cadre de cette thèse. Ainsi, les paragraphes qui suivent présentent la densité de probabilité, la fonction de régression, le mode conditionnel, la fonction de répartition conditionnelle et le quantile conditionnel accompagnés des estimateurs associés. Dans cette première partie, nous introduisons aussi le modèle additif de régression, le modèle de données censurées ainsi que les variables aléatoires fonctionnelles.

10 0. L'estimation non paramétrique par la méthode du noyau Introduction 0.. Présentation des estimateurs et du cadre de travail Estimation de la densité de probabilité Soit X,..., X n un échantillon de variables aléatoires identiquement distribuées, à valeurs dans R d, de densité commune f et K, appelé noyau de Parzen- Rosenblatt, une application dénie sur R d telle que Kxdx = et lim R d x R d x d R Kx = 0, d où. R d est la norme euclidienne sur R d. L'estimateur de la densité de Parzen-Rosenblatt est déni, pour tout x R d, par f n x := nh d n n x Xi K, i= où h n, appelé la fenêtre de lissage, est un paramètre tendant avec une certaine vitesse vers 0 lorsque n tend vers l'inni. Rosenblatt 956 donna dans son article l'erreur quadratique moyenne relative à l'estimation de la densité dans le cas d'observations univariées indépendantes et identiquement distribuées et où le noyau uniforme K = I [,] est utilisé I désigne la fonction indicatrice. Parzen 962 généralisa ce 2 résultat en considérant une classe très vaste de noyaux et établit aussi la normalité asymptotique, puis le cas multivarié fut traité par Cacoullos 966. De nombreux auteurs, parmi lesquels nous citons Roussas 969a, Rosenblatt 970, Borwanker 97 pour des δ-séquences incluant les estimateurs à noyau, Tran 990 et Pham et Tran 99, ont par la suite traité le cas où les variables sont dépendantes. Nous renvoyons à Bosq 998 pour une présentation détaillées des résultats dans ce contexte. Il ressort dans le cadre de structures de dépendances faibles que sous certaines conditions portant sur les coecients de mélangeance voir Doukhan 994 pour les dénitions et les propriétés des mélanges, il est possible d'atteindre les mêmes vitesses de convergence que dans le cas indépendant. Ainsi, pour une densité de probabilité deux fois continûment dérivable, sous des conditions usuelles que nous ne détaillons pas ici, il est établi, pour la convergence en moyenne quadratique, que h n n 4 4+d E fn x fx 2 = O. 2 Banon 978 fut le premier à s'intéresser à l'estimation de la densité en temps continu, dans le cas de processus de diusion sous la condition G 2 de Rosenblatt voir Rosenblatt 970 en utilisant des noyaux récursifs. L'estimateur de la densité par la méthode du noyau est donné, pour un processus X t observé pour t [0, T ], par 2

11 Introduction 0. L'estimation non paramétrique par la méthode du noyau f T x := T h d T T t=0 x Xt K dt. 3 Delecroix 979 obtint la convergence presque sûre et la convergence en moyenne quadratique des estimateurs de la densité et de la densité conditionnelle pour des processus strictement stationnaires et fortement mélangeants. Par la suite, Castellana et Leadbetter 986 démontrèrent qu'il était possible, sous certaines conditions sur les densités jointes du processus, d'atteindre une vitesse de convergence de l'estimateur de la densité en T, qu'on appelle vitesse "suroptimale" ou "paramétrique" puisqu'elle est identique aux vitesses obtenues classiquement en statistique paramétrique. h T Estimation de la fonction de régression Nadaraya 964 et Watson 964 furent les premiers à s'intéresser à l'estimation de la fonction de régression par la méthode du noyau. Soit X, Y,..., X n, Y n un échantillon de n répliques d'un couple aléatoire générique X, Y à valeurs dans R d R. La fonction de régression est l'espérance de la variable Y conditionnée par X : rx := E Y X = x. Cette grandeur est posée exister et être nie. L'estimateur de Nadaraya-Watson est alors déni comme suit n i= ik Y x X i h n, si n n i= K i= K x X i h n 0, rx := x X i h n n n i= Y i, pour n i= K x X i h n = 0. Une littérature abondante s'est développée sur l'étude de la convergence de cet estimateur. Nous renvoyons à Collomb 98, Krzy»ak et Pawlak 987, Collomb et Härdle 986, Bosq et Lecoutre 987, Györ et al. 989, Roussas 990 et Bosq 998 pour un corpus de résultats et des références plémentaires. Sous des conditions générales, la vitesse de convergence de l'estimateur de la fonction de régression est identique à celle obtenue pour l'estimateur de la densité, 4 n 4 4+d E rn x rx 2 = O. 5 L'estimateur de la fonction de régression par la méthode du noyau pour des processus à temps continu a été introduit par Cheze 992 qui établit la convergence 3

12 0. L'estimation non paramétrique par la méthode du noyau Introduction en moyenne quadratique, la convergence presque sûre et la normalité asymptotique. La vitesse suroptimale pour ce même estimateur fut obtenue par Bosq 993 et Bosq 997. Le mode conditionnel L'estimation de la fonction de régression est une méthode naturelle en vue de la prédiction, mais elle est sensible aux valeurs aberrantes et peut se montrer inappropriée dans certains cas, comme lorsque la distribution est multimodale ou fortement asymétrique. L'estimation du mode conditionnel constitue alors une alternative intéressante. Soit X, Y un couple de variables aléatoires à valeurs dans R d R d et X, Y,..., X n, Y n n copies de ce couple. On pose que le couple X, Y possède une densité jointe f X,Y et que la variable aléatoire X admet une densité marginale f X. Nous pouvons alors dénir le mode conditionnel θx, posé unique sur un compact S R d, comme étant la valeur maximisant la densité conditionnelle de Y sachant X = x, avec θx := argmax y S fy x fy x = f X,Y x, y. f X x Il s'agit en fait ici d'une version locale du mode conditionnel celui-ci étant normalement déni comme le remum pour y R d, orant l'avantage de poser l'unicité du mode conditionnel local sans exclure les distributions multi-modales. Pour estimer le mode conditionnel, on se donne deux noyaux de Parzen-Rosenblatt H et K, ainsi que deux fenêtres de lissage h H,n et h K,n et on pose f n y x := n i= H y Y i h d H,n nh d H,n x X i h H,n K n i= K x X i h K,n h K,n, si n i= K x X i h n 0, n i= H y Y i h H,n, pour n i= K x X i h K,n = 0. L'estimateur du mode conditionnel est alors déni par l'expression 6 θ n x := argmax y S fn y x. 7 Nous pouvons remarquer que cela ne dénit pas de façon unique l'estimateur plusieurs vecteurs y peuvent satisfaire la relation 7, mais le vrai mode conditionnel étant lui unique, les résultats obtenus sont valables pour tous les vecteurs satisfaisant 7. Collomb et al. 987 établirent la convergence uniforme de cet estimateur 4

13 Introduction 0. L'estimation non paramétrique par la méthode du noyau pour un processus φ-mélangeant avec d =, et Samanta et Thavaneswaran 990 obtinrent la normalité asymptotique. Pour des références plus récentes sur l'estimation du mode conditionnel, nous renvoyons à Quintela-Del-Río et Vieu 997, Berlinet et al. 998 et Louani et Ould-Saïd 999. Dans le cas de processus à temps continu, il n'y a, à notre connaissance, aucune publication sur le sujet. La fonction de répartition conditionnelle et les quantiles conditionnels La fonction de régression et le mode conditionnel ont tous deux l'inconvénient de ne fournir qu'une valeur prédictive sans nous renseigner sur la probabilité que la réalisation soit proche de celle-ci c'est à dire sans décrire la distribution de la variable conditionnée. La fonction de répartition conditionnelle nous donne la probabilité que la variable d'intérêt appartienne à un intervalle donné, tandis que les quantiles conditionnels permettent la construction d'intervalles de prédiction. Ils apportent par conséquent tout deux un complément d'information fort utile sur le comportement de la variable d'intérêt. Nous considérons le même échantillon que celui introduit dans la présentation de l'estimation de la fonction de régression. La fonction de répartition conditionnelle, dénie par la relation F y x := P Y y X = X, est posée admettre une version régulière, et nous l'estimons par la statistique F n y x := n i= I x X ],y]y i K i h n, si n i= K x X i h n n i= K x X i h n 0, n n i= I ],y]y i, pour n i= K x X i h n = 0. Nous pouvons constater que cet estimateur correspond à celui de la régression de la variable aléatoire I ],y] Y par rapport à la variable X. Pour x R d, nous posons alors que la fonction de répartition conditionnelle F y x est continue et strictement croissante sur un intervalle [a, b], et dénissons, pour tout θ [F a x, F b x], le quantile conditionnel u θ x comme vériant l'équation F u θ x x = θ. Un estimateur naturel du quantile conditionnel est alors donné par û θ x := u, F u x θ. u R L'estimation des quantiles conditionnels fut traitée pour la première fois par Roussas 969b dans le cas de processus de Markov, en utilisant un estimateur de la fonction de répartition conditionnelle déni comme étant l'intégrale de l'estimateur de la densité conditionnelle. Pour des références sur le sujet, nous renvoyons tout particulièrement à Berlinet et al

14 0. L'estimation non paramétrique par la méthode du noyau Introduction 0..2 Les modèles additifs, une solution au éau de la dimension. Comme nous pouvons le voir dans la relation 5, la vitesse de convergence de l'estimateur de la fonction de régression est une fonction décroissante de la dimension de la covariable. Ce fait, appelé le éau de la dimension, traduit la dispersion des données lorsque la dimension augmente. Ainsi, si nous considérons l'intervalle [0, ], nous pouvons le partitionner en 0 intervalles de longueur /0 tandis qu'il faut, en dimension d, 0 d hypercubes d'arête de longueur /0 pour partitionner [0, ] d. Par conséquent, si nous considérons une variable aléatoire à valeurs dans [0, ] d, il faut avoir un échantillon de taille 0 d+ pour avoir en moyenne autant d'observations par hypercube d'arête de longueur /0 qu'il y en a par intervalle de longueur /0 pour un échantillon de taille 00 en dimension. Parmi les travaux qui se sont proposés d'apporter un solution au problème posé par cette dispersion des données en grande dimension, on peut distinguer deux types d'approches. La première consiste en une diminution de la dimension des variables par projection sur un espace de dimension moindre, comme la projection pursuit, technique qui fut proposée par Kruskal 969 et adaptée à l'estimation de la fonction de régression par Friedman et Stuetzle 98. La seconde propose de faire des hypothèses sur la forme de la fonction de régression comme dans les modèles additifs généralisés dont nous savons depuis les travaux de Stone 985 et Stone 986 qu'ils permettent d'obtenir une vitesse de convergence identique à celle du cas univarié. Si cette approche a l'avantage de donner un résultat plus aisément interprétable que la projection pursuit, elle est cependant moins souple puisqu'elle pose que la fonction de régression s'écrive comme la somme de fonctions des composantes de la variable explicative. Pour ψ une fonction mesurable à valeurs dans R et x = x,...x d R d, le modèle s'écrit m ψ x := E ψy X = x = µ + d m l x l, l= où les fonctions m l, l [, d], sont appelées les composantes additives et sont dénies à une constante additive près. Cela implique que nous devons imposer une contrainte plémentaire an que le modèle soit identiable, la plus courante étant Em l X l = 0, l [0, d]. Le backtting voir Hastie et Tibshirani 990 pour une présentation détaillée de celui-ci, basé sur un algorithme itératif, est facilement implémentable et constitue par conséquent la méthode la plus utilisée en pratique pour estimer les composantes additives. En contre partie, la nature algorithmique de cette méthode rend malaisée 6

15 Introduction 0. L'estimation non paramétrique par la méthode du noyau l'étude théorique des propriétés asymptotiques de l'estimateur associé nous renvoyons à Opsomer et Ruppert 997 et Opsomer 2000 pour des résultats sur le sujet. Dans cette thèse, nous nous intéressons à la méthode d'intégration marginale introduite par Newey 994, Tjøstheim et Auestad 994 et Linton et Nielsen 995 et dont nous rappelons le principe dans ce qui suit. Nous considérons à nouveau un échantillon de n répliques d'un couple aléatoire X, Y R d R. Soient q,..., q d d fonctions de densité dénies sur R avec d 2. Pour x = x,..., x d R d et x l = x,...x l, x l+,..., x d, nous posons qx := d i= q ix i, q l x l := i l q ix i et η l x l := m ψ xq l x l dx l m ψ zqzdz. R d R d Cela permet de réécrire la fonction de régression comme suit d m ψ x = η l x l + m ψ zqzdz. 9 R d i= Un estimateur naturel de la fonction de régression additive est alors donné par avec m ψ,n,add x := d η l,n x l + m ψ,n zqzdz 0 R d l= m ψ,n x := m ψ,n,l x := η l x l := n ψy i K x Xi 3 i= nh d ˆf,,n n X i n xl X K n,l x l X i, l K2 h,n h 2,n i= nh,n h d f ψy i, 2,n n X i m ψ,n,l xq l x l dx l m ψ,n,l xqxdx, R d R d h,n où K, K 2 et K 3 sont des noyaux de Parzen-Rosenblatt et f n est l'estimateur de la densité déni en. Il est à noter que les fonctions η l, l [,..., d], sont égales, à une constante additive près, aux composantes additives m l ; il s'agit donc de composantes additives satisfaisant d'autres conditions d'identiabilité. Dans le cadre de cette thèse, nous avons traité le modèle additif en temps continu qui est présenté plus bas dans la section 0.2. de cette introduction Les variables aléatoires fonctionnelles. Si la qualité de l'estimation réduit considérablement lorsque la dimension augmente, il est naturel de s'interroger sur la vitesse de convergence des estimateurs 7

16 0. L'estimation non paramétrique par la méthode du noyau Introduction non-paramétriques lorsque la covariable est à valeurs dans un espace fonctionnel de dimension innie. Ce type de variables se retrouvant dans de nombreux domaines, comme la météorologie, la chimie quantitative, la biométrie, l'économétrie ou l'imagerie médicale voir Frank et Friedman 993, Hastie et al. 995, Ramsay et Silverman 2002, Ferraty et Vieu 2006 pour des exemples de situations où des variables fonctionnelles sont impliquées, un intérêt croissant s'est développé pour l'étude de celles-ci. De plus, en raison de la précision des appareils de mesure modernes et de l'importante capacité de stockage qu'orent les systèmes informatiques actuels, il est possible d'obtenir une discrétisation très ne des données qui sont par conséquent très proches des courbes étudiées. Les premiers travaux à envisager le cas de variables aléatoires fonctionnelles sont ceux de Rao 958 et Tucker 958 qui s'intéressèrent à l'analyse en composantes principales, mais l'intensication des recherches sur le sujet est récente. Frank et Friedman 993 rent une comparaison des diérentes méthodes de régression paramétrique pour variables fonctionnelles alors développées que sont la ridge regression dont le principe a été posé par Hoerl et Kennard 970, la régression sur composante principale Massy 965 et la régression partial least square voir Helland 990. Cet article fut suivi d'un commentaire de Hastie et Mallows 993 qui remarquèrent que ces méthodes, qui ne prennent pas en considération la nature fonctionnelle des données, ne sont pas adaptées lorsque les courbes ne sont pas lisses ou mesurées avec des erreurs ni lorsque la discrétisation des courbes n'est pas réalisée aux mêmes points, ce qui est souvent le cas en pratique. Par la suite, plusieurs auteurs ont proposé des modèles qui tiennent compte de la nature fonctionnelle des variables voir Ramsay et Silverman 997, Cardot et al. 999, Bosq 2000 et Cuevas et al Les modèles pleinement non-paramétriques pour les variables fonctionnelles ont quant à eux été introduits par Ferraty et Vieu, tout d'abord en utilisant la dimension fractale Ferraty et Vieu 2000 et Ferraty et al. 2002, an de maîtriser la probabilité que la variable appartienne à de petites boules, sans faire intervenir la notion de densité. Ils assouplirent par la suite cette condition Ferraty et Vieu 2004 en imposant au processus X i à valeur dans un espace fonctionnel H les conditions suivantes, pour tout x C, 0 < β φh P X Bx, h φhβ 2, 0 < β 3 ψh P X i, X j Bx, h Bx, h ψhβ 4, 2 i j où C est un compact de H auquel on restreint l'étude, Bx, h est la boule de centre x et de rayon h dénie par la semi-métrique de l'espace H, β, β 2, β 3, et β 4 sont 4 réels positifs, et φ et ψ sont des fonctions positives dépendant des propriétés du processus Les variables aléatoires censurées à droite La modélisation de la probabilité d'apparition d'un événement au cours du temps est un problème rencontré dans un grand nombre de domaines et de dis- 8

17 Introduction 0. L'estimation non paramétrique par la méthode du noyau ciplines. Ce problème est souvent lié à la notion de durée de survie, rencontrée à l'origine dans les études d'essais cliniques et par la suite en abilité et en économie. il se trouve dans certains cas que la participation d'individus à une étude est interrompue pour une raison indépendante du sujet d'intérêt. On parle alors d'un cas de censure car la durée de survie n'a pas été observée intégralement pour tous les participants. Le cadre décrit ici présente plus précisément la censure à droite qui est aléatoire si les interruptions de participations à l'étude se produisent de façon aléatoire et le nombre total de durées de survie observées complètement est aléatoire. Outre le modèle de censure déterministe, dit de type I, des modèles de censures de type II alliant une date de censure aléatoire et une composante déterministe imposant une contrainte sur le nombre de durées de survies eectivement observées ont aussi fait l'objet d'étude dans la littérature nous renvoyons à Koul et Deshpande 995 pour une présentation de résultats sur les variables censurées. Le travail effectué dans le cadre de cette thèse considère la censure aléatoire à droite où n'est observé que le minimum entre la durée de survie et l'instant aléatoire de censure. La question posée est d'expliquer la durée de survie Y sujette à une censure C par une variable aléatoire vectorielle X. Pour ce faire, nous disposons de n copies indépendantes X i, Y i, C i du triplet X, Y, C. Nous posons naturellement que la variable de censure C est indépendante du couple X, Y. Notons que les observations se résument à l'échantillon Z i, δ i, X i, i =,..., n, où Z i est le minimum entre Y i et C i, δ i = si Z i = Y i et δ i = 0 sinon : Z i = Y i C i δ i = I [,Ci ]Y i. 3 L'estimateur de la fonction de survie d'une variable aléatoire est celui de Kaplan et Meier 958 qui se présente comme suit. Si G est la fonction de répartition de la variable de censure C, alors l'estimateur de la variable de censure C, alors l'estimateur de Kaplan-Meier de la fonction de survie de C est déni, avec les conventions = et 00 =, par G nu := i:z i u δ Nn Z i i, pour tout u R 4 N n Z i où N n x = n i= I {Z i x}. Il ressort alors qu'un estimateur à noyau IPCW Inverse Probability of Censoring Weighted, voir Carbonez et al. 995 et Kohler et al de la fonction de régression est donné par m ψ,n,hx := n j= K x Xj h n i= K x X i h δ i ψz i G nz i. 5 9

18 0.2 Présentation des résultats Introduction 0.2 Présentation des résultats Les processus à temps continu seront étudiés dans les cinq premiers chapitres de cette thèse. Les deux premiers chapitres portent sur l'estimation de la fonction de régression additive, le troisième chapitre s'intéresse à l'estimation de la densité dans le cas où le processus est non stationnaire et les chapitres 4 et 5 traitent des variables aléatoires fonctionnelles. Finalement, nous nous intéressons dans le chapitre 6 à des variables aléatoires indépendantes censurées Le modèle additif pour des processus à temps continu Hormis les processus à trajectoires irrégulières pour lesquels l'estimateur de la fonction de régression converge à la vitesse paramétrique, les processus à temps continu subissent, comme les processus à temps discret, le éau de la dimension. Il semble donc naturel de s'intéresser aux modèles additifs qui, comme nous l'avons vu pour les processus à temps discret, apportent une solution à ce problème. Le cas de variables aléatoires mélangeantes a été traité par Camlong-Viot et al dans le cas β-mélangeant et par Camlong-Viot et al pour des processus α-mélangeants, mais aucun travail ne porte sur les processus à temps continu. L'estimateur de la fonction de régression additive par la méthode d'intégration marginale est dans ce cas donné par avec m ψ,t,add x = d η l x l + m ψ,t xqxdx 6 R d l= η l x l := m ψ,t x := m ψ,t,l x := m ψ,t,l xq l x l dx l m ψ,t,l xqxdx, R d R d T W T,t xψy t dt avec W T,t x = K x Xt 3 h,t 0 T h d ˆf,T T X t, T WT,txψY l t dt avec WT,tx l = K xl X t,l x l X t, l K2 h,t h 2,T 0 T h,t h d f 2,T T X t où f T est l'estimateur de la densité déni en 3. Nous nous intéressons dans le chapitre aux vitesses de convergence en moyenne quadratique et de convergence presque sûre de la fonction de régression additive, et obtenons des vitesses identiques au cas univarié. Dans le chapitre 2, nous établissons la normalité asymptotique des composantes additives η l. En temps continu, pour obtenir la normalité asymptotique d'un estimateur, il faut imposer des conditions assurant que celui-ci ne converge pas 0

19 Introduction 0.2 Présentation des résultats trop vite vers la fonction à estimer voir Cheze 992. Par conséquent, en plus de la normalité asymptotique, nous établissons sous des conditions moins contraignantes, pour tout α, β ]0; 2 [ ] 2 ; [, en notant Q α le quantile d'ordre α d'une loi normale centrée réduite, que lim inf T k T P 2k+ A { η l,t x l η l x l h k l,t b l x l } [Q α ; Q β ] β α, 7 où A est une constante non nulle vériant A lim T + T 2k 2k+ Varˆηl,T x l /2 et b l x l = ck k! R uk K l udu k m k l x l m R lzq k l zdz, avec c une constante et K l un noyau à valeurs dans R Estimation de la densité pour des processus non stationnaires L'étude de la convergence de l'estimateur de la densité par la méthode du noyau pour des processus non stationnaires s'appuie généralement sur des hypothèses vériées par les processus stationnaires. L'objectif du chapitre 3 est de tirer parti de la non stationnarité pour atteindre, pour certains processus, de meilleures vitesses de convergence, et obtenir, pour d'autres processus, la consistance de l'estimateur lorsque le coecient de mélangeance ne satisfait pas les hypothèses habituelles. Pour ce faire, nous introduisons un estimateur qui pondère les observations en fonction de leur localisation dans le temps : f T x := f T x, φ := φt h d T T 0 φ uk x h T, X u h T du, où φ est une application continûment dérivable sur ]0; + [, nulle et continue à l'origine, et strictement croissante et φ est sa dérivée et sert à pondérer les observations en fonction de l'instant de réalisation. En fait, ce type de pondération revient à un changement de temps, et nous obtenons donc que la vitesse de convergence presque sûre est identique à la vitesse classique, avec φt dépendant de la distribution du processus, donc inconnue à la place de T. Nous proposons alors une méthode permettant de sélectionner la fonction φ satisfaisant nos hypothèses parmi un ensemble ni de fonctions données et permettant de donner la meilleure vitesse de convergence Variables fonctionnelles en temps continu Les modèles non-paramétriques pour les variables fonctionnelles introduits par Ferraty et Vieu sont récents mais plusieurs résultats majeurs ont néanmoins été produits. Ainsi, la convergence presque sûre Ferraty et Vieu 2004, la convergence en moyenne quadratique et la normalité asymptotique Ferraty et al. 2007

20 0.2 Présentation des résultats Introduction et Attouch et al de l'estimateur de la fonction de régression ont été obtenues tandis que Ferraty et al ont établi la convergence presque sûre des estimateurs de la fonction de répartition conditionnelle, des dérivées de la densité de probabilité conditionnelle, du mode conditionnel et des quantiles conditionnels. Le but des chapitres 4 et 5 est d'établir ce type de résultats dans le cas de processus à temps continu. De nombreux phénomènes physiques, comme le champs magnétique terrestre, les ondes sismiques ou les isothermes et les isobares en météorologie, peuvent en eets être représentés par des variables aléatoires fonctionnelles en temps continu. Nous considérons un processus {X t, Y t } t R + observé pour t [0, T ], où Y t est une variable aléatoire réelle et X t est à valeurs dans un espace métrique H. Nous imposons toujours la relation tandis que la condition fondamentale 2 devient alors, pour un certain δ > 0, pour C un compact de H et pour tout réels positifs s et t tels que t s > δ, x C P X s Bx, h, X t Bx, h β 3 φh 2. Dans le chapitre 4, nous introduisons une fonction Ψ dénie sur R 2 et dénissons la fonction de régression généralisée que nous estimons par r T x, y := T rx, y = EΨy, Y 0 X 0 = x Ψy, Y t=0 tkh T dx, X tdt T t=0 Kh T dx, X, si T t=0 tdt Kh T dx, X tdt 0, T Ψy, Y T t=0 tdt, pour T t=0 Kh T dx, X tdt = 0. Nous montrons que la vitesse de convergence uniforme en y et en x de cet estimateur est identique à celle obtenue dans le cas discret pour un estimateur de la fonction de régression simple, i.e., de l'ordre de O h η T + lnt où η est un T φh T paramètre dépendant de la régularité de la fonction de régression, et en déduisons en corollaire la convergence des estimateurs de la fonction de répartition conditionnelle et des quantiles conditionnels. Sous des hypothèses plus fortes concernant la structure de dépendance et pour un choix spécique du noyau K, nous montrons qu'il est possible d'atteindre la vitesse de convergence en probabilité vers 0 suroptimale, ln m T à savoir O. T Dans le chapitre 5, nous nous intéressons à l'estimateur de la densité conditionnelle. Soient C et S des compacts de l'espace métrique H et R d respectivement, notre estimateur est alors déni, pour tout x, y C S, par 2 8

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes Zohra Guessoum 1 & Farida Hamrani 2 1 Lab. MSTD, Faculté de mathématique, USTHB, BP n 32, El Alia, Alger, Algérie,zguessoum@usthb.dz

Plus en détail

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA

Plus en détail

MAT 2377 Solutions to the Mi-term

MAT 2377 Solutions to the Mi-term MAT 2377 Solutions to the Mi-term Tuesday June 16 15 Time: 70 minutes Student Number: Name: Professor M. Alvo This is an open book exam. Standard calculators are permitted. Answer all questions. Place

Plus en détail

Rapport de Recherche. 1 Estimation fonctionnelle en temps continu. 1.1 Vitesses de convergence pour l estimateur à noyau. (D. Blanke - Mars 2008)

Rapport de Recherche. 1 Estimation fonctionnelle en temps continu. 1.1 Vitesses de convergence pour l estimateur à noyau. (D. Blanke - Mars 2008) Rapport de Recherche (D. Blanke - Mars 2008) L essentiel de mes activités de recherche porte sur l estimation fonctionnelle ou paramétrique pour des processus. L ensemble de ces travaux peut se diviser

Plus en détail

Cours STAT 2150. "Statistique non paramétrique: Méthodes de lissage"

Cours STAT 2150. Statistique non paramétrique: Méthodes de lissage Cours STAT 2150 "Statistique non paramétrique: Méthodes de lissage" Année académique 2008-2009 Séance 1 1 Table de matière du cours 1. Introduction (Fonction de répartition, histogramme, propriétés d un

Plus en détail

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Filtrage stochastique non linéaire par la théorie de représentation des martingales Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de

Plus en détail

Algorithmes Stochastiques

Algorithmes Stochastiques Algorithmes Stochastiques Session organisée par Peggy Cénac Un algorithme stochastique est un outil d'optimisation particulièrement utile lorsque l'on observe les données "en ligne". Il permet, entre autres

Plus en détail

Sélection de variables groupées avec les forêts aléatoires. Application à l analyse des données fonctionnelles multivariées.

Sélection de variables groupées avec les forêts aléatoires. Application à l analyse des données fonctionnelles multivariées. Sélection de variables groupées avec les forêts aléatoires. Application à l analyse des données fonctionnelles multivariées. Baptiste Gregorutti 12, Bertrand Michel 2 & Philippe Saint Pierre 2 1 Safety

Plus en détail

Clustering par quantification en présence de censure

Clustering par quantification en présence de censure Clustering par quantification en présence de censure Svetlana Gribkova 1 Laboratoire de Statistique Théorique et Appliquée, Université Pierre et Marie Curie Paris 6, 4 place Jussieu, 75005 Paris Résumé.

Plus en détail

Estimation spline de quantiles conditionnels pour variables explicatives fonctionnelles

Estimation spline de quantiles conditionnels pour variables explicatives fonctionnelles Estimation spline de quantiles conditionnels pour variables explicatives fonctionnelles Hervé Cardot 1, Christophe Crambes 2 & Pascal Sarda 2,3 1 INRA Toulouse, Biométrie et Intelligence Artificielle,

Plus en détail

Principe de symétrisation pour la construction d un test adaptatif

Principe de symétrisation pour la construction d un test adaptatif Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université

Plus en détail

Variational inequalities and time-dependent traffic equilibria

Variational inequalities and time-dependent traffic equilibria Time-dependent traffic equilibria Analyse mathématique/mathematical analysis Variational inequalities and time-dependent traffic equilibria Patrizia DANIELE, Antonino MAUGERI and Werner OETTLI P. D. A.

Plus en détail

Éléments spectraux d une fonction cyclostationnaire

Éléments spectraux d une fonction cyclostationnaire Éléments spectraux d une fonction cyclostationnaire Alain BOUDOU 1 & Sylvie VIGUIR-PLA 1 & 2 1 quipe de Stat. et Proba., Institut de Mathématiques, UMR5219 Université Paul Sabatier, 118 Route de Narbonne,

Plus en détail

Introduction au cours STA 102 Analyse des données : Méthodes explicatives

Introduction au cours STA 102 Analyse des données : Méthodes explicatives Analyse des données - Méthodes explicatives (STA102) Introduction au cours STA 102 Analyse des données : Méthodes explicatives Giorgio Russolillo giorgio.russolillo@cnam.fr Infos et support du cours Slide

Plus en détail

Estimation du Quantile conditionnel par les Réseaux de neurones à fonction radiale de base

Estimation du Quantile conditionnel par les Réseaux de neurones à fonction radiale de base Estimation du Quantile conditionnel par les Réseaux de neurones à fonction radiale de base M.A. Knefati 1 & A. Oulidi 2 & P.Chauvet 1 & M. Delecroix 3 1 LUNAM Université, Université Catholique de l Ouest,

Plus en détail

Introduction à la simulation de Monte Carlo

Introduction à la simulation de Monte Carlo Introduction à la simulation de 6-601-09 Simulation Geneviève Gauthier HEC Montréal e 1 d une I Soit X 1, X,..., X n des variables aléatoires indépendantes et identiquement distribuées. Elles sont obtenues

Plus en détail

Algebra for Digital Communication. Test 2

Algebra for Digital Communication. Test 2 EPFL - Section de Mathématiques Algebra for Digital Communication Prof. E. Bayer Fluckiger Sections de Systèmes de Communications et Physique Winter semester 2006-2007 Test 2 Thursday, 1st February 2007

Plus en détail

Estimation et modélisation de dépendance dans des modèles de survie bivariés en présence de censure

Estimation et modélisation de dépendance dans des modèles de survie bivariés en présence de censure Estimation et modélisation de dépendance dans des modèles de survie bivariés en présence de censure Svetlana Gribkova, Olivier Lopez Laboratoire de Statistique Théorique et Appliquée, Paris 6 4 Mars 2014

Plus en détail

Finance des matières premières (6b) De la formation des prix sur les marchés financiers à la possibilité d un équilibre (non walrasien)

Finance des matières premières (6b) De la formation des prix sur les marchés financiers à la possibilité d un équilibre (non walrasien) Finance des matières premières (6b) De la formation des prix sur les marchés financiers à la possibilité d un équilibre (non walrasien) Alain Bretto & Joël Priolon - 25 mars 2013 Question Dans un équilibre

Plus en détail

0 h(s)ds et h [t = 1 [t, [ h, t IR +. Φ L 2 (IR + ) Φ sur U par

0 h(s)ds et h [t = 1 [t, [ h, t IR +. Φ L 2 (IR + ) Φ sur U par Probabilités) Calculus on Fock space and a non-adapted quantum Itô formula Nicolas Privault Abstract - The aim of this note is to introduce a calculus on Fock space with its probabilistic interpretations,

Plus en détail

Estimation consistante des paramètres d un. modèle non linéaire pour des données. fonctionnelles discrétisées aléatoirement

Estimation consistante des paramètres d un. modèle non linéaire pour des données. fonctionnelles discrétisées aléatoirement Estimation consistante des paramètres d un modèle non linéaire pour des données fonctionnelles discrétisées aléatoirement Consistent estimation of parameters in a nonlinear model for functional data with

Plus en détail

Probabilités. I- Expérience aléatoire, espace probabilisé : ShotGun. 1- Définitions :

Probabilités. I- Expérience aléatoire, espace probabilisé : ShotGun. 1- Définitions : Probabilités I- Expérience aléatoire, espace probabilisé : 1- Définitions : Ω : Ensemble dont les points w sont les résultats possibles de l expérience Des évènements A parties de Ω appartiennent à A une

Plus en détail

Simulation de variables aléatoires

Simulation de variables aléatoires Simulation de variables aléatoires S. Robin INA PG, Biométrie Décembre 1997 Table des matières 1 Introduction Variables aléatoires discrètes 3.1 Pile ou face................................... 3. Loi de

Plus en détail

Test de comparaison de deux modèles de régression non paramétriques basé sur les coefficients de Fourier

Test de comparaison de deux modèles de régression non paramétriques basé sur les coefficients de Fourier Test de comparaison de deux modèles de régression non paramétriques basé sur les coefficients de Fourier Zaher Mohdeb Université Mentouri Département de Mathématiques, Constantine, Algérie E-mail: zaher.mohdeb@umc.edu.dz

Plus en détail

Retournement Temporel

Retournement Temporel Retournement Temporel Rédigé par: HENG Sokly Encadrés par: Bernard ROUSSELET & Stéphane JUNCA 2 juin 28 Remerciements Je tiens tout d'abord à remercier mes responsables de mémoire, M.Bernard ROUSSELET

Plus en détail

Travaux dirigés. Résolution numérique des équations diérentielles ordinaires. Département MIDO année 2013/2014 Master MMDMA

Travaux dirigés. Résolution numérique des équations diérentielles ordinaires. Département MIDO année 2013/2014 Master MMDMA Université Paris-Dauphine Méthodes numériques Département MIDO année 03/04 Master MMDMA Travaux dirigés Résolution numérique des équations diérentielles ordinaires Exercice. Pour α > 0, on considère le

Plus en détail

Université Paris 13 Année 2014-2015 M2 Introduction à la théorie spectrale

Université Paris 13 Année 2014-2015 M2 Introduction à la théorie spectrale Université Paris 13 Année 014-015 M Introduction à la théorie spectrale Examen Les exercices sont indépendants 1. Spectre des opérateurs annihilation-création. On considère sur R les opérateurs différentiels

Plus en détail

Tests d hypothèses restreintes

Tests d hypothèses restreintes Tests d hypothèses restreintes Céline Delmas & Jean-Louis Foulley Station de Génétique Quantitative et Appliquée I.N.R.A., Domaine de Vilvert 7835 Jouy-en-Josas Cedex {delmas,foulley}@dga.jouy.inra.fr

Plus en détail

Simulations des Grecques : Malliavin vs Différences finies

Simulations des Grecques : Malliavin vs Différences finies 0.1. LES GRECQUES 1 Simulations des Grecques : iavin vs Différences finies Christophe Chorro Ce petit document vise à illustrer de manière numérique les techniques présentées lors du mini cours sur le

Plus en détail

Modélisation des lois multidimensionnelles par la théorie des copules

Modélisation des lois multidimensionnelles par la théorie des copules Modélisation des lois multidimensionnelles par la théorie des copules Grégoire Mercier jeudi 9 novembre 26 Contenu 2 Mesure de dépendance Lien avec les copules 3 Estimation de l information mutuelle Estimation

Plus en détail

Outils mathématiques pour le datamining. http://www.elseware.fr/univevry

Outils mathématiques pour le datamining. http://www.elseware.fr/univevry Outils mathématiques pour le datamining http://wwwelsewarefr/univevry Géométrie Distance Distance entre parties Matrice de variance/covariance Inertie Minimisation Probabilités Définition Théorème de Bayes

Plus en détail

Chapitre 2 Le problème de l unicité des solutions

Chapitre 2 Le problème de l unicité des solutions Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)

Plus en détail

INTRODUCTION AUX MÉTHODES DE MONTE CARLO PAR CHAÎNES DE MARKOV

INTRODUCTION AUX MÉTHODES DE MONTE CARLO PAR CHAÎNES DE MARKOV Séminaire MTDE 22 mai 23 INTRODUCTION AUX MÉTHODES DE MONTE CARLO PAR CHAÎNES DE MARKOV Vincent Mazet CRAN CNRS UMR 739, Université Henri Poincaré, 5456 Vandœuvre-lès-Nancy Cedex 1 juillet 23 Sommaire

Plus en détail

Feuille d exercices Variables Aléatoires et Conditionnement

Feuille d exercices Variables Aléatoires et Conditionnement Feuille d exercices Variables Aléatoires et Conditionnement B. Delyon, V. Monbet Master 1-2013-2014 1 Indépendance et conditionnement 1.1 Introduction Exercice 1 Pour améliorer la sûreté de fonctionnement

Plus en détail

Statistiques et inférence topologique : de nouvelles méthodes pour l analyse des données

Statistiques et inférence topologique : de nouvelles méthodes pour l analyse des données Mathématiques en mouvement 2014 Statistiques et inférence topologique : de nouvelles méthodes pour l analyse des données Bertrand MICHEL (LSTA - Upmc & INRIA Saclay équipe GEOMETRICA ) Introduction Beaucoup

Plus en détail

Tavakoli, Shahin Fourier analysis of functional time series, with applications to DNA... 2014

Tavakoli, Shahin Fourier analysis of functional time series, with applications to DNA... 2014 resultats sont ensuite utilises pour construire des estimateurs des operateurs de densite spectrale bases sur des versions lissees du periodogramme, le generalisation fonctionnelle de la matrice de periodogramme.

Plus en détail

3 Approximation de solutions d équations

3 Approximation de solutions d équations 3 Approximation de solutions d équations Une équation scalaire a la forme générale f(x) =0où f est une fonction de IR dans IR. Un système de n équations à n inconnues peut aussi se mettre sous une telle

Plus en détail

2003 Maritime Mathematics Competition Concours de Mathématiques des Maritimes 2003

2003 Maritime Mathematics Competition Concours de Mathématiques des Maritimes 2003 200 Maritime Mathematics Competition Concours de Mathématiques des Maritimes 200 1. When a father distributes a number of candies among his children, each child receives 15 candies and there is one left

Plus en détail

Cours d Analyse. Fonctions de plusieurs variables

Cours d Analyse. Fonctions de plusieurs variables Cours d Analyse Fonctions de plusieurs variables Licence 1ère année 2007/2008 Nicolas Prioux Université de Marne-la-Vallée Table des matières 1 Notions de géométrie dans l espace et fonctions à deux variables........

Plus en détail

Cours d Analyse Réelle 4M003

Cours d Analyse Réelle 4M003 Cours d Analyse Réelle 4M003 Jean SAINT RAYMOND Université Pierre et Marie Curie Avant-propos Ce texte a été rédigé pour servir de support écrit à un cours de Master 1 de l Université Pierre-et-Marie Curie.

Plus en détail

Couples de variables aléatoires discrètes

Couples de variables aléatoires discrètes Couples de variables aléatoires discrètes ECE Lycée Carnot mai Dans ce dernier chapitre de probabilités de l'année, nous allons introduire l'étude de couples de variables aléatoires, c'est-à-dire l'étude

Plus en détail

Machines à sous (compléments)

Machines à sous (compléments) CHAPITRE 28 Machines à sous (compléments) Résumé. Ce qui suit complète le chapitre 22. On explique ici brièvement comment rre non-asymptotiques les résultats de convergence qui reposaient sur la loi des

Plus en détail

EXERCICES SANS PRÉPARATION HEC 2005. Question 11 D après HEC 2005-11 F 2 EXERCICES SANS PRÉPARATION 2008. Question 7 HEC 2006-7 F 1 élève

EXERCICES SANS PRÉPARATION HEC 2005. Question 11 D après HEC 2005-11 F 2 EXERCICES SANS PRÉPARATION 2008. Question 7 HEC 2006-7 F 1 élève 30-1- 2013 J.F.C. p. 1 F 1 F 2 F 3 Assez simple ou proche du cours. Demande du travail. Délicat. EXERCICES SANS PRÉPARATION HEC 2005 Question 11 D après HEC 2005-11 F 2 X est une variable aléatoire de

Plus en détail

Projets scilab. L3 Maths Appliquées lagache@biologie.ens.fr 02 Avril 2009

Projets scilab. L3 Maths Appliquées lagache@biologie.ens.fr 02 Avril 2009 Projets scilab L3 Maths Appliquées lagache@biologie.ens.fr 2 Avril 29 REMARQUE: quelques résultats importants concernant le théorème central limite et les intervalles de confiance sont rappelés dans la

Plus en détail

DEFINITION et PROPRIETES des PRINCIPALES LOIS de PROBABILITES

DEFINITION et PROPRIETES des PRINCIPALES LOIS de PROBABILITES Université Paris1, Licence 00-003, Mme Pradel : Principales lois de Probabilité 1 DEFINITION et PROPRIETES des PRINCIPALES LOIS de PROBABILITES Notations Si la variable aléatoire X suit la loi L, onnoterax

Plus en détail

Konstantin Avrachenkov, Urtzi Ayesta, Patrick Brown and Eeva Nyberg

Konstantin Avrachenkov, Urtzi Ayesta, Patrick Brown and Eeva Nyberg Konstantin Avrachenkov, Urtzi Ayesta, Patrick Brown and Eeva Nyberg Le présent document contient des informations qui sont la propriété de France Télécom. L'acceptation de ce document par son destinataire

Plus en détail

Le pire des cas dans le choix de la copule

Le pire des cas dans le choix de la copule Comment éviter le pire Département de Mathématique Université de Bretagne Occidentale 29200 Brest Solvency 2 impose aux assureurs une analyse des risques accumulés sur plusieurs produits d assurances.

Plus en détail

Procédure diagnostique en arbre utilisant les tests lisses d adéquation

Procédure diagnostique en arbre utilisant les tests lisses d adéquation Procédure diagnostique en arbre utilisant les tests lisses d adéquation Walid A AKHRAS 1 & Gilles DUCHARME 1 aboratoire de probabilités et statistique cc 051, Université Montpellier, 34095 Montpellier

Plus en détail

Estimation améliorée explicite d un degré de confiance conditionnel

Estimation améliorée explicite d un degré de confiance conditionnel Estimation améliorée explicite d un degré de confiance conditionnel Dominique Fourdrinier & Patrice Lepelletier UMR CNRS 6085, Université de Rouen, Site Colbert, 76 821 Mont-Saint-Aignan cedex, France

Plus en détail

ENSE3 - API/CSPI et Master Automatique - 2008/2009

ENSE3 - API/CSPI et Master Automatique - 2008/2009 ENSE3 - API/CSPI et Master Automatique - 28/29 DS Commande robuste - - 19 janvier 29 Nom Prénom Signature ATTENTION: Mettre votre nom et répondre directement sur les feuilles de l énoncé. Justifiez vos

Plus en détail

1.The pronouns me, te, nous, and vous are object pronouns.

1.The pronouns me, te, nous, and vous are object pronouns. 1.The pronouns me, te, nous, and vous are object pronouns.! Marie t invite au théâtre?!! Oui, elle m invite au théâtre.! Elle te parle au téléphone?!! Oui, elle me parle au téléphone.! Le prof vous regarde?!!!

Plus en détail

Analyse de données longitudinales continues avec applications

Analyse de données longitudinales continues avec applications Université de Liège Département de Mathématique 29 Octobre 2002 Analyse de données longitudinales continues avec applications David MAGIS 1 Programme 1. Introduction 2. Exemples 3. Méthodes simples 4.

Plus en détail

Détermination des fréquences propres d une structure avec paramètres incertains

Détermination des fréquences propres d une structure avec paramètres incertains Détermination des fréquences propres d une structure avec paramètres incertains Etienne ARNOULT Abdelhamid TOUACHE Pascal LARDEUR Université de Technologie de Compiègne Laboratoire Roberval BP 20 529 60

Plus en détail

Chapitre 3. Mesures stationnaires. et théorèmes de convergence

Chapitre 3. Mesures stationnaires. et théorèmes de convergence Chapitre 3 Mesures stationnaires et théorèmes de convergence Christiane Cocozza-Thivent, Université de Marne-la-Vallée p.1 I. Mesures stationnaires Christiane Cocozza-Thivent, Université de Marne-la-Vallée

Plus en détail

Example of the mdput fonts.

Example of the mdput fonts. Example of the mdput fonts. Paul Pichaureau August 9, 013 Abstract The package mdput consists of a full set of mathematical fonts, designed to be combined with Adobe Utopia as the main text font. This

Plus en détail

Provisionnement face au risque de défaut des emprunteurs

Provisionnement face au risque de défaut des emprunteurs Provisionnement face au risque de défaut des emprunteurs Geoffrey Nichil et Pierre Vallois Institut Elie Cartan de Lorraine. 6-11 Avril 2014 1/12 Geoffrey Nichil et Pierre Vallois Provisionnement face

Plus en détail

Estimation de la fonction de distribution conditionnelle à partir de données censurées par intervalle, cas I

Estimation de la fonction de distribution conditionnelle à partir de données censurées par intervalle, cas I Estimation de la fonction de distribution conditionnelle à partir de données censurées par intervalle, cas I Sandra Plancade MAP5 Université Paris 5 5 mai 2010 Plan de l'exposé I) Introduction II) Dénition

Plus en détail

COMPORTEMENT ASYMPTOTIQUE D UNE FILE D ATTENTE À UN SERVEUR

COMPORTEMENT ASYMPTOTIQUE D UNE FILE D ATTENTE À UN SERVEUR Université Paris VII. Préparation à l Agrégation. (François Delarue) COMPORTEMENT ASYMPTOTIQUE D UNE FILE D ATTENTE À UN SERVEUR Ce texte vise à l étude du temps d attente d un client à la caisse d un

Plus en détail

CONCOURS D ADMISSION. Option économique MATHEMATIQUES III. Année 2006

CONCOURS D ADMISSION. Option économique MATHEMATIQUES III. Année 2006 ESSEC M B A CONCOURS D ADMISSION Option économique MATHEMATIQUES III Année 2006 La présentation, la lisibilité, l orthographe, la qualité de la rédaction, la clarté et la précision des raisonnements entreront

Plus en détail

Sommaire. Chapitre 1 Variables et vecteurs aléatoires... 5. Chapitre 2 Variables aléatoires à densité... 65

Sommaire. Chapitre 1 Variables et vecteurs aléatoires... 5. Chapitre 2 Variables aléatoires à densité... 65 Sommaire Chapitre 1 Variables et vecteurs aléatoires............... 5 A. Généralités sur les variables aléatoires réelles.................... 6 B. Séries doubles..................................... 9

Plus en détail

MEDIAPLANNING & HYBRIDATION APPLIQUE A L INTERNET

MEDIAPLANNING & HYBRIDATION APPLIQUE A L INTERNET MEDIAPLANNING & HYBRIDATION APPLIQUE A L INTERNET MOBILE Gaël Crochet 1 & Gilles Santini 2 1 Médiamétrie, 70 rue Rivay, 92532 Levallois-Perret, France, gcrochet@mediametrie.fr 2 Vintco SARL, 8 rue Jean

Plus en détail

Introduction d un biais près d une borne (pour x = ph, 0 p < 1 ) si f(x) 0. Rectification : utilisation des "boundary kernels", par exemple :

Introduction d un biais près d une borne (pour x = ph, 0 p < 1 ) si f(x) 0. Rectification : utilisation des boundary kernels, par exemple : Problème d estimation aux bornes Introduction d un biais près d une borne (pour x = ph, 0 p < 1 ) si f(x) 0. Soit a l (p) = p 1 ul K(u) du, notons que a 0 (p) < 1 E[ f(x)] = a 0 (p)f(x) h a 1 (p)f (x)+

Plus en détail

Example of the mdbch fonts.

Example of the mdbch fonts. Example of the mdbch fonts. Paul Pichaureau August 9, 013 Abstract The package mdbch consists of a full set of mathematical fonts, designed to be combined with Bitstream Bitstream Charter as the main text

Plus en détail

Simulation de variables aléatoires

Simulation de variables aléatoires Chapter 1 Simulation de variables aléatoires Références: [F] Fishman, A first course in Monte Carlo, chap 3. [B] Bouleau, Probabilités de l ingénieur, chap 4. [R] Rubinstein, Simulation and Monte Carlo

Plus en détail

Exemple PLS avec SAS

Exemple PLS avec SAS Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that

Plus en détail

Calculs approchés d un point fixe

Calculs approchés d un point fixe M11 ÉPREUVE COMMUNE DE TIPE 2013 - Partie D TITRE : Calculs approchés d un point fixe Temps de préparation :.. 2 h 15 minutes Temps de présentation devant les examinateurs :.10 minutes Dialogue avec les

Plus en détail

QUELQUES ASPECTS ALGORITHMIQUES ET QUALITATIFS DES MODELES DE GESTION DE STOCKS DE TYPE AHM

QUELQUES ASPECTS ALGORITHMIQUES ET QUALITATIFS DES MODELES DE GESTION DE STOCKS DE TYPE AHM QUELQUES ASPECTS ALGORITHMIQUES ET QUALITATIFS DES MODELES DE GESTION DE STOCKS DE TYPE AHM THESE No 1121 (1993) PRESENTEE AU DEPARTEMENT DE MATHEMATIQUES ECOLE POLYTECHNIQUE FEDERALE DE LAUSANNE POUR

Plus en détail

Texte Agrégation limitée par diffusion interne

Texte Agrégation limitée par diffusion interne Page n 1. Texte Agrégation limitée par diffusion interne 1 Le phénomène observé Un fût de déchets radioactifs est enterré secrètement dans le Cantal. Au bout de quelques années, il devient poreux et laisse

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

Détection de ruptures offline et online pour des processus causaux

Détection de ruptures offline et online pour des processus causaux Détection de ruptures offline et online pour des processus causaux Travaux avec W. Kengne (Paris 1, Yaoundé) et O. Wintenberger (Paris IX) Jean-Marc Bardet bardet@univ-paris1.fr Trimestre du Laboratoire

Plus en détail

Moments des variables aléatoires réelles

Moments des variables aléatoires réelles Chapter 6 Moments des variables aléatoires réelles Sommaire 6.1 Espérance des variables aléatoires réelles................................ 46 6.1.1 Définition et calcul........................................

Plus en détail

Résolution d équations non linéaires

Résolution d équations non linéaires Analyse Numérique Résolution d équations non linéaires Said EL HAJJI et Touria GHEMIRES Université Mohammed V - Agdal. Faculté des Sciences Département de Mathématiques. Laboratoire de Mathématiques, Informatique

Plus en détail

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Soutenance de doctorat, sous la direction de Pr. Bilodeau, M. et Pr. Ducharme, G. Université de Montréal et Université

Plus en détail

Support du cours de Probabilités IUT d Orléans, Département d informatique

Support du cours de Probabilités IUT d Orléans, Département d informatique Support du cours de Probabilités IUT d Orléans, Département d informatique Pierre Andreoletti IUT d Orléans Laboratoire MAPMO (Bât. de Mathématiques UFR Sciences) - Bureau 126 email: pierre.andreoletti@univ-orleans.fr

Plus en détail

Nouveaux programmes de terminale Probabilités et statistiques

Nouveaux programmes de terminale Probabilités et statistiques Nouveaux programmes de terminale Probabilités et statistiques I. Un guide pour l'année II. La loi uniforme : une introduction III. La loi exponentielle IV. De la loi binomiale à la loi normale V. Échantillonnage

Plus en détail

Méthodes de quadrature. Polytech Paris-UPMC. - p. 1/48

Méthodes de quadrature. Polytech Paris-UPMC. - p. 1/48 Méthodes de Polytech Paris-UPMC - p. 1/48 Polynôme d interpolation de Preuve et polynôme de Calcul de l erreur d interpolation Étude de la formule d erreur Autres méthodes - p. 2/48 Polynôme d interpolation

Plus en détail

Chapitre 7 : Intégration sur un intervalle quelconque

Chapitre 7 : Intégration sur un intervalle quelconque Universités Paris 6 et Paris 7 M1 MEEF Analyse (UE 3) 2013-2014 Chapitre 7 : Intégration sur un intervalle quelconque 1 Fonctions intégrables Définition 1 Soit I R un intervalle et soit f : I R + une fonction

Plus en détail

Régression ridge à noyau pour des variables explicatives et d intérêts fonctionnelles

Régression ridge à noyau pour des variables explicatives et d intérêts fonctionnelles Régression ridge à noyau pour des variables explicatives et d intérêts fonctionnelles Hachem Kadri 1, Philippe Preux 1,2 & Emmanuel Duflos 1,3 1 Equipe-projet SequeL, INRIA Lille - Nord Europe, Villeneuve

Plus en détail

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun

Plus en détail

3 2 Séries numériques

3 2 Séries numériques BCPST 9 5 3 Séries numériques I Généralités A) Dénition Soit (a n ) n N une suite à valeurs dans R. On appelle série de terme général a n, et on note a n la suite dénie par : S n = On dit que S n est la

Plus en détail

Probabilités 5. Simulation de variables aléatoires

Probabilités 5. Simulation de variables aléatoires Probabilités 5. Simulation de variables aléatoires Céline Lacaux École des Mines de Nancy IECL 27 avril 2015 1 / 25 Plan 1 Méthodes de Monte-Carlo 2 3 4 2 / 25 Estimation d intégrales Fiabilité d un système

Plus en détail

Introduction aux Support Vector Machines (SVM)

Introduction aux Support Vector Machines (SVM) Introduction aux Support Vector Machines (SVM) Olivier Bousquet Centre de Mathématiques Appliquées Ecole Polytechnique, Palaiseau Orsay, 15 Novembre 2001 But de l exposé 2 Présenter les SVM Encourager

Plus en détail

1 Sujets donnés en option scientifique

1 Sujets donnés en option scientifique Les sujets suivants, posés aux candidats des options scientifique, économique, technologique et littéraire BL constituent la première version d un échantillon des sujets proposés lors des épreuves orales

Plus en détail

Théorie et codage de l information

Théorie et codage de l information Théorie et codage de l information Mesure quantitative de l information - Chapitre 2 - Information propre et mutuelle Quantité d information propre d un événement Soit A un événement de probabilité P (A)

Plus en détail

Nouvelles classes de problèmes pour la fouille de motifs intéressants dans les bases de données 2

Nouvelles classes de problèmes pour la fouille de motifs intéressants dans les bases de données 2 Nouvelles classes de problèmes pour la fouille de motifs intéressants dans les bases de données 2 Lhouari Nourine 1 1 Université Blaise Pascal, CNRS, LIMOS, France SeqBio 2012 Marne la vallée, France 2.

Plus en détail

Arithmetical properties of idempotents in group algebras

Arithmetical properties of idempotents in group algebras Théorie des Groupes/Group Theory Arithmetical properties of idempotents in group algebras Max NEUNHÖFFER Lehrstuhl D für Mathematik, Templergraben 64, 52062 Aachen, Allemagne E-mail: max.neunhoeffer@math.rwth-aachen.de

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Estimations de convexité pour des équations elliptiques nonlinéaires

Estimations de convexité pour des équations elliptiques nonlinéaires Estimations de convexité pour des équations elliptiques nonlinéaires et application à des problèmes de frontière libre Jean DOLBEAULT a, Régis MONNEAU b a Ceremade (UMR CNRS no. 7534), Université Paris

Plus en détail

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La licence Mathématiques et Economie-MASS de l Université des Sciences Sociales de Toulouse propose sur les trois

Plus en détail

Cours de Probabilités. Jean-Yves DAUXOIS

Cours de Probabilités. Jean-Yves DAUXOIS Cours de Probabilités Jean-Yves DAUXOIS Septembre 2013 Table des matières 1 Introduction au calcul des probabilités 7 1.1 Espace probabilisable et loi de variable aléatoire........ 8 1.1.1 Un exemple

Plus en détail

Mathématique - Cours

Mathématique - Cours Mathématique - Cours Filière STAV 2014-2015 Centre de Formation aux Métier de la Montagne Marine Estorge Le programme se compose ainsi : partie seconde partie 1/3 partie 2/3 partie 3/3 Sommaire 1 Ensemble

Plus en détail

Un résultat de densité pour les équations de Maxwell

Un résultat de densité pour les équations de Maxwell Un résultat de densité pour les équations de Maxwell Faker Ben Belgacem 1, Christine Bernardi 2, Martin Costabel 3, Monique Dauge 3 1 M.I.P. (UMR C.N.R.S. 5640), Université Paul Sabatier, 118 route de

Plus en détail

Travaux Dirigés de Probabilités - Statistiques, TD 4. Lois limites ; estimation.

Travaux Dirigés de Probabilités - Statistiques, TD 4. Lois limites ; estimation. Travaux Dirigés de Probabilités - Statistiques, TD 4 Lois limites ; estimation. Exercice 1. Trois machines, A, B, C fournissent respectivement 50%, 30%, 20% de la production d une usine. Les pourcentages

Plus en détail

Promotion of bio-methane and its market development through local and regional partnerships. A project under the Intelligent Energy Europe programme

Promotion of bio-methane and its market development through local and regional partnerships. A project under the Intelligent Energy Europe programme Promotion of bio-methane and its market development through local and regional partnerships A project under the Intelligent Energy Europe programme Contract Number: IEE/10/130 Deliverable Reference: W.P.2.1.3

Plus en détail

Majeure d informatique

Majeure d informatique Nicolas Sendrier Majeure d informatique Introduction la théorie de l information Cours n 1 Une mesure de l information Espace probabilisé discret L alphabet est X (fini en pratique) Variable aléatoire

Plus en détail

Recherche dans un tableau

Recherche dans un tableau Chapitre 3 Recherche dans un tableau 3.1 Introduction 3.1.1 Tranche On appelle tranche de tableau, la donnée d'un tableau t et de deux indices a et b. On note cette tranche t.(a..b). Exemple 3.1 : 3 6

Plus en détail

Imputation multiple pour variables qualitatives par analyse des correspondances multiples

Imputation multiple pour variables qualitatives par analyse des correspondances multiples Imputation multiple pour variables qualitatives par analyse des correspondances multiples Vincent Audigier & François Husson & Julie Josse Laboratoire de mathématiques appliquées, Agrocampus Ouest 65 rue

Plus en détail

Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples,

Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples, Non-linéarité Contexte Pour permettre aux algorithmes de cryptographie d être sûrs, les fonctions booléennes qu ils utilisent ne doivent pas être inversées facilement. Pour cela, elles doivent être très

Plus en détail

Econométrie Appliquée Séries Temporelles

Econométrie Appliquée Séries Temporelles Chapitre 1. UFR Economie Appliquée. Cours de C. Hurlin 1 U.F.R. Economie Appliquée Maîtrise d Economie Appliquée Cours de Tronc Commun Econométrie Appliquée Séries Temporelles Christophe HURLIN Chapitre

Plus en détail

Image d un intervalle par une fonction continue

Image d un intervalle par une fonction continue DOCUMENT 27 Image d un intervalle par une fonction continue La continuité d une fonction en un point est une propriété locale : une fonction est continue en un point x 0 si et seulement si sa restriction

Plus en détail