Propriétés asymptotiques de quelques estimateurs non-paramétriques pour des variables vectorielles et fonctionnelles.

Dimension: px
Commencer à balayer dès la page:

Download "Propriétés asymptotiques de quelques estimateurs non-paramétriques pour des variables vectorielles et fonctionnelles."

Transcription

1 THÈSE DE DOCTORAT DE l'université PARIS 6 Spécialité : Mathématiques Option : Statistique présentée par Bertrand Maillot pour obtenir le grade de DOCTEUR DE l'université PARIS 6 Sujet de la thèse : Propriétés asymptotiques de quelques estimateurs non-paramétriques pour des variables vectorielles et fonctionnelles. Soutenue le 03/2/2008 devant le jury composé de Directeur de thèse Djamal Louani Université Paris VI Rapporteurs Hervé Cardot Université de Bourgogne Marc Hoffmann Université de Marne-la-Vallée Examinateurs Denis Bosq Université Paris VI Paul Deheuvels Université Paris VI Elias Ould-Saïd Université du Littoral

2 2

3 Remerciements Mes premiers remerciements vont naturellement à Djamal Louani qui m'a encadré durant ces années de thèse. Je voudrais lui exprimer ma gratitude pour sa grande disponibilité, pour le temps qu'il a passé à m'aider à améliorer et compléter mes travaux, pour ses conseils avisés qui m'ont permis de mener à bien cette entreprise. Je voudrais remercier Hervé Cardot et Marc Homann pour avoir accepté d'être mes rapporteurs, ainsi que les membres de mon jury, Denis Bosq, Paul Deheuvels et Elias Ould-Saïd. Je tiens aussi à remercier Louise Lamart pour avoir toujours réglé ecacement les problèmes administratifs et pratiques avec le sourire et une bonne humeur communicative. J'adresse un remerciement aux doctorants du L.S.T.A. pour leur aide ainsi que l'ambiance décontractée et studieuse qu'ils ont su instaurer dans le bureau, avec un merci tout spécial à Mohammed, dont la gentillesse, la patience et la compétence ont rendu cette première expérience de collaboration aussi agréable qu'instructive. Je voudrais aussi exprimer ma reconnaissance, bien au delà du cadre de la co-rédaction, à Vivian. Je tiens évidemment à remercier mes amis pour les moments moins sérieux, dans l'ordre approximatif de proximité géographique : Julien, Jib malgré qui j'ai pu terminer cette thèse, Vivian encore et Virginie, Philippe et Solenne, Gabriel et Juliette, Alex et Viviane, Philippe et Claire, et Raoul. Ceux qui n'y sont pas apprendront par ces lignes que nous ne sommes pas amis, ou que je les ai oubliés... Même si son aide fut très réduite au niveau mathématiques, que seraient ces lignes si je ne remerciais pas Ségolen? Je prote d'être hors du contexte académique pour inclure ici Michel, Jean-Mi, Cédric, Karine, Kian et Ushane. Finalement, je voudrais terminer avec quelques lignes, sans doute trop courtes, pour exprimer toute ma gratitude à ma famille, et plus particulièrement mes parents, mon frère Vincent et Olivia ainsi que mémé Dédée. i

4 ii

5 Liste des travaux [] Debbarh, M. et Maillot, B Additive regression model for continuous time processes, Comm. Statist. Theory Methods 375, [2] Debbarh, M. et Maillot, B.2008 Asymptotic normality of the additive regression components for continuous time processes. C. R. Acad. Sci. Paris Sér. I Math., 346, [3] Maillot, B. Regression estimation for continuous time processes with values in functional spaces. Soumis. [4] Maillot, B. Conditional density estimation for continuous time processes with values in functional spaces, with applications to the conditional mode and the regression function estimators. Soumis. [5] Maillot, B. et Viallon, V. Uniform limit laws of the logarithm for nonparametric estimators of the regression function in presence of censored data. Soumis. iii

6 iv

7 Table des matières Introduction 0. L'estimation non paramétrique par la méthode du noyau Présentation des estimateurs et du cadre de travail Les modèles additifs, une solution au éau de la dimension Les variables aléatoires fonctionnelles Les variables aléatoires censurées à droite Présentation des résultats Le modèle additif pour des processus à temps continu Estimation de la densité pour des processus non stationnaires Variables fonctionnelles en temps continu Modèle de censure aléatoire à droite Additive regression model for continuous time processes 5. Introduction and motivations Notations and results Proofs Proof of Theorem Proof of Theorem Asymptotic normality of the additive regression components for continuous time processes Version française abrégée Introduction Hypotheses and Notations Results Proof Proof of Lemma Proof of Theorem Proof of Theorem Proof of Proposition : v

8 TABLE DES MATIÈRES TABLE DES MATIÈRES 3 Estimation de la densité par la méthode du noyau pour des processus non stationnaires 5 3. Introduction Hypothèses et résultats Démonstrations Preuve du Théorème Preuve du Théorème Regression estimation for continuous time processes with values in functional spaces Introduction Hypotheses and results Proofs Conditional density estimation for continuous time processes with values in functional spaces, with applications to the conditional mode and the regression function estimators Introduction Hypotheses and results Proofs Uniform limit laws of the logarithm for nonparametric estimators of the regression function in presence of censored data Introduction-Motivations Notations and hypotheses Main result Corollaries-Applications Corollaries Almost sure asymptotic simultaneous condence bands for the true regression function Proofs The uncensored case Proof of Theorem A useful technical result Proof of Theorem Proof of Theorem Proofs of corollaries 6.4., and Appendix A Perspectives de recherche 35 Bibliographie 36 vi

9 Introduction L'objet de cette thèse est d'établir des résultats limites consistance, vitesses de convergence, normalité asymptotique et loi du logarithme pour des estimateurs de fonctions et de fonctionnelles liées à divers modèles. Ainsi, notre cadre de travail est multiple, regroupant le modèle additif de régression et l'estimation de la densité pour des processus à temps continu, mais aussi l'étude de la fonction de régression, du mode conditionnel, de la fonction de répartition conditionnelle et des quantiles conditionnels pour des variables fonctionnelles observées en temps continu. Enn, nous considérons l'estimation de la fonction de régression pour des variables censurées. Les estimateurs étudiés sont construits sur la base de méthodes nonparamétriques. Ils sont présentés, ainsi que la nature des données et les modèles étudiés, dans le paragraphe de cette introduction. Le paragraphe 2 présente quant à lui de façon succincte les résultats obtenus. 0. L'estimation non paramétrique par la méthode du noyau Depuis les travaux de Rosenblatt 956 et Parzen 962 portant sur l'estimation non-paramétrique de la densité de probabilité, la méthode du noyau a été très largement utilisée pour l'estimation de diverses fonctions et fonctionnelles, et de nombreux travaux ont été consacrés à l'étude des propriétés des estimateurs sousjacents. Vu l'étendu de la littérature disponible dans ce domaine, nous ne pouvons faire un exposé exhaustif et nous nous limitons donc ici à présenter les fonctions et fonctionnelles qui ont été l'objet d'une étude dans le cadre de cette thèse. Ainsi, les paragraphes qui suivent présentent la densité de probabilité, la fonction de régression, le mode conditionnel, la fonction de répartition conditionnelle et le quantile conditionnel accompagnés des estimateurs associés. Dans cette première partie, nous introduisons aussi le modèle additif de régression, le modèle de données censurées ainsi que les variables aléatoires fonctionnelles.

10 0. L'estimation non paramétrique par la méthode du noyau Introduction 0.. Présentation des estimateurs et du cadre de travail Estimation de la densité de probabilité Soit X,..., X n un échantillon de variables aléatoires identiquement distribuées, à valeurs dans R d, de densité commune f et K, appelé noyau de Parzen- Rosenblatt, une application dénie sur R d telle que Kxdx = et lim R d x R d x d R Kx = 0, d où. R d est la norme euclidienne sur R d. L'estimateur de la densité de Parzen-Rosenblatt est déni, pour tout x R d, par f n x := nh d n n x Xi K, i= où h n, appelé la fenêtre de lissage, est un paramètre tendant avec une certaine vitesse vers 0 lorsque n tend vers l'inni. Rosenblatt 956 donna dans son article l'erreur quadratique moyenne relative à l'estimation de la densité dans le cas d'observations univariées indépendantes et identiquement distribuées et où le noyau uniforme K = I [,] est utilisé I désigne la fonction indicatrice. Parzen 962 généralisa ce 2 résultat en considérant une classe très vaste de noyaux et établit aussi la normalité asymptotique, puis le cas multivarié fut traité par Cacoullos 966. De nombreux auteurs, parmi lesquels nous citons Roussas 969a, Rosenblatt 970, Borwanker 97 pour des δ-séquences incluant les estimateurs à noyau, Tran 990 et Pham et Tran 99, ont par la suite traité le cas où les variables sont dépendantes. Nous renvoyons à Bosq 998 pour une présentation détaillées des résultats dans ce contexte. Il ressort dans le cadre de structures de dépendances faibles que sous certaines conditions portant sur les coecients de mélangeance voir Doukhan 994 pour les dénitions et les propriétés des mélanges, il est possible d'atteindre les mêmes vitesses de convergence que dans le cas indépendant. Ainsi, pour une densité de probabilité deux fois continûment dérivable, sous des conditions usuelles que nous ne détaillons pas ici, il est établi, pour la convergence en moyenne quadratique, que h n n 4 4+d E fn x fx 2 = O. 2 Banon 978 fut le premier à s'intéresser à l'estimation de la densité en temps continu, dans le cas de processus de diusion sous la condition G 2 de Rosenblatt voir Rosenblatt 970 en utilisant des noyaux récursifs. L'estimateur de la densité par la méthode du noyau est donné, pour un processus X t observé pour t [0, T ], par 2

11 Introduction 0. L'estimation non paramétrique par la méthode du noyau f T x := T h d T T t=0 x Xt K dt. 3 Delecroix 979 obtint la convergence presque sûre et la convergence en moyenne quadratique des estimateurs de la densité et de la densité conditionnelle pour des processus strictement stationnaires et fortement mélangeants. Par la suite, Castellana et Leadbetter 986 démontrèrent qu'il était possible, sous certaines conditions sur les densités jointes du processus, d'atteindre une vitesse de convergence de l'estimateur de la densité en T, qu'on appelle vitesse "suroptimale" ou "paramétrique" puisqu'elle est identique aux vitesses obtenues classiquement en statistique paramétrique. h T Estimation de la fonction de régression Nadaraya 964 et Watson 964 furent les premiers à s'intéresser à l'estimation de la fonction de régression par la méthode du noyau. Soit X, Y,..., X n, Y n un échantillon de n répliques d'un couple aléatoire générique X, Y à valeurs dans R d R. La fonction de régression est l'espérance de la variable Y conditionnée par X : rx := E Y X = x. Cette grandeur est posée exister et être nie. L'estimateur de Nadaraya-Watson est alors déni comme suit n i= ik Y x X i h n, si n n i= K i= K x X i h n 0, rx := x X i h n n n i= Y i, pour n i= K x X i h n = 0. Une littérature abondante s'est développée sur l'étude de la convergence de cet estimateur. Nous renvoyons à Collomb 98, Krzy»ak et Pawlak 987, Collomb et Härdle 986, Bosq et Lecoutre 987, Györ et al. 989, Roussas 990 et Bosq 998 pour un corpus de résultats et des références plémentaires. Sous des conditions générales, la vitesse de convergence de l'estimateur de la fonction de régression est identique à celle obtenue pour l'estimateur de la densité, 4 n 4 4+d E rn x rx 2 = O. 5 L'estimateur de la fonction de régression par la méthode du noyau pour des processus à temps continu a été introduit par Cheze 992 qui établit la convergence 3

12 0. L'estimation non paramétrique par la méthode du noyau Introduction en moyenne quadratique, la convergence presque sûre et la normalité asymptotique. La vitesse suroptimale pour ce même estimateur fut obtenue par Bosq 993 et Bosq 997. Le mode conditionnel L'estimation de la fonction de régression est une méthode naturelle en vue de la prédiction, mais elle est sensible aux valeurs aberrantes et peut se montrer inappropriée dans certains cas, comme lorsque la distribution est multimodale ou fortement asymétrique. L'estimation du mode conditionnel constitue alors une alternative intéressante. Soit X, Y un couple de variables aléatoires à valeurs dans R d R d et X, Y,..., X n, Y n n copies de ce couple. On pose que le couple X, Y possède une densité jointe f X,Y et que la variable aléatoire X admet une densité marginale f X. Nous pouvons alors dénir le mode conditionnel θx, posé unique sur un compact S R d, comme étant la valeur maximisant la densité conditionnelle de Y sachant X = x, avec θx := argmax y S fy x fy x = f X,Y x, y. f X x Il s'agit en fait ici d'une version locale du mode conditionnel celui-ci étant normalement déni comme le remum pour y R d, orant l'avantage de poser l'unicité du mode conditionnel local sans exclure les distributions multi-modales. Pour estimer le mode conditionnel, on se donne deux noyaux de Parzen-Rosenblatt H et K, ainsi que deux fenêtres de lissage h H,n et h K,n et on pose f n y x := n i= H y Y i h d H,n nh d H,n x X i h H,n K n i= K x X i h K,n h K,n, si n i= K x X i h n 0, n i= H y Y i h H,n, pour n i= K x X i h K,n = 0. L'estimateur du mode conditionnel est alors déni par l'expression 6 θ n x := argmax y S fn y x. 7 Nous pouvons remarquer que cela ne dénit pas de façon unique l'estimateur plusieurs vecteurs y peuvent satisfaire la relation 7, mais le vrai mode conditionnel étant lui unique, les résultats obtenus sont valables pour tous les vecteurs satisfaisant 7. Collomb et al. 987 établirent la convergence uniforme de cet estimateur 4

13 Introduction 0. L'estimation non paramétrique par la méthode du noyau pour un processus φ-mélangeant avec d =, et Samanta et Thavaneswaran 990 obtinrent la normalité asymptotique. Pour des références plus récentes sur l'estimation du mode conditionnel, nous renvoyons à Quintela-Del-Río et Vieu 997, Berlinet et al. 998 et Louani et Ould-Saïd 999. Dans le cas de processus à temps continu, il n'y a, à notre connaissance, aucune publication sur le sujet. La fonction de répartition conditionnelle et les quantiles conditionnels La fonction de régression et le mode conditionnel ont tous deux l'inconvénient de ne fournir qu'une valeur prédictive sans nous renseigner sur la probabilité que la réalisation soit proche de celle-ci c'est à dire sans décrire la distribution de la variable conditionnée. La fonction de répartition conditionnelle nous donne la probabilité que la variable d'intérêt appartienne à un intervalle donné, tandis que les quantiles conditionnels permettent la construction d'intervalles de prédiction. Ils apportent par conséquent tout deux un complément d'information fort utile sur le comportement de la variable d'intérêt. Nous considérons le même échantillon que celui introduit dans la présentation de l'estimation de la fonction de régression. La fonction de répartition conditionnelle, dénie par la relation F y x := P Y y X = X, est posée admettre une version régulière, et nous l'estimons par la statistique F n y x := n i= I x X ],y]y i K i h n, si n i= K x X i h n n i= K x X i h n 0, n n i= I ],y]y i, pour n i= K x X i h n = 0. Nous pouvons constater que cet estimateur correspond à celui de la régression de la variable aléatoire I ],y] Y par rapport à la variable X. Pour x R d, nous posons alors que la fonction de répartition conditionnelle F y x est continue et strictement croissante sur un intervalle [a, b], et dénissons, pour tout θ [F a x, F b x], le quantile conditionnel u θ x comme vériant l'équation F u θ x x = θ. Un estimateur naturel du quantile conditionnel est alors donné par û θ x := u, F u x θ. u R L'estimation des quantiles conditionnels fut traitée pour la première fois par Roussas 969b dans le cas de processus de Markov, en utilisant un estimateur de la fonction de répartition conditionnelle déni comme étant l'intégrale de l'estimateur de la densité conditionnelle. Pour des références sur le sujet, nous renvoyons tout particulièrement à Berlinet et al

14 0. L'estimation non paramétrique par la méthode du noyau Introduction 0..2 Les modèles additifs, une solution au éau de la dimension. Comme nous pouvons le voir dans la relation 5, la vitesse de convergence de l'estimateur de la fonction de régression est une fonction décroissante de la dimension de la covariable. Ce fait, appelé le éau de la dimension, traduit la dispersion des données lorsque la dimension augmente. Ainsi, si nous considérons l'intervalle [0, ], nous pouvons le partitionner en 0 intervalles de longueur /0 tandis qu'il faut, en dimension d, 0 d hypercubes d'arête de longueur /0 pour partitionner [0, ] d. Par conséquent, si nous considérons une variable aléatoire à valeurs dans [0, ] d, il faut avoir un échantillon de taille 0 d+ pour avoir en moyenne autant d'observations par hypercube d'arête de longueur /0 qu'il y en a par intervalle de longueur /0 pour un échantillon de taille 00 en dimension. Parmi les travaux qui se sont proposés d'apporter un solution au problème posé par cette dispersion des données en grande dimension, on peut distinguer deux types d'approches. La première consiste en une diminution de la dimension des variables par projection sur un espace de dimension moindre, comme la projection pursuit, technique qui fut proposée par Kruskal 969 et adaptée à l'estimation de la fonction de régression par Friedman et Stuetzle 98. La seconde propose de faire des hypothèses sur la forme de la fonction de régression comme dans les modèles additifs généralisés dont nous savons depuis les travaux de Stone 985 et Stone 986 qu'ils permettent d'obtenir une vitesse de convergence identique à celle du cas univarié. Si cette approche a l'avantage de donner un résultat plus aisément interprétable que la projection pursuit, elle est cependant moins souple puisqu'elle pose que la fonction de régression s'écrive comme la somme de fonctions des composantes de la variable explicative. Pour ψ une fonction mesurable à valeurs dans R et x = x,...x d R d, le modèle s'écrit m ψ x := E ψy X = x = µ + d m l x l, l= où les fonctions m l, l [, d], sont appelées les composantes additives et sont dénies à une constante additive près. Cela implique que nous devons imposer une contrainte plémentaire an que le modèle soit identiable, la plus courante étant Em l X l = 0, l [0, d]. Le backtting voir Hastie et Tibshirani 990 pour une présentation détaillée de celui-ci, basé sur un algorithme itératif, est facilement implémentable et constitue par conséquent la méthode la plus utilisée en pratique pour estimer les composantes additives. En contre partie, la nature algorithmique de cette méthode rend malaisée 6

15 Introduction 0. L'estimation non paramétrique par la méthode du noyau l'étude théorique des propriétés asymptotiques de l'estimateur associé nous renvoyons à Opsomer et Ruppert 997 et Opsomer 2000 pour des résultats sur le sujet. Dans cette thèse, nous nous intéressons à la méthode d'intégration marginale introduite par Newey 994, Tjøstheim et Auestad 994 et Linton et Nielsen 995 et dont nous rappelons le principe dans ce qui suit. Nous considérons à nouveau un échantillon de n répliques d'un couple aléatoire X, Y R d R. Soient q,..., q d d fonctions de densité dénies sur R avec d 2. Pour x = x,..., x d R d et x l = x,...x l, x l+,..., x d, nous posons qx := d i= q ix i, q l x l := i l q ix i et η l x l := m ψ xq l x l dx l m ψ zqzdz. R d R d Cela permet de réécrire la fonction de régression comme suit d m ψ x = η l x l + m ψ zqzdz. 9 R d i= Un estimateur naturel de la fonction de régression additive est alors donné par avec m ψ,n,add x := d η l,n x l + m ψ,n zqzdz 0 R d l= m ψ,n x := m ψ,n,l x := η l x l := n ψy i K x Xi 3 i= nh d ˆf,,n n X i n xl X K n,l x l X i, l K2 h,n h 2,n i= nh,n h d f ψy i, 2,n n X i m ψ,n,l xq l x l dx l m ψ,n,l xqxdx, R d R d h,n où K, K 2 et K 3 sont des noyaux de Parzen-Rosenblatt et f n est l'estimateur de la densité déni en. Il est à noter que les fonctions η l, l [,..., d], sont égales, à une constante additive près, aux composantes additives m l ; il s'agit donc de composantes additives satisfaisant d'autres conditions d'identiabilité. Dans le cadre de cette thèse, nous avons traité le modèle additif en temps continu qui est présenté plus bas dans la section 0.2. de cette introduction Les variables aléatoires fonctionnelles. Si la qualité de l'estimation réduit considérablement lorsque la dimension augmente, il est naturel de s'interroger sur la vitesse de convergence des estimateurs 7

16 0. L'estimation non paramétrique par la méthode du noyau Introduction non-paramétriques lorsque la covariable est à valeurs dans un espace fonctionnel de dimension innie. Ce type de variables se retrouvant dans de nombreux domaines, comme la météorologie, la chimie quantitative, la biométrie, l'économétrie ou l'imagerie médicale voir Frank et Friedman 993, Hastie et al. 995, Ramsay et Silverman 2002, Ferraty et Vieu 2006 pour des exemples de situations où des variables fonctionnelles sont impliquées, un intérêt croissant s'est développé pour l'étude de celles-ci. De plus, en raison de la précision des appareils de mesure modernes et de l'importante capacité de stockage qu'orent les systèmes informatiques actuels, il est possible d'obtenir une discrétisation très ne des données qui sont par conséquent très proches des courbes étudiées. Les premiers travaux à envisager le cas de variables aléatoires fonctionnelles sont ceux de Rao 958 et Tucker 958 qui s'intéressèrent à l'analyse en composantes principales, mais l'intensication des recherches sur le sujet est récente. Frank et Friedman 993 rent une comparaison des diérentes méthodes de régression paramétrique pour variables fonctionnelles alors développées que sont la ridge regression dont le principe a été posé par Hoerl et Kennard 970, la régression sur composante principale Massy 965 et la régression partial least square voir Helland 990. Cet article fut suivi d'un commentaire de Hastie et Mallows 993 qui remarquèrent que ces méthodes, qui ne prennent pas en considération la nature fonctionnelle des données, ne sont pas adaptées lorsque les courbes ne sont pas lisses ou mesurées avec des erreurs ni lorsque la discrétisation des courbes n'est pas réalisée aux mêmes points, ce qui est souvent le cas en pratique. Par la suite, plusieurs auteurs ont proposé des modèles qui tiennent compte de la nature fonctionnelle des variables voir Ramsay et Silverman 997, Cardot et al. 999, Bosq 2000 et Cuevas et al Les modèles pleinement non-paramétriques pour les variables fonctionnelles ont quant à eux été introduits par Ferraty et Vieu, tout d'abord en utilisant la dimension fractale Ferraty et Vieu 2000 et Ferraty et al. 2002, an de maîtriser la probabilité que la variable appartienne à de petites boules, sans faire intervenir la notion de densité. Ils assouplirent par la suite cette condition Ferraty et Vieu 2004 en imposant au processus X i à valeur dans un espace fonctionnel H les conditions suivantes, pour tout x C, 0 < β φh P X Bx, h φhβ 2, 0 < β 3 ψh P X i, X j Bx, h Bx, h ψhβ 4, 2 i j où C est un compact de H auquel on restreint l'étude, Bx, h est la boule de centre x et de rayon h dénie par la semi-métrique de l'espace H, β, β 2, β 3, et β 4 sont 4 réels positifs, et φ et ψ sont des fonctions positives dépendant des propriétés du processus Les variables aléatoires censurées à droite La modélisation de la probabilité d'apparition d'un événement au cours du temps est un problème rencontré dans un grand nombre de domaines et de dis- 8

17 Introduction 0. L'estimation non paramétrique par la méthode du noyau ciplines. Ce problème est souvent lié à la notion de durée de survie, rencontrée à l'origine dans les études d'essais cliniques et par la suite en abilité et en économie. il se trouve dans certains cas que la participation d'individus à une étude est interrompue pour une raison indépendante du sujet d'intérêt. On parle alors d'un cas de censure car la durée de survie n'a pas été observée intégralement pour tous les participants. Le cadre décrit ici présente plus précisément la censure à droite qui est aléatoire si les interruptions de participations à l'étude se produisent de façon aléatoire et le nombre total de durées de survie observées complètement est aléatoire. Outre le modèle de censure déterministe, dit de type I, des modèles de censures de type II alliant une date de censure aléatoire et une composante déterministe imposant une contrainte sur le nombre de durées de survies eectivement observées ont aussi fait l'objet d'étude dans la littérature nous renvoyons à Koul et Deshpande 995 pour une présentation de résultats sur les variables censurées. Le travail effectué dans le cadre de cette thèse considère la censure aléatoire à droite où n'est observé que le minimum entre la durée de survie et l'instant aléatoire de censure. La question posée est d'expliquer la durée de survie Y sujette à une censure C par une variable aléatoire vectorielle X. Pour ce faire, nous disposons de n copies indépendantes X i, Y i, C i du triplet X, Y, C. Nous posons naturellement que la variable de censure C est indépendante du couple X, Y. Notons que les observations se résument à l'échantillon Z i, δ i, X i, i =,..., n, où Z i est le minimum entre Y i et C i, δ i = si Z i = Y i et δ i = 0 sinon : Z i = Y i C i δ i = I [,Ci ]Y i. 3 L'estimateur de la fonction de survie d'une variable aléatoire est celui de Kaplan et Meier 958 qui se présente comme suit. Si G est la fonction de répartition de la variable de censure C, alors l'estimateur de la variable de censure C, alors l'estimateur de Kaplan-Meier de la fonction de survie de C est déni, avec les conventions = et 00 =, par G nu := i:z i u δ Nn Z i i, pour tout u R 4 N n Z i où N n x = n i= I {Z i x}. Il ressort alors qu'un estimateur à noyau IPCW Inverse Probability of Censoring Weighted, voir Carbonez et al. 995 et Kohler et al de la fonction de régression est donné par m ψ,n,hx := n j= K x Xj h n i= K x X i h δ i ψz i G nz i. 5 9

18 0.2 Présentation des résultats Introduction 0.2 Présentation des résultats Les processus à temps continu seront étudiés dans les cinq premiers chapitres de cette thèse. Les deux premiers chapitres portent sur l'estimation de la fonction de régression additive, le troisième chapitre s'intéresse à l'estimation de la densité dans le cas où le processus est non stationnaire et les chapitres 4 et 5 traitent des variables aléatoires fonctionnelles. Finalement, nous nous intéressons dans le chapitre 6 à des variables aléatoires indépendantes censurées Le modèle additif pour des processus à temps continu Hormis les processus à trajectoires irrégulières pour lesquels l'estimateur de la fonction de régression converge à la vitesse paramétrique, les processus à temps continu subissent, comme les processus à temps discret, le éau de la dimension. Il semble donc naturel de s'intéresser aux modèles additifs qui, comme nous l'avons vu pour les processus à temps discret, apportent une solution à ce problème. Le cas de variables aléatoires mélangeantes a été traité par Camlong-Viot et al dans le cas β-mélangeant et par Camlong-Viot et al pour des processus α-mélangeants, mais aucun travail ne porte sur les processus à temps continu. L'estimateur de la fonction de régression additive par la méthode d'intégration marginale est dans ce cas donné par avec m ψ,t,add x = d η l x l + m ψ,t xqxdx 6 R d l= η l x l := m ψ,t x := m ψ,t,l x := m ψ,t,l xq l x l dx l m ψ,t,l xqxdx, R d R d T W T,t xψy t dt avec W T,t x = K x Xt 3 h,t 0 T h d ˆf,T T X t, T WT,txψY l t dt avec WT,tx l = K xl X t,l x l X t, l K2 h,t h 2,T 0 T h,t h d f 2,T T X t où f T est l'estimateur de la densité déni en 3. Nous nous intéressons dans le chapitre aux vitesses de convergence en moyenne quadratique et de convergence presque sûre de la fonction de régression additive, et obtenons des vitesses identiques au cas univarié. Dans le chapitre 2, nous établissons la normalité asymptotique des composantes additives η l. En temps continu, pour obtenir la normalité asymptotique d'un estimateur, il faut imposer des conditions assurant que celui-ci ne converge pas 0

19 Introduction 0.2 Présentation des résultats trop vite vers la fonction à estimer voir Cheze 992. Par conséquent, en plus de la normalité asymptotique, nous établissons sous des conditions moins contraignantes, pour tout α, β ]0; 2 [ ] 2 ; [, en notant Q α le quantile d'ordre α d'une loi normale centrée réduite, que lim inf T k T P 2k+ A { η l,t x l η l x l h k l,t b l x l } [Q α ; Q β ] β α, 7 où A est une constante non nulle vériant A lim T + T 2k 2k+ Varˆηl,T x l /2 et b l x l = ck k! R uk K l udu k m k l x l m R lzq k l zdz, avec c une constante et K l un noyau à valeurs dans R Estimation de la densité pour des processus non stationnaires L'étude de la convergence de l'estimateur de la densité par la méthode du noyau pour des processus non stationnaires s'appuie généralement sur des hypothèses vériées par les processus stationnaires. L'objectif du chapitre 3 est de tirer parti de la non stationnarité pour atteindre, pour certains processus, de meilleures vitesses de convergence, et obtenir, pour d'autres processus, la consistance de l'estimateur lorsque le coecient de mélangeance ne satisfait pas les hypothèses habituelles. Pour ce faire, nous introduisons un estimateur qui pondère les observations en fonction de leur localisation dans le temps : f T x := f T x, φ := φt h d T T 0 φ uk x h T, X u h T du, où φ est une application continûment dérivable sur ]0; + [, nulle et continue à l'origine, et strictement croissante et φ est sa dérivée et sert à pondérer les observations en fonction de l'instant de réalisation. En fait, ce type de pondération revient à un changement de temps, et nous obtenons donc que la vitesse de convergence presque sûre est identique à la vitesse classique, avec φt dépendant de la distribution du processus, donc inconnue à la place de T. Nous proposons alors une méthode permettant de sélectionner la fonction φ satisfaisant nos hypothèses parmi un ensemble ni de fonctions données et permettant de donner la meilleure vitesse de convergence Variables fonctionnelles en temps continu Les modèles non-paramétriques pour les variables fonctionnelles introduits par Ferraty et Vieu sont récents mais plusieurs résultats majeurs ont néanmoins été produits. Ainsi, la convergence presque sûre Ferraty et Vieu 2004, la convergence en moyenne quadratique et la normalité asymptotique Ferraty et al. 2007

20 0.2 Présentation des résultats Introduction et Attouch et al de l'estimateur de la fonction de régression ont été obtenues tandis que Ferraty et al ont établi la convergence presque sûre des estimateurs de la fonction de répartition conditionnelle, des dérivées de la densité de probabilité conditionnelle, du mode conditionnel et des quantiles conditionnels. Le but des chapitres 4 et 5 est d'établir ce type de résultats dans le cas de processus à temps continu. De nombreux phénomènes physiques, comme le champs magnétique terrestre, les ondes sismiques ou les isothermes et les isobares en météorologie, peuvent en eets être représentés par des variables aléatoires fonctionnelles en temps continu. Nous considérons un processus {X t, Y t } t R + observé pour t [0, T ], où Y t est une variable aléatoire réelle et X t est à valeurs dans un espace métrique H. Nous imposons toujours la relation tandis que la condition fondamentale 2 devient alors, pour un certain δ > 0, pour C un compact de H et pour tout réels positifs s et t tels que t s > δ, x C P X s Bx, h, X t Bx, h β 3 φh 2. Dans le chapitre 4, nous introduisons une fonction Ψ dénie sur R 2 et dénissons la fonction de régression généralisée que nous estimons par r T x, y := T rx, y = EΨy, Y 0 X 0 = x Ψy, Y t=0 tkh T dx, X tdt T t=0 Kh T dx, X, si T t=0 tdt Kh T dx, X tdt 0, T Ψy, Y T t=0 tdt, pour T t=0 Kh T dx, X tdt = 0. Nous montrons que la vitesse de convergence uniforme en y et en x de cet estimateur est identique à celle obtenue dans le cas discret pour un estimateur de la fonction de régression simple, i.e., de l'ordre de O h η T + lnt où η est un T φh T paramètre dépendant de la régularité de la fonction de régression, et en déduisons en corollaire la convergence des estimateurs de la fonction de répartition conditionnelle et des quantiles conditionnels. Sous des hypothèses plus fortes concernant la structure de dépendance et pour un choix spécique du noyau K, nous montrons qu'il est possible d'atteindre la vitesse de convergence en probabilité vers 0 suroptimale, ln m T à savoir O. T Dans le chapitre 5, nous nous intéressons à l'estimateur de la densité conditionnelle. Soient C et S des compacts de l'espace métrique H et R d respectivement, notre estimateur est alors déni, pour tout x, y C S, par 2 8

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA

Plus en détail

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes Zohra Guessoum 1 & Farida Hamrani 2 1 Lab. MSTD, Faculté de mathématique, USTHB, BP n 32, El Alia, Alger, Algérie,zguessoum@usthb.dz

Plus en détail

MAT 2377 Solutions to the Mi-term

MAT 2377 Solutions to the Mi-term MAT 2377 Solutions to the Mi-term Tuesday June 16 15 Time: 70 minutes Student Number: Name: Professor M. Alvo This is an open book exam. Standard calculators are permitted. Answer all questions. Place

Plus en détail

Clustering par quantification en présence de censure

Clustering par quantification en présence de censure Clustering par quantification en présence de censure Svetlana Gribkova 1 Laboratoire de Statistique Théorique et Appliquée, Université Pierre et Marie Curie Paris 6, 4 place Jussieu, 75005 Paris Résumé.

Plus en détail

Sélection de variables groupées avec les forêts aléatoires. Application à l analyse des données fonctionnelles multivariées.

Sélection de variables groupées avec les forêts aléatoires. Application à l analyse des données fonctionnelles multivariées. Sélection de variables groupées avec les forêts aléatoires. Application à l analyse des données fonctionnelles multivariées. Baptiste Gregorutti 12, Bertrand Michel 2 & Philippe Saint Pierre 2 1 Safety

Plus en détail

Cours STAT 2150. "Statistique non paramétrique: Méthodes de lissage"

Cours STAT 2150. Statistique non paramétrique: Méthodes de lissage Cours STAT 2150 "Statistique non paramétrique: Méthodes de lissage" Année académique 2008-2009 Séance 1 1 Table de matière du cours 1. Introduction (Fonction de répartition, histogramme, propriétés d un

Plus en détail

Principe de symétrisation pour la construction d un test adaptatif

Principe de symétrisation pour la construction d un test adaptatif Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université

Plus en détail

Estimation du Quantile conditionnel par les Réseaux de neurones à fonction radiale de base

Estimation du Quantile conditionnel par les Réseaux de neurones à fonction radiale de base Estimation du Quantile conditionnel par les Réseaux de neurones à fonction radiale de base M.A. Knefati 1 & A. Oulidi 2 & P.Chauvet 1 & M. Delecroix 3 1 LUNAM Université, Université Catholique de l Ouest,

Plus en détail

Estimation consistante des paramètres d un. modèle non linéaire pour des données. fonctionnelles discrétisées aléatoirement

Estimation consistante des paramètres d un. modèle non linéaire pour des données. fonctionnelles discrétisées aléatoirement Estimation consistante des paramètres d un modèle non linéaire pour des données fonctionnelles discrétisées aléatoirement Consistent estimation of parameters in a nonlinear model for functional data with

Plus en détail

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Filtrage stochastique non linéaire par la théorie de représentation des martingales Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de

Plus en détail

Variational inequalities and time-dependent traffic equilibria

Variational inequalities and time-dependent traffic equilibria Time-dependent traffic equilibria Analyse mathématique/mathematical analysis Variational inequalities and time-dependent traffic equilibria Patrizia DANIELE, Antonino MAUGERI and Werner OETTLI P. D. A.

Plus en détail

Éléments spectraux d une fonction cyclostationnaire

Éléments spectraux d une fonction cyclostationnaire Éléments spectraux d une fonction cyclostationnaire Alain BOUDOU 1 & Sylvie VIGUIR-PLA 1 & 2 1 quipe de Stat. et Proba., Institut de Mathématiques, UMR5219 Université Paul Sabatier, 118 Route de Narbonne,

Plus en détail

Algebra for Digital Communication. Test 2

Algebra for Digital Communication. Test 2 EPFL - Section de Mathématiques Algebra for Digital Communication Prof. E. Bayer Fluckiger Sections de Systèmes de Communications et Physique Winter semester 2006-2007 Test 2 Thursday, 1st February 2007

Plus en détail

3 Approximation de solutions d équations

3 Approximation de solutions d équations 3 Approximation de solutions d équations Une équation scalaire a la forme générale f(x) =0où f est une fonction de IR dans IR. Un système de n équations à n inconnues peut aussi se mettre sous une telle

Plus en détail

Estimation et modélisation de dépendance dans des modèles de survie bivariés en présence de censure

Estimation et modélisation de dépendance dans des modèles de survie bivariés en présence de censure Estimation et modélisation de dépendance dans des modèles de survie bivariés en présence de censure Svetlana Gribkova, Olivier Lopez Laboratoire de Statistique Théorique et Appliquée, Paris 6 4 Mars 2014

Plus en détail

0 h(s)ds et h [t = 1 [t, [ h, t IR +. Φ L 2 (IR + ) Φ sur U par

0 h(s)ds et h [t = 1 [t, [ h, t IR +. Φ L 2 (IR + ) Φ sur U par Probabilités) Calculus on Fock space and a non-adapted quantum Itô formula Nicolas Privault Abstract - The aim of this note is to introduce a calculus on Fock space with its probabilistic interpretations,

Plus en détail

Travaux dirigés. Résolution numérique des équations diérentielles ordinaires. Département MIDO année 2013/2014 Master MMDMA

Travaux dirigés. Résolution numérique des équations diérentielles ordinaires. Département MIDO année 2013/2014 Master MMDMA Université Paris-Dauphine Méthodes numériques Département MIDO année 03/04 Master MMDMA Travaux dirigés Résolution numérique des équations diérentielles ordinaires Exercice. Pour α > 0, on considère le

Plus en détail

Tavakoli, Shahin Fourier analysis of functional time series, with applications to DNA... 2014

Tavakoli, Shahin Fourier analysis of functional time series, with applications to DNA... 2014 resultats sont ensuite utilises pour construire des estimateurs des operateurs de densite spectrale bases sur des versions lissees du periodogramme, le generalisation fonctionnelle de la matrice de periodogramme.

Plus en détail

Feuille d exercices Variables Aléatoires et Conditionnement

Feuille d exercices Variables Aléatoires et Conditionnement Feuille d exercices Variables Aléatoires et Conditionnement B. Delyon, V. Monbet Master 1-2013-2014 1 Indépendance et conditionnement 1.1 Introduction Exercice 1 Pour améliorer la sûreté de fonctionnement

Plus en détail

Finance des matières premières (6b) De la formation des prix sur les marchés financiers à la possibilité d un équilibre (non walrasien)

Finance des matières premières (6b) De la formation des prix sur les marchés financiers à la possibilité d un équilibre (non walrasien) Finance des matières premières (6b) De la formation des prix sur les marchés financiers à la possibilité d un équilibre (non walrasien) Alain Bretto & Joël Priolon - 25 mars 2013 Question Dans un équilibre

Plus en détail

Procédure diagnostique en arbre utilisant les tests lisses d adéquation

Procédure diagnostique en arbre utilisant les tests lisses d adéquation Procédure diagnostique en arbre utilisant les tests lisses d adéquation Walid A AKHRAS 1 & Gilles DUCHARME 1 aboratoire de probabilités et statistique cc 051, Université Montpellier, 34095 Montpellier

Plus en détail

Estimation améliorée explicite d un degré de confiance conditionnel

Estimation améliorée explicite d un degré de confiance conditionnel Estimation améliorée explicite d un degré de confiance conditionnel Dominique Fourdrinier & Patrice Lepelletier UMR CNRS 6085, Université de Rouen, Site Colbert, 76 821 Mont-Saint-Aignan cedex, France

Plus en détail

Probabilités. I- Expérience aléatoire, espace probabilisé : ShotGun. 1- Définitions :

Probabilités. I- Expérience aléatoire, espace probabilisé : ShotGun. 1- Définitions : Probabilités I- Expérience aléatoire, espace probabilisé : 1- Définitions : Ω : Ensemble dont les points w sont les résultats possibles de l expérience Des évènements A parties de Ω appartiennent à A une

Plus en détail

Régression ridge à noyau pour des variables explicatives et d intérêts fonctionnelles

Régression ridge à noyau pour des variables explicatives et d intérêts fonctionnelles Régression ridge à noyau pour des variables explicatives et d intérêts fonctionnelles Hachem Kadri 1, Philippe Preux 1,2 & Emmanuel Duflos 1,3 1 Equipe-projet SequeL, INRIA Lille - Nord Europe, Villeneuve

Plus en détail

Introduction au cours STA 102 Analyse des données : Méthodes explicatives

Introduction au cours STA 102 Analyse des données : Méthodes explicatives Analyse des données - Méthodes explicatives (STA102) Introduction au cours STA 102 Analyse des données : Méthodes explicatives Giorgio Russolillo giorgio.russolillo@cnam.fr Infos et support du cours Slide

Plus en détail

Introduction à la simulation de Monte Carlo

Introduction à la simulation de Monte Carlo Introduction à la simulation de 6-601-09 Simulation Geneviève Gauthier HEC Montréal e 1 d une I Soit X 1, X,..., X n des variables aléatoires indépendantes et identiquement distribuées. Elles sont obtenues

Plus en détail

1 Sujets donnés en option scientifique

1 Sujets donnés en option scientifique Les sujets suivants, posés aux candidats des options scientifique, économique, technologique et littéraire BL constituent la première version d un échantillon des sujets proposés lors des épreuves orales

Plus en détail

Simulation de variables aléatoires

Simulation de variables aléatoires Chapter 1 Simulation de variables aléatoires Références: [F] Fishman, A first course in Monte Carlo, chap 3. [B] Bouleau, Probabilités de l ingénieur, chap 4. [R] Rubinstein, Simulation and Monte Carlo

Plus en détail

Imputation multiple pour variables qualitatives par analyse des correspondances multiples

Imputation multiple pour variables qualitatives par analyse des correspondances multiples Imputation multiple pour variables qualitatives par analyse des correspondances multiples Vincent Audigier & François Husson & Julie Josse Laboratoire de mathématiques appliquées, Agrocampus Ouest 65 rue

Plus en détail

Product Platform Development: A Functional Approach Considering Customer Preferences

Product Platform Development: A Functional Approach Considering Customer Preferences Product Platform Development: A Functional Approach Considering Customer Preferences THÈSE N O 4536 (2009) PRÉSENTÉE le 4 décembre 2009 À LA FACULTé SCIENCES ET TECHNIQUES DE L'INGÉNIEUR LABORATOIRE DES

Plus en détail

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun

Plus en détail

Simulation de variables aléatoires

Simulation de variables aléatoires Simulation de variables aléatoires S. Robin INA PG, Biométrie Décembre 1997 Table des matières 1 Introduction Variables aléatoires discrètes 3.1 Pile ou face................................... 3. Loi de

Plus en détail

Cours de Probabilités. Jean-Yves DAUXOIS

Cours de Probabilités. Jean-Yves DAUXOIS Cours de Probabilités Jean-Yves DAUXOIS Septembre 2013 Table des matières 1 Introduction au calcul des probabilités 7 1.1 Espace probabilisable et loi de variable aléatoire........ 8 1.1.1 Un exemple

Plus en détail

Exemple PLS avec SAS

Exemple PLS avec SAS Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that

Plus en détail

1.The pronouns me, te, nous, and vous are object pronouns.

1.The pronouns me, te, nous, and vous are object pronouns. 1.The pronouns me, te, nous, and vous are object pronouns.! Marie t invite au théâtre?!! Oui, elle m invite au théâtre.! Elle te parle au téléphone?!! Oui, elle me parle au téléphone.! Le prof vous regarde?!!!

Plus en détail

Détection de ruptures offline et online pour des processus causaux

Détection de ruptures offline et online pour des processus causaux Détection de ruptures offline et online pour des processus causaux Travaux avec W. Kengne (Paris 1, Yaoundé) et O. Wintenberger (Paris IX) Jean-Marc Bardet bardet@univ-paris1.fr Trimestre du Laboratoire

Plus en détail

Le pire des cas dans le choix de la copule

Le pire des cas dans le choix de la copule Comment éviter le pire Département de Mathématique Université de Bretagne Occidentale 29200 Brest Solvency 2 impose aux assureurs une analyse des risques accumulés sur plusieurs produits d assurances.

Plus en détail

ENSE3 - API/CSPI et Master Automatique - 2008/2009

ENSE3 - API/CSPI et Master Automatique - 2008/2009 ENSE3 - API/CSPI et Master Automatique - 28/29 DS Commande robuste - - 19 janvier 29 Nom Prénom Signature ATTENTION: Mettre votre nom et répondre directement sur les feuilles de l énoncé. Justifiez vos

Plus en détail

Chapitre 2 Le problème de l unicité des solutions

Chapitre 2 Le problème de l unicité des solutions Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)

Plus en détail

Estimations de convexité pour des équations elliptiques nonlinéaires

Estimations de convexité pour des équations elliptiques nonlinéaires Estimations de convexité pour des équations elliptiques nonlinéaires et application à des problèmes de frontière libre Jean DOLBEAULT a, Régis MONNEAU b a Ceremade (UMR CNRS no. 7534), Université Paris

Plus en détail

Statistiques fonctionnelles pour l imagerie hyperspectrale

Statistiques fonctionnelles pour l imagerie hyperspectrale Statistiques fonctionnelles pour l imagerie hyperspectrale Laurent Delsol Cécile Louchet MAPMO 17e journée CASCIMODOT 6 décembre 2012 Plan Introduction Modélisation des spectres via les statistiques fonctionnelles

Plus en détail

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La licence Mathématiques et Economie-MASS de l Université des Sciences Sociales de Toulouse propose sur les trois

Plus en détail

Provisionnement face au risque de défaut des emprunteurs

Provisionnement face au risque de défaut des emprunteurs Provisionnement face au risque de défaut des emprunteurs Geoffrey Nichil et Pierre Vallois Institut Elie Cartan de Lorraine. 6-11 Avril 2014 1/12 Geoffrey Nichil et Pierre Vallois Provisionnement face

Plus en détail

Arithmetical properties of idempotents in group algebras

Arithmetical properties of idempotents in group algebras Théorie des Groupes/Group Theory Arithmetical properties of idempotents in group algebras Max NEUNHÖFFER Lehrstuhl D für Mathematik, Templergraben 64, 52062 Aachen, Allemagne E-mail: max.neunhoeffer@math.rwth-aachen.de

Plus en détail

CONCOURS D ADMISSION. Option économique MATHEMATIQUES III. Année 2006

CONCOURS D ADMISSION. Option économique MATHEMATIQUES III. Année 2006 ESSEC M B A CONCOURS D ADMISSION Option économique MATHEMATIQUES III Année 2006 La présentation, la lisibilité, l orthographe, la qualité de la rédaction, la clarté et la précision des raisonnements entreront

Plus en détail

Nouvelles classes de problèmes pour la fouille de motifs intéressants dans les bases de données 2

Nouvelles classes de problèmes pour la fouille de motifs intéressants dans les bases de données 2 Nouvelles classes de problèmes pour la fouille de motifs intéressants dans les bases de données 2 Lhouari Nourine 1 1 Université Blaise Pascal, CNRS, LIMOS, France SeqBio 2012 Marne la vallée, France 2.

Plus en détail

Instructions Mozilla Thunderbird Page 1

Instructions Mozilla Thunderbird Page 1 Instructions Mozilla Thunderbird Page 1 Instructions Mozilla Thunderbird Ce manuel est écrit pour les utilisateurs qui font déjà configurer un compte de courrier électronique dans Mozilla Thunderbird et

Plus en détail

Modélisation des lois multidimensionnelles par la théorie des copules

Modélisation des lois multidimensionnelles par la théorie des copules Modélisation des lois multidimensionnelles par la théorie des copules Grégoire Mercier jeudi 9 novembre 26 Contenu 2 Mesure de dépendance Lien avec les copules 3 Estimation de l information mutuelle Estimation

Plus en détail

Outils mathématiques pour le datamining. http://www.elseware.fr/univevry

Outils mathématiques pour le datamining. http://www.elseware.fr/univevry Outils mathématiques pour le datamining http://wwwelsewarefr/univevry Géométrie Distance Distance entre parties Matrice de variance/covariance Inertie Minimisation Probabilités Définition Théorème de Bayes

Plus en détail

Projets scilab. L3 Maths Appliquées lagache@biologie.ens.fr 02 Avril 2009

Projets scilab. L3 Maths Appliquées lagache@biologie.ens.fr 02 Avril 2009 Projets scilab L3 Maths Appliquées lagache@biologie.ens.fr 2 Avril 29 REMARQUE: quelques résultats importants concernant le théorème central limite et les intervalles de confiance sont rappelés dans la

Plus en détail

Économetrie non paramétrique I. Estimation d une densité

Économetrie non paramétrique I. Estimation d une densité Économetrie non paramétrique I. Estimation d une densité Stéphane Adjemian Université d Évry Janvier 2004 1 1 Introduction 1.1 Pourquoi estimer une densité? Étudier la distribution des richesses... Proposer

Plus en détail

APPENDIX 6 BONUS RING FORMAT

APPENDIX 6 BONUS RING FORMAT #4 EN FRANÇAIS CI-DESSOUS Preamble and Justification This motion is being presented to the membership as an alternative format for clubs to use to encourage increased entries, both in areas where the exhibitor

Plus en détail

Statistiques et inférence topologique : de nouvelles méthodes pour l analyse des données

Statistiques et inférence topologique : de nouvelles méthodes pour l analyse des données Mathématiques en mouvement 2014 Statistiques et inférence topologique : de nouvelles méthodes pour l analyse des données Bertrand MICHEL (LSTA - Upmc & INRIA Saclay équipe GEOMETRICA ) Introduction Beaucoup

Plus en détail

6. Les désastres environnementaux sont plus fréquents. 7. On ne recycle pas ses déchets ménagers. 8. Il faut prendre une douche au lieu d un bain.

6. Les désastres environnementaux sont plus fréquents. 7. On ne recycle pas ses déchets ménagers. 8. Il faut prendre une douche au lieu d un bain. 1. Notre planète est menacée! 2. Il faut faire quelque chose! 3. On devrait faire quelque chose. 4. Il y a trop de circulation en ville. 5. L air est pollué. 6. Les désastres environnementaux sont plus

Plus en détail

Méthodes de quadrature. Polytech Paris-UPMC. - p. 1/48

Méthodes de quadrature. Polytech Paris-UPMC. - p. 1/48 Méthodes de Polytech Paris-UPMC - p. 1/48 Polynôme d interpolation de Preuve et polynôme de Calcul de l erreur d interpolation Étude de la formule d erreur Autres méthodes - p. 2/48 Polynôme d interpolation

Plus en détail

Konstantin Avrachenkov, Urtzi Ayesta, Patrick Brown and Eeva Nyberg

Konstantin Avrachenkov, Urtzi Ayesta, Patrick Brown and Eeva Nyberg Konstantin Avrachenkov, Urtzi Ayesta, Patrick Brown and Eeva Nyberg Le présent document contient des informations qui sont la propriété de France Télécom. L'acceptation de ce document par son destinataire

Plus en détail

2 players Ages 8+ Note: Please keep these instructions for future reference. WARNING. CHOKING HAZARD. Small parts. Not for children under 3 years.

2 players Ages 8+ Note: Please keep these instructions for future reference. WARNING. CHOKING HAZARD. Small parts. Not for children under 3 years. Linja Game Rules 2 players Ages 8+ Published under license from FoxMind Games NV, by: FoxMind Games BV Stadhouderskade 125hs Amsterdam, The Netherlands Distribution in North America: FoxMind USA 2710 Thomes

Plus en détail

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences

Plus en détail

Promotion of bio-methane and its market development through local and regional partnerships. A project under the Intelligent Energy Europe programme

Promotion of bio-methane and its market development through local and regional partnerships. A project under the Intelligent Energy Europe programme Promotion of bio-methane and its market development through local and regional partnerships A project under the Intelligent Energy Europe programme Contract Number: IEE/10/130 Deliverable Reference: W.P.2.1.3

Plus en détail

EXERCICES SANS PRÉPARATION HEC 2005. Question 11 D après HEC 2005-11 F 2 EXERCICES SANS PRÉPARATION 2008. Question 7 HEC 2006-7 F 1 élève

EXERCICES SANS PRÉPARATION HEC 2005. Question 11 D après HEC 2005-11 F 2 EXERCICES SANS PRÉPARATION 2008. Question 7 HEC 2006-7 F 1 élève 30-1- 2013 J.F.C. p. 1 F 1 F 2 F 3 Assez simple ou proche du cours. Demande du travail. Délicat. EXERCICES SANS PRÉPARATION HEC 2005 Question 11 D après HEC 2005-11 F 2 X est une variable aléatoire de

Plus en détail

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Soutenance de doctorat, sous la direction de Pr. Bilodeau, M. et Pr. Ducharme, G. Université de Montréal et Université

Plus en détail

1998.02 Composition d un portefeuille optimal. Dinh Cung Dang

1998.02 Composition d un portefeuille optimal. Dinh Cung Dang 199802 Composition d un portefeuille optimal Dinh Cung Dang Docteur en gestion de l IAE de Paris Ingénieur Conseil Résumé : Dans ce travail, le risque est défini comme étant la probabilité de réaliser

Plus en détail

Contents Windows 8.1... 2

Contents Windows 8.1... 2 Workaround: Installation of IRIS Devices on Windows 8 Contents Windows 8.1... 2 English Français Windows 8... 13 English Français Windows 8.1 1. English Before installing an I.R.I.S. Device, we need to

Plus en détail

Probabilités 5. Simulation de variables aléatoires

Probabilités 5. Simulation de variables aléatoires Probabilités 5. Simulation de variables aléatoires Céline Lacaux École des Mines de Nancy IECL 27 avril 2015 1 / 25 Plan 1 Méthodes de Monte-Carlo 2 3 4 2 / 25 Estimation d intégrales Fiabilité d un système

Plus en détail

Retournement Temporel

Retournement Temporel Retournement Temporel Rédigé par: HENG Sokly Encadrés par: Bernard ROUSSELET & Stéphane JUNCA 2 juin 28 Remerciements Je tiens tout d'abord à remercier mes responsables de mémoire, M.Bernard ROUSSELET

Plus en détail

Cours d Analyse. Fonctions de plusieurs variables

Cours d Analyse. Fonctions de plusieurs variables Cours d Analyse Fonctions de plusieurs variables Licence 1ère année 2007/2008 Nicolas Prioux Université de Marne-la-Vallée Table des matières 1 Notions de géométrie dans l espace et fonctions à deux variables........

Plus en détail

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer Pour commencer Exercice 1 - Ensembles de définition - Première année - 1. Le logarithme est défini si x + y > 0. On trouve donc le demi-plan supérieur délimité par la droite d équation x + y = 0.. 1 xy

Plus en détail

INTRODUCTION AUX MÉTHODES DE MONTE CARLO PAR CHAÎNES DE MARKOV

INTRODUCTION AUX MÉTHODES DE MONTE CARLO PAR CHAÎNES DE MARKOV Séminaire MTDE 22 mai 23 INTRODUCTION AUX MÉTHODES DE MONTE CARLO PAR CHAÎNES DE MARKOV Vincent Mazet CRAN CNRS UMR 739, Université Henri Poincaré, 5456 Vandœuvre-lès-Nancy Cedex 1 juillet 23 Sommaire

Plus en détail

Econométrie Appliquée Séries Temporelles

Econométrie Appliquée Séries Temporelles Chapitre 1. UFR Economie Appliquée. Cours de C. Hurlin 1 U.F.R. Economie Appliquée Maîtrise d Economie Appliquée Cours de Tronc Commun Econométrie Appliquée Séries Temporelles Christophe HURLIN Chapitre

Plus en détail

Sommaire. Chapitre 1 Variables et vecteurs aléatoires... 5. Chapitre 2 Variables aléatoires à densité... 65

Sommaire. Chapitre 1 Variables et vecteurs aléatoires... 5. Chapitre 2 Variables aléatoires à densité... 65 Sommaire Chapitre 1 Variables et vecteurs aléatoires............... 5 A. Généralités sur les variables aléatoires réelles.................... 6 B. Séries doubles..................................... 9

Plus en détail

DES DISTRIBUTIONS DE PROBABILITÉ SINGULIÈRES. Marc BARBUT 1

DES DISTRIBUTIONS DE PROBABILITÉ SINGULIÈRES. Marc BARBUT 1 Math. Sci. hum / Mathematics and Social Sciences (48 e année, n 9, 2(2), p. -8) DES DISTRIBUTIONS DE PROBABILITÉ SINGULIÈRES Marc BARBUT RÉSUMÉ Ce texte n a rien d original. Son objectif est seulement

Plus en détail

Analyse de données longitudinales continues avec applications

Analyse de données longitudinales continues avec applications Université de Liège Département de Mathématique 29 Octobre 2002 Analyse de données longitudinales continues avec applications David MAGIS 1 Programme 1. Introduction 2. Exemples 3. Méthodes simples 4.

Plus en détail

Démonstration de la conjecture de Dumont

Démonstration de la conjecture de Dumont C. R. Acad. Sci. Paris, Ser. I 1 (005) 71 718 Théorie des nombres/combinatoire Démonstration de la conjecture de Dumont Bodo Lass http://france.elsevier.com/direct/crass1/ Institut Camille Jordan, UMR

Plus en détail

Détermination des fréquences propres d une structure avec paramètres incertains

Détermination des fréquences propres d une structure avec paramètres incertains Détermination des fréquences propres d une structure avec paramètres incertains Etienne ARNOULT Abdelhamid TOUACHE Pascal LARDEUR Université de Technologie de Compiègne Laboratoire Roberval BP 20 529 60

Plus en détail

MEDIAPLANNING & HYBRIDATION APPLIQUE A L INTERNET

MEDIAPLANNING & HYBRIDATION APPLIQUE A L INTERNET MEDIAPLANNING & HYBRIDATION APPLIQUE A L INTERNET MOBILE Gaël Crochet 1 & Gilles Santini 2 1 Médiamétrie, 70 rue Rivay, 92532 Levallois-Perret, France, gcrochet@mediametrie.fr 2 Vintco SARL, 8 rue Jean

Plus en détail

Machines à sous (compléments)

Machines à sous (compléments) CHAPITRE 28 Machines à sous (compléments) Résumé. Ce qui suit complète le chapitre 22. On explique ici brièvement comment rre non-asymptotiques les résultats de convergence qui reposaient sur la loi des

Plus en détail

M42. Compléments d analyse (résumé).

M42. Compléments d analyse (résumé). Université d Evry-Val-d Essonne. Année 2008-09 D. Feyel M42. Compléments d analyse (résumé). Table. I. Rappels sur les suites. Limites supérieure et inférieure. II. Topologie élémentaire. III. Fonctions

Plus en détail

PC industriels et disques associés

PC industriels et disques associés Technical Service Bulletin PRODUIT DATE CREATION DATE MODIFICATION FICHIER PC INDUSTRIEL 23/03/2010 201005 REV A PC industriels et disques associés English version follows. SF01 (du 4 au 8 janvier 2010)

Plus en détail

Moments des variables aléatoires réelles

Moments des variables aléatoires réelles Chapter 6 Moments des variables aléatoires réelles Sommaire 6.1 Espérance des variables aléatoires réelles................................ 46 6.1.1 Définition et calcul........................................

Plus en détail

MODE D'EMPLOI USER MANUAL. MIDI MESSENGER version 1-2-3. MIDI MESSENGER version 1-2-3

MODE D'EMPLOI USER MANUAL. MIDI MESSENGER version 1-2-3. MIDI MESSENGER version 1-2-3 MIDI MESSENGER version 1-2-3 USER MANUAL MidiMessenger has been designed to help virtual organs users by sending Midi messages to the instrument. But MidiMessenger is also a general purpose tool for one

Plus en détail

COMPORTEMENT ASYMPTOTIQUE D UNE FILE D ATTENTE À UN SERVEUR

COMPORTEMENT ASYMPTOTIQUE D UNE FILE D ATTENTE À UN SERVEUR Université Paris VII. Préparation à l Agrégation. (François Delarue) COMPORTEMENT ASYMPTOTIQUE D UNE FILE D ATTENTE À UN SERVEUR Ce texte vise à l étude du temps d attente d un client à la caisse d un

Plus en détail

3. Conditionnement P (B)

3. Conditionnement P (B) Conditionnement 16 3. Conditionnement Dans cette section, nous allons rappeler un certain nombre de définitions et de propriétés liées au problème du conditionnement, c est à dire à la prise en compte

Plus en détail

Choosing Your System Not sure where to start? There are six factors to consider when choosing your floor heating system:

Choosing Your System Not sure where to start? There are six factors to consider when choosing your floor heating system: Choosing Your System Not sure where to start? There are six factors to consider when choosing your floor heating system: 1.Which to choose: the cable or the mat? True Comfort offers two types of floor

Plus en détail

Introduction à la Statistique Inférentielle

Introduction à la Statistique Inférentielle UNIVERSITE MOHAMMED V-AGDAL SCIENCES FACULTE DES DEPARTEMENT DE MATHEMATIQUES SMI semestre 4 : Probabilités - Statistique Introduction à la Statistique Inférentielle Prinemps 2013 0 INTRODUCTION La statistique

Plus en détail

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. 14-3- 214 J.F.C. p. 1 I Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. Exercice 1 Densité de probabilité. F { ln x si x ], 1] UN OVNI... On pose x R,

Plus en détail

Théorie de la crédibilité

Théorie de la crédibilité ISFA - Année 2008-2009 Théorie de la crédibilité Chapitre 2 : Prime de Bayes Pierre-E. Thérond Email, Page web, Ressources actuarielles Langage bayesien (1/2) Considérons une hypothèse H et un événement

Plus en détail

Les licences Creative Commons expliquées aux élèves

Les licences Creative Commons expliquées aux élèves Les licences Creative Commons expliquées aux élèves Source du document : http://framablog.org/index.php/post/2008/03/11/education-b2i-creative-commons Diapo 1 Creative Commons presents : Sharing Creative

Plus en détail

PRÉSENTATION TRAVAIL EN COURS - APPRENTISSAGE INTERACTIF. Ianis Lallemand, 21 janvier 2013

PRÉSENTATION TRAVAIL EN COURS - APPRENTISSAGE INTERACTIF. Ianis Lallemand, 21 janvier 2013 PRÉSENTATION TRAVAIL EN COURS - APPRENTISSAGE INTERACTIF Ianis Lallemand, 21 janvier 2013 APPRENTISSAGE INTERACTIF definition Contours encore assez flous dans le champ de l apprentissage automatique. Néanmoins,

Plus en détail

Publication IEC 61000-4-3 (Edition 3.0 2008) I-SH 01

Publication IEC 61000-4-3 (Edition 3.0 2008) I-SH 01 Publication IEC 61000-4-3 (Edition 3.0 2008) I-SH 01 Electromagnetic compatibility (EMC) Part 4-3: Testing and measurement techniques Radiated, radio-frequency, electromagnetic field immunity test INTERPRETATION

Plus en détail

Problèmes de fiabilité dépendant du temps

Problèmes de fiabilité dépendant du temps Problèmes de fiabilité dépendant du temps Bruno Sudret Dépt. Matériaux et Mécanique des Composants Pourquoi la dimension temporelle? Rappel Résistance g( RS, ) = R S Sollicitation g( Rt (), St (),) t =

Plus en détail

Florida International University. Department of Modern Languages. FRENCH I Summer A Term 2014 FRE 1130 - U01A

Florida International University. Department of Modern Languages. FRENCH I Summer A Term 2014 FRE 1130 - U01A Florida International University Department of Modern Languages FRENCH I Summer A Term 2014 FRE 1130 - U01A Class time: Monday, Tuesday, Wednesday, Thursday; 6:20 P.M. - 9:00 P.M. Instructors: Prof. Jean-Robert

Plus en détail

Jeux à somme nulle : le cas fini

Jeux à somme nulle : le cas fini CHAPITRE 2 Jeux à somme nulle : le cas fini Les jeux à somme nulle sont les jeux à deux joueurs où la somme des fonctions de paiement est nulle. Dans ce type d interaction stratégique, les intérêts des

Plus en détail

Examen Master IFI, 2ème année, Parcours CSSR 2010/2011 Tous documents autorisés

Examen Master IFI, 2ème année, Parcours CSSR 2010/2011 Tous documents autorisés Examen Master IFI, 2ème année, Parcours CSSR 2010/2011 Tous documents autorisés F. Baude et al. 29 Novembre 2010, Durée 3 heures Exercice 1 (3 points) Design a probe-echo algorithm to count the number

Plus en détail

Modélisation de systèmes complexes et éléments de finance computationnelle

Modélisation de systèmes complexes et éléments de finance computationnelle Professeur Olivier BRANDOUY Modélisation de systèmes complexes et éléments de finance computationnelle Master Recherche (séance 6) 2009-2010 Olivier Brandouy - 2009/10-1 Plan de la séance 1. Faits stylisés,

Plus en détail

Couples de variables aléatoires discrètes

Couples de variables aléatoires discrètes Couples de variables aléatoires discrètes ECE Lycée Carnot mai Dans ce dernier chapitre de probabilités de l'année, nous allons introduire l'étude de couples de variables aléatoires, c'est-à-dire l'étude

Plus en détail

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications A. Optimisation sans contrainte.... Généralités.... Condition nécessaire et condition suffisante

Plus en détail

Introduction aux Support Vector Machines (SVM)

Introduction aux Support Vector Machines (SVM) Introduction aux Support Vector Machines (SVM) Olivier Bousquet Centre de Mathématiques Appliquées Ecole Polytechnique, Palaiseau Orsay, 15 Novembre 2001 But de l exposé 2 Présenter les SVM Encourager

Plus en détail

Est-ce que tu as un frère? Marc a une cousine à Québec. Nous avons une voiture. Est-ce que vous avez un vélo? Ils ont un appartement à Paris.

Est-ce que tu as un frère? Marc a une cousine à Québec. Nous avons une voiture. Est-ce que vous avez un vélo? Ils ont un appartement à Paris. Leçon 7 - La Vie est belle La vie de Nafi, une jeune Française d origine sénégalaise parle de sa vie. Elle est étudiante en sociologie à l Université de Toulouse. Aujourd hui, elle parle de sa vie. -Est-ce

Plus en détail

Application des courbes ROC à l analyse des facteurs pronostiques binaires

Application des courbes ROC à l analyse des facteurs pronostiques binaires Application des courbes ROC à l analyse des facteurs pronostiques binaires Combescure C (1), Perneger TV (1), Weber DC (2), Daurès J P (3), Foucher Y (4) (1) Service d épidémiologie clinique et Centre

Plus en détail

Haslingden High School French Y8 Block C Set 1 HOMEWORK BOOKLET

Haslingden High School French Y8 Block C Set 1 HOMEWORK BOOKLET Haslingden High School French Y8 Block C Set 1 HOMEWORK BOOKLET Name: Form: Subject Teacher: Date Given: Date to Hand in: Level: Effort: House Points: Comment: Target: Parent / Guardian Comment: Complete

Plus en détail