REDUCTION DE BASE DE DONNEES PAR LA CLASSIFICATION AUTOMATIQUE

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimension: px
Commencer à balayer dès la page:

Download "REDUCTION DE BASE DE DONNEES PAR LA CLASSIFICATION AUTOMATIQUE"

Transcription

1 INSTITUT DE LA FRANCOPHONIE POUR L INFORMATIQUE RAPPORT DU STAGE REDUCTION DE BASE DE DONNEES PAR LA CLASSIFICATION AUTOMATIQUE Sous la drecton de Pr. Georges HEBRAIL, ENST Pars Réalsé par LE Anh Tuan, IFI Hano Décembre 2004

2 Remercements Je tens à remercer mon encadrant du stage, Monseur Georges Hébral, le professeur du département Informatque et Réseaux (INFRES), ENST Pars, pour sa dsponblté, son soutent et son ade préceuse pendant toute la durée du stage. Je voudras également remercer chaleureusement Madame Sophe Bzart, le secrétare du département INFRES de m avor accuell et son ade pendant le stage. Un grand merc à l IFI d avor ben préparé mon stage. J a le plasr de remercer tous les stagares au département INFRES, ENST qu m ont porté leur amté. J exprme mon entère reconnassance à ma famlle et mes ams pour leurs soutens, leurs ades et leurs encouragements. 1

3 Table de matères Résumé... 4 Abstract... 4 Chaptre 1. Introducton... 5 Chaptre 2. Etat de l art Classfcaton de données Types de données et les mesures ) Classfcaton basée sur la talle de domane : ) Classfcaton basée sur l échelle de mesure : Méthodes de classfcaton ) Méthodes hérarchques (herarchcal clusterng) CURE ) Méthodes de parttonnement (parttonal clusterng): K-medods K-means ) Méthodes basées sur la densté DBSCAN DENCLUE ) Méthodes basées sur la grlle STING WaveCluster CLIQUE ) Algorthmes pour des données de haute dmenson Sélecton d attrbuts Réducton de dmensonnalté Classfcaton dans sous-espaces...24 v. Co-classfcaton ) Algorthmes pour les données qualtatves (catégore) ROCK STIRR CACTUS...27 Chaptre 4. Classfcaton sur le flux de données Classfcaton sur le flux de données STREAM-LOCALSEARCH GenIc Algorthmes BIRCH et CLUSTREAM ) BIRCH Arbre des CFs Algorthme Cluster Feature et la dstance dans BIRCH ) CLUSTREAM Mantenance en lgne des mcros classes Créaton des macros classes Analyse d évoluton des classes...45 Chaptre 3. Implémentaton et expérmentaton Implémentaton du BIRCH Expérmentaton du BIRCH...51 Chaptre 4. Concluson et perspectves...52 Annexe 1. Sommare des algorthmes de classfcaton

4 Annexe 2. Lste des fgures...55 Références

5 Résumé Aujourd hu, l y a plus en plus des applcatons dont la base de données est très grosse et les données apparassent sous la forme d un flux de données nfn comme des enregstrements de coup de téléphone, la survellance de réseaux... Pour ce type de données, les systèmes de geston de base de données (SGBDs) tradtonnels semblent ne pas convenables parce que ls ne tratent que des données à talle lmtée. Pour exploter effcacement des données massves en utlsant un espace de stockage lmté, l faut trouver un tratement spécal qu rédut les données afn d obtenr des nformatons nécessares appelées des résumés à partr de ces données. Il y a certanes méthodes pour ce fat : échantllonnage, compresson et classfcaton. Parm eux, la classfcaton est la soluton la plus convenable. Dans ce rapport, nous parlons des algorthmes de classfcaton en général et partculèrement de ceux qu sont pour le flux de données. Après avor découvert pluseurs algorthmes de classfcaton, nous avons trouvé que l algorthme BIRCH est une soluton de réducton de données très bonnes et le modèle CLUSTREAM permet de trater effcacement les données sur un flux de données. Nous avons également mplémenté l algorthme BIRCH pour tester sa performance. Abstract Today, there s more and more applcatons whose database s very large and the data appear n the form of an nfnte data stream lke records of telephone call, the montorng of networks... For ths type of data, the tradtonal database management systems (DBMS) seem not sutable because they treat only data wth lmted sze. To explot effectvely massve data by usng a space of lmted storage, t s necessary to fnd a specal processng whch reduces the data n order to obtan necessary nformaton called the summares from these data. There are certan methods for ths: samplng, compresson and clusterng. Among them, clusterng s the most sutable soluton. In ths report, we talk about the general clusterng algorthms and partcularly about those whch are for the data flow. After havng studed several clusterng algorthms, we found that BIRCH algorthm s a very good data reducton soluton and the CLUSTREAM s a model whch allows to effectvely treatng the data stream. We also mplemented algorthm BIRCH to test ts performance. 4

6 Chaptre 1. Introducton Aujourd hu, l y a pluseurs applcatons qu ont beson d un autre modèle de stockage des données que le modèle des SGBD (Système de Geston de Base de Données) tradtonnel. Un modèle de SGBD tradtonnel stocke des jeux de données fns et persstants, donc l n est appropré qu aux applcatons dont le volume de données n est pas ggantesque, dont des partes sgnfcatves de données sont souvent requses et dont les mses à jour sont relatvement peu fréquentes. On peut trouver de telles nouvelles applcatons dans les télécommuncatons, la survellance des réseaux, les affares, les marchés fnancers, les flux de clcs sur les pages web Dans ces applcatons, les données arrvent sous la forme d un flux de données,.e. un gros volume de données qu arrve contnuellement. Les données ne sont accessbles que par ordre d arrvée, les accès aléatores ne sont pas perms. La mémore réservée aux données est relatvement plus pette que le volume total du flux de données, donc l n y a qu une pette quantté de données qu peut être gardée. Dans les télécommuncatons, par exemple, les enregstrements d appel sont contnuellement générés. Typquement, la plupart de tratements sont fats en examnant un enregstrement une seule fos. Après, l ne sera plus examné. Il exste des méthodes pour réalser un comproms entre un gros volume de données qu arrvent et un espace de stockage et pett. On peut échantllonner les données qu arrvent et utlser les échantllons obtenus dans les opératons de l applcaton. Cette méthode perd beaucoup d nformatons concernant le jeu enter de données. Une autre méthode est de compresser les données et d utlser les données compressées au leu des données orgnales. Dans ce cas, les données compressées ne peuvent pas être effcacement nterprétées et drectement utlsées sans être décompressées. La classfcaton automatque est auss une technque de compresson (réducton) de données mas les données sont ben compressées en sens que le jeu de données peut être ben nterprété en n utlsant que les données compressées. La classfcaton automatque des données consste à dvser un jeu de données en sous-ensembles de données appelés classes pour que tous les ndvdus dans même une classe soent smlares et les ndvdus de classes dstnctes soent dssmlares. Typquement, chaque classe est représentée par un ndvdu qu s appelle le centre de la classe ou par certanes nformatons dérvées de tous les ndvdus de la classe qu sont suffsantes de décrre la classe. Il y a pluseurs algorthmes de classfcaton des données. Ils dffèrent par la nature de données qu ls tratent (données numérques ou données de catégore, pett jeu de données ou gros jeu de données, données de dmenson élevée ou mons élevée, sur un flux de données ou pas ), par les méthodes de dstrbuton des données en classes, par la représentaton des classes Ce stage de fn d étude a eu leu à l Ecole Natonale Supéreure des Télécommuncatons de Pars, France. J a travallé sous la drecton du professeur Georges HEBRAIL. Mon traval dans ce stage est de découvrr tout d abord le domane de classfcaton de données en général. Ce traval consste à fare 5

7 connassance le concept de classfcaton des données, les problèmes concernant du domane, une classfcaton des algorthmes de classfcaton dfférents afn de trouver que l algorthme BIRCH et le modèle CLUSTREAM est une bonne soluton pour le problème de classfcaton sur le flux de données. Nous avons également mplémenté l algorthme BIRCH et fat des expérmentatons pour évaluer sa performance. Une smulaton smple de classfcaton sur un flux de données est également réalsée en se basant sur cet algorthme. Ce rapport est organsé comme suvant : Le chaptre 2 décrt le problème de classfcaton de données en général et de dfférents algorthmes de classfcaton. Le chaptre 3 parle de l algorthme BIRCH et CLUSTREAM. Le chaptre 4 décrt notre mplémentaton et expérmentaton de l algorthme BIRCH. Le chaptre 5 est une concluson avec quelques perspectves. 6

8 Chaptre 2. Etat de l art 1. Classfcaton de données La classfcaton est une méthode qu a pour but de grouper les ndvdus d une populaton en des classes dsjontes telles que dans une même classe, les membres sont smlares et dans les classes dfférentes, les ndvdus sont dssmlares. Il faut dstnguer la classfcaton (la classfcaton non supervsée) avec le classement (la classfcaton supervsée) [1][3] : - Classfcaton supervsée: Etant donné un ensemble des classes déjà dentfées et un ndvdu, l s agt de trouver la melleure classe à laquelle cet ndvdu appartent. - Classfcaton non supervsée : Etant donné un ensemble des ndvdus, l s agt de structurer des classes pas encore dentfées qu groupent ces ndvdus. Nous nous ntéressons à la classfcaton non supervsée dans la foulle de données dans laquelle les exgences prncpales sont la capacté de tratement d un gros jeu de données et la capacté de tratement des dfférents types de données. Le processus de classfcaton comprend les étapes suvantes [2] [3] : (1) représentaton des ndvdus, (2) défnton d une mesure de smlarté approprée aux données, (3) classfcaton, (4) abstracton des données, (5) valdaton du résultat. La représentaton des ndvdus (patterns) a pour but de détermner les nformatons concernant les données : le nombre de classes désré, le nombre d ndvdus dsponbles, le nombre, le type et l échelle des attrbuts de données. Ces nformatons sont utlsées dans l algorthme de classfcaton. La proxmté des ndvdus est souvent mesurée par une foncton de dstance entre chaque par d ndvdus. De nombreuses mesures de proxmté sont proposées, se basant sur la nature de données. La classfcaton est une phase de groupement des ndvdus dans les classes. Pluseurs algorthmes de classfcaton sont proposés. La dfférence entre eux est la manère dont ls groupent les ndvdus telles que la méthode hérarchque, la méthode de partton, le type de données qu ls tratent comme des données numérques, de catégore, le flux de données, la mesure de proxmté des ndvdus et des classes qu ls utlsent, telles que la dstance eucldenne, la dstance de Mnkowsk, le len smple ou le len complet ou le crtère selon lequel on construt des classes. L abstracton des données est un processus d extracton d une représentaton smple et compacte pour un jeu de données. Typquement, une abstracton des données est une descrpton compacte de chaque classe, souvent en terme de prototypes des classes ou d ndvdus représentatfs des classes comme le centre des classes. La valdaton du résultat vse à détermner s les classes fournes sont sgnfcatves en utlsant un crtère spécfque d optmalté. Cependant, un tel crtère est souvent subjectf, donc l y a peu de manères standard pour valder la classfcaton sauf dans certans domanes ben décrts à pror. 7

9 La classfcaton est utle dans une varété de domanes comme : reconnassance des formes, apprentssage, foulle de données, recherche de documents, segmentaton d mages 2. Types de données et les mesures Dans la classfcaton, le type d objets tratés est dvers (des personnes, des avs, des enttés ). Ces objets dovent être sogneusement présentés en termes de leurs caractérstques. Ces caractérstques sont les varables prncpales du problème et leur chox nfluence consdérablement sur les résultats d'un algorthme de classfcaton. Nous présentons une classfcaton basée sur deux caractérstques : la talle de domane et l échelle de mesure [1][24]. 1) Classfcaton basée sur la talle de domane : Cette classfcaton dstngue des objets sur une varable en se basant sur la talle de leur domane,.e. le nombre de valeurs dstnctes de la varable. - Un attrbut est contnu s son domane n est pas compté et nfn,.e. ses éléments ne peuvent pas être ms dans une bjecton avec l'ensemble de nombres enters postfs. Cela sgnfe qu entre deux valeurs quelconques de l'attrbut, l exste un nombre nfn de valeurs. - Un attrbut est dscret s son domane est un ensemble fn,.e. un ensemble dont les éléments peuvent être ms dans une bjecton avec un sous-ensemble fn des nombres enters postfs. - Un attrbut est bnare s l est un attrbut dont le domane content exactement 2 valeurs. 2) Classfcaton basée sur l échelle de mesure : Cette classfcaton dstngue des attrbuts selon leur échelle de mesure. Supposons que x = ( x 1,..., x k ), y = ( y 1,..., y k ) et z = ( z 1,..., z k ) sont des objets dans un jeu de données D en k dmensons, x, y, z sont des attrbuts, = 1,, k. - Une échelle nomnale dstngue les catégores. Cela sgnfe que nous pouvons seulement dre s x = y ou x y. Les valeurs ne peuvent pas être totalement ordonnées. Elles sont smplement une généralsaton des attrbuts bnares, avec un domane à plus de deux valeurs dscrètes. - Une échelle ordnale mplque des attrbuts d échelle nomnale utlsant un dspostf addtonnel pour que leurs valeurs soent totalement mses en ordre, mas les dfférences entre les valeurs ne peuvent pas être quantfées. Par conséquent, au leu de dre x = y ou x y on peut dre x < y ou x > y. - Une échelle d'ntervalle mesure des valeurs dans l échelle lnéare. Avec l échelle d'ntervalle nous pouvons dre non seulement s une valeur se trouve avant ou après une autre, mas auss à quelle dstance avant ou après. Pusque des valeurs sont mses sur une échelle lnéare, s x > y alors nous pouvons également ndquer que x est dfférent de x y untés de y pour l attrbut. - Une échelle de rapport est une échelle d'ntervalle avec un pont nul sgnfcatf. 8

10 Des attrbuts d échelle nomnale et ordnale s appellent des attrbuts qualtatfs (ou catégorques), alors que l échelle d'ntervalle et de rapport s appelle des attrbuts quanttatfs. Il est évdent que des attrbuts quanttatfs sont mesurés en utlsant les untés spécfques, telles que des klogrammes et des centmètres. Les untés de mesure affectent les résultats d'analyse des classes, pusque, par exemple, les untés changeantes de mesure des klogrammes à lvres pour le pods, peuvent mener à un résultat dfférent. Le remède à ce problème s'appelle la standardsaton. Etant donné un attrbut, phases dans la standardsaton : 1 k et n objets x 1, x 2,, x n. Il s agt de deux - Trouver la dévaton absolue moyenne s de, pour tous les objets : 1 ( x m + x m + + x ) n m 1 2 s =..., tels que x 1, x 2,, x n sont n n valeurs de l attrbut dans n objets, et m est la moyenne de l attrbut. j j x m - Détermner la mesure standardsée : z =, 1 n s Une fos que les caractérstques des données ont été détermnées, nous sommes confrontés au problème de trouver des moyens approprés de décder à quelle dstance un objet se trouve de l autre. Les calculs de proxmté sont des mesures de la ressemblance ou de l assocaton entre les pares d'objets de données. Un calcul de proxmté peut mesurer la smlarté ou la dssmlarté : plus deux objets se ressemblent, plus leur smlarté est grande et plus leur dssmlarté est pette. La dssmlarté peut être mesurée de dfférentes manères, l une est la dstance. Quant à elle, la dstance peut également être mesurée de pluseurs façons. Chaque mesure de dstance est dépendante des caractérstques des données qu on trate. Les métrques sont les mesures de dstance les plus mportantes. Une métrque dot satsfare 4 condtons : non négatve, défntve (la dstance entre un objet et somême dot être à zéro), symétrque et l néquaton trangulare. En conséquence, une métrque est toujours une mesure mas l nverse n est pas toujours vra. Nous présentons une descrpton brève de mesures pour chaque type d attrbut de données : - Attrbuts d échelle d ntervalle: Après la standardsaton, la dssmlarté entre deux objets x et y peut être calculé par les métrques suvantes : n q + Dstance de Mnkowsk : d( x, y) = x y = 1 n 2 + Dstance eucldenne : ( ) d( x, y) = x y (Mnkowsk, q = 2). = 1 + Dstance de Manhattan : d( x, y) = x y (Mnkowsk, q = 1). n = 1 = max n =1 + Dstance maxmum: d( x, y) x y. (Mnkowsk, p ). 1 q 9

11 En cas où les attrbuts sont assgnés à des pods, l faut transformer les formules de dstance en formules pondérées, e.g.: w est le pods pour l attrbut, =1,, k. + Dstance de Mahanalobs : k 2 d( x, y) = w ( x y ), tel que 1 = 1 d( x, y) = ( x y) ( x y), tel que est une matrce de covarance d échantllon ou une matrce de covarance connue du processus de génératon d ndvdus. - Attrbuts bnares : Supposons que les attrbuts de 2 objets x et y n aent que les valeurs 1 et 0. α +δ + Smple Matchng Coeffcent : d ( x, y) = (x et y sont symétrques) τ α + Jaccard Coeffcent : d ( x, y) = (x et y sont asymétrques) α + β + γ Tels que α est le nombre de valeurs d attrbut qu sont égales à 1 dans tous les deux objets, β est le nombre de valeurs d attrbut qu sont égales à 1 dans x mas 0 dans y, γ est le nombre de valeurs d attrbut qu sont égales à 0 dans x mas 1 dans y, δ est le nombre de valeurs d attrbut qu sont égales à 0 dans tous les deux objets, τ = α + β + γ + δ p m - Attrbuts d échelle nomnale : d( x, y) =, tels que m est le nombre p d attrbuts dont la valeur est parelle dans tous les deux objets, p est le nombre total d attrbuts. - Attrbuts d échelle ordnale : Ce type d attrbuts peut être traté comme celu d ntervalle mas l a beson d être convert en une forme convenable. T Supposons que est un attrbut d échelle ordnale dont le domane content M valeurs. Ces valeurs sont mses en ordre [1 M ], donc on peut remplacer chaque valeur par son rang correspondant r { 1,..., M }. Chaque attrbut ordnal pourrat avor une talle dfférente de domane, donc l est souvent nécessare de convertr chaque valeur en une valeur se trouvant dans l ntervalle [0.0, 1.1] en utlsant la formule j j r 1 suvante : z = M 1 Après la transformaton, on peut calculer la dssmlarté entre les objets par les mesures des attrbuts d ntervalle en applquant ces mesures sur les z j. - Attrbuts d échelle de rapport : Il y a pluseurs méthodes pour calculer la dssmlarté entre ces attrbuts. Une soluton est d applquer une formule logarthmque sur chaque attrbut. Le résultat peut être traté comme un attrbut d ntervalle. L utlsaton d une transformaton dépend de la défnton des attrbuts et de l applcaton. 10

12 - Attrbuts mélangés : k attrbuts mélangés, f δ xy d( x, y) k f f δ xy d xy f = 1 = k f δ xy f = 1, tels que x et y sont des objets de sgnfe le degré de dssmlarté entre x et y à l attrbut f et f d xy est la contrbuton de l attrbut f à la dssmlarté entre x et y. 3. Méthodes de classfcaton De nombreux algorthmes ont été nventés dans le domane. Ils se dffèrent grâce aux facteurs : le type d attrbuts de données qu ls tratent (numérques, de catégore, taxonomques ) donc la structure de données utlsée est dfférente, la capacté de trater un gros jeu de données, la capacté de trater des données en haute dmenson, la capacté de trater des observatons aberrantes, la complexté de l algorthme (temps de calcul), la dépendance de l ordre des données qu arrvent, la dépendance des paramètres prédéfns par utlsateurs ou la connassance a pror sur les données Selon ces crtères et leurs combnasons, l y a pluseurs types d algorthmes de classfcaton. Tradtonnellement et souvent, les méthodes de classfcaton sont dvsées en 2 catégores prncpales : Méthodes hérarchques et méthodes de parttonnement selon la manère dont on construt les classes. Tands que les premères établssent graduellement les classes, les dernères apprennent drectement les classes. C'est-à-dre qu elles les découvrent en fasant bouger des ponts entre les classes. Ensute, les algorthmes se dffèrent grâce aux autres crtères comme le nombre de passes d accès aux données, le nombre de dmensons, le type de données tratées, la forme des classes Ces algorthmes sont sot hérarchques, sot de type parttonnement, sot une combnason de ces deux types, et ls utlsent dfférents mécansmes d organsaton des données, de recherche, de constructon des classes Fare une classfcaton pour tous les crtères n est pas facle, donc c nous ne fasons qu une dstncton entre les 2 types fondamentaux et nous décrrons certanes famlles d algorthmes qu jouent un rôle mportant dans la communauté de classfcaton. Ce sont [1] [2] [3] : Méthodes hérarchques, méthodes de parttonnement, méthodes basant sur la grlle, méthodes basant sur la densté, algorthmes pour les données qualtatves (catégore), algorthmes pour les données en haute dmenson et algorthmes pour le flux de données. 1) Méthodes hérarchques (herarchcal clusterng) Ces méthodes construsent les classes graduellement sous une forme hérarchque, autrement dt, un arbre des classes qu est appelé un dendrogramme. Elles sont dvsées en 2 sous-types : Agglomératon (ascendant) et dvson (descendant). - Agglomératon : On commence en consdérant chaque pont comme une classe et on essaye de fusonner deux ou pluseurs classes approprées (selon une 11

13 smlarté) pour former une nouvelle classe. Le processus est téré jusqu à ce que tous les ponts se trouvent dans une même classe ou ben jusqu à ce qu on l arrête. - Dvson : En consdérant tous les ponts comme une seule classe au début, on dvse successvement les classes en classes plus raffnées. Le processus marche jusqu à ce que chaque classe contenne un seul pont ou ben s l on attent un nombre de classes désré. Les méthodes hérarchques ont les avantages: La flexblté pour le nveau de granularté (on peut attendre une classe la plus fne ou la plus épasse comme souhat), la capacté de trater n mporte quelle mesure de smlarté ou dstance et l applcaton sur n mporte quel type d attrbuts. A côté, elles ont les nconvénents : la crtère de termnason est souvent vague et le beson de mult accès aux données. La plupart des méthodes hérarchques utlsent le len smple (sngle-lnk), len complet (complete-lnk) ou le len moyen pour mesurer la smlarté entre les classes [1] [3]: - Dans le len smple, la dstance entre 2 classes est la valeur mnmum des dstances entre toutes les pares d ndvdus, l un de la premère classe, l autre de la deuxème. - Dans le len complet, la dstance entre 2 classes est la valeur maxmum des dstances entre toutes les pares d ndvdus - Dans le len moyen, la dstance entre 2 classes est la valeur moyenne des dstances entre toutes les pares d ndvdus, l un de la premère classe, l autre de la deuxème. Fgure 1: Classfcaton de len smple (gauche) et complet (drote) d objets contenant 2 classes 1 et 2 avec le brut *. L'algorthme de len complet produt des classes étrotement lées ou compactes. En revanche, l'algorthme de len smple souffre d'un effet d'enchaînement. Il a une tendance de produre des classes qu sont prolongées (Vor la fgure c-dessus). Cependant l'algorthme de len smple est plus souple que l'algorthme de len complet. D un pont de vue pragmatque, on a observé que l'algorthme de len complet produt des hérarches plus utles dans beaucoup d'applcatons que l'algorthme de len smple [3]. Il y a de nombreux algorthmes qu sont proposés. Les algorthmes hérarchques les plus connus sont CURE, COBWEB, CACTUS, BIRCH. Nous décrrons COBWEB et CACTUS dans la secton algorthmes pour les données qualtatves, et BIRCH dans une secton propre. 12

14 . CURE CURE (Clusterng Usng REpresentatves) a été proposé par Guha, Rastag et Sm [20]. Il est une approche hybrde : utlser tous les ponts de données et ans un un centrod pour former les classes) : Il représente une classe par un nombre constant de ponts de représentaton appelés les représentants. Pour obtenr ces ponts, tout d abord, on chost les ponts qu s éparpllent ben autour d une classe. Ensute on les fat rétrécr vers le centrod de la classe par une fracton quelconque. Ces ponts éparpllés après le rétrécssement seront utlsés comme les représentants de la classe. Les représentants vsent à capturer la forme et l ampleur de la classe. Le rétrécssement des ponts éparpllés vers le mean de la classe par un facteur a pour but de débarrasser les surfaces anormales et dmnuer les effets des ponts aberrants. L dée est basée sur le fat que les aberrants se trouvent normalement lon du centre de la classe. En conséquence, le rétrécssement pourrat fat déplacer les aberrants plus vers le centre tands que les représentants sont mons déplacés. Le grand déplacement des aberrants peut rédure de mauvases fusons des classes. La dstance entre deux classes utlsée dans le processus d agglomératon n est n le len smple n len moyen. Seuls les ponts de représentants sont utlsés pour la calculer. La dstance est défne comme le mnmum de dstances entre deux représentants de deux classes. CURE est conçu pour trater de gros jeux de données. Pour ce fare, on dvse l algorthme en 2 passes. Dans la premère, l algorthme utlse des échantllonnages aléatores qu sont retrés du jeu de données et classfé pour former des parttons partelles. Après, ces parttons partelles sont classfées pendant la deuxème passe pour former les classes désrées. Pour chaque classe, on stocke son mean, un ensemble de représentants pour le calcul de la dstance entre elle et une autre classe et la classe la plus proche d elle. L algorthme commence en consdérant chaque pont d entrée comme une classe et successvement fusonne chaque pare de classes les plus proches. Intalement, les représentants d une classe sont les ponts dans la classe. Chaque classe est fusonnée avec sa classe la plus proche en fasant smplement une unon des ponts de deux classes. Dans la nouvelle classe, les représentants sont calculés en tout d abord chosssant par tératons les ponts ben éparpllés et après en les rétrécssant vers le centre de la classe. Dans la premère tératon, le pont le plus lon du centre dans la classe est chos comme le premer pont éparpllé. Dans chaque tératon suvante, le pont le plus lon des ponts éparpllés précédents est chos. Après avor chos les ponts ben éparpllés, les représentants sont obtenus par rétrécssement de ces ponts par une fracton vers le centre de la classe. L algorthme utlse un arbre kd (kd-tree) où sont stockés les ponts représentants des classes qu sont prs pour calculer la classe la plus proche d une classe. La complexté de temps du pre cas est O (n 2 log n). S la dmenson des données est pette, la complexté de temps peut être rédute à O (n 2 ) [20]. La complexté d espace est O (n). 13

15 2) Méthodes de parttonnement (parttonal clusterng): Ces méthodes produsent une seule partton des données au leu d une structure des classes. Elles créent les classes en optmsant une foncton objectve qu est défne d une façon locale (sur un sous-ensemble des données) ou globale (sur toutes les données) [3]. Le coût de constructon des classes est cher, donc des heurstques sont utlsées pour l optmsaton d tératons sous la forme de mécansme de réallocaton qu réaffectent les ponts entre les classes. Ces méthodes raffnent graduellement les classes et donc peuvent donner les classes de melleure qualté. En fat, les algorthmes ont beson d exécuter pluseurs fos avec dfférents états ntaux afn d obtenr un melleur résultat. Une approche est d utlser un pont de vue conceptuel pour dentfer les classes en supposant que les données vennent d un mélange de certanes populatons Une autre approche travalle avec une foncton objectve défne sur chaque classe. Dépendant de la représentaton d une classe, on classfe ces types d algorthmes en deux : k-medods et k-means.. K-medods Dans ces algorthmes, une classe est représentée par un de ses ponts, qu s appelle medod. Une telle représentaton nous donne deux avantages : elle s adapte à n mporte quel type d attrbuts, et le médod est chos comme une fracton des ponts prédomnants dans une classe, donc l n est pas sensble aux aberrants. S les médods sont choss, les classes sont défnes comme les sous-ensembles de ponts proches du médod correspondant. Et la foncton objectve sera défne comme la dstance (ou d autres mesures de dssmlarté) moyenne entre un pont et le medod. [11] Les algorthmes les plus connus sont PAM, CLARA et CLARANS [1] [2] [10] - PAM (Parttonng around Medods) a été développé par Kaufman and Rousseeuw [12]. PAM recherche les medods des classes. Intalement, PAM chost k ponts représentatfs à partr des données de N ponts (k est le nombre de classes, N est le nombre total de ponts). Ensute, N-k ponts restants sont classfés en se basant sur leur dstance aux medods : chaque pont restant appartent à une classe s la dstance entre ce pont et le medod de cette classe est la plus pette. Pus, PAM échange 2 ponts : l un de l ensemble de medods, et l autre de l ensemble de nonmedods. Le crtère de la sélecton est que la somme de dstance de tous les ponts à leur medod correspondant dot dmnuer et avor la décrossance la plus forte. PAM calcule le changement de la dstance après un échange pour toutes les pares (medod et non-medod). Il chosra le par dont la valeur de changement est la plus pette (cette valeur est toujours négatve). S l n y a plus de pares dont le changement est négatf, cela sgnfe que la classe courante est bonne, donc que PAM s arrête et renvoe k medods. Les classes seront formées en calculant les dstances entre les ponts et ces medods. La complexté d une seule tératon (un échange) de PAM est O (k (N-k) 2 ). Donc le coût total de calcul est vrament cher car l a de plus beson de nombreuses tératons avant de termner. 14

16 - CLARA (Clusterng LARge Applcatons) est auss développé par Kaufman et Rousseeuw [12]. L améloraton de CLARAN par rapport de PAM est qu l ne se base pas sur l ensemble enter de ponts, l travalle sur les échantllons des ponts. On prend une pette parte de données pour les représenter et k medods sont détermnés en applquant PAM sur cet échantllon. S cet échantllon est chos d une manère aléatore, alors l représente ben les données entères, donc les medods sont smlares à ceux qu sont créés à partr des données tout entères. L algorthme est exécuté sur pluseurs échantllons pour obtenr le melleur résultat. En conséquence, CLARA peut trater un plus gros jeu de données que PAM. La complexté d une tératon est O (ks 2 +k (n-k)) avec S est la talle d un échantllon. Les auteurs ont ndqué, sute à leurs expérmentatons, que la talle d un échantllon de 40+2k donne un bon résultat. Un nconvénent de cet algorthme est qu un pont qu serat le melleur medod n apparaît dans aucun échantllon, alors CLARA ne trouvera jamas le melleur résultat. - CLARANS (Clusterng Large Applcatons based on RANdomzed Search) est une combnason de PAM et CLARA. Il a été développé par Raymon Ng et Jawe Han [12]. Dans cet algorthme, les auteurs ont utlsé une abstracton de graphe pour représenter le problème de recherche des k melleurs medods. On construt un graphe dont chaque nœud est un ensemble de k ponts (ntutvement, ce sont k medods). Deux nœuds sont dts vosnages s ls ne dffèrent que par un seul pont. En conséquence, le problème de détermner un ensemble de k melleurs medods devent le problème de recherche dans ce graphe du melleur nœud. Le crtère pour estmer qu un nœud est melleur qu un autre est comme dans le PAM : on mnmse le changement dans la dstance s un medod est remplacé par un pont non medod en parcourant d un nœud à un nœud vosn. Ce changement est appelé le coût dfférentel de remplacement d un medod par un pont non medod. PAM le fat en parcourant tous les nœuds vosns d un nœud donc c est trop cher. CLARAN le fat en parcourant un sous graphe. En conséquence, cela ne donne pas toujours un bon résultat car l travalle sur une régon localsée. CLARANS est une combnason des deux algorthmes. C est à dre à partr d un nœud dans le graphe, l n examne pas tous les vosnages. Il chost un nombre (donné comme un paramètre de l algorthme) de vosns aléatores (ce n est pas tous les vosns) pour rechercher un vosn dont le coût de remplacement de ce nœud par son vosn est mnmsé. S ce coût est négatf,.e. le remplacement ne peut optmser plus le résultat, le nœud trouvé est le melleur résultat, et le processus peut s arrêter. Théorquement, la complexté de CLARA est O (k 3 +nk) pour chaque tératon, tands que celle de CLARANS est lnéare par rapport au nombre de ponts, donc le deuxème est théorquement melleur que le premer. L expérmentaton des auteurs prouve également que CLARANS est melleur que CLARA dans tous les cas [12]. K-means Cet algorthme est le plus connu dans la communauté de classfcaton des données. Dans cet algorthme, chaque classe est représentée par la moyenne (mean) ou la moyenne pondérée qu est nommée le centrod. K-means est un algorthme tératf. Il commence avec un ensemble de k ponts de référence (centrod) chos par l utlsateur. Au début, les ponts de données sont parttonnés dans k classes : Un pont appartent à une classe s le pont de référence de cette classe est le plus proche 15

17 de lu. La mse à jour des ponts de référence et l affectaton des ponts de données aux classes sont réalsées pendant les tératons successves. Il y a pluseurs versons de k-means. On peut les dstnguer selon deux crtères : la dfférence dans la mse à jour des classes et le crtère pour fare cette mse à jour. Pour le premer crtère, les algorthmes de ce type dffèrent dans le détal de la génératon et de l ajustement des classes. Il y a 3 algorthmes de base de ce type : Standard K-means, l algorthme de Lloyd, et contnuous K-means qu a été proposé par McQueen en 1967 [15]. - L algorthme de Lloyd : L ntalsaton de l algorthme est smlare à la descrpton c-dessus. Les ajustements sont réalsés en calculant le centrod pour chaque classe et en utlsant ces centrods comme les ponts de référence dans l tératon suvante pour tous les ponts de données. La mse à jour des centrods n est fate qu après une tératon. - Standard k-means: Cet algorthme est melleur que celu de Lloyd en terme de l utlsaton plus effcace de l nformaton à chaque pas d tératon. C est à dre la mse à jour des centrods est fate pendant et après une tératon. S un pont appartent à une classe et que pour lu, le centrod de cette classe est le pont de référence le plus proche, alors l n y aura aucun ajustement. Mas s après avor affecté un pont x à une classe A, on trouve qu l y a une autre classe B dont le centrod est le pont de référence plus proche de x que celu de A, alors l faut réaffecter x à la classe B et recalculer les centrods de toutes les deux classes, et les ponts de référence de ces deux classes se déplacent aux nouveaux centrods. - Contnuous k-means: Cet algorthme dffère au standard k-means par le chox des ponts de référence ntaux et la sélecton des ponts pour la mse à jour des classes. Dans la premère dfférence, pas comme dans Lloyd ou standard k-means où les ponts de référence ntaux sont arbtrarement choss, dans cet algorthme, ces ponts sont choss comme un échantllon aléatore de la populaton entère des ponts. S l échantllon est assez gros, alors la dstrbuton des ponts de référence ntaux pourrat refléter celle des ponts de la populaton. La deuxème dfférence, contrarement au standard k-means où tous les ponts sont séquentellement examnés, cet algorthme n examne qu un échantllon aléatore des ponts. S le jeu de données est gros et l échantllon est représentatf du jeu de données, alors l algorthme peut converger plus vte qu un algorthme qu dot examner séquentellement tous les ponts. Pour le deuxème, l y a deux versons de l optmsaton tératve de k- means [1]: - L algorthme de Forgy, est smlare à l algorthme EM et ses tératons dsposent de deux pas : réaffecter tous les ponts à leur centrod le plus proche et recalculer les centrods des nouveaux groupes créés. Les tératons contnuent jusqu à ce qu on attegne un crtère de termnason (par exemple, l n y a plus de réaffecton). Les avantages sont la capacté de travaller sur toutes les normes L p, la faclté de parallélser, l nsensblté à l ordre des données. 16

18 - L algorthme d optmsaton tératve réaffecte les ponts en se basant sur une analyse plus détallée des effets sur la foncton objectve quand un pont est déplacé de sa classe à une classe potentelle. S l effet est postf, ce pont sera réaffecté et deux centrods seront recalculés. L expérmentaton prouve que la verson classque est souvent melleure que celle de Forgy [4]. K-means est populare et beaucoup utlsé grâce à sa smplcté. En fat, l a pas mal des nconvénents : Le résultat est vrament dépendant des centrods ntaux, l optmum local calculé est trop dfférent de la valeur globale, l n est pas facle de détermner un bon nombre de classes utlsé pour l algorthme, le processus est sensble aux aberrants, l algorthme n est pas extensble et l algorthme ne travalle que sur les données numérques. Pour reméder à ces nconvénents, certanes améloratons et extensons sont proposées comme ISODATA qu permet de détermner automatquement un bon nombre de classes utlsé pour donner un bon résultat, k-modes, k-prototypes pour manpuler sur les données catégore [5] ou l accélératon de k-means par l néquaton trangulare, sngle pass k-means pour travaller sur un gros jeu de données [6] - ISODATA : Comme on a vu, le nombre de classes K est toujours détermné à pror pour k-means. ISODATA a été proposé pour reméder à cet nconvénent. Il ntercale des phases de fuson et d éclatement de groupes dans k-means [14] : fusonner 2 classes s la dstance entre elles est fable (nféreure à un seul) et éclater une classe en 2 classes s son nerte est trop grande (supéreure à un seul). Intalement, on donne un nombre k assez grand comme l entrée du nombre de classes de k-means. Après avor applqué k-means sur ces données, on fat la fuson et l éclatement pour trouver un bon nombre de classes. La dffculté est que l on a beson détermner deux seuls pour la phase supplémentare. - K-modes, k-prototypes sont développés par Z. Huang [5]. On sat que K- means ne travalle que sur les données numérques sur lesquelles on utlse la dstance eucldenne pour calculer la dssmlarté entre les ponts ou les classes. Pour que cet algorthme pusse marcher avec les données catégorques, Z. Huang a proposé deux extensons de k-means en défnssant une mesure de dssmlarté pour comparer les objets de données. En conséquence, on utlse les modes au leu des means et une méthode basée sur la fréquence pour mettre à jour les modes. Etant donnés 2 objets de type catégore, la dssmlarté entre eux est défne comme le nombre d attrbuts dfférents correspondants entre ces deux objets. n 0 s x = y d( x, y) = δ ( x, y ) Tel que δ ( x, y ) = = 1 1 s x y Le mode d une classe est l objet qu apparaît le plus dans la classe. L algorthme k-modes a pour but de trater seulement les données catégore, k- prototypes vse à manpuler les données mélangées (numérque et catégore) en addtonnant la dstance eucldenne pour les attrbuts numérques avec la dstance décrte c-dessus pour les attrbuts catégorques avec un pods (la somme pondérée) : 17

19 d = d n + λ. d c, tels que d n est la dstance numérque et d c est la dstance catégorque, λ est un pods qu équlbre la domnaton des attrbuts catégore sur les attrbuts numérques. Cette dstance est utlsée dans l algorthme k-means. - Sngle pass k-means (Scalable k-means): Cet algorthme a été développé par Bradley, Fayyad et Rena [6]. Il vse à augmenter l extensblté de k-means pour de gros jeux de données. L dée de cet algorthme est basée sur la noton que les solutons effectves de classfcaton peuvent être obtenues en sélectonnant et stockant des partes mportantes de données et résumant les autres. Il est capable d dentfer les régons de données qu sont compressbles, les régons qu dovent être gardées dans la mémore et les régons qu peuvent être supprmées. Pour représenter un groupe de données (une sous-classe) sous une forme compressée, l algorthme utlse un trplet de statstque (SUM, SQUAREDSUM, N) tels que SUM est la somme lnéare de tous les ponts dans le groupe, SQUAREDSUM est la somme des écarts carrés des ponts au centrod, et N est le nombre de ponts dans ce groupe. Il a beson de 3 types de jeu de données stockés dans la mémore : DS- jeu de données supprmées, CS- jeu de données compressées et RS- jeu de données gardées. Notons que DS et CS stocke les statstques de données. L algorthme comprend 2 étapes de compresson : la compresson prmare a pour but de détermner les données qu sont supprmées (donc stockées dans DS). La compresson secondare vse à compresser les données qu ne sont pas supprmées dans la premère phase (le résultat est stocké dans CS). Les données qu ne sont pas tratées dans ces 2 étapes de compresson sont stockées dans RS. Les ponts qu sont supprmés dans la premère étape sont ceux qu ne se déplacent quasment jamas à une autre classe. Cette tâche est effectuée en utlsant le seullage d un rayon de Mahalanobs autour du centre d une classe. Les ponts se trouvent dans ce rayon sont compressés. Chaque classe a un jeu de données supprmées représenté par le trplet cdessus pour représenter tous les ponts appartenant à cette classe. La premère étape trouve les régons denses (les sous-classes) qu ne sont pas compressées par la premère étape en applquant l algorthme k-means avec un nombre de classes k > k. Après avor trouvé k sous-classes, on applque un crtère de compacté (dense) sur ces k classes comme un fltre: une sous-classe dont la covarance est nféreure à un seul est passée ce fltre. Les sous-classes fltrées sont fusonnées avec celles stockées dans CS et les autres ponts par une classfcaton hérarchque d agglomératon. - Accélératon de k-means : En utlsant l négalté trangulare, Elkan a proposé une améloraton qu permet de dmnuer le coût de calcul des dstances dans k-means [13]. L dée est basée sur le fat que la plupart des calculs de dstance sont redondants. S un pont se trouve très lon d un centre, alors ce n est pas nécessare de calculer la dstance exacte entre lu et ce centre afn de savor s ce pont peut être affecté à ce centre. En plus, s un pont est vrament plus proche d un centre que tous les autres centres, on n a pas beson de calculer les dstances exactes pour décder s le pont appartent à ce centre. 3) Méthodes basées sur la densté C est des méthodes hérarchques dans lesquelles les classes sont consdérées comme des régons en haute densté qu sont séparées par des régons en fable 18

20 densté. La densté est représentée par le nombre d objets de données dans le vosnage. C est pourquo ces méthodes sont capables de chercher des classes de forme arbtrare. Elles ne travallent que dans un espace métrque, donc elles sont utlsées dans la classfcaton de données spatales. Pour rédure le coût de calcul lors de la classfcaton, les données sont ndexées, par exemple R*-tree (cf. secton Méthodes de recherche de vosnage), donc elles ne sont effcaces qu avec les données en basse dmenson. Il y a deux approches dans ce type de classfcaton, l une est basée sur la connectvté de densté, l autre est basée sur la foncton de densté. Les algorthmes les plus connus de ce type sont DBSCAN (connectvté de densté) et DENCLUE (foncton de densté).. DBSCAN DBSCAN (Densty Based Spatal Clusterng of Applcatons wth Nose) est un algorthme très populare dans ce type d algorthme de classfcaton [2] [18]. Pour chaque objet, l cherche le vosnage qu content un nombre mnmum d objets. Une classe est formée par tous les objets qu sont transtvement connectés par leurs vosnages. Un vosnage de rayon Eps contenant au mons MnPts objets d un objet est appelé le vosnage Eps-MnPts de cet objet. On utlse la noton connecté-densté pour former des classes : - Un objet est dt drectement accessble-densté Eps-MnPts d un autre objet s l se trouve dans le vosnage Eps-MnPts de cet objet. - Un objet est dt accessble-densté Eps-MnPts d un autre objet s l y a une chaîne d objets entre eux dont tous les 2 objets successfs sont drectement accessble densté Eps-MnPts. - Un objet est dt connecté-densté Eps-MnPts d un autre objet s l y a un objet duquel tous les deux objets sont accessbles-densté. Une classe avec Eps et MnPts prédéfns est défne comme un ensemble non vde d objets qu satsfat 2 condtons, l une est la condton de connectvté,.e. tous les objets de la classe dovent être connectés-densté, l autre est la condton de maxmum,.e. tous les objets qu se trouvent dans le vosnage Eps-MnPts d un objet de la classe dovent appartenr à cette classe. classe. Le brut est défn comme un ensemble d objets qu n appartennent à aucune Il y a deux objets dfférents qu sont prs en compte dans la classfcaton : l objet de noyau et non noyau. Un objet de noyau est celu qu a un vosnage Eps- MnPts. Un objet non noyau est celu qu n a pas un tel vosnage. Un objet non noyau peut être un objet de frontère ou un brut. L algorthme commence en prenant en compte d un objet arbtrare et cherche tous les objets accessbles densté. S l est objet de noyau, alors cette phase forme une classe. S l est un objet de frontère et qu l n y a aucun objet qu est accessble densté depus lu, alors c est un brut, l algorthme passe à un autre objet. 19

21 Normalement, la complexté de la recherche du vosnage est O(N 2 ). Pour accélérer cette recherche, on peut utlser certanes méthodes d accès spatal comme l arbre R* ou l arbre M pour obtenr une complexté de O (N logn). On les verra dans la secton de Méthodes de recherche d un vosnage. DBSCAN peut chercher les classes de forme arbtrare. Il est nsensble à l ordre d entrée des objets. Il est ncrémental car un nouvel objet qu arrve peut affecter certans vosnages. A côté, l algorthme a des nconvénents : l est dffcle à précser le rayon Eps et le seul de la cardnalté d un vosnage et la performance peut être dmnuée pour les données de haute dmenson.. DENCLUE DENCLUE (DENsty CLUstErng) est une approche de classfcaton basée sur la densté mas travalle d une manère plus formelle que DBSCAN en modélsant la densté globale d'un ensemble de ponts comme somme des fonctons d nfluence de densté assocées à chaque pont. La foncton de densté globale aura des maxma locaux de densté, ces maxma peuvent être choss pour défnr des classes d'une manère smple. Typquement la foncton d'nfluence est symétrque (.e. elle est la même dans toutes les drectons) et sa valeur (contrbuton) dmnue s la dstance du pont au centre augmente. Une foncton d nfluence très connue est la foncton gaussenne 2 ds tan ce( x, y) 2 2 σ K( x) = e Fgure 2 : La foncton d nfluence gaussenne, un jeu de ponts et la foncton de densté globale DENCLUE a deux étapes, une étape de prétratement et une étape de classfcaton. Dans l'étape de prétratement, une grlle pour les données est créée en dvsant l hyper rectangle englobant mnmal en hyper rectangles d dmensonnels avec la longueur d arête égale à 2 σ. Les cellules de grlle qu contennent des ponts sont alors détermnées (seulement les cellules occupées de grlle dovent être construtes). Les cellules de grlle sont numérotées selon une orgne partculère (sur une arête de l hyper rectangle englobant) et les clefs sont stockées dans un arbre de recherche pour fournr un accès effcace au tratement ultéreur. Pour chaque cellule de grlle, le nombre de ponts, la somme des ponts dans la cellule, et des connexons aux cellules vosnes sont également stockés. 20

22 Pour l'étape de classfcaton, DENCLUE ne consdère que les cellules fortement denses et les cellules qu leur sont relées. Pour chaque pont x, la foncton locale de densté est calculée en consdérant seulement les ponts qu se trouvent aux cellules de grlle qu sont proches de x. L algorthme jette des classes assocées à un attracteur de densté dont la densté est mons queξ. Enfn, DENCLUE fusonne les attracteurs de densté qu peuvent être jonts par un chemn des ponts, qu ont une densté plus grande queξ. DENCLUE peut être paramétré de sorte qu'l se comporte comme DBSCAN, mas l est beaucoup plus effcace que DBSCAN. DENCLUE peut également se comporter comme K-means par le chox d une valeurσ convenable et en omettant l'étape qu fusonne les classes de centre défn dans les classes de forme arbtrare. En outre, en répétant la classfcaton pour dfférentes valeurs deσ, on peut obtenr une classfcaton hérarchque. La complexté de l algorthme est O (n log n). 4) Méthodes basées sur la grlle L dée de ces méthodes est qu on dvse l espace de données en cellules. Donc ce type d algorthme est conçu pour des données spatales. Une cellule peut être un cube, une régon, un hyper rectangle. En fat, elle est un produt cartésen de sous ntervalles d attrbuts de données. Avec une telle représentaton des données, au leu de fare la classfcaton dans l espace de données, on la fat dans l espace spatal en utlsant des nformatons statstques des ponts dans la cellule. Les méthodes de ce type sont hérarchques ou de parttonnement. Les algorthmes les plus connus sont STING, CLIQUE, WaveCluster.. STING STING (STatstcal Informaton Grd) découpe l espace spatal de données en un nombre fn de cellules sous une structure hérarchque : Chaque cellule est récursvement découpée en 4 sous-cellules. On commence en consdérant l espace enter comme une cellule ancêtre de la hérarche et on s arrête s l on attent un crtère de termnason : le nombre des ponts dans une cellule est nféreur à un seul. Chaque cellule possède certanes nformatons nécessares pour l affectaton d un pont : c est la moyenne de toutes les valeurs dans la cellule, la varance de toutes les valeurs d attrbut dans la cellule, la valeur d attrbut mnmum, maxmum dans la cellule et le type de dstrbuton de la cellule (normale, unforme, exponentelle ou smplement une énumératon). Quand on remonte dans la hérarche, ces nformatons statstques sont calculées à l ade de celles du nveau nféreur. On trouve que STING est vrament extensble car l a beson d une seule passe sur les données et un nouvel objet qu arrve peut être faclement nséré dans la grlle en vstant les cellules approprées à chaque nveau de la hérarche. La classfcaton est effectuée dans ces cellules de feulle au leu de toutes les données, donc le coût de calcul est vrament rédut (O (K) au leu de O (N) tels que K est le nombre de cellules et N est le nombre de ponts de données). 21

23 . WaveCluster C est un algorthme qu est conçu pour travaller sur des données spatales. Dans l algorthme, on consdère les données spatales comme les sgnaux multdmensonnels et on applque une technque de tratement de sgnal qu s appelle la transformaton wavelet pour transformer l espace de données vers un domane de fréquence [16]. L dée est basée sur le fat que les partes de haute fréquence du sgnal correspondent aux régons de l espace spatal de données où l y a un changement brusque dans la dstrbuton des objets. Ce sont les frontères des classes. Au contrare, les partes de basse fréquence du sgnal correspondent aux régons de l espace de données où les objets sont concentrés. Autrement dt, ce sont les classes. Tout d abord, l algorthme quantfe l espace de données (dvse l espace en cellules) et affecte les objets aux cellules. Ensute, l applque la transformaton wavelet pour l espace quantfé afn d obtenr un espace transformé. Pus l cherche les composantes connectées (les classes) dans les sous bandes (l espace transformé est un espace de fréquence). Deux composantes sont dtes connectées s le nombre d objets de chacune dans l espace transformé est supéreur à un seul et s elles sont epslons vosns (la dstance entre eux est nféreure à epslon). Enfn, l étquette les cellules et réaffecte les objets à leurs classes correspondantes. WaveCluster est capable de trater effcacement les gros jeux de données spatales donc en basse dmenson. Il peut découvrr des classes de forme arbtrare et ben trater le brut. En plus, grâce au tratement du sgnal applqué, WaveCluster nous donne la mult résoluton,.e. l peut donner des classes de dfférent nveau du détal. La complexté de la phase de quantfcaton est O (N) et celle de la phase de transformaton wavelet est au plus de O (4/3K) tel que K est le nombre de cellules [16].. CLIQUE Au leu de construre les classes dans l espace orgnal comme les autres algorthmes, CLIQUE (CLusterng In QUEst) le fat dans des sous-espaces en dmenson la plus haute s possble [2] [17]. L dée est basée sur le fat que s une collecton de ponts S est une classe dans un espace de k dmensons, alors S est ans une parte d une classe dans n mporte quelle projecton en k-1 dmensons de cet espace. L algorthme travalle en nveaux. Tout d abord, l détermne toutes les untés denses en 1 dmenson en balayant une fos les données. Après avor détermné les untés denses en (k-1) dmensons, l détermne les untés denses canddates en k dmensons en utlsant une procédure qu génère les untés canddates. La procédure de génératon utlse l ensemble de toutes les untés denses en k- 1 dmensons D k-1. Elle jont D k-1 avec elle-même sous une condton où les untés qu sont jontes partagent les premères k-2 dmensons pour obtenr un ensemble de canddates C k. On supprmera les untés denses de C k qu ont une projecton en k dmensons qu ne sont pas ncluse dans C k-1. L algorthme se termne lorsqu l n y a plus de canddatures générées. CLIQUE est une soluton pour la classfcaton de données en haute dmenson. Il est nsensble à l ordre des données. Cependant, sa complexté est 22

classification non supervisée : pas de classes prédéfinies Applications typiques

classification non supervisée : pas de classes prédéfinies Applications typiques Qu est ce que le clusterng? analyse de clusterng regroupement des obets en clusters un cluster : une collecton d obets smlares au sen d un même cluster dssmlares au obets appartenant à d autres clusters

Plus en détail

Proposition d'une solution au problème d initialisation cas du K-means

Proposition d'une solution au problème d initialisation cas du K-means Proposton d'une soluton au problème d ntalsaton cas du K-means Z.Guelll et L.Zaou, Unversté des scences et de la technologe d Oran MB, Unversté Mohamed Boudaf USTO -BP 505 El Mnaouer -ORAN - Algére g.zouaou@gmal.com,

Plus en détail

Analyse Numérique - Projet A rendre au plus tard le jour de l examen final, en Janvier 2010.

Analyse Numérique - Projet A rendre au plus tard le jour de l examen final, en Janvier 2010. Master 1ère année de Mathématques Analyse Numérque - Projet A rendre au plus tard le jour de l examen fnal, en Janver 2010. CMI, Unversté de Provence Année 2009-2010 Ce qu vous est demandé : Rédger les

Plus en détail

Chapitre 5: La programmation dynamique

Chapitre 5: La programmation dynamique Chaptre 5: La programmaton dynamque. Introducton La programmaton dynamque est un paradgme de concepton qu l est possble de vor comme une améloraton ou une adaptaton de la méthode dvser et régner. Ce concept

Plus en détail

Prévision des ventes des articles textiles confectionnés. B. Zitouni*, S. Msahli* * Unité de Recherches Textiles, Ksar-Hellal, Tunisie.

Prévision des ventes des articles textiles confectionnés. B. Zitouni*, S. Msahli* * Unité de Recherches Textiles, Ksar-Hellal, Tunisie. Prévson des ventes des artcles textles confectonnés B Ztoun*, S Msahl* * Unté de Recherches Textles, Ksar-Hellal, Tunse Résumé Dans cette étude, on se propose de détermner s le recours à des réseaux de

Plus en détail

N - ANNEAUX EUCLIDIENS

N - ANNEAUX EUCLIDIENS N - ANNEAUX EUCLIDIENS Dans ce qu sut A est un anneau untare, mun de deux opératons notées addtvement et multplcatvement. Le neutre de l addton est noté 0, celu de la multplcaton est noté e. On pose A

Plus en détail

Feuilles de style CSS

Feuilles de style CSS Feulles de style CSS 71 Feulles de style CSS Les standards du web Les langages du web : le HTML et les CSS Depus la verson 4 de l'html (décembre 1999), le W3C propose les feulles de style en cascade, les

Plus en détail

V FORMATION DES IMAGES DANS L EXEMPLE DU MIROIR PLAN

V FORMATION DES IMAGES DANS L EXEMPLE DU MIROIR PLAN Chaptre V page V-1 V FORMTION DES IMGES DNS L EXEMPLE DU MIROIR PLN Le but de ce chaptre est d ntrodure la noton d mage { travers l exemple du mror plan. Vous vous êtes sûrement déjà regardé(e) dans un

Plus en détail

Cours de Calcul numérique MATH 031

Cours de Calcul numérique MATH 031 Cours de Calcul numérque MATH 03 G. Bontemp, A. da Slva Soares, M. De Wulf Département d'informatque Boulevard du Tromphe - CP22 http://www.ulb.ac.be/d Valeurs propres en pratque. Localsaton. Méthode de

Plus en détail

Miroirs sphériques Dioptres sphériques. 1 Miroirs sphériques. 1.1 Introduction : focaliser la lumière. 1.2 Miroir concaves faisceau parallèle

Miroirs sphériques Dioptres sphériques. 1 Miroirs sphériques. 1.1 Introduction : focaliser la lumière. 1.2 Miroir concaves faisceau parallèle Mrors spérques Doptres spérques Nous allons mantenant aborder des systèmes optques un peu plus complexes, couramment utlsés pour produre des mages. Nous allons commencer par étuder un mror spérque de façon

Plus en détail

Ajustement affine par les moindres carrés

Ajustement affine par les moindres carrés 1. Nveau Termnales STG et ES Ajustement affne par les mondres carrés 2. Stuaton-problème proposée Introducton à la méthode des mondres carrés. 3. Support utlsé Tableur et calculatrce. 4. Contenu mathématque

Plus en détail

I. Fonctionnalités du tableur

I. Fonctionnalités du tableur Olver Coma Macro MRP pour Excel Decembre 1999 I. Fonctonnaltés du tableur I.1. Feulle «Nomenclature «Le tableur propose pluseurs optons à l ouverture du fcher. Cnq boutons apparassent à drote de la feulle

Plus en détail

Remboursement d un emprunt par annuités constantes

Remboursement d un emprunt par annuités constantes Sére STG Journées de formaton Janver 2006 Remboursement d un emprunt par annutés constantes Le prncpe Utlsaton du tableur Un emprunteur s adresse à un prêteur pour obtenr une somme d argent (la dette)

Plus en détail

LES POMPES. Devant la grande diversité de situations possibles, on trouve un grand nombre de machines que l on peut classer en deux grands groupes :

LES POMPES. Devant la grande diversité de situations possibles, on trouve un grand nombre de machines que l on peut classer en deux grands groupes : Ste: http://gene.ndustrel.aa.free.fr LES POMPES Les pompes sont des apparels permettant un transfert d énerge entre le flude et un dspostf mécanque convenable. Suvant les condtons d utlsaton, ces machnes

Plus en détail

Solution : 1. Soit y = α + βt, l équation de la droite considérée. Le problème de régression linéaire s écrit. i=1 2(α + βt i b i )t i

Solution : 1. Soit y = α + βt, l équation de la droite considérée. Le problème de régression linéaire s écrit. i=1 2(α + βt i b i )t i Exercces avec corrgé succnct du chaptre 3 (Remarque : les références ne sont pas gérées dans ce document, par contre les quelques?? qu apparassent dans ce texte sont ben défns dans la verson écran complète

Plus en détail

Banque d exercices pour le cours de "mise à niveau" de statistique de M1 AgroParisTech

Banque d exercices pour le cours de mise à niveau de statistique de M1 AgroParisTech Banque d exercces pour le cours de "mse à nveau" de statstque de M1 AgroParsTech Instructons pour les exercces 1. Lorsque ren n est précsé, on suppose que la dstrbuton étudée est gaussenne. Pour les exercces

Plus en détail

L'INDUCTION ON5WF (MNS)

L'INDUCTION ON5WF (MNS) 'IDUCTIO ème parte / O5WF (MS) Dans la ère parte de cet artcle, nous avons vu qu'un courant électrque donnat leu à un champ magnétque (expérence d'oersted). ous avons ensute vu comment Faraday, après avor

Plus en détail

La décomposition en valeurs singulières: un outil fort utile

La décomposition en valeurs singulières: un outil fort utile La décomposton en valeurs sngulères: un outl fort utle Références utles: 1- Sonka et al.: sectons 3.2.9 et 3.2.1 2- Notes manuscrtes du cours 3- Press et al: Numercal recpes * Dernère révson: Patrck Hébert

Plus en détail

Partie I: Différences finies avec centrage partiel

Partie I: Différences finies avec centrage partiel U. PARIS VI et ÉCOLE POLYTECHNIQUE 7 anver 04 Spécalté Probablté et Fnance du Master de Scences et Technologe EXAMEN DU COURS ANALYSE NUMÉRIQUE DES ÉQUATIONS AUX DÉRIVÉES PARTIELLES EN FINANCE verson 03/0/04

Plus en détail

Hansard OnLine. Guide relatif au Unit Fund Centre

Hansard OnLine. Guide relatif au Unit Fund Centre Hansard OnLne Gude relatf au Unt Fund Centre Table des matères Page Présentaton du Unt Fund Centre (UFC) 3 Utlsaton de crtères de recherche parm les fonds 4-5 Explotaton des résultats des recherches par

Plus en détail

Electronique TD1 Corrigé

Electronique TD1 Corrigé nersté du Mane - Faculté des Scences! etour D électronque lectronque D1 Corrgé Pour un sgnal (t) quelconque : 1 $ (t) # MOY! (t) dt 1 FF! (t) dt (t) MX MOY mpltude crête à - crête mpltude Mn Pérode t emarque

Plus en détail

Introduction. 1. le modèle de survie de COX utilisé par O. Brandmeyer dans son stage de Master 2 IMOI au Centre de Médecine Préventive de Nancy ;

Introduction. 1. le modèle de survie de COX utilisé par O. Brandmeyer dans son stage de Master 2 IMOI au Centre de Médecine Préventive de Nancy ; Introducton Le groupe de Bo-Statstque a eu une actvté soutenue en 2006-2007. Cette dernère s est concrétsée par des réunons de petts groupes de traval autour de thèmes de recherche partculers et par la

Plus en détail

MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)

MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Unversté d Orléans Econométre des Varables Qualtatves Chaptre 3 Modèles à Varable Dépendante Lmtée Modèles Tobt Smples et Tobt Généralsés Chrstophe Hurln

Plus en détail

Université Pierre & Marie Curie (Paris 6) Licence de Mathématiques L3 UE LM364 Intégration 1 Année 2011 12. TD4. Tribus.

Université Pierre & Marie Curie (Paris 6) Licence de Mathématiques L3 UE LM364 Intégration 1 Année 2011 12. TD4. Tribus. Unversté Perre & Mare Cure (Pars 6) Lcence de Mathématques L3 UE LM364 Intégraton 1 Année 2011 12 TD4. Trbus. Échauffements Exercce 1. Sot X un ensemble. Donner des condtons sur X pour que les classes

Plus en détail

Détection et suivi de visages par Support Vector Machine robustes aux changements d échelle

Détection et suivi de visages par Support Vector Machine robustes aux changements d échelle Détecton et suv de vsages par Support Vector Machne robustes au changements d échelle Lonel CARMINATI Drectrce de Thèse : Jenny Benos-Pneau Projet Analyse et Indeaton Vdéo lcarmna@labr.fr http://www.labr.fr/recherche/imageson/aiv/

Plus en détail

Editions ENI. Excel 2013. Collection Référence Bureautique. Extrait

Editions ENI. Excel 2013. Collection Référence Bureautique. Extrait Edtons ENI Collecton Référence Bureautque Extrat Tableaux de données Tableaux de données Créer un tableau de données Un tableau de données, auss appelé lste de données (dans les ancennes versons d Excel),

Plus en détail

Exercices d algorithmique

Exercices d algorithmique Exercces d algorthmque Les algorthmes proposés ne sont pas classés par ordre de dffculté Nombres Ecrre un algorthme qu renvoe la somme des nombre entre 0 et n passé en paramètre Ecrre un algorthme qu renvoe

Plus en détail

Interface OneNote 2013

Interface OneNote 2013 Interface OneNote 2013 Interface OneNote 2013 Offce 2013 - Fonctons avancées Lancer OneNote 2013 À partr de l'nterface Wndows 8, utlsez une des méthodes suvantes : - Clquez sur la vgnette OneNote 2013

Plus en détail

Il fournit un complément d information au document du BSIF que voici :

Il fournit un complément d information au document du BSIF que voici : Préavs REMARQUE* Objet : ttre des garantes de fonds dstncts des socétés d assurance-ve qu utlsent les facteurs prescrts Catégore : Captal Date : Le présent préavs décrt une méthode factorelle alternatve

Plus en détail

Bien débuter avec Illustrator

Bien débuter avec Illustrator CHAPITRE 1 Ben débuter avec Illustrator Illustrator est un logcel de dessn vectorel. Cela sgnfe qu'l permet de créer des llustratons composées avec des objets décrts par des vecteurs. Une telle défnton

Plus en détail

CHAPITRE 2. La prévision des ventes

CHAPITRE 2. La prévision des ventes CHAPITRE La prévson des ventes C est en foncton des prévsons de ventes que l entreprse détermne la producton, les achats et les nvestssements nécessares. La prévson des ventes condtonne l ensemble de la

Plus en détail

Fi chiers. Créer/ouvrir/enregistrer/fermer un fichier. i i

Fi chiers. Créer/ouvrir/enregistrer/fermer un fichier. i i Fchers F chers Offce 2013 - Fonctons de base Créer/ouvrr/enregstrer/fermer un fcher Clquez sur l onglet FICHIER. Pour créer un nouveau fcher, clquez sur l opton Nouveau pus, selon l applcaton utlsée, clquez

Plus en détail

Enseignement secondaire. PHYSI Physique Programme

Enseignement secondaire. PHYSI Physique Programme Ensegnement secondare Dvson supéreure PHYSI Physque Programme 3CB_3CC_3CF_3MB_3MC_3MF Langue véhculare : franças Nombre mnmal de devors par trmestre : 1 PHYSI_3CB_3CC_3CF_3MB_3MC_3MF_PROG_10-11 Page 1

Plus en détail

Théorie des Nombres - TD1 Rappels d arithmétique élémentaire

Théorie des Nombres - TD1 Rappels d arithmétique élémentaire Unversté Perre & Mare Cure Master de mathématques 1 Année 2012-2013 Module MM020 Théore des Nombres - TD1 Rappels d arthmétque élémentare Exercce 1 : Trouver tous les enters n N tels que ϕ(n) = 6. Même

Plus en détail

Chapitre 3: Stockage et distribution

Chapitre 3: Stockage et distribution I- Défntons Chaptre 3: Stockage et dstrbuton Réseau de desserte = Ensemble des équpements (canalsatons et ouvrages annexes) achemnant de manère gravtare ou sous presson l eau potable ssue des untés de

Plus en détail

Analyses de sensibilité et Recalage de modèles thermiques spatiaux à l aide d algorithmes génétiques.

Analyses de sensibilité et Recalage de modèles thermiques spatiaux à l aide d algorithmes génétiques. Analyses de sensblté et Recalage de modèles thermques spataux à l ade d algorthmes génétques. Approches stochastques et Industre 2&3/02/2006 F.JOUFFROY/A.CAPITAINE Plan de la présentaton Contexte Modélsaton

Plus en détail

Ch 4 Séries statistiques à une dimension Définitions et représentation graphique

Ch 4 Séries statistiques à une dimension Définitions et représentation graphique Ch 4 Séres statstques à une dmenson Défntons et représentaton graphque Termnologe Ensemble étudé = populaton Eléments de cet ensemble = ndvdus ou untés Attrbut consdéré = caractère qu peut être qualtatf

Plus en détail

Application de la méthode hybride RT/RS au problème d engagement des turbines "Unit Commitment"

Application de la méthode hybride RT/RS au problème d engagement des turbines Unit Commitment Applcaton de la méthode hybrde RT/RS au problème d engagement des turbnes "nt Commtment" R. D. OHAEDI S. ARIF A. HELLAL Laboratore d Analyse et de Commande des Systèmes d Énerge et Réseaux Électrques,

Plus en détail

ÉCHANTILLON REPRÉSENTATIF (D UNE POPULATION FINIE) : DÉFINITION STATISTIQUE

ÉCHANTILLON REPRÉSENTATIF (D UNE POPULATION FINIE) : DÉFINITION STATISTIQUE ÉCHANTILLON REPRÉSENTATIF (D UNE POPULATION FINIE) : DÉFINITION STATISTIQUE ET PROPRIÉTÉS Léo Gervlle-Réache, Vncent Coualler To cte ths verson: Léo Gervlle-Réache, Vncent Coualler. ÉCHANTILLON REPRÉSENTATIF

Plus en détail

MODELISATION DES PROCESSUS LINEAIRES

MODELISATION DES PROCESSUS LINEAIRES MDELISATIN DES PRCESSUS LINEAIRES Dans un premer temps, nous ne consdérons que des processus partculers, supposés notamment statonnare. Cec permet de présenter un certan nombre d'outls dans un cadre relatvement

Plus en détail

Editions ENI. Excel 2013. Collection Référence Bureautique. Extrait

Editions ENI. Excel 2013. Collection Référence Bureautique. Extrait Edtons ENI Excel 2013 Collecton Référence Bureautque Extrat Tableaux de données Tableaux de données Excel 2013 Créer un tableau de données Un tableau de données, auss appelé lste de données (dans les ancennes

Plus en détail

Tableau croisé dynamique

Tableau croisé dynamique Tableau crosé dynamque Tableau crosé dynamque Excel 2010 Créer un tableau crosé dynamque Un tableau crosé dynamque permet de résumer, d analyser, d explorer et de présenter des données de synthèse. S la

Plus en détail

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire 2006-2007. Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 3

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire 2006-2007. Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 3 UNIVERSITE MONTESQUIEU BORDEAUX IV Lcence 3 ère année Econome - Geston Année unverstare 2006-2007 Semestre 2 Prévsons Fnancères Travaux Drgés - Séances n 3 «Les Crtères Fondamentaux des Chox d Investssement»

Plus en détail

Classification des images des dattes par SVM : contribution à l amélioration du processus de tri

Classification des images des dattes par SVM : contribution à l amélioration du processus de tri Classfcaton des mages des dattes par SVM : contrbuton à l améloraton du processus de tr Djeffal Abdelhamd 1, Regueb Salah 1, Babahenn Mohamed Chaouk 1,Taleb Ahmed Abdelmalk 2, 1 Département d Informatque,

Plus en détail

Globalisation de l Algorithme de Nelder-Mead : Application aux Composites

Globalisation de l Algorithme de Nelder-Mead : Application aux Composites INSA de Rouen LMR - Laboratore de Mécanque UMR 638 Rapport Technque : Globalsaton de l Algorthme de Nelder-Mead : Applcaton aux Compostes Marco Antôno Luersen, Doctorant au LMR Rodolphe Le Rche, Chargé

Plus en détail

Méthode de Vogel Modifiée pour la résolution du problème de transport simple

Méthode de Vogel Modifiée pour la résolution du problème de transport simple Appled Mathematcal Scences, Vol. 5, 2011, no. 48, 2373-2388 Méthode de Vogel Modfée pour la résoluton du problème de transport smple Salmata G. Dagne Département de Mathématques Unversté Chekh Anta Dop,

Plus en détail

Valeur absolue et fonction valeur absolue Cours

Valeur absolue et fonction valeur absolue Cours Valeur absolue foncton valeur absolue Cours CHAPITRE 1 : Dstance entre deu réels 1) Eemples prélmnares 2) Défnton 3) Proprétés CHAPITRE 2 : Valeur absolue d un réel 1) Défnton 2) Proprétés CHAPITRE 3 :

Plus en détail

Gestion et stratégie Utilisateur

Gestion et stratégie Utilisateur Geston et stratége Utlsateur GESTION ET STRATEGIE UTILISATEUR...2 1.) Comment gérer des utlsateurs?...2 1.1) Geston des utlsateurs en groupe de traval...2 1.2) Geston des utlsateurs par domane...2 Rôle

Plus en détail

Utilisation du symbole

Utilisation du symbole HKBL / 7 symbole sgma Utlsaton du symbole Notaton : Pour parler de la somme des termes successfs d une sute, on peut ou ben utlser les pontllés ou ben utlser le symbole «sgma» majuscule noté Par exemple,

Plus en détail

Mesure de compatibilité et recherche de solutions régulières en contact pénalisé

Mesure de compatibilité et recherche de solutions régulières en contact pénalisé Mesure de compatblté et recherche de solutons régulères en contact pénalsé G. Vermot des Roches,3, E. Balmes,2, Hachm Ben Dha 3, Rém Lemare 4 SDTools 44, Rue Vergnaud, 7503, Pars - FRANCE {vermot,balmes}@sdtools.com

Plus en détail

SIMNUM : Simulation de systèmes auto-gravitants en orbite

SIMNUM : Simulation de systèmes auto-gravitants en orbite SIMNUM : Smulaton de systèmes auto-gravtants en orbte sujet proposé par Ncolas Kelbasewcz : ncolas.kelbasewcz@ensta-parstech.fr 14 janver 2014 1 Établssement du modèle 1.1 Approxmaton de champ lontan La

Plus en détail

Représentation de l'information

Représentation de l'information 1. L nformaton 1-1 Dualté état et temps Représentaton de l'nformaton La noton d'nformaton correspond à la connassance d'un état donné parm pluseurs possbles à un nstant donné. La Fgure 1 llustre cette

Plus en détail

L'affichage des pages

L'affichage des pages L'affchage des pages des pages L'affchage des pages dans les navgateurs 51 Tester la page dans un navgateur Avec Dreamweaver vous travallez dans un envronnement graphque : vous voyez à l'écran ce que vous

Plus en détail

Virga. itunes 4. sous Mac et Windows. Éditions OEM (Groupe Eyrolles),2004, ISBN 2-7464-0503-2

Virga. itunes 4. sous Mac et Windows. Éditions OEM (Groupe Eyrolles),2004, ISBN 2-7464-0503-2 Vrga Tunes 4 et Pod sous Mac et Wndows Édtons OEM (Groupe Eyrolles),2004, ISBN 2-7464-0503-2 Synchronser l Pod avec l ordnateur L Pod connaît deux types de synchronsaton. L a synchronsaton de la musque

Plus en détail

Optimisation du conditionnement d'air des locaux de télécommunication par utilisation de produits à changement de phase

Optimisation du conditionnement d'air des locaux de télécommunication par utilisation de produits à changement de phase Optmsaton du condtonnement d'ar des locaux de télécommuncaton par utlsaton de produts à changement de phase Davd NÖRTERSHÄUSER, Stéphane LE MASSON France Telecom R&D, 2 Avenue Perre Marzn, 2 LANNION Résumé

Plus en détail

Impact de la chirurgie sur une cohorte d adultes d souffrant d éd. épilepsie partielle pharmacorésistante

Impact de la chirurgie sur une cohorte d adultes d souffrant d éd. épilepsie partielle pharmacorésistante Impact de la chrurge sur une cohorte d adultes d souffrant d éd éplepse partelle pharmacorésstante sstante: Analyse par score de propenson 4 ème Conférence Francophone d Epdémologe Clnque - Congrès thématque

Plus en détail

SEPTEMBRE 2009 RC-POS

SEPTEMBRE 2009 RC-POS SEPTEMBRE 2009 RC-POS (09_POS_131) (mn.) RAPPORT DE MINORITE DE LA COMMISSION THEMATIQUE DE LA SANTE PUBLIQUE chargée d'examner l'objet suvant: Postulat Fabenne Despot et consorts demandant à qu profte

Plus en détail

UTILISATION DES COPULES POUR ANALYSER L IMPACT DES DEPENDANCES SUR UN PORTEFEUILLE DE CREDITS RAPPORT DE STAGE D INGENIEUR CONFIDENTIEL

UTILISATION DES COPULES POUR ANALYSER L IMPACT DES DEPENDANCES SUR UN PORTEFEUILLE DE CREDITS RAPPORT DE STAGE D INGENIEUR CONFIDENTIEL Yohan KABLA ECP - 3 EME ANNEE MAP SMF UTILISATION DES COPULES POUR ANALYSER L IMPACT DES DEPENDANCES SUR UN PORTEFEUILLE DE CREDITS RAPPORT DE STAGE D INGENIEUR CONFIDENTIEL 5 MAI NOVEMBRE 00 MAITRES DE

Plus en détail

Indicateurs de compétitivité- prix et de performances à l exportation

Indicateurs de compétitivité- prix et de performances à l exportation Décembre 2009 Indcateurs de compéttvté- prx et de performances à Méthodologe Les ndcateurs présentés dans ce document vsent à mesurer en temps réel l évoluton des parts de marché des prncpaux exportateurs

Plus en détail

1 ère S. «Thème 3 / L énergie et ses transferts» Livret 1 / Les TP

1 ère S. «Thème 3 / L énergie et ses transferts» Livret 1 / Les TP 1 ère S «Thème 3 / L énerge et ses transferts» Lvret 1 / Les TP Sommare Page 3 : Page 5 : Page 6 : Page 7 : Page 8 : Page 9 : TP/ Chaleur latente de fuson de la glace TP/ Détermnaton d une énerge de combuston

Plus en détail

L Interprétation des Images Médicales Cérébrales : Segmentation par L approche Split et Merge

L Interprétation des Images Médicales Cérébrales : Segmentation par L approche Split et Merge L Interprétaton des Images Médcales Cérébrales : Segmentaton par L approche Splt et Merge Berrch Fatma Zohra 1, Benyettou Mohamed 1 1 Laboratore de Modélsaton et Optmsaton des Systèmes Industrels : LAMOSI.

Plus en détail

Exercices sur la géométrie plane

Exercices sur la géométrie plane Eercces sur la géoétre plane Sot un trangle équlatéral et M un pont ntéreur au trangle n note H, K, L les projetés orthogonau respectfs de M sur les tros côtés éontrer que la soe MH + MK + ML est constante

Plus en détail

(Licence L1 /Durée 3H) Stand d étude de l'effort tranchant dans une poutre Règle Des accroches poids

(Licence L1 /Durée 3H) Stand d étude de l'effort tranchant dans une poutre Règle Des accroches poids (Lcence L1 /Durée 3H) Objectfs : Se famlarser avec l apparel d étude de l'effort tranchant dans une poutre (les pèces consttutves, mode d emplo...) Ben matrser les étapes qu mènent à l élaboraton des dfférents

Plus en détail

Mailing. Les étapes de conception d un mailing. Créer un mailing

Mailing. Les étapes de conception d un mailing. Créer un mailing Malng Malng Word 2011 pour Mac Les étapes de concepton d un malng Le malng ou publpostage permet l envo en nombre de documents à des destnatares répertorés dans un fcher de données. Cette technque sous-entend

Plus en détail

- Equilibre simultané IS/LM : Pour déterminer le couple d équilibre général, il convient de résoudre l équation IS = LM.

- Equilibre simultané IS/LM : Pour déterminer le couple d équilibre général, il convient de résoudre l équation IS = LM. Exercce n 1 Cet exercce propose de détermner l équlbre IS/LM sur la base d une économe dépourvue de présence étatque. Pour ce fare l convent, dans un premer temps de détermner la relaton (IS) marquant

Plus en détail

EXEMPLES D UTILISATION DE LA TECHNIQUE DES OBSERVATIONS INSTANTANÉES.

EXEMPLES D UTILISATION DE LA TECHNIQUE DES OBSERVATIONS INSTANTANÉES. EXEMPLES D UTILISATIN DE LA TECHNIQUE DES BSERVATINS INSTANTANÉES. Chrstan Fortn, ng., Ph.D. Ergonome et hygénste du traval Centre of santé et servces socaux de la Montagne, Montréal. Résumé La technque

Plus en détail

o cl o a L'Aide Personnalisée aux élèves en mise en place par I'Etat, difficulté un dispositif irréaliste (1) CL (1, (1) (1, ffi

o cl o a L'Aide Personnalisée aux élèves en mise en place par I'Etat, difficulté un dispositif irréaliste (1) CL (1, (1) (1, ffi ff ----a L'Ade Personnalsée aux élèves en dffculté (1) o a (1) L CL (1, E L (1, II a o cl mse en place par I'Etat, un dspostf rréalste Vendred ltoctobre 2008 à 14h Mare de Mourenx Sommare ---o : : ----r

Plus en détail

Généralités sur les fonctions 1ES

Généralités sur les fonctions 1ES Généraltés sur les fonctons ES GENERALITES SUR LES FNCTINS I. RAPPELS a. Vocabulare Défnton Une foncton est un procédé qu permet d assocer à un nombre x appartenant à un ensemble D un nombre y n note :

Plus en détail

DOCUMENT DE TRAVAIL 2004-023

DOCUMENT DE TRAVAIL 2004-023 Publé par : Publsed by : Publcacón de la : Édton électronque : Electronc publsng : Edcón electrónca : Dsponble sur Internet : Avalable on Internet Dsponble por Internet : Faculté des scences de l admnstraton

Plus en détail

IUT Lannion Optique instrumentale

IUT Lannion Optique instrumentale IUT Lannon Optque nstrumentale Plan du cours Notons de base et défntons Photométre / Sources de lumère Les bases de l optque géométrque Généraltés sur les systèmes optques Eléments à faces planes Doptres

Plus en détail

Note méthodologique. Traitements hebdomadaires Quiestlemoinscher.com. Quelle méthode de collecte de prix? Qui a collecté les prix?

Note méthodologique. Traitements hebdomadaires Quiestlemoinscher.com. Quelle méthode de collecte de prix? Qui a collecté les prix? Note méthodologque Tratements hebdomadares Questlemonscher.com Quelle méthode de collecte de prx? Les éléments méthodologques ont été défns par le cabnet FaE onsel, socété d études et d analyses statstques

Plus en détail

Exercices Électrocinétique

Exercices Électrocinétique ercces Électrocnétque alculs de tensons et de courants -21 éseau à deu malles Détermner, pour le crcut c-contre, l ntensté qu 1 2 traverse la résstance 2 et la tenson u au bornes de la résstance 3 : 3

Plus en détail

THÈSE DE DOCTORAT. Steven MARTIN. le 6 juillet 2004. pour obtenir le titre de

THÈSE DE DOCTORAT. Steven MARTIN. le 6 juillet 2004. pour obtenir le titre de THÈSE DE DOCTORAT UNIVERSITÉ PARIS XII présentée par Steven MARTIN le 6 ullet 2004 pour obtenr le ttre de DOCTEUR EN SCIENCES Spécalté Informatque MAÎTRISE DE LA DIMENSION TEMPORELLE DE LA QUALITÉ DE SERVICE

Plus en détail

Métaheuristiques pour l Optimisation Combinatoire Multi-objectifs : Etat de l art

Métaheuristiques pour l Optimisation Combinatoire Multi-objectifs : Etat de l art Métaheurstques pour l Optmsaton Combnatore Mult-objectfs : Etat de l art El-Ghazal TALBI Equpe OPAC (Optmsaton PArallèle Coopératve) Laboratore d Informatque Fondamentale de Llle Unversté de Llle 1, France

Plus en détail

C.P.G.E-TSI-SAFI Redressement non commandé 2006/2007

C.P.G.E-TSI-SAFI Redressement non commandé 2006/2007 C.P.G.E-TSI-SAFI edressement non commandé 2006/2007 edressement non commandé Introducton : es réseaux et les récepteurs électrques absorbent de l énerge sous deux formes, en contnus ou en alternatfs. Pour

Plus en détail

Synthèse de cours PanaMaths (Terminale S) Les nombres complexes

Synthèse de cours PanaMaths (Terminale S) Les nombres complexes Snthèse de cours PanaMaths (Termnale S) L ensemble des nombres complees Défntons n pose tel que = 1 { } L ensemble des nombres complees, noté, est l ensemble : z /(, ) = + Le réel est appelé «parte réelle

Plus en détail

Définition des tâches

Définition des tâches Défnton des tâches Défnton des tâches Project 2010 Sasr les tâches d'un projet Les tâches représentent le traval à accomplr pour attendre l'objectf du projet. Elles représentent de ce fat, les éléments

Plus en détail

Méthodes d Extraction de Connaissances à partir de Données (ECD) appliquées aux Systèmes d Information Géographiques (SIG)

Méthodes d Extraction de Connaissances à partir de Données (ECD) appliquées aux Systèmes d Information Géographiques (SIG) UNIVERSITÉ DE NANTES FACULTÉ DES SCIENCES ÉCOLE DOCTORALE SCIENCES ET TECHNOLOGIES DE L INFORMATION ET DES MATÉRIAUX Année 2006 N attrbué par la bblothèque Méthodes d Extracton de Connassances à partr

Plus en détail

Accord Entreprise. Le Guide du True-Up. Enterprise Agreement True - Up Guide

Accord Entreprise. Le Guide du True-Up. Enterprise Agreement True - Up Guide Enterprse Agreement True-Up Gude Accord Entreprse Le Gude du True-Up Enterprse Agreement True - Up Gude Le gude du True-Up dans l Accord Entreprse Table des matères Le True-Up des lcences on premse et

Plus en détail

EXAMEN FINAL DE STATISTIQUES DESCRIPTIVES L1 ECO - SESSION 1 - Correction - Minimum Moyenne Ecart-type

EXAMEN FINAL DE STATISTIQUES DESCRIPTIVES L1 ECO - SESSION 1 - Correction - Minimum Moyenne Ecart-type EAME FIAL DE STATISTIQUES DESCRIPTIVES L1 ECO - SESSIO 1 - Correcton - Exercce 1 : 1) Questons à Chox Multples (QCM). Cochez la bonne réponse Classer ces statstques selon leur nature (ndcateur de poston

Plus en détail

EN81-28: qu est-ce que c est? Bloqué dans l ascenseur?

EN81-28: qu est-ce que c est? Bloqué dans l ascenseur? EN81-28: qu est-ce que c est? Bloqué dans l ascenseur? www.safelne.se Pas de panque! SafeLne est à votre écoute Hsselektronk développe et fabrque des composants électronques pour ascenseurs. Les produts

Plus en détail

L anonymat dans les protocoles cryptographiques

L anonymat dans les protocoles cryptographiques École normale supéreure Département d nformatque Équpe CASCADE INRIA Unversté Pars 7 Dens Dderot L anonymat dans les protocoles cryptographques Thèse présentée et soutenue publquement le jeud 1 er octobre

Plus en détail

MGA802. Analyse fonctionnelle. Chapitre 1. S. Antoine Tahan, ing. Ph.D. Département de génie mécanique

MGA802. Analyse fonctionnelle. Chapitre 1. S. Antoine Tahan, ing. Ph.D. Département de génie mécanique Analyse fonctonnelle Chaptre S. Antone Tahan, ng. Ph.D. Département de géne mécanque Ma 009 Manuel : Métrologe MEC66 Auteur : Antone Tahan, ng., Ph.D. atahan@mec.etsmtl.ca ère édton : novembre 004 ème

Plus en détail

Les nombres premiers ( Spécialité Maths) Terminale S

Les nombres premiers ( Spécialité Maths) Terminale S Les nombres premers ( Spécalté Maths) Termnale S Dernère mse à jour : Mercred 23 Avrl 2008 Vncent OBATON, Ensegnant au lycée Stendhal de Grenoble (Année 2007-2008) Lycée Stendhal, Grenoble ( Document de

Plus en détail

Cryptographie évolutionniste

Cryptographie évolutionniste Cryptographe évolutonnste Applcaton des algorthmes évolutonnstes à la cryptographe Fouza Omary* Abderrahm Tragha** Aboubakr Lbekkour* *Département de mathématques et nformatque faculté des scences-rabat

Plus en détail

Corrélation et régression linéaire

Corrélation et régression linéaire Corrélaton et régresson lnéare 1. Concept de corrélaton. Analyse de régresson lnéare 3. Dfférences entre valeurs prédtes et observées d une varable 1. Concept de corrélaton L objectf est d analyser un

Plus en détail

Mesurer la qualité de la prévision

Mesurer la qualité de la prévision Mesurer la qualté de la prévson Luc Baetens 24/11/2011 www.mobus.eu Luc Baetens 11 ans d expérence Planfcaton Optmsaton des stocks Organsaton de la Supply Chan Performance de la Supply Chan Geston de la

Plus en détail

Soutien : Modèle de Potts mars 2015

Soutien : Modèle de Potts mars 2015 Année 04 05 Physque Statstque hors équlbre et transtons de phase Souten : Modèle de Potts mars 05 On onsdère une varante du modèle d Isng, dte de Potts, dans laquelle les N degrés de lberté (qu on appellera

Plus en détail

Traitement des images multispectrales

Traitement des images multispectrales Tratement des mages multspectrales É. DINET LIGIV Unversté Jean MONNET Bât. E, 10 rue Barroun 4000 SAINT-ÉTIENNE France Erc.Dnet@unv-st-etenne.fr Résumé Pour répondre aux besons et aux exgences d applcatons

Plus en détail

Aide multicritère au pilotage d un processus basée sur le raisonnement à partir de cas

Aide multicritère au pilotage d un processus basée sur le raisonnement à partir de cas Ade multcrtère au plotage d un processus basée sur le rasonnement à partr de cas Dala Dhoub To cte ths verson: Dala Dhoub. Ade multcrtère au plotage d un processus basée sur le rasonnement à partr de cas.

Plus en détail

Application des algorithmes évolutionnaires multicritères à la conception de véhicules électriques

Application des algorithmes évolutionnaires multicritères à la conception de véhicules électriques Chaptre 5 Applcaton des algorthmes évolutonnares multcrtères à la concepton de véhcules électrques Dans ce chaptre, nous entreprenons vértablement la concepton systémque par optmsaton de véhcules électrques

Plus en détail

Assistance à la saisie en milieu non structuré

Assistance à la saisie en milieu non structuré Assstance à la sase en mleu non structuré R. Gharb 1, N. Rezzoug 1, P. Gorce 1 P. Hoppenot 2, E. Colle 2 1 Laboratore ESP EA 3162 Unversté de Toulon et du Var BP 20132, 83957 La Garde gorce{rezzoug, gharb}@unv-tln.fr

Plus en détail

PEB: EXEMPLES DE DIVISION DE PROJET

PEB: EXEMPLES DE DIVISION DE PROJET Performance Energétque des âtments > pour archtectes et bureaux d études PE: EXEMPLES DE DIVISION DE PROJET Annexes au VADE-MECUM PE Verson jun 2008 Plus d nfos : www.bruxellesenvronnement.be > professonnels

Plus en détail

12ème colloque de l'association de comptabilité nationale Paris, 4-6 juin 2008

12ème colloque de l'association de comptabilité nationale Paris, 4-6 juin 2008 12ème colloque de l'assocaton de comptablté natonale Pars, 4-6 jun 2008 Sesson n 1 Au-delà du PIB : à la recherche d ndcateurs synthétques la prse en compte du ben-être Mesurer le nveau de ve : revenu

Plus en détail

direction de l animation de la recherche, des études et des statistiques Numéro 176 Juillet 2013

direction de l animation de la recherche, des études et des statistiques Numéro 176 Juillet 2013 Document d études drecton de l anmaton de la recherche, des études et des statstques Numéro 176 Jullet 2013 La régonalsaton des dépenses de formaton des entreprses au ttre du plan de formaton Jérôme Lê

Plus en détail

Schlüter -KERDI-BOARD. Support de pose, panneau d agencement, étanchéité composite (SPEC)

Schlüter -KERDI-BOARD. Support de pose, panneau d agencement, étanchéité composite (SPEC) Schlüter -KERDI-BOARD Support de pose, panneau d agencement, étanchété composte (SPEC) Schlüter -KERDI-BOARD Schlüter -KERDI-BOARD Le support de pose unversel pour carrelages Important! Qu l s agsse d

Plus en détail

Chapitre 2 : Energie potentielle électrique. Potentiel électrique

Chapitre 2 : Energie potentielle électrique. Potentiel électrique 2 e BC 2 Energe potentelle électrque. Potentel électrque 12 Chaptre 2 : Energe potentelle électrque. Potentel électrque 1. Traval de la orce électrque a) Expresson mathématque dans le cas du déplacement

Plus en détail

Paramétrer le diaporama

Paramétrer le diaporama PowerPont 2013 - Fonctons avancées Daporama Daporama PowerPont 2013 - Fonctons avancées Paramétrer le daporama Le daporama est la projecton de la présentaton à l écran. Ouvrez la présentaton à projeter.

Plus en détail

LES DIMENSIONS DANS LA PERCEPTION DES INTERVALLES MUSICAUX *

LES DIMENSIONS DANS LA PERCEPTION DES INTERVALLES MUSICAUX * LES DIMENSIONS DANS LA PERCEPTION DES INTERVALLES MUSICAUX * "W.J.M. LEVELT et R. PLOMP (Insttute for Percepton R.V.O.-T.N.O., SOESTERBERG, PAYS-BAS) Introducton Il est ntéressant de savor de quelle manère

Plus en détail

PROPOSITION D UNE PROCEDURE DE DETERMINATION DE TEMPS UNITAIRE DE PIECES DECOUPEES

PROPOSITION D UNE PROCEDURE DE DETERMINATION DE TEMPS UNITAIRE DE PIECES DECOUPEES 8 e Conférence Internatonale de MOdélsaton et SIMulaton - MOSIM - au 2 ma - Hammamet - Tunse «Evaluaton et optmsaton des systèmes nnovants de producton de bens et de servces» PROPOSITION D UNE PROCEDURE

Plus en détail