ALGORITHMES ÉVOLUTIONNAIRES ET OPTIMISATION

Dimension: px
Commencer à balayer dès la page:

Download "ALGORITHMES ÉVOLUTIONNAIRES ET OPTIMISATION"

Transcription

1 LABORATOIRE INFORMATIQUE, SIGNAUX ET SYSTÈMES DE SOPHIA ANTIPOLIS UMR 6070 ALGORITHMES ÉVOLUTIONNAIRES ET OPTIMISATION MULTI-OBJECTIFS EN DATA MINING Dominique Francisci Projet MECOSI Rapport de recherche I3S/RR FR mars 2002 LABORATOIRE I3S: Les Algorithmes / Euclide B 2000 route des Lucioles B.P Sophia-Antipolis Cedex, France Tél. (33) Télécopie : (33)

2 Algorithmes Evolutionnaires et Optimisation Multi-objectifs en Data Mining Dominique FRANCISCI Rapport de recherche I3S/RR FR Mars 2002

3 Sommaire 1. Introduction Optimisation multi-objectifs Concepts de base et terminologie Recherche et prise de décision Les approches traditionnelles La méthodes des poids La méthode des contraintes Discussion sur les méthodes classiques Les algorithmes évolutionnaires Les algorithmes évolutionnaires pour l optimisation multi-objectifs Principes de base des algorithmes évolutionnaires Problèmes clés dans la recherche multi-objectifs Assignation de valeur de fitness et sélection Sélection par échange des objectifs Sélection par agrégation avec variation des paramètres Sélection basée sur Pareto Diversité de la population Partage de la fitness Restriction de la reproduction Isolation par la distance La surspécification La réinitialisation L entassement L élitisme

4 3. Obtention et analyse de nuages de points présentant des frontières de Pareto Description de la base utilisée Description d un individu Sémantiques et définitions des critères utilisés Support Confiance Sensibilité Spécificité Couverture J-mesure Interprétation des graphes Interprétation des graphes de la figure Interprétation des graphes de la figure Annexes Références bibliographiques

5 Algorithmes évolutionnaires et optimisation multi-objectifs en Data Mining 1. Introduction La plupart des problèmes du monde réel nécessitent l optimisation simultanée de plusieurs objectifs souvent irrationnels et dépendants les uns des autres. Tandis qu en optimisation à objectif unique (ou à critère unique ou encore mono-objectif), la solution optimale est généralement clairement définie, cela n est pas le cas pour les problèmes à objectifs multiples (ou à critères multiples ou encore multi-objectifs). Au lieu d une solution optimale, il existe plutôt un ensemble de solutions qui sont des «compromis» ; cet ensemble est généralement dénommé «l ensemble des solutions optimales de Pareto». Ces solutions sont optimales dans le sens qu aucune autre solution dans l espace de recherche n est supérieure à elles, lorsque tous les objectifs sont considérés simultanément. Dans ce chapitre, les principes de l optimisation multi-objectifs sont abordés et les concepts de bases sont définis formellement. Ceci est suivi par une discussion concernant les approches traditionnelles pour approximer l ensembles des solutions optimales de Pareto ainsi que leurs désavantages. Ensuite les algorithmes évolutionnaires sont présentés comme une méthode récente d optimisation qui possède plusieurs caractéristiques qui sont souhaitées pour ce genre de problèmes. Un historique des algorithmes évolutionnaires en optimisation multi-objectifs est brièvement présentée avec un accent mis en particulier sur les questions ouvertes dans ce domaine de recherche. S en suit pour conclure, une étude concernant l utilisation d algorithmes évolutionnaires en optimisation multi-objectifs en Data Mining Optimisation multi-objectifs Concepts de base et terminologie Les problèmes d optimisation mutli-objectifs (POM) sont courants. Par exemple, considérons la conception d un système informatique complexe (du point de vue matériel et logiciel) comme on peut en trouver dans les téléphones mobiles, les voitures etc. Souvent le coût de tels systèmes doit être minimisé, tandis que les performances désirées, elles, doivent être maximisées. D autres objectifs dépendants de l application peuvent être importants tels que la fiabilité par exemple. Ceux-ci peuvent être soit explicitement définis comme des critères d optimisation (objectifs ou critères) ou bien formulés comme étant des contraintes. Par exemple dans notre exemple, ces contraintes pourraient être des dimensions imposées au produit à ne pas dépasser. Formellement, ceci peut être défini comme suit : Définition 1 : Problème d optimisation multi-objectifs (POM) Un POM général inclus un ensemble de n paramètres (variables de décision), un ensemble de k fonctions d objectifs et un ensemble de m contraintes. Les fonctions d objectifs et les contraintes sont des fonctions des variables de décision. Le but de l optimisation est de : maximiser y = f( x) = ( f1( x), f2( x),..., fk( x)) sachant que e( x) = ( e1( x), e2( x),..., em ( x)) 0 (1.1) 4

6 où et x = ( x1, x2,..., xn) X y = ( y1, y2,..., yk) Y x est le vecteur de décision, y est le vecteur d objectifs, X est l espace de décision et Y l espace des objectifs. Les contraintes e ( x) 0 déterminent l ensemble des solutions vraisemblables (c est à dire pouvant être obtenues). Définition 2 : Ensemble de satisfaisabilité L ensemble de satisfaisabilité X f est défini comme l ensemble des vecteurs de décision x qui satisfont les contraintes e(x) : { x X / e( ) 0} X f = x (1.2) L image de X f, c est à dire, la région de satisfaisabilité dans l espace des objectifs, est notée Yf = f( X f) = f( x) U x X f { } Sans perte de généralité, on considère ici un problème de maximisation. Pour les problèmes de minimisation ou maximisation/minimisation, les définitions présentées dans cette section sont similaires. Considérons à nouveau le problème précédent et supposons deux objectifs : la performance (f 1 ) et l inverse du coût (f 2 ), qui doivent être maximisés connaissant les contraintes de taille (e 1 ). Une conception optimale serait une architecture ayant des performances maximales et un coût minimal tout en respectant les contraintes de taille imposées. Ce qui fait des POM des problèmes difficiles, résulte dans le fait que les objectifs sont souvent conflictuels et ne peuvent être optimisés simultanément. Il est alors nécessaire de trouver des compromis. Dans notre exemple, la performance et le faible coût sont généralement concurrents : une architecture à haute performance augmente de coût de manière sensible, tandis qu une architecture peu coûteuse fournit souvent des performances relativement faibles. Une solution intermédiaire (performance moyenne et coût moyen) peut être un compromis acceptable. Cette discussion permet de mettre en lumière le fait qu une nouvelle définition d optimalité est nécessaire pour les POM. f 2 frontière optimale deparero f 2 région de satisfaisabilité est dominé indifférent E A E A B B D C D domine C indifférent f 1 f 1 Fig. 1 : Illustration de l optimalité de Pareto dans l espace des objectifs (à gauche) et les relations possibles entre les solutions (à droite). 5

7 En optimisation mono-objectif, l ensemble de satisfaisabilité est totalement ordonné selon une fonction d objectif f : soient deux solutions a, b X f soit f( a) f( b) soit f( b) f( a). Le but est de trouver la solution (ou les solutions) qui donne la valeur maximale à f [1]. Cependant, lorsque plusieurs objectifs sont concernés, la situation change : X f est, en général, non totalement ordonné, mais partiellement ordonné [2]. Ceci est illustré dans la figure 1 sur la gauche. La solution représenté par le point B est meilleure que la solution représentée par le point C : elle fournit une meilleure performance à un coût plus faible. De même pour la solution C qui est meilleure que la solution D à coûts égaux. Dans le but d exprimer cette situation mathématiquement, les relations =, et > sont étendues aux vecteurs d objectifs par analogie au cas des objectifs uniques : Définition 3 : Soient deux vecteurs d objectifs u et v, { 1,2,..., k } ui vi {,2,..., k } ui vi u = v i : = u v i 1 : (1.3) u > v u v u v Les relations et < sont définies de façon similaire. En utilisant ces notions, il s avère que B > C, C > D, et, par conséquent B > D. Cependant, lorsque l on compare les solutions B et E, aucune n est supérieure à l autre, puisque B > E et E > B. Bien que la solution associée à E soit moins coûteuse, elle fournit une plus faible performance que la solution représentée par B. Donc, deux vecteurs de décision a et b peuvent avoir trois types de relations en optimisation multi-objectifs (par rapport à l opérateur ) : f( a) f( b), f( b) f( a) ou f( a) f( b) f( b) f( a). Les symboles et termes suivants sont utilisés dans le but de différencier ces trois situations. Définition 4 : Domination de Pareto. Soient deux vecteurs de décision a et b : a f b (a domine b) f ( a) > f( b) a f b (a domine faiblement b) f( a) f( b) (1.4) a b (a est indifférent pour b) f( a) f( b) f( b) f( a) Les définitions pour un problème de minimisation ( p,, ) sont analogues. Dans la figure 1 à droite, le rectangle gris clair entoure la région dans l espace des objectifs qui est dominée par le vecteur de décision représenté par B. Le rectangle gris foncé contient les vecteurs d objectifs qui correspondent aux vecteurs de décision dominant la solution associée à B. Toutes les solutions dont le vecteur de décision correspondant est ni dans le rectangle clair, ni dans le rectangle foncé, sont indifférentes pour la solution représentée par B. Basé sur le concept de domination de Pareto, les critères d optimalité pour les POM peuvent être introduits. Dans la figure 1, A est unique parmi B, C, D et E : son vecteur de décision a n est dominé par aucun autre vecteur de décision. Cela signifie que a est optimal dans le sens où il ne peut être amélioré sur aucun objectif sans causer la dégradation d au 6

8 moins un autre objectif. De telles solutions sont appelées solutions optimales de Pareto ; parfois le terme de solutions non-inférieures [3] est utilisé. Définition 5 : Optimalité de Pareto Un vecteur de décision x X f est dit non dominé par rapport à un ensemble A X f ssi : a A : a f x (1.5) Dans la figure 1 les points blancs représentent les solutions optimales de Pareto. Elles sont indifférentes les une des autres. Cela constitue la principale différence avec les problèmes à objectif unique (POU) : il n y a pas une seule solution optimale mais plutôt un ensemble de compromis optimaux. Aucun d eux ne peut être identifié comme étant meilleur que les autres sans qu une information de préférence ne soit inclue. L ensemble des solutions optimales de Pareto est appelé ensemble optimal de Pareto ; les vecteurs d objectifs correspondants constituent la frontière (ou front) de Pareto ou plus généralement la surface de Pareto. Définition 6 : Ensembles et frontières non dominés Soit A X f. La fonction p(a) donne l ensemble des vecteurs de décision non dominés dans A : p(a)={ a A / a est non dominé dans A } (1.6) L ensemble p(a) est l ensemble non dominé dans A, l ensemble des vecteurs d objectifs correspondants f(p(a)) est la frontière non dominée dans A. De plus, l ensemble X p = p( X f) est appelé l ensemble optimal de Pareto et l ensemble Y p = f( X p) est dénommé la frontière optimale de Pareto. L ensemble optimal de Pareto comprend la globalité des solutions optimales. Cependant, comme dans les POU, il peut y avoir plusieurs optima locaux qui constituent un ensemble non dominé à l intérieur d un certain voisinage. Ceci correspond au concept d ensembles optimaux locaux et globaux de Pareto introduits dans [4, 5]. Définition 7 : Considérons un ensemble de vecteurs de décision A X f. 1. L ensemble A est dénommé ensemble optimal local de Pareto ssi : a A : x X f : x f a x a < ε f( x) f( a) < δ (1.7) où. est une métrique de distance et ε > 0, δ > L ensemble A est dénommé ensemble optimal global de Pareto ssi : a A : x X f : x f a (1.8) La différence entre optima locaux et globaux est représentée dans la figure 2. La ligne en pointillés constitue la frontière optimale globale de Pareto, tandis que la ligne continue 7

9 représente une frontière optimale locale de Pareto. Les vecteurs de décision associés à la dernière sont localement non dominés bien que non Pareto-optimaux, parce que la solution relative au point A domine chacun d eux. Finalement, notons qu un ensemble optimal global de Pareto ne contient pas nécessairement toutes les solutions optimales de Pareto et que tout ensemble optimal global de Pareto est aussi un ensemble optimal local de Pareto. f 2 frontière optimale globale de Pareto région de satisfaisabilité A frontière optimale locale de Pareto f 1 Fig. 2 : Illustration des ensembles de solutions localement et globalement optimales dans l espace des objectifs Recherche et prise de décision En résolvant un POM, deux types de difficultés conceptuellement différents peuvent être considérés : la recherche et la prise de décision. Le premier aspect est relatif au processus d optimisation dans lequel l ensemble de satisfaisabilité est échantillonné pour les solutions optimales de Pareto. Alors qu en optimisation à objectif unique, de grands et complexes espaces de recherche peuvent rendre la recherche difficile et exclure l utilisation de méthodes exactes d optimisation comme la programmation linéaire [6]. Le second aspect concerne le problème de la sélection des solutions (des compromis) à partir de l ensemble optimal de Pareto. Un preneur de décision humain est nécessaire pour faire le compromis souvent difficile entre les objectifs conflictuels. Dépendant de la manière dont les processus d optimisation et de décision sont mêlés, les méthodes d optimisation mutli-objectifs peuvent être grossièrement classifiées en trois catégories [7, 8] : Prise de décision avant recherche : les objectifs des POM sont agrégés en un seul objectif qui inclus implicitement les informations de préférences données par le preneur de décision. Recherche avant la prise de décision : l optimisation est effectuée sans qu aucune information de préférence ne soit fournie. Le résultat du processus de recherche est un ensemble (idéalement optimal de Pareto) de solutions candidates à partir duquel le choix final est fait par le preneur de décision. Prise de décision durant la recherche : le preneur de décision peut articuler les préférences durant le processus d optimisation interactif. Après chaque étape d optimisation, un certain 8

10 nombre de compromis est présenté sur la base duquel le preneur de décision spécifie davantage d informations de préférence, pour guider la recherche. L agrégation de multiples objectifs en un seul critère d optimisation possède l avantage que les stratégies classiques d optimisation à objectif unique peuvent être appliquées sans plus de modifications. Cependant, cela requière une grande connaissance du domaine qui n est souvent pas disponible. Effectuer la recherche avant la prise de décision supprime cet inconvénient, mais exclue l articulation des préférences par le preneur de décision qui doit réduire la complexité de l espace de recherche. Un autre problème avec cela ainsi qu avec la troisième catégorie d algorithmes est la visualisation et la représentation des ensembles nondominés pour les POM à grandes dimensions [1]. Finalement, l intégration de la recherche et de la prise de décision est une voie prometteuse pour combiner les deux autres approches, unissant les avantages des deux. Dans ce document, la lumière est portée sur les méthodes d optimisation multiobjectives capables de : 1. manipuler des espaces de recherche vastes et complexes et, 2. générer l ensemble optimal de Pareto exact ou une approximation de celui-ci. Ceci est la première étape dans la direction de la prise décision pendant la recherche et représente les bases pour de futures recherches dans ce domaine Les approches traditionnelles Les méthodes classiques pour générer l ensemble optimal de Pareto regroupent les objectifs en un seul. Les paramètres de la fonction employée ne sont pas fournis par le preneur de décision mais par l optimiseur. Plusieurs exécution de l optimiseur sont effectuées dans le but de trouver un ensemble de solutions qui approxime l ensemble optimal de Pareto. Généralement, cette procédure est indépendante de l algorithme sous-jacent mis en œuvre. Plusieurs méthodes représentatives de ces techniques sont la méthode des poids [3], la méthode des contraintes [3] ou encore l approche minmax [9]. Les deux premières sont présentées plus en détails ici La méthodes des poids Le POM original est converti en POU en formant une combinaison linéaire des objectifs : maximiser y = f( x) = w1. f1( x) + w2. f2( x) wk. fk( x) (1.9) sachant que x X f Les w i sont appelés poids et ils sont normalisés : w i = 1. Résoudre le problème d optimisation ci-dessus pour un certain nombre de combinaisons différentes de poids, fournie un ensemble de solutions. A la condition que les poids soient tous positifs, cette méthode génère uniquement les solutions optimales de Pareto qui peuvent être aisément montrées. Supposons qu un vecteur de décision satisfiable a maximise f pour une combinaison de poids donnée et que a ne soit 9

11 pas Pareto optimal. Alors, il existe une solution b qui domine a, c est à dire telle que : f 1( b) > f1( a) et fi( b) fi( a) pour i = 2,, k. Donc, f ( b) > f( a), est une contradiction avec la supposition que f (a) est maximum. Le principal inconvénient de cette technique est qu elle ne peut générer toute les solutions optimales de Pareto avec une surface de compromis non-convexe. Ceci est illustré sur la figure 3. Pour des poids fixés w 1 et w2, la solution x cherche à maximiser 1 y y = w1. f1( x) + w2. f2( x). Cette équation peut être reformulée comme f 2 ( x) =. f1( x) w w +, 2 w2 y qui définie une droite de pente w w1 et intercèpte dans l espace des objectifs (ligne 2 w 2 continue dans la figure 3). Graphiquement, le processus d optimisation revient à déplacer cette ligne vers le haut, jusqu à ce qu aucun vecteur d objectifs ne soit au dessus et qu au moins un vecteur d objectifs satisfiable (ici A et D) soit dessus. Cependant, les points B et C ne maximiserons jamais f. Si la pente est augmentée, D fournie une plus grande valeur à f (ligne supérieure en pointillés) ; si la pente est diminuée, A a une plus grande valeur pour f que B et D (ligne inférieure en pointillés). f 2 f 2 r D D y/w 2 C B pente=-w 1 /w 2 r C B satisfiable insatisfiable A A f 1 f 1 Fig. 3 : Interprétation graphique de la méthode des poids (à gauche) et de la méthode des contraintes (à droite) La méthode des contraintes Une autre technique qui n est pas biaisée par les portions convexes de la frontière optimale de Pareto transforme k 1 des k objectifs en contraintes. L objectif restant, qui peut être choisi arbitrairement, est la fonction d objectif du POU qui en résulte : maximiser y = f( x) = fh( x) sachant que ei( x) = fi( x) ε i, (1 i k, i h) (1.10) et x X f Les limites inférieures, ε i, sont les paramètres qui sont changés par l optimiseur dans le but de trouver plusieurs solutions optimales de Pareto. 10

12 Comme décrit dans la figure 3, sur la droite, la méthode des contraintes est capable d obtenir des solutions associées avec des parties non-convexes de la courbe des compromis. Avec h = 1 et ε 2 = r (ligne continue), cela rend la solution représentée par le point A insatisfiable en regard à l ensemble étendu des contraintes, tandis que le vecteur de décision relatif au point B maximise f parmi les solutions restantes. La figure 3 montre également un problème avec cette technique. Si les limites inférieures ne sont pas choisies de façon appropriée ( ε 2 = r' ), le nouvel ensemble de satisfaisabilité obtenu peut être vide, c est à dire, qu il n y a pas de solutions au POU correspondant. Dans le but d éviter cette situation, un échantillon adéquat de valeurs pour les ε i doit être déterminé avant le processus Discussion sur les méthodes classiques Ce qui rend les méthodes traditionnelles attractives et la raison pour laquelle elles sont populaires peut être attribuée au fait que des algorithmes éprouvés pour les POU peuvent être employés avec les POM. La section précédente sur les méthodes des poids et des contraintes montre que certaines difficultés peuvent également apparaître dans les stratégies d optimisation classiques. Certaines méthodes, dont la méthode des poids, peuvent être sensibles à la forme de la frontière de Pareto. Une connaissance du problème peut être requise, mais celle-ci n est pas toujours disponible. De plus, les méthodes classiques ont toutes en commun qu elles requièrent plusieurs étapes d optimisation pour obtenir une approximation de l ensemble optimal de Pareto. Récemment, les algorithmes évolutionnaires se sont révélés une alternative aux méthodes classiques grâce i) à leur faculté à exploiter de vastes espaces de recherche et ii) des compromis multiples peuvent être générés en une seule étape d optimisation. De plus, ils peuvent être implémentés de façon à éviter les deux problèmes mentionnés précédemment. 1.3 Les algorithmes évolutionnaires Le terme d algorithme évolutionnaire (AE) est relatif à une classe de méthodes d optimisation stochastiques qui simulent le processus de l évolution naturelle. Les origines des algorithmes évolutionnaires remontent à la fin des années 50, et depuis 1970, plusieurs méthodes évolutionnaires ont été proposées, principalement concernants les algorithmes génétiques, la programmation génétique et les stratégies d évolution [10]. Toutes ces approches opèrent sur un ensemble de solutions candidates. Utilisant d importantes simplifications, cet ensemble est successivement modifié par deux principes de l évolution : la sélection et la variation. La sélection représente la compétition pour les ressources parmi les êtres vivants. Certains sont meilleurs que d autres et sont plus aptes à survivre et à transmettre leur matériel génétique. Dans les algorithmes évolutionnaires, la sélection naturelle est simulée par un processus de sélection stochastique. Chaque solution a une chance de se reproduire un certain nombre de fois, dépendant de leur qualité (fitness). Donc, la qualité est estimée en évaluant les individus et en leur assignant une valeur de fitness. L autre principe, 11

13 la variation, imite la capacité naturelle de créer de «nouveaux» êtres vivants au moyen du croisement et de la mutation. Bien que les principes sous-jacents soient simples, ces algorithmes s avèrent être des mécanismes de recherche généraux, puissants et robustes. De plus, les AE semblent être spécialement utiles en optimisation multi-objective car ils sont capables de déterminer plusieurs solutions optimales de Pareto en une seule exécution et peuvent exploiter les similarités des solutions par croisement. Certains chercheurs suggèrent que la recherche multi-objective et l optimisation peuvent être des problèmes où les AE font mieux que les autres méthodes de recherche aveugles [11, 12]. Ces algorithmes sont appelés algorithmes évolutionnaires à objectifs multiples (AEOM). Après les premières études sur les AEOM dans le milieu des années 80 [13, 14, 15], quelques implémentations différentes des AEOM furent proposées en [16, 17, 18, 19, 20]. Plus tard, ces approches (et des variations de celles-ci), ont été appliquées avec succès à divers problèmes d optimisation multi-objectifs [12, 21, 22, 23, 24]. Récemment, certains chercheurs ont étudié certaines formes de recherches évolutionnaires multi-objectifs, telle que la convergence vers la frontière de Pareto [25, 26], les niches écologiques [27] et l élitisme [24, 27] pendant que d autres se sont concentrés sur le développement de techniques évolutionnaires [28, 29]. 2. Les algorithmes évolutionnaires pour l optimisation multi-objectifs En raison de leur parallélisme inhérent, les AE ont la capacité à trouver plusieurs solutions optimales de Pareto en une seule exécution. Cependant, avec de nombreuses applications complexes, il est impossible de générer des solutions non-inférieures. Donc, le but de l optimisation pour les POM peut être reformulé de façon plus générale, basé sur trois objectifs : La distance de la frontière non-dominée à la frontière optimale de Pareto doit être minimisée. Une bonne (et le plus souvent uniforme) distribution des solutions trouvées est souhaitable. L étendue de la frontière non-dominée obtenue doit être maximisée, c est à dire que pour chaque objectif, un large intervalle de valeurs doit être couvert par les solutions non-dominées. Le sujet de ce chapitre concerne la manière dont ces trois buts peuvent être atteints en recherche évolutionnaire multi-objective. Après que la terminologie de base et la présentation de l AE général aient été soulignées dans la section 2.1, les idées fondamentales de AEOM sont introduites dans la section suivante, où en particulier les différences entre l optimisation évolutionnaire mono-objectif et multi-objectifs sont présentées. La section 2.4 introduit un nouvel AEOM qui combine plusieurs caractéristiques des précédents optimiseurs évolutionnaires multi-objectifs d une manière unique, et dans la dernière section un mécanisme pour éviter la perte de le solutions non-dominées durant le processus de recherche est proposé. 12

14 2.1 Principes de base des algorithmes évolutionnaires En général, un AE est caractérisé par trois faits : 1. Un ensemble de solutions candidates est maintenu, 2. celui-ci subi un processus de sélection et 3. est manipulé par des opérateurs génétiques, le plus souvent le croisement et la mutation. Par analogie avec l évolution naturelle, les solutions candidates sont appelées individus, et l ensemble des solutions candidates est appelé la population. Chaque individu représente un solution possible, c est à dire, dans un sens, représente un vecteur de décision du problème. Cependant, un individu n est pas à proprement parlé un vecteur de décision mais encode plutôt un vecteur de décision selon une structure appropriée. Cette structure est supposée être un vecteur, un vecteur de bits ou bien un vecteur de réels, bien que d autres structures comme les arbres [30] peuvent également être utilisées ; l ensemble de tous les vecteurs possibles constitue l espace des individus I. Dans cette terminologie, la population est un ensemble de vecteurs i I, pour être plus précis, un ensemble multiple de vecteurs puisque il peut contenir plusieurs individus identiques. Dans le processus de sélection, qui peut être soit stochastique, soit totalement déterministe, les individus de faible qualité sont supprimés de la population, tandis que les individus de haute qualité sont reproduits. Le but est de diriger la recherche sur certaines portions de l espace de recherche et d augmenter la qualité moyenne à l intérieur de la population. La qualité d un individu est représentée par une valeur numérique, également appelée fitness. Notons que puisque la qualité est relative à la fonction d objectifs et aux contraintes, un individu doit d abord être décodé avant que sa fitness puisse être calculée. Cette situation est illustrée dans la figure 4. Soit un individu i I. Une fonction de mapping m encapsule l algorithme de décodage pour obtenir le vecteur de décision x = m(i) à partir de i. Appliquer f à x fournie le vecteur d objectifs correspondant sur la base duquel une valeur de fitness est assignée à i. Le croisement et la mutation ont pour but la génération de nouveaux candidats à l intérieur de l espace de recherche par la variation des solutions existantes. L opérateur de croisement prend un certain nombre de parents et crée un certain nombre d enfants par recombinaison des parents. Pour imiter la nature stochastique de l évolution, une probabilité de croisement est associée à cet opérateur. En contraste, l opérateur de mutation modifie les individus en changeant certains portions du vecteur de décision associé selon une probabilité de mutation donnée. Le croisement et la mutation s appliquent à des individus, c est à dire dans l espace de recherche, et non sur les vecteurs de décision décodés. Basé sur les précédents concepts, l évolution naturelle est simulée par un processus itératif. D abord, une population initiale est créée de manière aléatoire (ou selon un schéma prédéfini). Cette population est le point de départ du processus d évolution. Ensuite une boucle consistant en les étapes d évaluation (assignation des valeurs de fitness aux individus), de sélection, de croisement et/ou de mutation est exécutée un certain nombre de fois. Chaque itération est appelé une génération, et souvent un nombre maximum prédéfini de génération sert de critère de terminaison de la boucle. Mais d autres conditions, stagnation dans la population ou existence d individus de valeur de fitness suffisante, peuvent être utilisées pour 13

15 stopper l exécution. A la fin, le/les meilleur(s) individu(s) dans la population ou celui/ceux trouvé(s) durant le processus d évolution tout entier est/sont le résultat de l exécution de l AE. Dans ce qui suit, la structure basique d un AE est formalisée. La population P à une certaine génération t est présentée par le symbole P t, et le symbole + est utilisé comme opérateur d union ensembliste. Fonction de mapping m x=m(i) Fonction d objectif f y=f(x) individu i vecteur de décision x vecteur d objectif y Espace I des individus Espace X de décision Espace Y des objectifs Fig. 4 : Relation entre espace des individus, espace de décision et espace des objectifs. Algorithme 1 : (AE général) Entrée : N T p c p m (taille de la population) (nombre maximum de générations) (probabilité de croisement) (probabilité de mutation) Sortie : A (ensemble non dominé) Etape 1 : Initialisation : Soient P 0 = {} et t = 0. Pour c = 1,, N faire : a) Choisir i I de façon aléatoire. b) P 0 = P 0 + { i }. Etape 2 : Affectation d une valeur de fitness. Pour chaque individu i P t, déterminer le vecteur de décision x = m(i) ainsi que le vecteur d objectif y = f(x) et calculer la valeur de fitness F(i). Etape 3 : Sélection. Soit P = {}. Pour c = 1,, N faire : a) Sélectionner un individu i P t selon un schéma donné basé sur sa valeur de fitness F(i). b) P = P + {i}. La population temporaire P est appelée le groupe de reproduction. 14

16 Etape 4 : Croisement. Soit P = {}. Pour c = 1,, N faire : 2 a) Choisir deux individus i et j P et les supprimer de P. b) Croiser i et j. Les descendants résultants sont k et l tels que k, l I. c) Ajouter k et l à P avec la probabilité p c. Autrement ajouter i et j à P. Etape 5 : Mutation. Soit P = {}. Pour chaque individu i P faire : a) Muter i avec la probabilité de mutation p m. L individu résultant est j tel que j I. b) P = P + {j}. Etape 6 : Terminaison. Soit P t+1 = P et t = t + 1. Si t T ou un autre critère de terminaison est satisfait, alors A = p(m(p t )) sinon aller à l étape 2. Il doit être souligné que cet algorithme ne reflète pas un algorithme génétique dans sa forme la plus générale, la taille de la population pouvant être non constante et le croisement pouvant impliquer plus de deux individus. De plus, un grand nombre d opérateurs de sélection, de croisement et de mutation ont été proposés pour différentes représentations ou applications qui ne sont pas présentées ici. 2.2 Problèmes clés dans la recherche multi-objectifs Comme mentionné au début de ce chapitre, avec un POM, l objectif d optimisation lui-même consiste en plusieurs objectifs. Etant donné les trois objectifs présentés au début du chapitre 2, deux problèmes majeurs doivent être abordés lorsqu un AE est appliqué à l optimisation multi-objectifs : 1. Comment accomplir l assignation de la valeur de fitness à un individu ainsi que la sélection, respectivement, dans le but de guider la recherche vers l ensemble optimal de Pareto? 2. Comment maintenir une population diversifiée dans le but de prévenir une convergence prématurée et obtenir un ensemble bien distribué et bien étendu? Dans ce qui suit, une catégorisation de techniques générales qui traitent ces problèmes est présentée. Un autre problème, l élitisme, est brièvement abordé étant donné qu il est plus complexe avec les POM qu avec les POU Assignation de valeur de fitness et sélection En contraste avec l optimisation à objectif unique, où la fonction d objectif et la fonction de fitness sont souvent identiques, l assignation de la valeur de fitness et la sélection doivent considérer plusieurs objectifs en optimisation multi-objectifs. En général, on peut distinguer les AEOM (AE à optimisation multi-objectifs) où les objectifs sont considérés séparément, approches qui sont basées sur les techniques classiques d aggrégation, et les méthodes qui utilisent directement le concept de la domination de Pareto. 15

17 Sélection par échange des objectifs Au lieu de combiner les objectifs en une unique valeur de fitness, cette catégorie de AEOM échange les objectifs pendant la phase de sélection. Chaque fois qu un individu est choisi pour la reproduction, un objectif différent permet de décider quel membre de la population va être copié dans le groupe de reproduction. En conséquence, les étapes 2 et 3 de l AE général précédent, sont souvent intégrées ou exécutées alternativement. Par exemple, Schaffer [14] a proposé de remplir des portions égales du groupe de reproduction suivant les différents objectifs, tandis que Fourman [15] a implémenté un schéma de sélection où les individus sont comparés selon un ordre établi (ou aléatoire) sur les objectifs. Plus tard, Kursawe [16] a suggéré d assigner une probabilité à chaque objectif ce qui détermine si l objectif sera le critère de tri dans la prochaine étape de sélection les probabilités peuvent être définies par l utilisateur ou choisies aléatoirement dans le temps. Toutes ces approches peuvent avoir un biais vers les solutions «extrêmes» et être sensibles à des frontières optimales de Pareto non convexes [8] Sélection par agrégation avec variation des paramètres D autres implémentations d AEOM sont basées sur les techniques traditionnelles pour générer des compromis de surfaces de Pareto (cf. section 1.2). Avec ces méthodes, les objectifs sont agrégés en une seule fonction d objectifs paramétrée ; cependant, les paramètres de cette fonction ne sont pas changés pour différentes exécutions de l AE, mais varient pendant une même exécution. Certaines approches [17, 21], par exemple, utilisent la méthode des poids. Puisque chaque individu est supposé utiliser une combinaison particulière de poids (soit encodé dans l individu ou bien choisie aléatoirement), tous les membres de la population sont évalués par différentes fonctions d objectif. En conséquence, l optimisation est effectuée dans plusieurs directions simultanément. Néanmoins, les inconvénients potentiels de la méthode de scalarisation sous-jacente, (un biais vers les potions convexes de la frontière optimale de Pareto), peuvent restreindre l efficacité de tels AEOM [31] Sélection basée sur Pareto Le concept de calculer la fitness d un individu sur la base de la domination de Pareto fût suggéré par Goldberg pour la première fois en 1989 [32]. Il présenta un «croquis révolutionnaire en 10 lignes» [33] d une procédure itérative de classification : d abord tous les individus non-dominés sont assignés du rang un et temporairement effacés de la population. Ensuite, les individus non-dominés suivants, sont assignés du rang deux et ainsi de suite. Finalement, le rang d un individu détermine sa valeur de fitness. Ce qui est remarquable ici, c est que le fait que la valeur de fitness est relative à la population entière, tandis qu avec les autres techniques d agrégation, la valeur de fitness d un individu est calculée indépendamment des autres individus. Cette idée a été utilisée par de nombreux chercheurs, induisant plusieurs schémas d assignation de valeur de fitness basée sur Pareto [18, 19, 20]. Bien que cette catégorie d AEOM soit théoriquement capable de trouver n importe quelle solution optimale de Pareto, les dimensions de l espace de recherche peuvent influencer les performances de l algorithme, comme il est suggéré dans [11] : 16

18 «[ ] on ne peut pas attendre des AE basés sur Pareto qu ils fonctionnent bien sur les problèmes faisant intervenir de nombreux objectifs concurrents, ils peuvent simplement ne pas parvenir à produire des solutions satisfaisantes étant donné les grandes dimensions mises en œuvre et la taille de la surface de Pareto.» Cependant, les techniques basées sur Pareto semblent être les plus populaires dans le domaine de l optimisation multi-objectifs [25] Diversité de la population Dans le but d approximer l ensemble optimal de Pareto en une seule exécution, les optimiseurs évolutionnaires doivent effectuer une recherche multimodale où de multiples solutions largement différentes les unes des autres doivent être trouvées. Donc, maintenir une diversité dans la population est crucial pour l efficacité de l AEOM. Malheureusement, un simple AE a tendance à converger vers une solution unique et perd souvent les autres solutions en raison de trois effets [34] : 1) la pression de la sélection, 2) le bruit de la sélection, 3) la perturbation due aux opérateurs. La pression de la sélection représente le temps au bout duquel la population est complètement remplie par le même individu lorsque seulement la sélection est utilisée [35]. Le bruit de la sélection est relatif à la discordance d un schéma de sélection, tandis que la perturbation due aux opérateurs représente les effets destructeurs que le croisement et la mutation peuvent avoir (les individus de grandes qualité peuvent être perturbés). Pour surmonter ce problème, plusieurs méthodes ont été développées ; les plus fréquemment utilisées en optimisation évolutionnaire multi-objectifs sont brièvement résumé ici Partage de la fitness Le partage de la fitness [36], qui est la technique la plus souvent utilisée, a pour but de promouvoir la formulation et la maintenance de sous-populations stables (niches). Ceci est basé sur l idée que les individus dans une niche particulière, ont à se partager les ressources disponibles. Plus des individus sont localisés dans le voisinage d un certain individu, plus leurs valeurs de fitness sont dégradées. Le voisinage est défini en terme de distance d(i, j) et spécifié par le rayon de niche σ share. Mathématiquement, la valeur de fitness partagée F(i) d un individu i P est égale à son ancienne valeur de fitness F (i) divisée par son compte de niches : F' ' ( i) F( i) = (2.1) s( d( i, j)) j P Le compte de niche d un individu est la somme des valeurs de la fonction de partage (s) entre lui-même et les autres individus de la population. Une fonction de partage couramment utilisée est : 17

19 α d( i, j) s( d( i, j)) = 1 σ si d(i, j) < σ share et 0 sinon (2.2) share De plus, selon comme la fonction de distance d(i, j) est définie, on peut distinguer trois types de partage : 1) partage de fitness dans l espace des individus : d( i, j) = i j, 2) partage de fitness dans l espace de décision : d( i, j) = m( i) m( j) et 3) partage de fitness dans l espace des objectifs : d( i, j) = f( m( i)) f( m( j)) où. est une métrique de distance appropriée. Couramment, la plupart des AEOM implémentent le partage de fitness [17, 18, 19, 20, 22, 37, 38] Restriction de la reproduction De façon générale, deux individus sont choisis pour se reproduire seulement s ils sont à une certaine distance l un de l autre (donnée par le paramètre σ share ). Comme abordé précédemment, avec le partage de fitness, la distance entre deux individus peut être définie dans l espace des individus, dans l espace de décision ou dans l espace des objectifs. Ce mécanisme permet d éviter la formation d individus mortels et donc améliore les performances. Néanmoins, comme mentionné dans [11], cela ne semble pas répendu dans le domaine des AEOM [17, 18, 39] Isolation par la distance Ce type de mécanisme de diversification assigne à chaque individu une position [40] où en général deux approches peuvent être distinguées. Soit, une structure spatiale est définie sur une population de telle manière que des niches spatiales peuvent évoluer dans la même population, soit il existe plusieurs populations distinctes qui échangent uniquement occasionnellement des individus (migration). Poloni [41], par exemple, utilise un AE distribué avec plusieurs petites populations, tandis que Laumanns, Rudolph et Schwefel [29] ont structuré la population par l emploi d un graphe, un tore à deux dimensions, où chaque individu est associé à un nœud différent La surspécification Avec cette méthode, l individu contient des parties actives et des parties inactives : les premières spécifient le vecteur de décision, les dernières sont redondantes et ont aucune fonction. Puisque les parties inactives peuvent devenir actives et vice et versa durant l évolution, l information peut être cachée dans un individu. La diploïdie [32] est un exemple de surspécification qui est utilisée dans l AEOM proposé par Kursawe dans [16]. 18

20 La réinitialisation Un autre technique pour prévenir la convergence prématurée est de réinitialiser la totalité ou certaines parties de la population après un certain temps ou à chaque fois que la recherche stagne. Par exemple, Fonseca et Fleming [42] ont présenté une formulation unifiée d optimisation évolutionnaire multi-objectifs où à chaque génération un petit nombre d individus immigrants choisis aléatoirement est introduit dans la population L entassement Finalement, l entassement [43] et ses dérivés semblent être rarement implémentés dans les AEOM [44]. Ici, les nouveaux individus (les enfants) remplacent les individus similaires dans la population. En contraste avec l algorithme 1, la population n est pas entièrement soumise à la sélection, au croisement et à la mutation mais seulement quelques individus sont considérés à la fois L élitisme De Jong [43] a suggéré de toujours inclure le meilleur individu de la population P t dans la population P t+1 dans le but de prévenir sa perte due aux effets d échantillonnage ou aux perturbations des opérateurs. Cette stratégie, qui peut être étendue en copiant les b meilleures solutions à la génération suivante, est appelé élitisme. Dans ses expérimentations, De Jong a trouvé que l élitisme peut améliorer les performances d un algorithme génétique sur des fonctions unimodales, tandis qu avec les fonctions multimodales, il peut causer une convergence prématurée. En optimisation évolutionnaire multi-objectifs, l élitisme joue un rôle important. L incorporation de l élitisme dans un AEOM est plus complexe qu en optimisation mono-objectifs. Au lieu d un meilleur individu, il y a un ensemble d élites dont la taille peu être considérable comparée à celle de la population, par exemple, lorsque l ensemble optimal de Pareto contient un nombre infini de solutions. Ce fait met en évidence deux questions dans ce contexte : 1) Population ensemble d élites : Quels individus sont pris pour aller dans l ensemble d élites et pour combien de temps? 2) Ensemble d élites population : Quand et comment les membres de l ensemble d élites sont réinsérés dans la population? En général, deux approches basiques d élitisme peuvent être rencontrées dans la littérature sur les AEOM. Une stratégie qui utilise directement l idée de De Jong, consiste à copier les individus de la population P t vers la population P t+1 dont les vecteurs de décisions sont nondominés [45]. Quelquefois, une variante plus restrictive est implémentée où seulement les k individus dont les vecteurs de décisions correspondants maximisent un des k objectifs constituent l ensemble d élites [38, 46, 47]. La sélection dénommé «sélection ( λ + µ )» principalement utilisée dans le domaine des stratégies d évolution [35], appartient à cette classe de stratégies d élitisme. Par exemple, Rudolph [26] a examiné une version simplifiée de l AEOM présenté dans [16] qui est basé sur la sélection (1 + 1). 19

21 Un concept également souvent utilisé consiste à maintenir un ensemble externe P d individus dont les vecteurs de décision sont non-dominés parmi toutes les solutions générées. Dans chaque génération, un certain pourcentage de la population est remplacé par les membres de l ensemble externe ces membres sont soit sélectionnés de manière aléatoire [21, 48], soit suivant d autres critères, tels que la période pendant laquelle un individu est resté dans l ensemble [24]. Puisque l ensemble externe peut être considérablement plus grand que la population, Parks et Miller [24] permettent à un individu d être copié dans cet ensemble uniquement si celui-ci est suffisamment di-similaire avec tous les membres de l ensemble d élites. Occasionnellement, les deux approches ci-dessus sont appliquées en même temps [38, 47]. 3. Obtention et analyse de nuages de points présentant des frontières de Pareto L objectif de ce chapitre est la présentation de plusieurs graphes obtenus à partir de différents critères présentés par des ensembles d individus utilisés dans un algorithme génétique appliqué à la classification ; l analyse de certains de ces graphes est faite lorsque ceux-ci présentent une frontière de Pareto. Ces graphes joints en annexes fournissent les représentations d individu dans le plan suivant deux critères par graphe. Chaque losange sur un graphe représente un individu dont l ensemble des gènes est initialisé de manière aléatoire. La position d un individu dans le plan dépendant des valeurs des deux critères le caractérisant. Les critères utilisés sont le support, la confiance, la sensibilité, la spécificité, la couverture et la J-Mesure. L objectif étant d optimiser simultanément les deux critères. Le tableau cidessous présente les différents couples de critères formés ainsi que les numéros des figures correspondantes. yy xx Confiance Support Sensibilité Spécificité Couverture J-Mesure Confiance Support Figures 1a et 1b Sensibilité Figures 2a et 2b Figures 6a et 6b Spécificité Figures 3a et 3b Figures 7a et 7b Figures 10a et 10b Couverture Figures 4a et 4b Figures 8a et 8b Figures 11a et 11b Figures 13a et 13b J-Mesure Figures 5a et 5b Figures 9a et 9b Figures 12a et 12b Figures 14a et 14b Figures 15a et 15b Les quinze couples de critères utilisés pour obtenir les graphes Ce chapitre présente une description de la base à partir de laquelle les critères des chromosomes sont calculés et une description des individus utilisés. Ensuite la sémantique de chacun des critères utilisés ainsi qu une définition formelle de ceux-ci sont abordées. Pour finir, une interprétation des graphes présentant une surface de Pareto est effectuée. 20

22 3.1 Description de la base utilisée La base comporte des descriptions d espèces vivantes selon quinze caractéristiques (exemple : le fait d avoir des plumes, de pondre des œufs, d être domestique ) Chacune de ces caractéristiques est représentée par un attribut binaire. Chaque description appartient à une des sept classes suivantes : amphibien, oiseau, poisson, insecte, invertébré, mammifère et reptile Description d un individu Un individu, qui dans le cas présent est un chromosome comportant au moins un gène, représente une règle de classification. Sa forme est la suivante : I : A C avec : I : l individu A : l antécédent de la règle qui est de la forme : Gi... Gj avec i < j et où Gk est le k ème gène a valeur binaire de l individu. Si la valeur de ce gène est «vraie», l individu a la caractéristique correspondante et inversement si la valeur de ce gène est «false». C : la classe prédite par la règle Sémantiques et définitions des critères utilisés Support - Sémantique : Le support d un chromosome I, noté Supp(I) représente la proportion d entrées e de la base B contenant I. - Définition : { e B / I e } Supp(I) = B avec B le nombre d entrées dans B Confiance - Sémantique : La confiance d un chromosome I, notée Conf(I) représente la probabilité que la règle représentée par le chromosome I prédise la classe C sachant A est vérifié. - Définition : Conf(I) = Supp( A C) Supp( A) avec Supp(A C) = Supp(I). 21

23 Sensibilité - Sémantique : La sensibilité d un individu I notée Se(I) représente la proportion d entrées de la base qui sont bien classées par la règle représentée par l individu I. - Définition : Soient les critères suivants utilisés pour calculer la sensibilité et la spécificité : V p (vrai positif) : le nombre de fois où la règle prédit C sachant que A est vrai ; F p (faux positif) : le nombre de fois où la règle prédit C sachant que A est faux ; V n (vrai négatif) : le nombre de fois où la règle ne prédit pas C sachant que A est vrai ; F n (faux négatif) : le nombre de fois où la règle ne prédit pas C sachant que A est faux. Se( I) = Vp Vp + Fn La présence de V p au dénominateur se justifie pour normaliser Se(I) Spécificité - Sémantique : La sensibilité d un individu I notée Sp(I) représente la proportion d entrées de la base qui sont mal classées par la règle représentée par l individu I. - Définition : Sp( I) = Vn Vn + Fp La présence de V n au dénominateur se justifie pour normaliser Sp(I) Couverture - Sémantique : La couverture (qui est le «contraire» de la confiance) d un chromosome I, notée couv(i) représente la probabilité que la règle représentée par le chromosome I ait A vrai sachant que la classe C est prédite. - Définition : Couv(I) = Supp(A C) / Supp(C) 22

24 J-Mesure - Sémantique : La J-Mesure d un individu I permet de mesurer le degré d intérêt de la règle représentée par cet individu. - Définition : J-Mesure(I) = P(A).a avec : a = Conf( I) Conf( I). log Supp( C) + (1 1 Conf( I) Conf( I)). log 1 Supp( C) et P(A) la probabilité d avoir A. Le terme P(A) favorise la généralité de la règle car plus ce terme est proche de un, plus la règle est «présente». 3.4 Interprétation des graphes Chaque graphe présente les deux critères utilisés ainsi que le coefficient de corrélation du nuages de points. Chaque nuages est composé de points, cette valeur ayant été choisie arbitrairement. Dans le but de pouvoir apprécier la distribution des points dans le plan, il est nécessaire d éviter que plusieurs individus n aient les mêmes critères, ceux-ci sont bruités par l ajout d une valeur δ avec δ [... ] ; la valeur 1 ayant 50 été déterminé de manière empirique ; en effet, c est une des valeurs offrant une bonne lisibilité des points sur le graphe. Le fait que plusieurs individus pourtant différents aient les mêmes critères, est dû à la petite dimension de la base comparativement au nombre de points obtenus pour tracer les graphes. Parmi les quinze graphes joints, seuls les graphes des figures 2a, 2b, 12a et 12b présentent des surfaces de Pareto et c est eux qui nous intéressent ici. Les autres graphes mettant simplement en évidence des couples de critères qui sont de «mauvais» candidats à l optimisation multiobjectifs étant donné qu un critère ayant été optimisé (voir maximisé) ne sera pas pénalisé si l autre critère est lui aussi optimisé (voir maximisé) Chaque figure comporte deux graphes : un représentant les individus prédisant la classe «mammifère» de la base et l autre prédisant la classe «oiseau». La première classe étant la classe la plus présente dans la base. Ce choix n a pas de raison autre que celui d insister sur le fait que l aspect global d un nuage pour deux critères (dans le cas présent), est indépendant de la classe prédite mais dépendant des critères employés Interprétation des graphes de la figure 2 Les deux critères utilisés sont la confiance (en abscisse) et la sensibilité. Une grande quantité d individus ont une confiance maximale pour une sensibilité inférieure ou égale à 0.45 environ (en ce qui concerne la classe «mammifère») et inférieure ou égale à 0.22 environ (en ce qui concerne la classe «oiseau»). Au niveau de la frontière de Pareto, lorsque la confiance 23

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

Résolution d équations non linéaires

Résolution d équations non linéaires Analyse Numérique Résolution d équations non linéaires Said EL HAJJI et Touria GHEMIRES Université Mohammed V - Agdal. Faculté des Sciences Département de Mathématiques. Laboratoire de Mathématiques, Informatique

Plus en détail

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications A. Optimisation sans contrainte.... Généralités.... Condition nécessaire et condition suffisante

Plus en détail

Coup de Projecteur sur les Réseaux de Neurones

Coup de Projecteur sur les Réseaux de Neurones Coup de Projecteur sur les Réseaux de Neurones Les réseaux de neurones peuvent être utilisés pour des problèmes de prévision ou de classification. La représentation la plus populaire est le réseau multicouche

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

Chapitre 2 Le problème de l unicité des solutions

Chapitre 2 Le problème de l unicité des solutions Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)

Plus en détail

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

La survie nette actuelle à long terme Qualités de sept méthodes d estimation La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories : La vision nous permet de percevoir et d interpreter le monde qui nous entoure. La vision artificielle a pour but de reproduire certaines fonctionnalités de la vision humaine au travers de l analyse d images.

Plus en détail

CHAPITRE 5. Stratégies Mixtes

CHAPITRE 5. Stratégies Mixtes CHAPITRE 5 Stratégies Mixtes Un des problèmes inhérents au concept d équilibre de Nash en stratégies pures est que pour certains jeux, de tels équilibres n existent pas. P.ex.le jeu de Pierre, Papier,

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Raisonnement probabiliste

Raisonnement probabiliste Plan Raisonnement probabiliste IFT-17587 Concepts avancés pour systèmes intelligents Luc Lamontagne Réseaux bayésiens Inférence dans les réseaux bayésiens Inférence exacte Inférence approximative 1 2 Contexte

Plus en détail

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé Baccalauréat S/L Métropole La Réunion 13 septembre 2013 Corrigé A. P. M.. P. XRCIC 1 Commun à tous les candidats Partie A 1. L arbre de probabilité correspondant aux données du problème est : 0,3 0,6 H

Plus en détail

Théorie et Codage de l Information (IF01) exercices 2013-2014. Paul Honeine Université de technologie de Troyes France

Théorie et Codage de l Information (IF01) exercices 2013-2014. Paul Honeine Université de technologie de Troyes France Théorie et Codage de l Information (IF01) exercices 2013-2014 Paul Honeine Université de technologie de Troyes France TD-1 Rappels de calculs de probabilités Exercice 1. On dispose d un jeu de 52 cartes

Plus en détail

Optimisation, traitement d image et éclipse de Soleil

Optimisation, traitement d image et éclipse de Soleil Kléber, PCSI1&3 014-015 I. Introduction 1/8 Optimisation, traitement d image et éclipse de Soleil Partie I Introduction Le 0 mars 015 a eu lieu en France une éclipse partielle de Soleil qu il était particulièrement

Plus en détail

La demande Du consommateur. Contrainte budgétaire Préférences Choix optimal

La demande Du consommateur. Contrainte budgétaire Préférences Choix optimal La demande Du consommateur Contrainte budgétaire Préférences Choix optimal Plan du cours Préambule : Rationalité du consommateur I II III IV V La contrainte budgétaire Les préférences Le choix optimal

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

La programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique

La programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique La programmation linéaire : une introduction Qu est-ce qu un programme linéaire? Qu est-ce qu un programme linéaire? Exemples : allocation de ressources problème de recouvrement Hypothèses de la programmation

Plus en détail

Programmation linéaire

Programmation linéaire Programmation linéaire DIDIER MAQUIN Ecole Nationale Supérieure d Electricité et de Mécanique Institut National Polytechnique de Lorraine Mathématiques discrètes cours de 2ème année Programmation linéaire

Plus en détail

3 Approximation de solutions d équations

3 Approximation de solutions d équations 3 Approximation de solutions d équations Une équation scalaire a la forme générale f(x) =0où f est une fonction de IR dans IR. Un système de n équations à n inconnues peut aussi se mettre sous une telle

Plus en détail

Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires

Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires Julien Jorge julien.jorge@univ-nantes.fr Laboratoire d Informatique de Nantes Atlantique,

Plus en détail

Agrégation des portefeuilles de contrats d assurance vie

Agrégation des portefeuilles de contrats d assurance vie Agrégation des portefeuilles de contrats d assurance vie Est-il optimal de regrouper les contrats en fonction de l âge, du genre, et de l ancienneté des assurés? Pierre-O. Goffard Université d été de l

Plus en détail

Programmation linéaire

Programmation linéaire 1 Programmation linéaire 1. Le problème, un exemple. 2. Le cas b = 0 3. Théorème de dualité 4. L algorithme du simplexe 5. Problèmes équivalents 6. Complexité de l Algorithme 2 Position du problème Soit

Plus en détail

aux différences est appelé équation aux différences d ordre n en forme normale.

aux différences est appelé équation aux différences d ordre n en forme normale. MODÉLISATION ET SIMULATION EQUATIONS AUX DIFFÉRENCES (I/II) 1. Rappels théoriques : résolution d équations aux différences 1.1. Équations aux différences. Définition. Soit x k = x(k) X l état scalaire

Plus en détail

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Baccalauréat ES/L Amérique du Sud 21 novembre 2013 Baccalauréat ES/L Amérique du Sud 21 novembre 2013 A. P. M. E. P. EXERCICE 1 Commun à tous les candidats 5 points Une entreprise informatique produit et vend des clés USB. La vente de ces clés est réalisée

Plus en détail

ALGORITHME GENETIQUE ET MODELE DE SIMULATION POUR L'ORDONNANCEMENT D'UN ATELIER DISCONTINU DE CHIMIE

ALGORITHME GENETIQUE ET MODELE DE SIMULATION POUR L'ORDONNANCEMENT D'UN ATELIER DISCONTINU DE CHIMIE ALGORITHME GENETIQUE ET MODELE DE SIMULATION POUR L'ORDONNANCEMENT D'UN ATELIER DISCONTINU DE CHIMIE P. Baudet, C. Azzaro-Pantel, S. Domenech et L. Pibouleau Laboratoire de Génie Chimique - URA 192 du

Plus en détail

CHOIX OPTIMAL DU CONSOMMATEUR. A - Propriétés et détermination du choix optimal

CHOIX OPTIMAL DU CONSOMMATEUR. A - Propriétés et détermination du choix optimal III CHOIX OPTIMAL DU CONSOMMATEUR A - Propriétés et détermination du choix optimal La demande du consommateur sur la droite de budget Résolution graphique Règle (d or) pour déterminer la demande quand

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

F7n COUP DE BOURSE, NOMBRE DÉRIVÉ

F7n COUP DE BOURSE, NOMBRE DÉRIVÉ Auteur : S.& S. Etienne F7n COUP DE BOURSE, NOMBRE DÉRIVÉ TI-Nspire CAS Mots-clés : représentation graphique, fonction dérivée, nombre dérivé, pente, tableau de valeurs, maximum, minimum. Fichiers associés

Plus en détail

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation

Plus en détail

Modernisation et gestion de portefeuilles d applications bancaires

Modernisation et gestion de portefeuilles d applications bancaires Modernisation et gestion de portefeuilles d applications bancaires Principaux défis et facteurs de réussite Dans le cadre de leurs plans stratégiques à long terme, les banques cherchent à tirer profit

Plus en détail

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme? Exercices Alternatifs Quelqu un aurait-il vu passer un polynôme? c 2004 Frédéric Le Roux, François Béguin (copyleft LDL : Licence pour Documents Libres). Sources et figures: polynome-lagrange/. Version

Plus en détail

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme? Exercices Alternatifs Quelqu un aurait-il vu passer un polynôme? c 2004 Frédéric Le Roux, François Béguin (copyleft LDL : Licence pour Documents Libres). Sources et figures: polynome-lagrange/. Version

Plus en détail

IFT3245. Simulation et modèles

IFT3245. Simulation et modèles IFT 3245 Simulation et modèles DIRO Université de Montréal Automne 2012 Tests statistiques L étude des propriétés théoriques d un générateur ne suffit; il estindispensable de recourir à des tests statistiques

Plus en détail

Correction du baccalauréat ES/L Métropole 20 juin 2014

Correction du baccalauréat ES/L Métropole 20 juin 2014 Correction du baccalauréat ES/L Métropole 0 juin 014 Exercice 1 1. c.. c. 3. c. 4. d. 5. a. P A (B)=1 P A (B)=1 0,3=0,7 D après la formule des probabilités totales : P(B)=P(A B)+P(A B)=0,6 0,3+(1 0,6)

Plus en détail

Le montant des garanties constituées aux fins du STPGV est-il excessif?

Le montant des garanties constituées aux fins du STPGV est-il excessif? Le montant des garanties constituées aux fins du STPGV est-il excessif? Kim McPhail et Anastasia Vakos* L e système canadien de transfert des paiements de grande valeur (STPGV) sert à effectuer les paiements

Plus en détail

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures) Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures) Eercice 1 (5 points) pour les candidats n ayant pas choisi la spécialité MATH Le tableau suivant donne l évolution du chiffre

Plus en détail

PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES

PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES Leçon 11 PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES Dans cette leçon, nous retrouvons le problème d ordonnancement déjà vu mais en ajoutant la prise en compte de contraintes portant sur les ressources.

Plus en détail

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production Revue des Sciences et de la Technologie RST- Volume 4 N 1 /janvier 2013 Etude d un cas industriel : Optimisation de la modélisation de paramètre de production A.F. Bernate Lara 1, F. Entzmann 2, F. Yalaoui

Plus en détail

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

modélisation solide et dessin technique

modélisation solide et dessin technique CHAPITRE 1 modélisation solide et dessin technique Les sciences graphiques regroupent un ensemble de techniques graphiques utilisées quotidiennement par les ingénieurs pour exprimer des idées, concevoir

Plus en détail

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Roxane Duroux 1 Cadre de l étude Cette étude s inscrit dans le cadre de recherche de doses pour des essais cliniques

Plus en détail

Trépier avec règle, ressort à boudin, chronomètre, 5 masses de 50 g.

Trépier avec règle, ressort à boudin, chronomètre, 5 masses de 50 g. PHYSQ 130: Hooke 1 LOI DE HOOKE: CAS DU RESSORT 1 Introduction La loi de Hooke est fondamentale dans l étude du mouvement oscillatoire. Elle est utilisée, entre autres, dans les théories décrivant les

Plus en détail

Les nombres entiers. Durée suggérée: 3 semaines

Les nombres entiers. Durée suggérée: 3 semaines Les nombres entiers Durée suggérée: 3 semaines Aperçu du module Orientation et contexte Pourquoi est-ce important? Dans le présent module, les élèves multiplieront et diviseront des nombres entiers concrètement,

Plus en détail

Chp. 4. Minimisation d une fonction d une variable

Chp. 4. Minimisation d une fonction d une variable Chp. 4. Minimisation d une fonction d une variable Avertissement! Dans tout ce chapître, I désigne un intervalle de IR. 4.1 Fonctions convexes d une variable Définition 9 Une fonction ϕ, partout définie

Plus en détail

Équations non linéaires

Équations non linéaires Équations non linéaires Objectif : trouver les zéros de fonctions (ou systèmes) non linéaires, c-à-d les valeurs α R telles que f(α) = 0. y f(x) α 1 α 2 α 3 x Equations non lineaires p. 1/49 Exemples et

Plus en détail

Les algorithmes de base du graphisme

Les algorithmes de base du graphisme Les algorithmes de base du graphisme Table des matières 1 Traçage 2 1.1 Segments de droites......................... 2 1.1.1 Algorithmes simples.................... 3 1.1.2 Algorithmes de Bresenham (1965).............

Plus en détail

Différentes opérateurs évolutionnaires de permutation: sélections, croisements et mutations

Différentes opérateurs évolutionnaires de permutation: sélections, croisements et mutations LABORATOIRE D INFORMATIQUE DE L UNIVERSITE DE FRANCHE-COMTE EA 4269 Différentes opérateurs évolutionnaires de permutation: sélections, croisements et mutations Mais HAJ-RACHID, Christelle BLOCH, Wahiba

Plus en détail

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007 Vision industrielle et télédétection - Détection d ellipses Guillaume Martinez 17 décembre 2007 1 Table des matières 1 Le projet 3 1.1 Objectif................................ 3 1.2 Les choix techniques.........................

Plus en détail

Image d un intervalle par une fonction continue

Image d un intervalle par une fonction continue DOCUMENT 27 Image d un intervalle par une fonction continue La continuité d une fonction en un point est une propriété locale : une fonction est continue en un point x 0 si et seulement si sa restriction

Plus en détail

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et

Plus en détail

1 Recherche en table par balayage

1 Recherche en table par balayage 1 Recherche en table par balayage 1.1 Problème de la recherche en table Une table désigne une liste ou un tableau d éléments. Le problème de la recherche en table est celui de la recherche d un élément

Plus en détail

Transmission d informations sur le réseau électrique

Transmission d informations sur le réseau électrique Transmission d informations sur le réseau électrique Introduction Remarques Toutes les questions en italique devront être préparées par écrit avant la séance du TP. Les préparations seront ramassées en

Plus en détail

Arithmétique binaire. Chapitre. 5.1 Notions. 5.1.1 Bit. 5.1.2 Mot

Arithmétique binaire. Chapitre. 5.1 Notions. 5.1.1 Bit. 5.1.2 Mot Chapitre 5 Arithmétique binaire L es codes sont manipulés au quotidien sans qu on s en rende compte, et leur compréhension est quasi instinctive. Le seul fait de lire fait appel au codage alphabétique,

Plus en détail

Fonctions de plusieurs variables

Fonctions de plusieurs variables Module : Analyse 03 Chapitre 00 : Fonctions de plusieurs variables Généralités et Rappels des notions topologiques dans : Qu est- ce que?: Mathématiquement, n étant un entier non nul, on définit comme

Plus en détail

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55

Plus en détail

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN Les contenues de ce document sont la propriété exclusive de la société REVER. Ils ne sont transmis qu à titre d information et ne peuvent en aucun cas

Plus en détail

DÉVERSEMENT ÉLASTIQUE D UNE POUTRE À SECTION BI-SYMÉTRIQUE SOUMISE À DES MOMENTS D EXTRÉMITÉ ET UNE CHARGE RÉPARTIE OU CONCENTRÉE

DÉVERSEMENT ÉLASTIQUE D UNE POUTRE À SECTION BI-SYMÉTRIQUE SOUMISE À DES MOMENTS D EXTRÉMITÉ ET UNE CHARGE RÉPARTIE OU CONCENTRÉE Revue Construction étallique Référence DÉVERSEENT ÉLASTIQUE D UNE POUTRE À SECTION BI-SYÉTRIQUE SOUISE À DES OENTS D EXTRÉITÉ ET UNE CHARGE RÉPARTIE OU CONCENTRÉE par Y. GALÉA 1 1. INTRODUCTION Que ce

Plus en détail

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre : Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

BACCALAURÉAT GÉNÉRAL SESSION 2012 OBLIGATOIRE MATHÉMATIQUES. Série S. Durée de l épreuve : 4 heures Coefficient : 7 ENSEIGNEMENT OBLIGATOIRE

BACCALAURÉAT GÉNÉRAL SESSION 2012 OBLIGATOIRE MATHÉMATIQUES. Série S. Durée de l épreuve : 4 heures Coefficient : 7 ENSEIGNEMENT OBLIGATOIRE BACCALAURÉAT GÉNÉRAL SESSION 2012 MATHÉMATIQUES Série S Durée de l épreuve : 4 heures Coefficient : 7 ENSEIGNEMENT OBLIGATOIRE Les calculatrices électroniques de poche sont autorisées, conformément à la

Plus en détail

Université Paris-Dauphine DUMI2E 1ère année, 2009-2010. Applications

Université Paris-Dauphine DUMI2E 1ère année, 2009-2010. Applications Université Paris-Dauphine DUMI2E 1ère année, 2009-2010 Applications 1 Introduction Une fonction f (plus précisément, une fonction réelle d une variable réelle) est une règle qui associe à tout réel x au

Plus en détail

Licence Sciences et Technologies Examen janvier 2010

Licence Sciences et Technologies Examen janvier 2010 Université de Provence Introduction à l Informatique Licence Sciences et Technologies Examen janvier 2010 Année 2009-10 Aucun document n est autorisé Les exercices peuvent être traités dans le désordre.

Plus en détail

GROUPE DE TRAVAIL «ARTICLE 29» SUR LA PROTECTION DES DONNÉES

GROUPE DE TRAVAIL «ARTICLE 29» SUR LA PROTECTION DES DONNÉES GROUPE DE TRAVAIL «ARTICLE 29» SUR LA PROTECTION DES DONNÉES 00727/12/FR WP 192 Avis 02/2012 sur la reconnaissance faciale dans le cadre des services en ligne et mobiles Adopté le 22 mars 2012 Le groupe

Plus en détail

Projet de Traitement du Signal Segmentation d images SAR

Projet de Traitement du Signal Segmentation d images SAR Projet de Traitement du Signal Segmentation d images SAR Introduction En analyse d images, la segmentation est une étape essentielle, préliminaire à des traitements de haut niveau tels que la classification,

Plus en détail

Pourquoi l apprentissage?

Pourquoi l apprentissage? Pourquoi l apprentissage? Les SE sont basés sur la possibilité d extraire la connaissance d un expert sous forme de règles. Dépend fortement de la capacité à extraire et formaliser ces connaissances. Apprentissage

Plus en détail

Guide de l utilisateur Usagers d œuvres

Guide de l utilisateur Usagers d œuvres Guide de l utilisateur Usagers d œuvres Système de gestion des droits de reproduction en ligne de Copibec Table des matières Introduction 5 Compte 6 Inscription d un nouveau compte 6 Création d un nouveau

Plus en détail

Création et utilisation de formulaire pdf

Création et utilisation de formulaire pdf Création et utilisation de formulaire pdf Grâce à Adobe Acrobat, il est plus facile de créer, de remplir et d envoyer des formulaires électroniques PDF. Vous pouvez concevoir et créer un formulaire complètement

Plus en détail

MODIFICATIONS DES PRINCIPES DIRECTEURS CONCERNANT LA RÉDACTION DES DÉFINITIONS RELATIVES AU CLASSEMENT

MODIFICATIONS DES PRINCIPES DIRECTEURS CONCERNANT LA RÉDACTION DES DÉFINITIONS RELATIVES AU CLASSEMENT ANNEXE VI MODIFICATIONS DES PRINCIPES DIRECTEURS CONCERNANT LA RÉDACTION DES DÉFINITIONS RELATIVES AU CLASSEMENT RECOMMANDATIONS GÉNÉRALES Les utilisateurs s attendent à trouver dans les définitions des

Plus en détail

Représentation des Nombres

Représentation des Nombres Chapitre 5 Représentation des Nombres 5. Representation des entiers 5.. Principe des représentations en base b Base L entier écrit 344 correspond a 3 mille + 4 cent + dix + 4. Plus généralement a n a n...

Plus en détail

Cours d Analyse. Fonctions de plusieurs variables

Cours d Analyse. Fonctions de plusieurs variables Cours d Analyse Fonctions de plusieurs variables Licence 1ère année 2007/2008 Nicolas Prioux Université de Marne-la-Vallée Table des matières 1 Notions de géométrie dans l espace et fonctions à deux variables........

Plus en détail

Métriques de performance pour les algorithmes et programmes parallèles

Métriques de performance pour les algorithmes et programmes parallèles Métriques de performance pour les algorithmes et programmes parallèles 11 18 nov. 2002 Cette section est basée tout d abord sur la référence suivante (manuel suggéré mais non obligatoire) : R. Miller and

Plus en détail

Grandes lignes ASTRÉE. Logiciels critiques. Outils de certification classiques. Inspection manuelle. Definition. Test

Grandes lignes ASTRÉE. Logiciels critiques. Outils de certification classiques. Inspection manuelle. Definition. Test Grandes lignes Analyseur Statique de logiciels Temps RÉel Embarqués École Polytechnique École Normale Supérieure Mercredi 18 juillet 2005 1 Présentation d 2 Cadre théorique de l interprétation abstraite

Plus en détail

Probabilités conditionnelles Loi binomiale

Probabilités conditionnelles Loi binomiale Exercices 23 juillet 2014 Probabilités conditionnelles Loi binomiale Équiprobabilité et variable aléatoire Exercice 1 Une urne contient 5 boules indiscernables, 3 rouges et 2 vertes. On tire au hasard

Plus en détail

TP 2 Réseaux. Adresses IP, routage et sous-réseaux

TP 2 Réseaux. Adresses IP, routage et sous-réseaux TP 2 Réseaux Adresses IP, routage et sous-réseaux C. Pain-Barre INFO - IUT Aix-en-Provence version du 24/2/2 Adressage IP. Limites du nombre d adresses IP.. Adresses de réseaux valides Les adresses IP

Plus en détail

Traitement bas-niveau

Traitement bas-niveau Plan Introduction L approche contour (frontière) Introduction Objectifs Les traitements ont pour but d extraire l information utile et pertinente contenue dans l image en regard de l application considérée.

Plus en détail

Modèles et simulations informatiques des problèmes de coopération entre agents

Modèles et simulations informatiques des problèmes de coopération entre agents Modèles et simulations informatiques des problèmes de coopération entre agents Bruno Beaufils LIFL Axe CIM Équipe SMAC Laboratoire d'informatique Plan 1. Motivations 2. Dilemme itéré du prisonnier 3. Simulations

Plus en détail

Analyse des coûts. 1 ère année DUT GEA, 2005/2006 Analyse des coûts

Analyse des coûts. 1 ère année DUT GEA, 2005/2006 Analyse des coûts Analyse des coûts Les techniques de calcul et d analyse des coûts portent le nom de comptabilité analytique ou comptabilité de gestion. Ces deux termes seront utilisés indifféremment dans ce cours. Contrairement

Plus en détail

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée. ANALYSE 5 points Exercice 1 : Léonie souhaite acheter un lecteur MP3. Le prix affiché (49 ) dépasse largement la somme dont elle dispose. Elle décide donc d économiser régulièrement. Elle a relevé qu elle

Plus en détail

INTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE

INTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE INTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE Le schéma synoptique ci-dessous décrit les différentes étapes du traitement numérique

Plus en détail

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57 Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation

Plus en détail

LES DIFFÉRENTS FORMATS AUDIO NUMÉRIQUES

LES DIFFÉRENTS FORMATS AUDIO NUMÉRIQUES LES DIFFÉRENTS FORMATS AUDIO NUMÉRIQUES Compétences mises en jeu durant l'activité : Compétences générales : S'impliquer, être autonome. Compétence(s) spécifique(s) : Reconnaître des signaux de nature

Plus en détail

Classe de première L

Classe de première L Classe de première L Orientations générales Pour bon nombre d élèves qui s orientent en série L, la classe de première sera une fin d étude en mathématiques au lycée. On a donc voulu ici assurer à tous

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

Notes explicatives Règles de facturation en matière de TVA

Notes explicatives Règles de facturation en matière de TVA Notes explicatives Règles de facturation en matière de TVA (directive 2010/45/UE du Conseil) Pourquoi des notes explicatives? Les notes explicatives visent à mieux faire comprendre la législation adoptée

Plus en détail

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie Partie I : Séries statistiques descriptives univariées (SSDU) A Introduction Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie et tous sont organisés selon le même

Plus en détail

4. Résultats et discussion

4. Résultats et discussion 17 4. Résultats et discussion La signification statistique des gains et des pertes bruts annualisés pondérés de superficie forestière et du changement net de superficie forestière a été testée pour les

Plus en détail

Travailler avec les télécommunications

Travailler avec les télécommunications Travailler avec les télécommunications Minimiser l attrition dans le secteur des télécommunications Table des matières : 1 Analyse de l attrition à l aide du data mining 2 Analyse de l attrition de la

Plus en détail

Sillage Météo. Notion de sillage

Sillage Météo. Notion de sillage Sillage Météo Les représentations météorologiques sous forme d animation satellites image par image sont intéressantes. Il est dommage que les données ainsi visualisées ne soient pas utilisées pour une

Plus en détail

CRM pour le Service clients et l Assistance technique

CRM pour le Service clients et l Assistance technique CRM pour le Service clients et l Assistance technique La satisfaction Maximizer. Inciter la fidélisation de la clientèle. Servir la clientèle efficacement est l élément clé d une croissance d affaires

Plus en détail

Apprentissage par renforcement (1a/3)

Apprentissage par renforcement (1a/3) Apprentissage par renforcement (1a/3) Bruno Bouzy 23 septembre 2014 Ce document est le chapitre «Apprentissage par renforcement» du cours d apprentissage automatique donné aux étudiants de Master MI, parcours

Plus en détail

Modélisation aléatoire en fiabilité des logiciels

Modélisation aléatoire en fiabilité des logiciels collection Méthodes stochastiques appliquées dirigée par Nikolaos Limnios et Jacques Janssen La sûreté de fonctionnement des systèmes informatiques est aujourd hui un enjeu économique et sociétal majeur.

Plus en détail

Algorithme des fourmis appliqué à la détection et au suivi de contours dans une image

Algorithme des fourmis appliqué à la détection et au suivi de contours dans une image IN52-IN54 A2008 Algorithme des fourmis appliqué à la détection et au suivi de contours dans une image Etudiants : Nicolas MONNERET Alexandre HAFFNER Sébastien DE MELO Responsable : Franck GECHTER Sommaire

Plus en détail

Continuité d une fonction de plusieurs variables

Continuité d une fonction de plusieurs variables Chapitre 2 Continuité d une fonction de plusieurs variables Maintenant qu on a défini la notion de limite pour des suites dans R n, la notion de continuité s étend sans problème à des fonctions de plusieurs

Plus en détail

Complément d information concernant la fiche de concordance

Complément d information concernant la fiche de concordance Sommaire SAMEDI 0 DÉCEMBRE 20 Vous trouverez dans ce dossier les documents correspondants à ce que nous allons travailler aujourd hui : La fiche de concordance pour le DAEU ; Page 2 Un rappel de cours

Plus en détail

INTERSYSTEMS CACHÉ COMME ALTERNATIVE AUX BASES DE DONNÉES RÉSIDENTES EN MÉMOIRE

INTERSYSTEMS CACHÉ COMME ALTERNATIVE AUX BASES DE DONNÉES RÉSIDENTES EN MÉMOIRE I N T E RS Y S T E M S INTERSYSTEMS CACHÉ COMME ALTERNATIVE AUX BASES DE DONNÉES RÉSIDENTES EN MÉMOIRE David Kaaret InterSystems Corporation INTERSySTEMS CAChé CoMME ALTERNATIvE AUx BASES de données RéSIdENTES

Plus en détail