Classification avec recouvrement des classes : une extension des k-moyennes
|
|
|
- Marie-Thérèse Eliane Bilodeau
- il y a 9 ans
- Total affichages :
Transcription
1 Classification avec recouvrement des classes : une extension des k-moyennes Guillaume Cleuziou Laboratoire d Informatique Fondamentale d Orléans (LIFO) Université d Orléans ORLEANS Cedex 2 [email protected] RÉSUMÉ. On constate ces dernières années un intérêt croissant pour les méthodes de classification construisant des schémas autorisant le recouvrement des classes. Ces schémas sont, en effet, particulièrement adaptés à certains types de données documentaires ou biologiques par exemple. Malheureusement les quelques techniques existantes s avèrent peu ou mal adaptées à ces applications. Nous proposons dans cet article d adapter l algorithme des k-moyennes à cette tâche, en reconsidérant à la fois le critère de qualité et l algorithme de recherche d un recouvrement optimal. MOTS-CLÉS : Classification non-supervisée, recouvrement des classes, k-moyennes. 1. Introduction La classification est un domaine de recherches en constante évolution du fait de l émergence perpétuelle de nouvelles problématiques issues du monde réel. Cette évolution porte autant sur les méthodes employées (centres mobiles, hiérarchies, mélanges de lois, agents artificiels, etc.) que sur l idéal recherché. Ceux qui cherchaient hier une organisation en classes compactes et séparées s autorisent aujourd hui à varier les formes, densités, tailles, nombres et agencements des classes, selon le contexte applicatif visé. Dans cette étude nous nous intéressons à l agencement des classes entres elles et plus particulièrement aux recouvrements (appelés aussi intersections ou empiétements) entre les classes. Dans certains domaines d applications, ce type de schéma de classification est naturel. Par exemple en biologie un gène peut influencer plusieurs aspects du métabolisme, en recherche d information un document (texte, image, vidéo, etc.) peut aborder plusieurs thématiques ou appartenir à plusieurs genres différents, enfin en traitement du langage un mot peut avoir plusieurs interprétations. Dans chacun de ces domaines, restreindre chaque élément à n appartenir qu à une seule classe entraîne une perte d information potentiellement utile à l utilisateur mais également cruciale pour le processus de classification. Les approches de classification aboutissant à des classes recouvrantes n abondent pas dans la littérature ; deux approches de référence nécessitent cependant d être mentionnées ici : la classification pyramidale [DID 84] et la classification floue [BEZ 81]. Pourtant ces deux approches sont peu utilisées dans les domaines d application cités précédemment car peu adaptées. Les pyramides autorisent des recouvrement trop limités et entre des classes nécessairement assez similaires tandis que la classification floue oblige à effectuer, a posteriori, un choix d affectation peu évident, à partir des fonctions d appartenance. L affectation plus ou moins arbitraire des individus à des classes pré-construites est un raisonnement classificatoire que l on rencontre dans d autres méthodes plus récentes [LEL 93, PAN 03, CLE 04]. Nous considérerons dans cette étude que les recouvrements entre classes ne doivent pas être simplement tolérés mais, au contraire, que le processus de construction des classes doit les intégrer et en tirer profit. De même que les pyramides étendent les hiérarchies en autorisant les recouvrements, nous proposons d adapter la recherche d une bonne partition à celle d un bon recouvrement. Dans cette perspective, nous présentons une extension des k-moyennes [MAC 67], fondée d une part sur l adaptation de la fonction objective à optimiser et d autre part sur l algorithme de recherche d un recouvrement optimal.
2 2. Algorithme de classification avec recouvrement des classes 2.1. L algorithme des k-moyennes Étant donné un ensemble d individus X = {x 1, x 2,..., x n } définis dans R p muni d une métrique euclidienne d, l algorithme des k-moyennes est fondé sur la recherche d une partition I = {I 1, I 2,..., I k } de X minimisant le critère de variance intra-classes : k V (I) = p i d 2 (x i, c j ) [1] j=1 {x i I j} où c j désigne le centre de la classe I j et p i la masse relative à l individu x i (traditionnellement chaque individu est pondéré de façon uniforme, avec p i = 1). Les deux étapes le l algorithme des k-moyennes qui consistent à (1) affecter chaque individu au centre de classe le plus proche et (2) mettre à jour le centre de chaque classe en calculant son centre de gravité, permettent d assurer la convergence du critère V (.) vers une partition stable 1. On remarquera que l optimisation du critère de variance intra-classes ne tolère (et encore moins ne favorise) aucun recouvrement de classes. En effet, chaque affectation supplémentaire d un individu x i à une classe I j impliquerait une augmentation du critère V (.) de la quantité p i d 2 (x i, c j ). Nous proposons de modifier la fonction objective utilisée, de façon à autoriser l affectation de chaque individu à une ou plusieurs classes Une autre interprétation de la fonction objective Résumer une collection d individus à travers un ensemble de classes permet une analyse globale des données mais suppose en même temps de concéder une partie de l information contenue dans ces données. La fonction objective V (.), étudiée précédemment, peut alors être interprétée comme un critère mesurant l information perdue ou encore l erreur commise en substituant chaque individu à un centre (ou représentant) de classe 2. Dans la suite nous parlerons d image d un individu pour désigner ce substitut. Définition 2.1 Soient une collection de classes I = {I 1, I 2,..., I k } formant une partition de l ensemble d individus X = {x 1, x 2,..., x n } et c 1, c 2,..., c k les centres respectifs des classes de I, l image de x i (notée x i ) dans la classification est donnée par le centre c j de la classe I j à laquelle x i est affecté. Dans la cas où I n est plus une partition mais un recouvrement de X, la définition 2.1 doit être étendue. Considérant que l affectation d un individu x i à plusieurs classes se justifie par le fait que x i partage des propriétés avec chacune de ces classes, l image de x i doit résulter d un compromis entre tous les centres de classes concernées. Définition 2.2 Soient une collection de classes I = {I 1, I 2,..., I k } formant un recouvrement de l ensemble d individus X = {x 1, x 2,..., x n } et c 1, c 2,..., c k les centres respectifs des classes de I, l image de x i (notée x i ) dans la classification est donnée par le centre de gravité 3 de l ensemble {c j x i I j }. Par la définition 2.2, la fonction objective V (.) peut être réécrite de manière à favoriser les recouvrements de classes lorsque ceux-ci permettent de capturer d avantage d information sur les individus concernés. On note V (I) ce critère évaluant la qualité d un recouvrement I d un ensemble d individus X : V (I) = p i d 2 (x i, x i ) [2] x i X 2.3. Algorithme de recherche d un recouvrement optimal Une manière naïve de rechercher le recouvrement qui minimise le critère V (.) serait de générer tous les recouvrements possibles. Cette solution est exclue dans le cas de partitions du fait qu il existe de l ordre de k n partitions 1. La partition stable obtenue correspond à une situation où l algorithme ne peut plus évoluer. Nous parlerons dans la suite d optimum local pour évoquer cette situation. 2. Dans le critère V (.) l erreur commise pour un individu x i affecté à la classe I j vaut d 2 (x i, c j) 3. Dans cette définition, les classes contenant x i sont pondérées de façon uniforme.
3 en k classes pour n individus. Le nombre de recouvrements possibles étant beaucoup plus grand encore, il convient de proposer un algorithme permettant d explorer partiellement l espace des possibilités au risque d aboutir à un optimum seulement local. L algorithme que nous présentons (Figure 1) s inspire largement de l algorithme des k-moyennes et procède par itérations de deux étapes : 1. l affectation des individus aux centres les plus proches, 2. le calcul des nouveaux centres des classes. Dans cet algorithme, l heuristique d affectation (AFFECTER(x i,c t )) consiste à affecter d abord x i au centre le plus proche, puis à considérer les autres centres - du plus proche au plus éloigné - en effectuant l affectation tant que d(x i, x i ) décroît. Initialisation : (t=0) choisir aléatoirement k centres C t = {c t 1, c t 2,..., c t k } dans X, Pour chaque x i X : AFFECTER(x i,c t ), en déduire un recouvrement initial I t = {I1, t I2, t..., Ik t}. FAIRE (t=t1) Calcul des nouveaux centres C t : pour j allant de 1 à k calculer le nouveau centre c t j de I j, Affectation : Pour chaque x i X : AFFECTER(x i,c t ), en déduire un nouveau recouvrement I t, TANT QUE I t I t 1 FIG. 1. Algorithme (simplifié) de recherche d un recouvrement optimal. L algorithme simplifié, tel que présenté en Figure 1, nécessite quelques précisions afin d en assurer la convergence (cf. Section 2.4). Tout d abord concernant l affectation des individus : après recalcul des centres, il est possible que les centres les plus proches d un individu aient changés sans toutefois qu une nouvelle affectation conduise à une meilleur image ; dans ce cas nous choisirons de conserver l ancienne affectation. La seconde précision porte sur le calcul des centres de classes. Dans cet algorithme, le centre c j d une classe I j correspond au centre de gravité du nuage de points N j = {(x i, p i ) x i I j } où les masses p i associées à chaque individu sont données par : { 0 si d(xi j, c p i = j,i ) = 0, η.d 2 (x i j, x i )/d 2 (x i j, c j,i ) sinon. [3] Dans cette expression, x i j désigne l image partielle de x i, i.e le centre de gravité de l ensemble {c l x i I l et j l}. Le terme c j,i désigne le centre c j idéal pour permettre à x i de coller à son image (d(x i, x i ) = 0) et η est un coefficient normalisateur ( p i = 1). Dans la suite on notera également x b i et x a i les images de x i respectivement avant (before) et après (after) la mise à jour du centre c j. Notons que dans le cas d une partition (chaque individu appartient à une seule classe), on se ramène au calcul classique d un centre de gravité avec des points tous de même masse η puisque c j,i = x i Convergence de l algorithme Nous donnons dans cette section les principaux éléments visant à démontrer la convergence de l algorithme à travers la décroissance du critère V (.). Chaque itération de l algorithme est composée de deux étapes : l affectation des individus aux centres et le recalcul des centres. Concernant l étape d affectation, nous avons précisé que pour chaque individu x i, une nouvelle affectation n est pas retenue si elle fait augmenter la quantité d(x i, x i ) ; et donc indirectement le critère V (.). On peut également montrer que ce critère décroît lors de l étape de recalcul des
4 centres et plus précisément pour chaque centre recalculé. Étant donné une classe Ij t, on note d après le théorème de Huygens : p i.d 2 (c j,i, c t j) = p i.d 2 (c j,i, c t1 j ) p i.d 2 (c t j, c t1 j ) [4] x i Ij t On peut de plus montrer géométriquement (Thalès) l égalité suivante : d 2 (x i j, x i ) d 2 (x i j, c j,i ) = d2 (x i, x b i) d 2 (c t j, c i,j) = d2 (x i, x a i ) d 2 (c t1 j, c i,j ) [5] En remplaçant dans [4] les p i par leur définition donnée en [3] puis en utilisant l égalité [5] on obtient : d 2 (x i, x b i) = d 2 (x i, x a i ) T (avec T 0) [6] ce qui montre que l étape de calcul des nouveaux centres fait décroître (strictement 4 ) V (.). La convergence de l algorithme est donc assurée du fait de la décroissance (stricte) du critère V (.) sur un ensemble fini de recouvrements. 3. Discussion et conclusion Dans la méthode exposée, l heuristique d affectation choisie n est certainement pas de nature à minimiser la fonction objective. Il s agit simplement d en assurer la décroissance en essayant 5 de respecter la propriété suivante : chaque individu doit être affecté aux centres les plus proches. Étant donnés k centres de classes, il serait en effet possible d extraire un schéma d affectation optimal au sens du critère V (.) mais qui ne vérifierait pas la contrainte pourtant indispensable pour assurer la cohérence des classes. Critères V (.) et V (.) recouvrements partitions Itérations Classes Étiquettes Iris Setosa 50 Iris Versicolor Iris Virginica FIG. 3. Matrice de confusion. FIG. 2. Convergences des critères V (.) et V (.) dans les mêmes conditions initiales. Afin d illustrer notre approche, nous présentons une première expérimentation de l algorithme sur la base Iris (UCI repository). Ce jeu de donné, traditionnellement utilisé en classification supervisée, disposerait d une organisation en trois classes de 50 individus chacune, dont deux classes sont réputées difficilement séparables (classes des Iris Versicolor et Virginica). Les résultats présentés correspondent à la meilleure classification obtenue (relativement à V (.)) sur 20 exécutions de l algorithme. On observe via la matrice de confusion proposée en Figure 3 que chaque classe d Iris extraite par notre approche correspond à une classe prédéfinie : la classe 1 s identifie principalement aux Iris Virginica, la classe 2 aux Iris 4. Dans [6], T est strictement positif sauf dans le cas où aucun centre n a été modifié. 5. L algorithme proposé ne permet pas de satisfaire totalement à cette contrainte. Cependant l heuristique d affectation limite en pratique ces violations, qui ne remettent donc pas en cause la cohérence globale des classes.
5 2 1.5 cluster 1 cluster 2 cluster FIG. 4. Visualisation des classes par projection sur les deux premiers vecteurs propres (ACP). Versicolor et la dernière classe presque exclusivement aux Iris Setosa. De plus, les intersections mentionnées entre les deux premières classes obtenues indiquent effectivement la confusion qui existe entre les deux classes Versicolor et Virginica. La visualisation proposée en Figure 4 atteste de la cohérence globale des classes construites mais également des recouvrements entre ces classes. Enfin, le graphique de la Figure 2 expose sur un exemple pratique que la vitesse de convergence de l algorithme proposé est du même ordre que pour la méthode des k-moyennes. Pour conclure, nous rappelons que nous avons traité dans cet article du problème de la classification en classes recouvrantes. Constatant qu il n existe pas de méthodologie clairement établie pour ce problème, nous avons présenté une première approche dans laquelle la construction de classes recouvrantes est utilisée dans le processus même de classification afin d améliorer la représentativité des classes relativement aux données initiales. Les études à venir sur ce thème de recherche consisteront notamment à proposer une méthode d affectation des individus conciliant à la fois les contraintes de cohérence des classes et d amélioration du critère de qualité du recouvrement. 4. Bibliographie [BEZ 81] BEZDEK J. C., Pattern Recognition with Fuzzy Objective Function Algoritms, Plenum Press, New York,, [CLE 04] CLEUZIOU G., MARTIN L., VRAIN C., PoBOC : an Overlapping Clustering Algorithm. Application to Rule-Based Classification and Textual Data, R. LÓPEZ DE MÁNTARAS AND L. SAITTA, IOS PRESS, Ed., Proceedings of the 16th European Conference on Artificial Intelligence, Valencia, Spain, August , p [DID 84] DIDAY E., Une représentation visuelle des classes empiétantes : Les Pyramides, Rocquencourt 78150, France. rapport, 1984, INRIA n 291, [LEL 93] LELU A., Modèles neuronaux pour l analyse de données documentaires et textuelles, Thèse de doctorat, mars 1993, Université de Paris VI. [MAC 67] MACQUEEN J., Some methods for classification and analysis of multivariate observations, Proceedings of the Fifth Berkeley Symposium on Mathematical statistics and probability, vol. 1, Berkeley, 1967, University of California Press, p [PAN 03] PANTEL P., Clustering by Committee, Ph.d. dissertation, 2003, Department of Computing Science, University of Alberta.
La classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique
Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55
Analyse en Composantes Principales
Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées
1 Complément sur la projection du nuage des individus
TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent
Programmation linéaire
1 Programmation linéaire 1. Le problème, un exemple. 2. Le cas b = 0 3. Théorème de dualité 4. L algorithme du simplexe 5. Problèmes équivalents 6. Complexité de l Algorithme 2 Position du problème Soit
Théorèmes de Point Fixe et Applications 1
Théorèmes de Point Fixe et Applications 1 Victor Ginsburgh Université Libre de Bruxelles et CORE, Louvain-la-Neuve Janvier 1999 Published in C. Jessua, C. Labrousse et D. Vitry, eds., Dictionnaire des
Etude d un cas industriel : Optimisation de la modélisation de paramètre de production
Revue des Sciences et de la Technologie RST- Volume 4 N 1 /janvier 2013 Etude d un cas industriel : Optimisation de la modélisation de paramètre de production A.F. Bernate Lara 1, F. Entzmann 2, F. Yalaoui
Introduction au Data-Mining
Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme
Principe de symétrisation pour la construction d un test adaptatif
Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, [email protected] 2 Université
Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services
69 Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services M. Bakhouya, J. Gaber et A. Koukam Laboratoire Systèmes et Transports SeT Université de Technologie de Belfort-Montbéliard
Chapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Modélisation géostatistique des débits le long des cours d eau.
Modélisation géostatistique des débits le long des cours d eau. C. Bernard-Michel (actuellement à ) & C. de Fouquet MISTIS, INRIA Rhône-Alpes. 655 avenue de l Europe, 38334 SAINT ISMIER Cedex. Ecole des
Intégration de la dimension sémantique dans les réseaux sociaux
Intégration de la dimension sémantique dans les réseaux sociaux Application : systèmes de recommandation Maria Malek LARIS-EISTI [email protected] 1 Contexte : Recommandation dans les réseaux sociaux
Plus courts chemins, programmation dynamique
1 Plus courts chemins, programmation dynamique 1. Plus courts chemins à partir d un sommet 2. Plus courts chemins entre tous les sommets 3. Semi-anneau 4. Programmation dynamique 5. Applications à la bio-informatique
Big Data et Graphes : Quelques pistes de recherche
Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de
Jean-Philippe Préaux http://www.i2m.univ-amu.fr/~preaux
Colonies de fourmis Comment procèdent les colonies de fourmi pour déterminer un chemin presque géodésique de la fourmilière à un stock de nourriture? Les premières fourmis se déplacent au hasard. Les fourmis
Nouvelles propositions pour la résolution exacte du problème de sac à dos bi-objectif unidimensionnel en variables binaires
Nouvelles propositions pour la résolution exacte du problème de sac à dos bi-objectif unidimensionnel en variables binaires Julien Jorge, Xavier Gandibleux Laboratoire d Informatique de Nantes Atlantique
Chapitre 5 : Flot maximal dans un graphe
Graphes et RO TELECOM Nancy A Chapitre 5 : Flot maximal dans un graphe J.-F. Scheid 1 Plan du chapitre I. Définitions 1 Graphe Graphe valué 3 Représentation d un graphe (matrice d incidence, matrice d
L exclusion mutuelle distribuée
L exclusion mutuelle distribuée L algorithme de L Amport L algorithme est basé sur 2 concepts : L estampillage des messages La distribution d une file d attente sur l ensemble des sites du système distribué
Intégration et probabilités TD1 Espaces mesurés Corrigé
Intégration et probabilités TD1 Espaces mesurés Corrigé 2012-2013 1 Petites questions 1 Est-ce que l ensemble des ouverts de R est une tribu? Réponse : Non, car le complémentaire de ], 0[ n est pas ouvert.
COURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES
COURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES EPF 4/ 5 ème année - Option Ingénierie d Affaires et de Projets - Finance Bertrand LIAUDET 4 : Modélisation non-supervisée
Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie
Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie 1 Présenté par: Yacine KESSACI Encadrement : N. MELAB E-G. TALBI 31/05/2011 Plan 2 Motivation
Analyse de la variance Comparaison de plusieurs moyennes
Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction
Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA
Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Soutenance de doctorat, sous la direction de Pr. Bilodeau, M. et Pr. Ducharme, G. Université de Montréal et Université
Programmation Linéaire - Cours 1
Programmation Linéaire - Cours 1 P. Pesneau [email protected] Université Bordeaux 1 Bât A33 - Bur 265 Ouvrages de référence V. Chvátal - Linear Programming, W.H.Freeman, New York, 1983.
Exercices Alternatifs. Une fonction continue mais dérivable nulle part
Eercices Alternatifs Une fonction continue mais dérivable nulle part c 22 Frédéric Le Rou (copleft LDL : Licence pour Documents Libres). Sources et figures: applications-continues-non-derivables/. Version
Exercices Alternatifs. Une fonction continue mais dérivable nulle part
Eercices Alternatifs Une fonction continue mais dérivable nulle part c 22 Frédéric Le Rou (copyleft LDL : Licence pour Documents Libres). Sources et figures: applications-continues-non-derivables/. Version
Big Data et Graphes : Quelques pistes de recherche
Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université
Programmation linéaire
Programmation linéaire DIDIER MAQUIN Ecole Nationale Supérieure d Electricité et de Mécanique Institut National Polytechnique de Lorraine Mathématiques discrètes cours de 2ème année Programmation linéaire
Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes
de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes Zohra Guessoum 1 & Farida Hamrani 2 1 Lab. MSTD, Faculté de mathématique, USTHB, BP n 32, El Alia, Alger, Algérie,[email protected]
Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications
L intelligence économique outil stratégique pour l entreprise Professeur Bernard DOUSSET [email protected] http://atlas.irit.fr Institut de Recherche en Informatique de Toulouse (IRIT) Equipe Systèmes d
Les clusters Linux. 4 août 2004 Benoît des Ligneris, Ph. D. [email protected]. white-paper-cluster_fr.sxw, Version 74 Page 1
Les clusters Linux 4 août 2004 Benoît des Ligneris, Ph. D. [email protected] white-paper-cluster_fr.sxw, Version 74 Page 1 Table des matières Introduction....2 Haute performance (High
Le Programme «Archives Audiovisuelles de la Recherche»
1 Maison des Sciences de l Homme (MSH) Equipe Sémiotique Cognitive et Nouveaux Médias (ESCoM) Le Programme «Archives Audiovisuelles de la Recherche» L édition de CD/DVD Rapport rédigé par Peter Stockinger
Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I
Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Roxane Duroux 1 Cadre de l étude Cette étude s inscrit dans le cadre de recherche de doses pour des essais cliniques
LES MÉTA-HEURISTIQUES : quelques conseils pour en faire bon usage
LES MÉTA-HEURISTIQUES : quelques conseils pour en faire bon usage Alain HERTZ Ecole Polytechnique - GERAD Département de mathématiques et de génie industriel CP 679, succ. Centre-ville, Montréal (QC) H3C
TP 2 Réseaux. Adresses IP, routage et sous-réseaux
TP 2 Réseaux Adresses IP, routage et sous-réseaux C. Pain-Barre INFO - IUT Aix-en-Provence version du 24/2/2 Adressage IP. Limites du nombre d adresses IP.. Adresses de réseaux valides Les adresses IP
Francis BISSON (06 794 819) Kenny CÔTÉ (06 836 427) Pierre-Luc ROGER (06 801 883) IFT702 Planification en intelligence artificielle
Francis BISSON (06 794 819) Kenny CÔTÉ (06 836 427) Pierre-Luc ROGER (06 801 883) PLANIFICATION DE TÂCHES DANS MS PROJECT IFT702 Planification en intelligence artificielle Présenté à M. Froduald KABANZA
données en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
L apprentissage automatique
L apprentissage automatique L apprentissage automatique L'apprentissage automatique fait référence au développement, à l analyse et à l implémentation de méthodes qui permettent à une machine d évoluer
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Texte Agrégation limitée par diffusion interne
Page n 1. Texte Agrégation limitée par diffusion interne 1 Le phénomène observé Un fût de déchets radioactifs est enterré secrètement dans le Cantal. Au bout de quelques années, il devient poreux et laisse
Application de K-means à la définition du nombre de VM optimal dans un cloud
Application de K-means à la définition du nombre de VM optimal dans un cloud EGC 2012 : Atelier Fouille de données complexes : complexité liée aux données multiples et massives (31 janvier - 3 février
Probabilités sur un univers fini
[http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur
Modélisation du comportement habituel de la personne en smarthome
Modélisation du comportement habituel de la personne en smarthome Arnaud Paris, Selma Arbaoui, Nathalie Cislo, Adnen El-Amraoui, Nacim Ramdani Université d Orléans, INSA-CVL, Laboratoire PRISME 26 mai
Classification non supervisée
AgroParisTech Classification non supervisée E. Lebarbier, T. Mary-Huard Table des matières 1 Introduction 4 2 Méthodes de partitionnement 5 2.1 Mesures de similarité et de dissimilarité, distances.................
INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES
INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine
Chapitre VI - Méthodes de factorisation
Université Pierre et Marie Curie Cours de cryptographie MM067-2012/13 Alain Kraus Chapitre VI - Méthodes de factorisation Le problème de la factorisation des grands entiers est a priori très difficile.
L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :
La vision nous permet de percevoir et d interpreter le monde qui nous entoure. La vision artificielle a pour but de reproduire certaines fonctionnalités de la vision humaine au travers de l analyse d images.
Équation de Langevin avec petites perturbations browniennes ou
Équation de Langevin avec petites perturbations browniennes ou alpha-stables Richard Eon sous la direction de Mihai Gradinaru Institut de Recherche Mathématique de Rennes Journées de probabilités 215,
Introduction au Data-Mining
Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane
Apprentissage Automatique
Apprentissage Automatique Introduction-I [email protected] www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Optimisation, traitement d image et éclipse de Soleil
Kléber, PCSI1&3 014-015 I. Introduction 1/8 Optimisation, traitement d image et éclipse de Soleil Partie I Introduction Le 0 mars 015 a eu lieu en France une éclipse partielle de Soleil qu il était particulièrement
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Calcul intégral élémentaire en plusieurs variables
Calcul intégral élémentaire en plusieurs variables PC*2 2 septembre 2009 Avant-propos À part le théorème de Fubini qui sera démontré dans le cours sur les intégrales à paramètres et qui ne semble pas explicitement
Cours de Master Recherche
Cours de Master Recherche Spécialité CODE : Résolution de problèmes combinatoires Christine Solnon LIRIS, UMR 5205 CNRS / Université Lyon 1 2007 Rappel du plan du cours 16 heures de cours 1 - Introduction
Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar [email protected]
Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar [email protected] Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines
Atelier Transversal AT11. Activité «Fourmis» Pierre Chauvet. [email protected]
Atelier Transversal AT11 Activité «Fourmis» Pierre Chauvet [email protected] Ant : un algorithme inspiré de l éthologie L éthologie Etude scientifique des comportements animaux, avec une perspective
Extraction d informations stratégiques par Analyse en Composantes Principales
Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 [email protected] 1 Introduction
Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/
Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation
Rapport de Stage. Titre : Clustering à l aide d une représentation supervisée
Nicolas Creff Du 1er février au 31 juillet 2011 Promotion 2011 Majeure SCIA Rapport de Stage Titre : Clustering à l aide d une représentation supervisée Sujet : Personnalisation de scores à l aide de la
Communications collectives et ordonnancement en régime permanent pour plates-formes hétérogènes
Loris MARCHAL Laboratoire de l Informatique du Parallélisme Équipe Graal Communications collectives et ordonnancement en régime permanent pour plates-formes hétérogènes Thèse réalisée sous la direction
Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche
Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche Bachir Bekka Février 2007 Le théorème de Perron-Frobenius a d importantes applications en probabilités (chaines
Analyse fonctionnelle Théorie des représentations du groupe quantique compact libre O(n) Teodor Banica Résumé - On trouve, pour chaque n 2, la classe
Analyse fonctionnelle Théorie des représentations du groupe quantique compact libre O(n) Teodor Banica Résumé - On trouve, pour chaque n 2, la classe des n n groupes quantiques compacts qui ont la théorie
Quelques algorithmes simples dont l analyse n est pas si simple
Quelques algorithmes simples dont l analyse n est pas si simple Michel Habib [email protected] http://www.liafa.jussieu.fr/~habib Algorithmique Avancée M1 Bioinformatique, Octobre 2008 Plan Histoire
Une application des algorithmes génétiques à l ordonnancement d atelier
Une application des algorithmes génétiques à l ordonnancement d atelier VACHER Jean-Philippe - GALINHO Thierry - MAMMERI Zoubir Laboratoire d Informatique du Havre Université du Havre 25, Rue Philippe
Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1
Premiers pas avec SES-Pegase 1 Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données www.delta-expert.com Mise à jour : Premiers pas avec SES-Pegase
BAROMETRE DE CONJONCTURE DE L HEBERGEMENT D ENTREPRISES
1 er et 2 ème trimestres 2010 Note semestrielle N 1 BAROMETRE DE CONJONCTURE DE L HEBERGEMENT D ENTREPRISES 1. CHIFFRE D AFFAIRES TOTAL DES CENTRES D AFFAIRES Chiffre d affaires total / surface totale
Application du data mining à la segmentation du marché des meubles aux États-Unis
Application du data mining à la segmentation du marché des meubles aux États-Unis THI THU HOA LE 1, BRUNO AGARD 1, STÉPHANE DEVEAULT 2 1 ÉCOLE POLYTECHNIQUE DE MONTRÉAL C.P. 6079, succ. Centre-ville, Montréal
Relation entre deux variables : estimation de la corrélation linéaire
CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence
Laboratoire 4 Développement d un système intelligent
DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI LOG770 - SYSTÈMES INTELLIGENTS ÉTÉ 2012 Laboratoire 4 Développement d un système intelligent 1 Introduction Ce quatrième et dernier laboratoire porte sur le développement
Lecture critique et pratique de la médecine
1-00.qxp 24/04/2006 11:23 Page 13 Lecture critique appliquée à la médecine vasculaireecture critique et pratique de la médecine Lecture critique et pratique de la médecine Introduction Si la médecine ne
Instructions relatives à la soumission d une question sur le sujet d étude
Programme de bourses de recherche Amy Mahan pour évaluer l impact de l accès public aux TIC Instructions relatives à la soumission d une question sur le sujet d étude Table des matières À propos la Question
Intelligence Artificielle Planification
Intelligence Artificielle Planification Bruno Bouzy http://web.mi.parisdescartes.fr/~bouzy [email protected] Licence 3 Informatique UFR Mathématiques et Informatique Université Paris Descartes
Sommaire. Introduction.2. 1. Définition..2. 2. Historique.2. 3. Domaine d application.2. 4.Les Travaux réalisés sur les domaines d application.
Sommaire Introduction.2 1. Définition..2 2. Historique.2 3. Domaine d application.2 4.Les Travaux réalisés sur les domaines d application.3 5.Algorithme 4 6.Exemple d application 5 7. Avantage et inconvénient..6
Article 2 : Conseils et meilleures pratiques pour gérer un cloud privé
Article 2 : Conseils et meilleures pratiques pour gérer un cloud privé Sponsored by Mentions relatives aux droits d'auteur 2011 Realtime Publishers. Tous droits réservés. Ce site contient des supports
Limitations of the Playstation 3 for High Performance Cluster Computing
Introduction Plan Limitations of the Playstation 3 for High Performance Cluster Computing July 2007 Introduction Plan Introduction Intérêts de la PS3 : rapide et puissante bon marché L utiliser pour faire
L OPTIMISATION ÉCONOMIQUE DU VOLUME DU LOT DE FABRICATION DANS LE MANAGEMENT DE LA PRODUCTION EN SÉRIE
L OPTIMISATION ÉCONOMIQUE DU VOLUME DU LOT DE FABRICATION DANS LE MANAGEMENT DE LA PRODUCTION EN SÉRIE Gradinaru Dorule L Université de Pite ti, La Faculté de Sciences Économiques, 0752458187, [email protected]
NON-LINEARITE ET RESEAUX NEURONAUX
NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail
Mathématique et Automatique : de la boucle ouverte à la boucle fermée. Maïtine bergounioux Laboratoire MAPMO - UMR 6628 Université d'orléans
Mathématique et Automatique : de la boucle ouverte à la boucle fermée Maïtine bergounioux Laboratoire MAPMO - UMR 6628 Université d'orléans [email protected] Plan 1. Un peu de
CCP PSI - 2010 Mathématiques 1 : un corrigé
CCP PSI - 00 Mathématiques : un corrigé Première partie. Définition d une structure euclidienne sur R n [X]... B est clairement symétrique et linéaire par rapport à sa seconde variable. De plus B(P, P
Optimisation de la compression fractale D images basée sur les réseaux de neurones
Optimisation de la compression fractale D images basée sur les réseaux de neurones D r BOUKELIF Aoued Communication Networks,Architectures and Mutimedia laboratory University of S.B.A [email protected]
Chapitre 2 Le problème de l unicité des solutions
Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)
Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring
Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems
Techniques d interaction dans la visualisation de l information Séminaire DIVA
Techniques d interaction dans la visualisation de l information Séminaire DIVA Zingg Luca, [email protected] 13 février 2007 Résumé Le but de cet article est d avoir une vision globale des techniques
Chp. 4. Minimisation d une fonction d une variable
Chp. 4. Minimisation d une fonction d une variable Avertissement! Dans tout ce chapître, I désigne un intervalle de IR. 4.1 Fonctions convexes d une variable Définition 9 Une fonction ϕ, partout définie
Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.
Promotion X 004 COURS D ANALYSE DES STRUCTURES MÉCANIQUES PAR LA MÉTHODE DES ELEMENTS FINIS (MEC 568) contrôle non classant (7 mars 007, heures) Documents autorisés : polycopié ; documents et notes de
Modélisation multi-agents - Agents réactifs
Modélisation multi-agents - Agents réactifs Syma cursus CSI / SCIA Julien Saunier - [email protected] Sources www-lih.univlehavre.fr/~olivier/enseignement/masterrecherche/cours/ support/algofourmis.pdf
MABioVis. Bio-informatique et la
MABioVis Modèles et Algorithmes pour la Bio-informatique et la Visualisation Visite ENS Cachan 5 janvier 2011 MABioVis G GUY MELANÇON (PR UFR Maths Info / EPI GRAVITE) (là, maintenant) - MABioVis DAVID
Soutien technique en informatique
Service de formation aux adultes Soutien technique en informatique PLAN DE COURS Utilisation et création de bases de données 420-B64-GR 2-2-2 75 heures Session automne 2010 NOM DE L ENSEIGNANT : JIE YANG
I. Polynômes de Tchebychev
Première épreuve CCP filière MP I. Polynômes de Tchebychev ( ) 1.a) Tout réel θ vérifie cos(nθ) = Re ((cos θ + i sin θ) n ) = Re Cn k (cos θ) n k i k (sin θ) k Or i k est réel quand k est pair et imaginaire
Objectifs du cours d aujourd hui. Informatique II : Cours d introduction à l informatique et à la programmation objet. Complexité d un problème (2)
Objectifs du cours d aujourd hui Informatique II : Cours d introduction à l informatique et à la programmation objet Complexité des problèmes Introduire la notion de complexité d un problème Présenter
Arbres binaires de décision
1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression
= 1 si n = m& où n et m sont souvent des indices entiers, par exemple, n, m = 0, 1, 2, 3, 4... En fait,! n m
1 épartement de Physique, Université Laval, Québec Pierre Amiot, 1. La fonction delta et certaines de ses utilisations. Clientèle Ce texte est destiné aux physiciens, ingénieurs et autres scientifiques.
Optimisation Combinatoire et Colonies de Fourmis Nicolas Monmarche April 21, 1999 Sommaire Inspiration biologiques Ant Colony Optimization Applications TSP QAP Flow Shop Problemes dynamiques 1 Historique
La programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique
La programmation linéaire : une introduction Qu est-ce qu un programme linéaire? Qu est-ce qu un programme linéaire? Exemples : allocation de ressources problème de recouvrement Hypothèses de la programmation
UNE EXPERIENCE, EN COURS PREPARATOIRE, POUR FAIRE ORGANISER DE L INFORMATION EN TABLEAU
Odile VERBAERE UNE EXPERIENCE, EN COURS PREPARATOIRE, POUR FAIRE ORGANISER DE L INFORMATION EN TABLEAU Résumé : Cet article présente une réflexion sur une activité de construction de tableau, y compris
PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE
PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE Jean-Paul Valois, Claude Mouret & Nicolas Pariset Total, 64018 Pau Cédex MOTS CLEFS : Analyse spatiale, ACP, Lissage, Loess PROBLEMATIQUE En analyse multivariée,
La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.
La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. Gaël Le Mahec - p. 1/12 L algorithme BLAST. Basic Local Alignment Search Tool est un algorithme de recherche
