THESE. Applications des algorithmes d'auto-organisation à la classification et à la prévision

Dimension: px
Commencer à balayer dès la page:

Download "THESE. Applications des algorithmes d'auto-organisation à la classification et à la prévision"

Transcription

1 UNIVERSITE PARIS I PANTHEON SORBONNE U.F.R. DE MATHEMATIQUES et INFORMATIQUE Année 999 THESE Pour obtenir le rade de DOCTEUR DE L'UNIVERSITE PARIS I Discipline : Mathéatiques Présentée et soutenue publiqueent Par Patric ROUSSET Titre : Applications des alorithes d'auto-oranisation à la classification et à la prévision Directeur de Thèse : Marie COTTRELL Michel Verleysen Jeanny Herault Marie Cottrell Jean-Pierre Fénelon François Gardes Stephane Canu JURY

2 Reercieents Si pour beaucoup la thèse est le oyen de trouver un eploi dans la recherche ou l'enseineent, c'est on travail à 'université et une expérience préalable d'enseineent qui 'ont donné l'envie de faire celle-ci. Elle 'a peris de continuer à découvrir et proresser, de concrétiser des idées nées de rencontres et de lectures, ainsi que de ieux e connaître. Au oent de conclure ce travail, es preières pensées vont à es parents et es proches. Etre le téoin priviléié de la destinée de es élèves a élari l'anle de vue sur on propre parcours, c'est pourquoi je suis heureux d'avoir ici l'opportunité de reercier tous ceux qui 'ont aidé, encouraé ou soutenu tout au lon de es études. En ce qui concerne la thèse, elle-êe, je dois son aboutisseent aux professeurs Marie Cottrell et Bernard Girard. Décrire leur contribution en réduirait l'iportance. Je les reercie donc succincteent d'avoir ajouté à leur rande copétence la entillesse et la disponibilité. Ces qualités se trouvent d'ailleurs facileent au SAMOS (ainsi que la réponse à la plupart de es questions). Merci aussi à Yvonne Girard et au SCIPRE de 'avoir fourni atériel et assistance, à Chaiya pour la qualité des ipressions couleurs et à a cousine Doinique pour sa relecture. J'ai eu aussi plaisir à travailler en collaboration avec Patrice Gaubert, Christiane Guinot, François Gardes, Yvonne Girard, Bertrand Maillet, Christian Derquenne et Moran Maneas, à avoir une rencontre fructueuse avec Michael Jordan. Je voudrais reercier aussi Michel Verleysen et Jeanny Herault pour avoir accepté la chare de rapporter cette thèse, pour leurs rearques et leurs encouraeents ainsi que les ebres du jury Stéphane Canu, Jean-Pierre Fénelon et François Gardes. Un clin d'œil à Krystyna, Thierry, Arnaud, Olivier, Salah,... et aux habitants de Sari d'orcino. Mes encouraeents enfin pour Elena, Maxence, Alexandre, Mia, Clara, Laura, Huo et les autres pour qui le chein est encore lon.

3 TABLE DES MATIERES Introduction ère PARTIE : ANALYSE DE DONNEES A L'AIDE DES CARTES DE KOHONEN. 5 Analyse de données Problèe et exeples Le problèe Présentation de trois exeples de bases de données La classification de Kohonen Introduction de l alorithe de Kohonen Quelques alorithes de classification Alorithe de Kohonen La relation entre la éthode basée sur la classification de Kohonen et les autres éthodes Analyse de données en utilisant les cartes de Kohonen Analyse de données appliquées en pratique Analyse linéaire des données Analyse de données à l aide des réseaux de neurones Analyse de données à l aide des cartes de Kohonen niveaux de classification Représentation des distances inter classes Contenu des classes et hooénéité Croiseent de la classification avec une variable qualitative Analyse restreinte à une réion de la carte Projection des observations de A dans le plan P(A) Représentation des classes voisines Coparaison avec les éthodes classiques L'exeple du fer à cheval Les représentations issues de l'acp Utilisation de la classification à l'aide de l'alorithe de Kohonen Coparaison entre la classification de Kohonen et l'analyse factorielle èe PARTIE : PREVISION A L'AIDE DES CARTES DE KOHONEN Probléatique Problèe Doaine d'application Exeple

4 4.4 Les odèles classiques Un odèle linéaire: L'Arax Un odèle neuronal: Le perceptron ulticouches Conclusion La MEP : une éthode de prévision dans le cas d'une série chronoloique qui cuule deux évolutions de teps ayant chacune sa cadence propre Définition et notations Méthode de prévision Application de la MEP à l'exeple de la prévision de la consoation électrique nationale polonaise Classification des profils Utilisation d'une classification hiérarchique Utilisation de la classification de Kohonen Variantes de l'alorithe de Kohonen susceptible d'aéliorer la classification des courbes de chare Classification et prévision des profils Estiation des courbes de chares électriques et perforances Estiation des courbes de chares électriques par la éthode MPE. 6.. Un odèle de référence pour valider la éthode par coparaison Perforances de la MEP Analyse de l'erreur Analyse de l'erreur de prévision du profil Analyse de l'erreur de prévision de la courbe de chare Quelques réflexions sur la éthode Noralisation de l'estié du profil et renoralisation des poids à chaque itération de l'apprentissae Options techniques Choix de la classification Liites Conclusion et perspectives

5 INTRODUCTION Les travaux scientifiques nécessitent souvent une confrontation entre les nouvelles techniques et celles existantes. On aura éaleent cette exience dans la suite, c'est pourquoi il peut être intéressant de faire un point soaire sur l'évolution des outils statistiques et de se deander ce que l'on attend d'une nouveauté. En particulier, quelles caractéristiques elle doit posséder pour répondre à l'évolution des oyens coe par exeple le atériel et pour servir de relais aux éthodes existantes pour résoudre les problèes. Evolution de la statistique : Les statistiques ont rapideent évolué au cours des dernières décennies. Les techniques se sont en effet beaucoup développées et de nouvelles sont apparues. De plus, son doaine d'application s'est élari et la population des utilisateurs s'est diversifiée. Cette évolution provient des prorès de l'inforatique qui a d'abord révolutionné le onde de la statistique à son arrivée et l'a, depuis, fait évoluer continuelleent. La capacité randissante des ordinateurs a iposé un renouvelleent très fréquent des techniques. Pari les rands axes d'influence de l'inforatique sur les techniques, on peut citer trois exeples.

6 La capacité de stocae des ordinateurs a peris un accroisseent de la taille des bases de données dans des proportions telles qu'il est aujourd'hui courant de disposer de recueil de données dont le nobre d'individus s'exprie en illions et celui des variables en centaines. Ce phénoène réclae naturelleent une approche et des techniques nouvelles. Les prorès des outils inforatiques pour réaliser des représentations raphiques ont orienté les statistiques vers des techniques qui aboutissent à des résultats qui se traduisent par des représentations raphiques sous fore de tableaux ou de cartes. Par exeple, les analyses factorielles, dont le but est de représenter "au ieux" l'inforation sur des plans, ont pris une rande iportance dans l'analyse de données ultidiensionnelles. D'autre part, la vitesse d'exécution randissante des ordinateurs a peris d'envisaer l'utilisation d'alorithes qui ont un coût élevé en tere de teps de calcul. En particulier, cela a provoqué une diversification des techniques de classification. Outre l'évolution des techniques, l'inforatique a aussi odifié le cadre d'application des statistiques. Les doaines d'étude se sont diversifiés et les techniques sont de plus en plus utilisées par des non statisticiens, spécialistes d'autres sciences coe l'éconoie, la finance, l'assurance, ou de façon plus énérale la plupart des inénieurs. Cette évolution provient de la ise à disposition des loiciels qui proposent une ae de odèles statistiques qu'il suffit d'exécuter sur son ordinateur personnel. Il est à noter que les sorties sous fore de raphiques et de tableaux ont lareent contribué à la vularisation des techniques statistiques. En êe teps de l'inforatique, le développeent récent des réseaux de neurones apporte aussi une source de renouvelleent pour les statistiques. De nouveaux alorithes répondent ainsi au besoin d'approches nouvelles déjà évoqué. En particulier, ils perettent une étude non linéaire ieux adaptée à certaines structures. "Quelles caractéristiques pourrait avoir un nouvel alorithe qui s'inscrirait dans l'évolution des statistiques?" : D'après le bilan historique fait précédeent, il apparaît que c'est plus au besoin d'analyse qu'il doit répondre qu'au problèe des oyens (les problèes de calcul étant oindres). Il doit fournir un oyen de traiter des bases de données de plus en plus iportantes et coplexes. Un alorithe issu des réseaux de neurones peut par exeple répondre à cette deande. De plus, pour être appliqué par des non spécialistes et suivre ainsi l'évolution de l'analyse classique, il doit être relativeent siple à utiliser et doit fournir des sorties sous une fore qui facilite leur interprétation. C'est-à-dire sous fore de tableaux ou

7 de raphiques. Il est d'ailleurs possible d'envisaer des représentations raphiques autres que les projections linéaires. Avant de présenter les avantaes de celles proposées dans la suite, nous ne résistons pas au plaisir de contepler une de celles produites par un analyste plus doué : Picasso : L'acrobate Contexte et objectif de la thèse : L'esprit dans lequel nous avons essayé de concevoir un odèle de prévision des courbes de consoation nationale électrique française est à rapprocher d'une citation de Jean-Paul Benzécri présente dans l'introduction de l'ouvrae "Statistiques exploratoire utidiensionnelle" [68], "le odèle doit suivre les données et non l'inverse". On a, ainsi, is au point une éthode de prévision qui s'appuie sur une analyse de données, car cela paraissait ieux adapté à cette série chronoloique. On a choisi de le faire à partir de la classification de Kohonen car elle offrait plus de possibilités. On a développé les outils 3

8 d'interprétation de cette dernière pour aéliorer notre potentiel d'analyse et par là êe la qualité de notre prévision. En parallèle, d'autres études se sont présentées, elles appartenaient à des doaines variés tels que l'analyse de la consoation des canadiens ou du chôae qui sont fournies en annexe. Les outils précités se sont avérés perforants pour les analyser, ais on a souvent dû les faire évoluer ou en ajouter d'autres. Cet échane entre les problèes et les solutions a abouti à un enseble de oyens d'analyse copléentaires et adaptatifs. C'est pourquoi, dans la suite, l'analyse de données sera présentée indépendaent de la prévision. Elle constituera la preière partie, la prévision étant le sujet de la seconde. Pour ontrer l'adaptabilité des outils développés, on illustrera leur utilisation à l'aide d'exeples de bases de données variées, souvent issues d'études réelles. Par contre, leurs études coplètes fournies en annexe ne sont pas traitées. A la suite de la présentation de l'analyse de données et de sa coparaison à l'association classification analyse factorielle, on ontrera dans la seconde partie coent s'appuyer sur celle-ci pour ettre au point une éthode de prévision qui s'écarte des éthodes récursives et s'adapte à des contextes nouveaux. En particulier, on l'appliquera aux données de consoation électrique polonaise, is entient à notre disposition par le professeur Osowsi de l'université Warsaw Technical, pour lesquelles les techniques précitées ont ontré à la fois leurs qualités et leurs liites. L'étude de la consoation française est présentée en annexe. 4

9 ère PARTIE ANALYSE DE DONNEES A L'AIDE DES CARTES DE KOHONEN Chap. Chap. Chap.3 Analyse de données Problèe et exeples La classification de Kohonen Analyse de données en utilisant les cartes de Kohonen

10

11 Analyse de données - Problèe et exeples. Analyse de données - Problèe et exeples.. Le problèe L'apparition puis le développeent des ordinateurs ont peris d'envisaer de nouvelles techniques d'analyse de données, notaent en exécutant rapideent certains calculs tels que l'inversion de atrice ou la diaonalisation. C'est le cas des analyses factorielles coe par exeple l'analyse en coposantes principales ou ACP qui ont répondu au besoin de visualiser les données. Ces éthodes réalisent en effet, des projections sur les plans dits "principaux" (contenant le axiu d'inertie) où l'on voit le ieux le nuae de points. Mais il existe un besoin de copléter ces éthodes par de nouvelles qui seraient capables de traiter des bases de données de rande taille, ayant une structure non linéaire, et par conséquent al expliquées par les outils traditionnels. Certains réseaux de neurones, coe le perceptron ulticouche, perettent de replacer les analyses classiques. Mais ils n offrent pas toujours de représentations raphiques et les interprétations sont parfois 7

12 Analyse de données à l'aide des cartes de ohonen difficiles. La classification de Kohonen a, quant à elle, le double avantae de faire une analyse non linéaire de la base de données et de se prêter à des représentations raphiques faciles à utiliser. Dans ce chapitre vont être développées différentes façons d exploiter cette dernière éthode pour répondre à plusieurs problèes de l analyse de données tels que la classification, l analyse de la dispersion, la caractérisation des individus par des variables explicatives qualitatives, etc. Les techniques qui vont être présentées seront appliquées à des exeples siulés pour l'illustration ou issus d'études pratiques dont le lecteur pourra trouver les analyses coplètes en annexe.. Présentation de trois exeples de bases de données. Soit une base de données X de N observations dans laquelle chaque individu i est décrit par p variables quantitatives et q variables qualitatives. On note x i =(x i,, x j i,,x p i ) le vecteur de R p constitué des p variables quantitatives. Trois exeples de bases de données vont servir à illustrer les techniques que nous proposons. L objectif n est pas d en faire l étude, ais d exploiter la spécificité de chacune pour illustrer les différentes parties développées par la suite. Le preier exeple, d effectif réduit, est construit artificielleent pour visualiser le écanise d apprentissae de l alorithe de Kohonen. Le deuxièe issu d'une étude pratique peret d effectuer des analyses qui cobinent des variables quantitatives et qualitatives, il servira de plus à donner un exeple de classification avec la distance du χ. Enfin, le troisièe utilise une notion teporelle qui facilitera l interprétation des rapprocheents des classes à l intérieur des cartes de Kohonen. 8

13 Analyse de données - Problèe et exeples. er exeple : Le preier exeple est constitué d une base de données siulées contenant 300 individus et variables. Chaque individu est construit à partir du élane aléatoire des 3 fores a, b, c de R de la fiure ieux visualisées par le type de représentation de la fiure, adopté pour la suite, qui joint les points indiquant les valeurs. Ceci revient à prendre une cobinaison linéaire des trois vecteurs de base a, b et c fixés du type αa+βb+γc où α, β et γ sont des scalaires aléatoires copris entre 0 et afin d'obtenir des fores variées, coe par exeple celles de la fiure 3. * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * a b c Fiure : Les trois fores a, b et c sont construites à partir de variables 9

14 Analyse de données à l'aide des cartes de ohonen a b c Fiure : Les points sont joints pour ettre en évidence la fore Fiure 3 : Exeple d'une fore construite à partir du élane de a, b et c avec α=0.44, β=0.7 et γ=0. 0

15 Analyse de données - Problèe et exeples. èe exeple : Cet exeple est issu de deux enquêtes de consoation réalisées par Statistiques Canada entre 986 et 99 auprès d environ 0000 énaes. Un individu est défini par son profil de consoation, c est-à-dire par la répartition de sa consoation dans 0 produits (Loeent, achat de véhicule etc. ). Pour un individu, la valeur associée à une variable représente le ratio de la consoation de ce produit rapporté à la consoation totale (par exeple, consoation dans le loeent / consoation totale). Les variables sont donc des pourcentaes, elles prennent des valeurs positives et leur soe vaut. j=,, 0 x j 0 et 0 j= x j = Coparer deux individus revient à coparer deux profils. Lorsque les observations sont des pourcentaes, il est classique de choisir la distance du χ, c est donc celle qui sera utilisée dans cet exeple. La fiure 4 représente la consoation d un individu i. Sur l axe des abscisses sont indiqués les produits de consoation, l ordre est alphabétique et n a donc aucun sens (ce n est pas un axe teporel). De êe, les points sont reliés entre eux dans le seul but de rendre le profil plus lisible. consoation 0, 0,5 0, 0,05 0 alcool al.do al.ext chares co. divers don educ. habill. loeent loisirs loterie eubles santé secu soin tabac tr.pers tr.pub. veh. Fiure 4 : Profil de consoation de l'individu i La liste exhaustive des variables de consoation est la suivante : alcool, alientation au doicile, alientation à l'extérieur, chares, counication (dépense de téléphone), divers (intérêts des prêts personnels, produits d'entretien), dons, éducation, habilleent, loeent, loisirs, loterie, eubles, santé, dépenses de sécurité (assurance chôae, vie, retraite), soins, tabac, transport personnel, transport public, achat de véhicule

16 Analyse de données à l'aide des cartes de ohonen Cette enquête fournit aussi des caractéristiques qualitatives copléentaires sur les individus : le niveau d éducation, la tranche d âe, la détention de loeent et le niveau de pauvreté. Cet exeple perettra donc, dans la suite, d'illustrer la façon dont on peut utiliser les cartes de Kohonen qui réalisent une classification des individus par rapport des variables quantitatives (ici la consoation) afin de réaliser la cartoraphie d'un autre critère qui n a pas servi à la classification (par exeple la détention de loeent). 3 èe exeple : Cet exeple a été construit artificielleent à partir d une base de données réelles. Il contient 000 observations qui représentent les relevés journaliers d une esure faite toute les deux heures (la preière valeur est le relevé à 0h00, le deuxièe à h00, le troisièe à 4h00, etc.). Sur les fiures 5 et 6 sont représentées les esures d'une journée pour les individus i et i de la base de données. On exploitera cet exeple pour illustrer les études sur la dispersion et les relations entre les unités de la carte de Kohonen qui s expliquent dans ce cas particulier par une notion failière aux statisticiens, l évolution teporelle. Cet exeple perettra ainsi de faire le lien avec l exploitation des cartes de Kohonen dans le cadre de la prévision présentée au chapitre. Le niveau de pauvreté a été évalué par des éconoistes à partir de critères dont l un est la consoation.

17 Analyse de données - Problèe et exeples h00 h00 4h00 6h00 8h00 0h00 h00 4h00 6h00 8h00 0h00 h00 heure Fiure 5 :Relevé bi-horaire du jour i h00 h00 4h00 6h00 8h00 0h00 h00 6h00 8h00 0h00 h00 4h00 Fiure 6 :Relevé bi-horaire du jour i 3

18 Analyse de données à l'aide des cartes de ohonen 4

19 La classification de Kohonen La classification de Kohonen. Introduction de l alorithe de Kohonen. Teuvo Kohonen a proposé dès 98 (Kohonen, 98 [6, 63]) un alorithe qui produit une carte d oranisation topoloique ([64, 65]). Le processus ne dépend que des entrées et ne nécessite pas l intervention d un superviseur, on parle dans ce cas d'autooranisation. Sa fonction principale est de faire correspondre les éléents de l'espace d'entrée avec des unités ordonnées sur une carte qui est une représentation raphique où chaque unité est entourée de ses voisines, les voisinaes ayant été définis à priori. Le résultat est une fonction de l'espace des entrées vers l'enseble des unités, telle que les iaes de deux éléents voisins au sens d'une certaine distance dans l'espace des entrées sont la êe unité ou des unités voisines sur la carte. 5

20 Analyse de données à l'aide des cartes de Kohonen Les propriétés de l alorithe et de ses cartes de sortie perettent conjointeent d analyser des données qui ont une structure non linéaire et de réaliser des représentations raphiques qui ettent en évidence certaines de leurs caractéristiques. L'application la plus courante est la classification de l espace d entrée, où l'on définit une notion de voisinae entre les classes qui n'est pas prise en copte par les éthodes de classification classiques.. Quelques alorithes de classification. Introduction : On distinue deux randes catéories d'alorithes de classification. La preière consiste à effectuer une partition de l espace en un nobre de classes fixé, c est le cas de la éthode des centres obiles et ses variantes issues des travaux de Fory (965) [43], Thorndie (953) [95], Mac Queen (967) [79], Ball et Hall (967) [6]. La deuxièe fournit une classification pour chaque niveau de reroupeent, chacune se déduisant de l aréation ou de la dissociation des classes du niveau précédent. La classification hiérarchique de type WARD procède par exeple par aréation (Ward J.H. (963) [99]). Ces éthodes sont présentées dans les ouvraes de statistiques classiques tels que Statistique Exploratoire Multidiensionnelle (Lebart, Morineau, Piron (995) [68]) ou Probabilités Analyse de Données et Statistiques (Saporta, S. (990) [94] ). 6

21 La classification de Kohonen èr type de classification : les classifications à nobre de classes fixé. a) La éthode des centres obiles : Cette éthode, dont la paternité est attribuée à Fory, est particulièreent adaptée aux données de rande taille. En effet, dans sa ise en place inforatique, le tableau de données conservé en éoire auxiliaire est lu plusieurs fois ais de façon séquentielle, et ainsi n occupe jaais de zone éoire iportante. Son efficacité est en rande partie attestée par les seuls résultats expérientaux. Ce type de classification est souvent utilisé coe technique de description et de réduction en association avec des analyses factorielles. Pour plus de précisions, on peut se rapporter aux ouvraes de Soal et Sneath (963) [93], Lance et Willias (967) [66] ou plus réceent Gordon (987) [5]. - L alorithe : Considérons l enseble X de N individus décrits par p variables à partitionner en U classes à l aide d une distance d (souvent la distance euclidienne ou celle du χ ). Les étapes de l alorithe sont les suivantes : Etape0: On déterine U centres provisoires de classes, les centres {G 0,..., G 0,..., G 0 U } (tirés selon un tirae pseudo aléatoire sans reise de U individus dans la population coe le préconise Mac Queen ( Mac Queen J. B. (967) [79]). Les U centres induisent une preière partition {C 0,..., C 0,...,C 0 U }. L individu i appartient à la classe C 0 s il est plus proche de G 0 que de tous les autres centres. Etape: On définit U nouveaux centres de classes {G,..., G,..., G U } en déterinant les centres de ravité des classes C 0,..., C 0,..., C 0 U. Ces nouveaux centres induisent une nouvelle partition forée des classes notées {C,..., C,..., C U }. Etape : On déterine U nouveaux centres de classe {G,..., G,..., G U } en prenant les centres de ravité des classes C -,..., C -,..., C - U, ce qui induit la nouvelle partition {C,...,C,..., C U.}. 7

22 Analyse de données à l'aide des cartes de Kohonen - Montrons que le processus convere : On note v() la esure de la dispersion autour des centres de classes à l étape : v( ) = U = i C x i G Considérons la soe des carrés des écarts à la oyenne intra classe à l étape, V() U V ( ) = x G où G + étant le centre de ravité de la classe C. = i C i + On va ontrer que v() V() v(+) : Ceci ontrera la converence vers le iniu à la fois de la dispersion autour des centres de classes et de la soe des carrés des écarts à la oyenne intra classe. D après le théorèe de Huyens, U v( ) = V ( ) + n G G où n est l effectif de C = + d où et v() V() v()=v() =,,U G + =G Montrons que V() v(+) : A l étape + v( + ) = U = + i C x i G + L expression de V() est identique à celle de v(+) si on replace C par C +. Or par définition C + est celui qui iniise la dispersion autour de {G + } =,,U d où + xi G + i C i C x i G + donc Conclusion V() v(+). v() V() v(+). avec () v()=v() =,,U G + = G 8

23 La classification de Kohonen Une suite positive stricteent décroissante convere, donc l alorithe convere vers un iniu local. De plus, si deux étapes conduisent à la êe partition, cette dernière est une solution de l alorithe. b) Siple copetitive learnin ou alorithe de Lloyd : une version stochastique en line des centres obiles : L'alorithe SCL est une version stochastique de l'alorithe de Fory présenté au pararaphe précédent, qui a la particularité de déplacer un seul centre de classe à la fois lors de la présentation d'un individu, ce qui le rend ieux adapté aux randes bases de données. Son principe, dont le détail peut être trouvé dans les ouvraes Hertz J. et al. (99) [54] Linde Y. et al. (980) [74], Lloyd S.P. (98) [75] et Mac Queen J. (967) [79], est le suivant : Les centres de classes G,, G U sont initialisés de façon aléatoire. A l'étape t, on présente l'observation x= x(t+) extraite au hasard. Puis, on définit l'indice anant u 0 coe celui du centre de classe qui iniise la distance euclidienne au vecteur présenté: x G u0 ( t) = in u x G u Gu 0 est alors odifié selon la forule: G u0 ( t + ) = G ( t) + ε( t)( x G u0 u0 ( t)) où le paraètre d'adaptation ε(t) décroît vers 0 en satisfaisant la condition de Robbins- Monro ( ε(t) = et ε ( t) < ). On peut ajouter une autre version stochastique des centres obiles appelée K-eans introduite par Mac Queen (967) et analoue à celle de Fory. On ontre que ces trois alorithes converent vers un iniu local de la soe des carrés des écarts aux centres de classes. Celui de Lloyd est très proche de l'alorithe de Kohonen présenté au pararaphe.3. 9

24 Analyse de données à l'aide des cartes de Kohonen èe type de classification : pari les classifications qui fournissent un reroupeent pour chaque niveau, on utilise en particulier les classifications hiérarchiques, avec la distance de WARD : Le principe de la classification ascendante hiérarchique consiste à créer, à chaque étape, une nouvelle partition de l enseble des données en aréeant les deux éléents les plus proches selon une distance choisie à priori. - Principe de l alorithe (coun à toutes les distances) : L'alorithe consiste à calculer à chaque étape s la atrice des distances entre les n s représentants des classes et à déteriner les deux classes dont les représentants sont les plus proches afin de les aréer et d obtenir (n s -) classes à l étape suivante. A l étape 0, il y a autant de classes que d individus dans la base de données. A l étape s, on en trouve n-s. A la fin, il ne reste plus qu une classe. - Définitions: Pour tout, on note le barycentre de la classe C et son effectif et désine le barycentre de toutes les données. On appelle soe des carrés des écarts aux centres de classes, notée SC W (pour soe des carrés intra ou within), la quantité. SC W = s = i C x i La soe des carrés des écarts entre les centres de classes et le centre de ravité est notée SC B (pour soe des carrés inter ou between)et vaut SC B = s = La soe des carrés des écarts au centre de ravité, notée SC T (pour soe des carrés totale) s'écrit SC T = s = i C x i La relation de Huyens induit la propriété suivante : SC T = SC B + SC W - La classification hiérarchique qui utilise la distance de WARD : 0

25 La classification de Kohonen La stratéie consiste, ici, à choisir à chaque étape l aréation entre deux classes qui fait le oins varier la soe des carrés des écarts aux centres de classes. C est-à-dire qu on cherche à obtenir à chaque pas un iniu local de la quantité SC W ou de façon équivalente un axiu de SC B. Considérons le passae de la partition P s à s classes à P s- forée de s- classes par l aréation des classes ), ( C et ), ( C qui donne la classe C. On peut calculer son effectif t et son barycentre s t. On a t + = et t + + = Avant l'aréation des classes, la soe des carrés des écarts entre les centres de classes et le centre de ravité s'écrit: SC B (s)= = = + + = s s & Après l'aréation des classes, elle s'écrit: SC B (s-)= = + s & t t La diinution de la quantité SC B, notée s, vaut: s t t + = Le théorèe de Huyens s écrit : t t t t + + = + et la diinution de la quantité SC B, s due au passae de s à s- classes devient : s + =. De plus t + + = d'où ), ²( s x x d + = + = Les barycentres

26 Analyse de données à l'aide des cartes de Kohonen A chaque étape, on cherche les classes C et C qui correspondent au plus petit s. s est appelé indice de niveau et on vérifie que la soe des indices de niveaux est l inertie totale des n éléents. - Résultat: Les classifications hiérarchiques déterinent une notion de paternité qui se traduit par un dendrorae indiquant pour chaque niveau, le reroupeent effectué. Mais il ne fournit pas d oranisation des classes qui perette d associer facileent à l une d entre elles celles qui lui sont proches. En effet, les fiures 7 et 8 ontrent deux représentations possibles de la êe classification hiérarchique. Il n est donc pas possible, à partir de l arbre, de donner les classes les plus proches de la classe autres que la classe issue du êe père. Il faudrait une notion de voisinae entre les classes pour pouvoir les disposer sur le raphique selon un ordre qui reflète leur proxiité. C'est préciséent cette notion centrale dans l'alorithe de Kohonen qui va fournir des représentations raphiques qui identifient les classes voisines dans le cas de la classification présentée au chapitre suivant. 3 4 Fiure 7 : Dendrorae, la classe est représentée entre la classe et de la classe3

LES CHIFFRES SIGNIFICATIFS ET LES INCERTITUDES

LES CHIFFRES SIGNIFICATIFS ET LES INCERTITUDES Une prédiction de certains écoloistes : Les poissons devraient avoir disparu en 048! LES CHIFFRES SIGNIFICATIFS ET LES INCERTITUDES Les rèles suivantes s appliquent pour tous les calculs ipliquant des

Plus en détail

Mécanique : Cinématique du point. Chapitre 1 : Position. Vitesse. Accélération

Mécanique : Cinématique du point. Chapitre 1 : Position. Vitesse. Accélération 2 e B et C 1 Position. Vitesse. Accélération 1 Mécanique : Cinéatique du point La écanique est le doaine de tout ce qui produit ou transet un ouveent, une force, une déforation : achines, oteurs, véhicules,

Plus en détail

Première S2 Chapitre 20 : probabilités. Page n 1 2007 2008

Première S2 Chapitre 20 : probabilités. Page n 1 2007 2008 Preière S2 Chapitre 20 : probabilités. Page n De tous teps, les hoes se sont intéressés aux jeux de hasard. La théorie des probabilités est une branche des athéatiques née de l'étude des jeux de hasard

Plus en détail

2.1 Comment fonctionne un site?

2.1 Comment fonctionne un site? Coent fonctionne un site? Dans ce chapitre, nous allons étudier la liste des logiciels nécessaires à la création d un site ainsi que les principes de base indispensables à son bon fonctionneent. 2.1 Coent

Plus en détail

L indice des prix à la consommation

L indice des prix à la consommation L indice des prix à la consoation Base 2004 Direction générale Statistique et Inforation éconoique 2007 L indice des prix à la consoation Base 2004 = 100 La Direction générale Statistique et Inforation

Plus en détail

La détérioration des termes de l échange 1 Bernard Conte 2002

La détérioration des termes de l échange 1 Bernard Conte 2002 La détérioration des teres de l échange des pays du Sud Bernard Conte el : conte@u-bordeau4.fr site web : http://conte.u-bordeau4.fr Les pays du Sud seraient inéluctableent frappés par la détérioration

Plus en détail

Problème I : Microscope à force atomique

Problème I : Microscope à force atomique Problèe I : Microscope à force atoique Ces dernières années, de nouvelles techniques dites de "icroscopies à chap proche" se sont développées pour étudier les surfaces. Pari ces techniques, le icroscope

Plus en détail

Arrondissage des résultats de mesure. Nombre de chiffres significatifs

Arrondissage des résultats de mesure. Nombre de chiffres significatifs BUREAU NATIONAL DE MÉTROLOGIE COMMISSARIAT À L'ÉNERGIE ATOMIQUE LABORATOIRE NATIONAL HENRI BECQUEREL Note technique LNHB/04-13 Arrondissage des résultats de esure Nobre de chiffres significatifs M.M. Bé,

Plus en détail

ÉTUDE BDC LES CINQ FACTEURS CLÉS ET LES CINQ PIÈGES À ÉVITER POUR RÉUSSIR EN AFFAIRES

ÉTUDE BDC LES CINQ FACTEURS CLÉS ET LES CINQ PIÈGES À ÉVITER POUR RÉUSSIR EN AFFAIRES ÉTUDE BDC LES CINQ FACTEURS CLÉS ET LES CINQ PIÈGES À ÉVITER POUR RÉUSSIR EN AFFAIRES Seaine de la PME BDC 2014 Résué --------------------------------------------------------------------------------------

Plus en détail

Utiliser Internet Explorer

Utiliser Internet Explorer 5 Utiliser Internet Explorer 5 Utiliser Internet Explorer Internet Explorer est le plus utilisé et le plus répandu des navigateurs web. En effet, Internet Explorer, couraent appelé IE, est le navigateur

Plus en détail

La planification en cas d inaptitude. Vous avez le pouvoir d agir!

La planification en cas d inaptitude. Vous avez le pouvoir d agir! La planification en cas d inaptitude. Vous avez le pouvoir d agir! Août 2015 Jaie Golobek Directeur gestionnaire, Planification fiscale et successorale Services consultatifs de gestion de patrioine CIBC

Plus en détail

GRAFCET. 1- Structure générale. CPGE / Sciences Industrielles pour l Ingénieur C60 Cours GRAFCET. Divergence en OU

GRAFCET. 1- Structure générale. CPGE / Sciences Industrielles pour l Ingénieur C60 Cours GRAFCET. Divergence en OU C60 GRAFCET 1- Structure générale Etape initiale : généraleent associée à une attente ou à une ise en réérence de la partie opérative Réceptivité : cobinaison d inorations reçues par la partie coande et

Plus en détail

OBJECTIFS. I. A quoi sert un oscilloscope?

OBJECTIFS. I. A quoi sert un oscilloscope? OBJECTIFS Oscilloscope et générateur basse fréquence (G.B.F.) Siuler le fonctionneent et les réglages d'un oscilloscope Utiliser l oscilloscope pour esurer des tensions continues et alternatives Utiliser

Plus en détail

Voyez la réponse à cette question dans ce chapitre. www.alternativesjournal.ca/people-and-profiles/web-exclusive-ela-alumni-make-splash

Voyez la réponse à cette question dans ce chapitre. www.alternativesjournal.ca/people-and-profiles/web-exclusive-ela-alumni-make-splash Une personne de 60 kg est à gauche d un canoë de 5 de long et ayant une asse de 90 kg. Il se déplace ensuite pour aller à droite du canoë. Dans les deux cas, il est à 60 c de l extréité du canoë. De cobien

Plus en détail

MECANIQUE QUANTIQUE Chapitre 3: Solutions stationnaires de l équation de Schrödinger

MECANIQUE QUANTIQUE Chapitre 3: Solutions stationnaires de l équation de Schrödinger MCANIQU QUANTIQU Capitre : Solutions stationnaires de l équation de Scrödinger Pr. M. ABD-FDI Université Moaed V-V Agdal Faculté des Sciences Départeent de Pysique Année universitaire 7-8 8 Filières SM-SMI

Plus en détail

L étalonnage par traceur Compton, une nouvelle méthode de mesure primaire d activité en scintillation liquide

L étalonnage par traceur Compton, une nouvelle méthode de mesure primaire d activité en scintillation liquide PH. CASSEE L étalonnage par traceur Copton, une nouvelle éthode de esure priaire d activité en scintillation liquide he Copton source efficiency tracing ethod, a new standardization ethod in liquid scintillation

Plus en détail

Les bases de données. Historique

Les bases de données. Historique 1 Les bases de données Aujourd hui indispensables dans tous les systèes de gestion de l inforation, les bases de données sont une évolution logique de l augentation de la deande de stockage de données.

Plus en détail

La métrologie du ph au LNE : état de l art et perspectives. Metrology of ph at LNE: state of the art and perspectives

La métrologie du ph au LNE : état de l art et perspectives. Metrology of ph at LNE: state of the art and perspectives La étrologie du p au LNE : état de l art et perspectives Metrology of p at LNE: state of the art and perspectives Rachel CAMPION et Cédric RIVIER Laboratoire national de étrologie et d essais (LNE), rue

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Abstract. Key-words: The flowshop problem, Heuristics, Job scheduling, Total flowtime.

Abstract. Key-words: The flowshop problem, Heuristics, Job scheduling, Total flowtime. Abstract Since the flowshop scheduling proble has found to be an NP-coplete proble, the developent of heuristic algoriths that give better solutions becoe necessary. In this paper we discuss how to resolve

Plus en détail

La mémoire C HAPITRE S EPT. 7.1 Qu est-ce que la mémoire? 166. 7.2 L utilisation de la mémoire à court terme 169

La mémoire C HAPITRE S EPT. 7.1 Qu est-ce que la mémoire? 166. 7.2 L utilisation de la mémoire à court terme 169 La éoire C HAPITRE S EPT 7.1 Qu est-ce que la éoire? 166 Les types de éoires 166 Vue d enseble des processus éoriels 168 7.2 L utilisation de la éoire à court tere 169 La éoire iconique 169 La éoire à

Plus en détail

Tolérance aux fautes-2 Serveurs à haute disponibilité

Tolérance aux fautes-2 Serveurs à haute disponibilité École Doctorale de Grenoble Master 2 Recherche Systèes et Logiciel Disponibilité des s Tolérance aux fautes-2 Serveurs à haute disponibilité Sacha Krakowiak Université Joseph Fourier Projet Sardes (INRIA

Plus en détail

Etude salaires : le marketing s'en sort bien

Etude salaires : le marketing s'en sort bien Page 1/5 Etude salaires : le arketing s'en sort bien Public- le i:» 12 2013 pai ('ATI IF RI M; UFrRTFHISi Selon l'étude Maesina Marketing Search/Aon Hewitt, les arketers ont vu leur réunération progresser

Plus en détail

DOSSIER SUR LE SECTEUR DES NOMS DE DOMAINE VOLUME 11 - NUMÉRO 4 - JANVIER 2015

DOSSIER SUR LE SECTEUR DES NOMS DE DOMAINE VOLUME 11 - NUMÉRO 4 - JANVIER 2015 DOSSIER SUR LE SECTEUR DES NOMS DE DOMAINE VOLUME 11 - NUMÉRO - JANVIER 2015 RAPPORT DE VERISIGN SUR LES NOMS DE DOMAINE LEADER MONDIAL DU SECTEUR DES NOMS DE DOMAINE ET DE LA SÉCURITÉ D'INTERNET, VERISIGN

Plus en détail

Solution Examen final

Solution Examen final Solution Eaen inal Intellience Artiicielle II I-7587 Jeudi 29 avril 2004 De 8h30 à h20 en salles L-255 out docuent est peris. Le nobre de points accordés à chacune des questions est inscrit entre parenthèses.

Plus en détail

Équations générales des milieux continus

Équations générales des milieux continus Équations générales des ilieux continus Jean Garrigues 1 ai 212 ii Avant-propos L objectif de ce cours est d établir les équations générales régissant tous les ilieux continus, qu ils soient solides ou

Plus en détail

TS Devoir surveillé N 3 mardi 08/01/2013

TS Devoir surveillé N 3 mardi 08/01/2013 TS Devoir surveillé N 3 ardi 8//3 No et Préno : Note : / Toute réponse doit être justifiée. Eercice : Le saut de la grenouille (7,5 points) Etienne Jules Marey (Beaune 83 Paris 94) physiologiste français,

Plus en détail

innovation / construction / territoire Crèche modulaire-bois La Rose des Vents GAILLAC (81) COMMUNAUTÉ DE COMMUNES

innovation / construction / territoire Crèche modulaire-bois La Rose des Vents GAILLAC (81) COMMUNAUTÉ DE COMMUNES innovation / construction / territoire Crèche odulaire-bois La Rose des Vents GAILLAC (81) COMMUNAUTÉ DE COMMUNES Présentation de la crèche éco-responsable et odulaire de la Rose des vents à Gaillac La

Plus en détail

ETUDE DE L ATTENUATION DES ONDES ULTRASONORES. APPLICATION AU CONTROLE NON DESTRUCTIF DES

ETUDE DE L ATTENUATION DES ONDES ULTRASONORES. APPLICATION AU CONTROLE NON DESTRUCTIF DES N d ordre 006-ISA-009 Année 006 Thèse ETUDE DE ATTENUATION DES ONDES UTRASONORES. AIATION AU ONTROE NON DESTRUTIF DES SOUDURES EN AIER INOXYDABE AUSTENITIQUE présentée devant Institut National des Sciences

Plus en détail

Autour des nombres et des polynômes de Bernoulli

Autour des nombres et des polynômes de Bernoulli Autour des nobres et des polynôes de Bernoulli Gaëtan Bisson d après un cours de Don Zagier Résué En athéatiques, les nobres de Bernoulli ont d abord été étudiés en cherchant à calculer les soes du type

Plus en détail

EXERCICE II : LE TELEPHONE "POT DE YAOURT" (5 points)

EXERCICE II : LE TELEPHONE POT DE YAOURT (5 points) USA 2005 EXERCICE II : LE TELEPHONE "POT DE YAOURT" (5 points) A l'ère du téléphone portable, il est encore possible de couniquer avec un systèe bien plus archaïque L'onde sonore produite par le preier

Plus en détail

Le Centre de Tri. Projet d espace de coworking à Bègles 21 janvier 2011

Le Centre de Tri. Projet d espace de coworking à Bègles 21 janvier 2011 Le Centre de Tri Projet d espace de coworking à Bègles 21 janvier 2011 Contexte 2 Objectifs 4 Projet 6 Lieu 8 Équipe projet 11 S o a i r Équipe d aniation Prograation Modèle éconoique Budget prévisionnel

Plus en détail

TRAITEMENT DES DONNEES MANQUANTES AU MOYEN DE L ALGORITHME DE KOHONEN

TRAITEMENT DES DONNEES MANQUANTES AU MOYEN DE L ALGORITHME DE KOHONEN TRAITEMENT DES DONNEES MANQUANTES AU MOYEN DE L ALGORITHME DE KOHONEN Marie Cottrell, Smaïl Ibbou, Patrick Letrémy SAMOS-MATISSE UMR 8595 90, rue de Tolbiac 75634 Paris Cedex 13 Résumé : Nous montrons

Plus en détail

PALANS TREUILS PONTS ROULANTS

PALANS TREUILS PONTS ROULANTS PALANS TREUILS PONTS ROULANTS Certified Copany Prograe Palans et Treuils électriques et pneuatiques Palans standards, hauteur réduite et hauteur perdue réduite Chaînes de charge et de anœuvre zinguées

Plus en détail

«Des places de jeux pour tous» Formulaire de demande

«Des places de jeux pour tous» Formulaire de demande «Des places de jeux pour tous» Forulaire de deande Ce questionnaire infore quant à la place de jeu en projet et ne constitue pas une grille d évaluation. Les renseigneents doivent donner une ipression

Plus en détail

Dossier pratique exposant

Dossier pratique exposant La rencontre du MARIAGE & PACS Dossier pratique exposant Quand? Où? Coent? Quoi? Les réponses aux questions que je e pose pour une bonne oranisation on salon! www.ariae-salon.co 1 Global Expo France www.lobalexpofrance.co

Plus en détail

CONDUCTIMÉTRIE 1. CONDUCTIVITÉ DE 3 ÉLECTROLYTES

CONDUCTIMÉTRIE 1. CONDUCTIVITÉ DE 3 ÉLECTROLYTES Travaux pratiques de chiie physique I Fournier Coralie, Chappuis Eilie Groupe E 5..29 CONDUCTIMÉTRIE. CONDUCTIITÉ DE ÉLECTROLYTES. But Déduire par conductiétrie si une solution d électrolytes suit la loi

Plus en détail

3. Données sur la personne responsable de l'établissement (requérant-e de l'autorisation)

3. Données sur la personne responsable de l'établissement (requérant-e de l'autorisation) REQUETE EN VUE DE L OBTENTION DE L'AUTORISATION D'EXPLOITER UN ETABLISSEMENT REGI PAR LA LOI SUR L HOTELLERIE, LA RESTAURATION ET LE COMMERCE DE BOISSONS ALCOOLIQUES (Renseigneents utiles à l'adresse :

Plus en détail

CH.9 ÉNERGIES exercices - correction

CH.9 ÉNERGIES exercices - correction CH.9 ÉNERGIES exercices - correction SAVOIR SON COURS ❶ Choisir la bonne réponse : Enoncés Réponse A Réponse B Réponse C ❶ L énergie de position d un objet ❷ Lorsqu un objet tobe augente quand son altitude

Plus en détail

Réseaux Évidentiels pour la fusion de données multimodales hétérogènes : application à la détection de chutes

Réseaux Évidentiels pour la fusion de données multimodales hétérogènes : application à la détection de chutes Réseaux Évidentiels pour la fusion de données ultiodales hétérogènes : application à la détection de chutes Paulo Arando Cavalcante Aguilar To cite this version: Paulo Arando Cavalcante Aguilar. Réseaux

Plus en détail

SNC du Chemin de Paris Création d un bâtiment d activité industrielle et de stockage ZAC du Chemin de Paris 60440 Nanteuil le Haudouin

SNC du Chemin de Paris Création d un bâtiment d activité industrielle et de stockage ZAC du Chemin de Paris 60440 Nanteuil le Haudouin DOSSIER DE DEMANDE D ENREGISTREMENT D UNE INSTALLATION CLASSEE POUR LA PROTECTION DE L ENVIRONNEMENT Code de l Environneent Livre V Titre I SNC du Chein de Paris Création d un bâtient d activité industrielle

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

Calibration bayesienne et prédiction de réglages. Marc Sancandi CESTA-DEV/SIS «Incertitudes et Simulation» 3-4 Octobre 2007

Calibration bayesienne et prédiction de réglages. Marc Sancandi CESTA-DEV/SIS «Incertitudes et Simulation» 3-4 Octobre 2007 Calibratio bayesiee et prédictio de réglages Marc Sacadi CEA/CESTA Séiaire «Icertitudes et Siulatio», DIF 3-4 Octobre 2007 CESTA-DEV/SIS «Icertitudes et Siulatio» 3-4 Octobre 2007 1 Qu est-ce que la «prédictio

Plus en détail

Échafaudage de façade UNI 70/100

Échafaudage de façade UNI 70/100 Stark gerüstet. Échafaudage de façade 70/100 Français valable à partir du 15.04.2013 Table des atières Montage du systèe / Avantages du systèe 2-3 Châssis 4-5 Planchers 6 Escaliers «intérieurs» 7 Escaliers

Plus en détail

PROPRIETES ELASTIQUES DU PLI UNIDIRECTIONNEL APPROCHE MICROMECANIQUE

PROPRIETES ELASTIQUES DU PLI UNIDIRECTIONNEL APPROCHE MICROMECANIQUE Cours Matériau Coposites Fiche 2 PROPRITS LASTIQUS DU PLI UNIDIRCTIONNL APPROCH MICROMCANIQU A. Chateauinois RSUM : Cette iche présente des approches sipliiées perettant d'éaluer le odule longitudinal

Plus en détail

modélisation solide et dessin technique

modélisation solide et dessin technique CHAPITRE 1 modélisation solide et dessin technique Les sciences graphiques regroupent un ensemble de techniques graphiques utilisées quotidiennement par les ingénieurs pour exprimer des idées, concevoir

Plus en détail

L UTILISATION DES CARTES DE KOHONEN DANS LA CLASSIFICATION. Patrick Rousset CEREQ rousset@cereq.fr

L UTILISATION DES CARTES DE KOHONEN DANS LA CLASSIFICATION. Patrick Rousset CEREQ rousset@cereq.fr L UTILISATION DES CARTES DE KOHONEN DANS LA CLASSIFICATION Patrick Rousset CEREQ rousset@cereq.fr Quel apport pour une nouvelle méthode dans l analyse de grandes bases de données par rapport à des méthodes

Plus en détail

Fiche de présentation

Fiche de présentation 1 / 8 Découvrir le code 1 5P-6P Fiche de présentation Titre de l'activité Sous-titre Degré(s) concerné(s) Durée estimée Résumé Contexte d'utilisation de la calculatrice Contenus et compétences mathématiques

Plus en détail

Lyon. HUB numérique. * Accro à Lyon

Lyon. HUB numérique. * Accro à Lyon HUB nuérique * Accro à tout Le nuérique 04 08 10 12 14 16 18 Posté par Laurent et Olivier de la Clergerie. Fabrice Lacroix, 44 ans. Teinté d innovation et d entrepreneuriat, le parcours de Fabrice épouse

Plus en détail

Pour tout renseignement complémentaire, veuillez contacter le service technique au 01 40 13 37 77. HORAIRES MONTAGE-DEMONTAGE

Pour tout renseignement complémentaire, veuillez contacter le service technique au 01 40 13 37 77. HORAIRES MONTAGE-DEMONTAGE Salon de l iobilier d entreprise règleent de décoration VALIDATION DES PROJETS Vos projets d aénageent de stand devront être validés dans le cadre du respect des règles d architecture du salon et du respect

Plus en détail

VISUALISATION DES DISTANCES ENTRE LES CLASSES DE LA CARTE DE KOHONEN POUR LE DEVELOPPEMENT D'UN OUTIL D'ANALYSE ET DE REPRESENTATION DES DONNEES

VISUALISATION DES DISTANCES ENTRE LES CLASSES DE LA CARTE DE KOHONEN POUR LE DEVELOPPEMENT D'UN OUTIL D'ANALYSE ET DE REPRESENTATION DES DONNEES VISUALISATION DES DISTANCES ENTRE LES CLASSES DE LA CARTE DE KOHONEN POUR LE DEVELOPPEMENT D'UN OUTIL D'ANALYSE ET DE REPRESENTATION DES DONNEES Patrick Rousset 1,2 et Christiane Guinot 3 1 CEREQ, Service

Plus en détail

COMMUNAUTE de COMMUNES de DOUVE & DIVETTE

COMMUNAUTE de COMMUNES de DOUVE & DIVETTE COMMUNAUTE de COMMUNES de DOUVE & DIVETTE PROJET D ASSAINISSEMENT NON COLLECTIF Ce forulaire est à renvoyer, dûent repli, au Service Public d Assainisseent Non Collectif (SPANC). Il peret à ce service

Plus en détail

Gamme et conseils de mise en œuvre

Gamme et conseils de mise en œuvre ENVELOPPE DU BÂTIMENT Gae et conseils de ise en œuvre BATIROC COMPLÉMENT DE GAMME, nous consulter PROFILS DE BARDAGE BATIBAC 4-25BV BATIBAC 6-25BH BATIBAC 5-35BH 25 267,5 FACE B (extérieur) 25 80,8 FACE

Plus en détail

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes. Introduction L'objectif de mon TIPE est la reconnaissance de sons ou de notes de musique à l'aide d'un réseau de neurones. Ce réseau doit être capable d'apprendre à distinguer les exemples présentés puis

Plus en détail

À propos des matrices échelonnées

À propos des matrices échelonnées À propos des matrices échelonnées Antoine Ducros appendice au cours de Géométrie affine et euclidienne dispensé à l Université Paris 6 Année universitaire 2011-2012 Introduction Soit k un corps, soit E

Plus en détail

Comment tracer une droite représentative d'une fonction et méthode de calcul de l'équation d'une droite.

Comment tracer une droite représentative d'une fonction et méthode de calcul de l'équation d'une droite. Comment tracer une droite représentative d'une fonction et méthode de calcul de l'équation d'une droite. Introduction : Avant de commencer, il est nécessaire de prendre connaissance des trois types de

Plus en détail

e-commerce+ Passez au e-commerce pour simplifier vos process de vente! RENCONTREZ-NOUS Salon E-commerce 23-25 septembre - Paris

e-commerce+ Passez au e-commerce pour simplifier vos process de vente! RENCONTREZ-NOUS Salon E-commerce 23-25 septembre - Paris e-coerce+ agazine d inforation d Octave N 11 Juin 2014 TO Passez au e-coerce pour siplifier vos process de vente! RENCONTREZ-NOUS Salon E-coerce 23-25 septebre - Paris Salon #vad.conext 21-23 octobre -

Plus en détail

Explorer l espace des mots : du linéaire au non-linéaire

Explorer l espace des mots : du linéaire au non-linéaire Explorer l espace des mots : du linéaire au non-linéaire Ludovic Lebart CNRS ENST, 46 rue Barrault, 75013, Paris. Abstract To visualize the associations between words within a series of texts, it is frequent

Plus en détail

Chapitre 1 Régime transitoire dans les systèmes physiques

Chapitre 1 Régime transitoire dans les systèmes physiques Chapitre 1 Régime transitoire dans les systèmes physiques Savoir-faire théoriques (T) : Écrire l équation différentielle associée à un système physique ; Faire apparaître la constante de temps ; Tracer

Plus en détail

OPERATIONS MANAGEMENT

OPERATIONS MANAGEMENT OPERATIONS MANAGEMENT RIRL 00 - Bordeaux Septeber 30t & Otober st, 00 RIRL 00 Te 8t International Conferene on Loistis and SCM Resear BEM Bordeaux Manaeent Sool Septeber 9, 30 and Otober st 00 La estion

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre : Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant

Plus en détail

LE PROBLEME DU PLUS COURT CHEMIN

LE PROBLEME DU PLUS COURT CHEMIN LE PROBLEME DU PLUS COURT CHEMIN Dans cette leçon nous définissons le modèle de plus court chemin, présentons des exemples d'application et proposons un algorithme de résolution dans le cas où les longueurs

Plus en détail

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies Régis Boulet Charlie Demené Alexis Guyot Balthazar Neveu Guillaume Tartavel Sommaire Sommaire... 1 Structure

Plus en détail

Date : 18.11.2013 Tangram en carré page

Date : 18.11.2013 Tangram en carré page Date : 18.11.2013 Tangram en carré page Titre : Tangram en carré Numéro de la dernière page : 14 Degrés : 1 e 4 e du Collège Durée : 90 minutes Résumé : Le jeu de Tangram (appelé en chinois les sept planches

Plus en détail

Chapitre 5: Oscillations d un pendule élastique horizontal

Chapitre 5: Oscillations d un pendule élastique horizontal 1 re B et C 5 Oscillations d'un pendule élastique horizontal 40 Chapitre 5: Oscillations d un pendule élastique horizontal 1. Définitions a) Oscillateur écanique * Un systèe écanique qui effectue un ouveent

Plus en détail

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

Notion de fonction. Série 1 : Tableaux de données. Série 2 : Graphiques. Série 3 : Formules. Série 4 : Synthèse

Notion de fonction. Série 1 : Tableaux de données. Série 2 : Graphiques. Série 3 : Formules. Série 4 : Synthèse N7 Notion de fonction Série : Tableaux de données Série 2 : Graphiques Série 3 : Formules Série 4 : Synthèse 57 SÉRIE : TABLEAUX DE DONNÉES Le cours avec les aides animées Q. Si f désigne une fonction,

Plus en détail

A l'intention des collègues dont les élèves vont tester le sujet "prospectif" de bac ES.

A l'intention des collègues dont les élèves vont tester le sujet prospectif de bac ES. A l'intention des collègues dont les élèves vont tester le sujet "prospectif" de bac ES. Le sujet proposé s'inscrit dans le cadre du texte d'orientation ci-joint. L'exercice I est du type "compréhension

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

Leçon N 4 : Statistiques à deux variables

Leçon N 4 : Statistiques à deux variables Leçon N 4 : Statistiques à deux variables En premier lieu, il te faut relire les cours de première sur les statistiques à une variable, il y a tout un langage à se remémorer : étude d un échantillon d

Plus en détail

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) 87 FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) Dans le cadre de la réforme pédagogique et de l intérêt que porte le Ministère de l Éducation

Plus en détail

NOTIONS DE PROBABILITÉS

NOTIONS DE PROBABILITÉS NOTIONS DE PROBABILITÉS Sommaire 1. Expérience aléatoire... 1 2. Espace échantillonnal... 2 3. Événement... 2 4. Calcul des probabilités... 3 4.1. Ensemble fondamental... 3 4.2. Calcul de la probabilité...

Plus en détail

Épreuve pratique de mathématiques Printemps 2009. Descriptifs. (Page vide)

Épreuve pratique de mathématiques Printemps 2009. Descriptifs. (Page vide) Épreuve pratique de mathématiques Printemps 2009 Descriptifs (Page vide) Sujet 001 Épreuve pratique de mathématiques Descriptif Étude d une fonction dépendant d un paramètre Étant donné une fonction dépendant

Plus en détail

VISUALISATION EN TEMPS RÉEL PERSPECTIVES À POINT DE VUE MOBILE

VISUALISATION EN TEMPS RÉEL PERSPECTIVES À POINT DE VUE MOBILE 167 VISUALISATION EN TEMPS RÉEL DE J. SAPALY On sait que l'exploration visuelle consiste en une succession de fixations du regard, séparées par des mouvements oculaires saccadés, chaque fixation amenant

Plus en détail

Concours de recrutement interne PLP 2009

Concours de recrutement interne PLP 2009 Concours de recrutement interne PLP 2009 Le sujet est constitué de quatre exercices indépendants. Le premier exercice, de nature pédagogique au niveau du baccalauréat professionnel, porte sur le flocon

Plus en détail

Corps de palier. Aperçu des produits Corps de palier... 1322 Caractéristiques Matières du corps de palier et surfaces extérieures...

Corps de palier. Aperçu des produits Corps de palier... 1322 Caractéristiques Matières du corps de palier et surfaces extérieures... Corps Corps Pae Aperçu des produits Corps... 3 Caractéristiques Matières du corps et surfaces extérieures... 34 Paliers fixes et paliers libres... 34... 34 Corps à seelle onoblocs et en deux parties Corps

Plus en détail

Rapport du Jury du Concours 2010 Épreuve Pratique d Algorithmique et de Programmation (EPAP)

Rapport du Jury du Concours 2010 Épreuve Pratique d Algorithmique et de Programmation (EPAP) Rapport du Jury du Concours 2010 Épreuve Pratique d Algorithmique et de Programmation (EPAP) Loris Marchal, Guillaume Melquion, Frédéric Tronel 21 juin 2011 Remarques générales à propos de l épreuve Organisation

Plus en détail

Estimations d erreur a priori de la méthode de Lagrange Galerkin pour les équations de type Kazhikhov Smagulov

Estimations d erreur a priori de la méthode de Lagrange Galerkin pour les équations de type Kazhikhov Smagulov Estiations d erreur a priori de la étode de Lagrange Galerkin pour les équations de type Kazikov Sagulov Jocelyn Étienne b,a Pierre Saraito a a LMC-IMAG, BP 53, 3841 Grenoble cedex b Adresse actuelle:

Plus en détail

SESSION 2014 MATHÉMATIQUES. Série : SCIENCES ET TECHNOLOGIES DU MANAGEMENT ET DE LA GESTION STMG. DURÉE DE L ÉPREUVE : 3 heures COEFFICIENT : 3

SESSION 2014 MATHÉMATIQUES. Série : SCIENCES ET TECHNOLOGIES DU MANAGEMENT ET DE LA GESTION STMG. DURÉE DE L ÉPREUVE : 3 heures COEFFICIENT : 3 BACCALAURÉAT TECHNOLOGIQUE SESSION 2014 MATHÉMATIQUES Série : SCIENCES ET TECHNOLOGIES DU MANAGEMENT ET DE LA GESTION STMG DURÉE DE L ÉPREUVE : 3 heures COEFFICIENT : 3 Calculatrice autorisée, conformément

Plus en détail

LES NOMBRES DECIMAUX. I. Les programmes

LES NOMBRES DECIMAUX. I. Les programmes LES NOMBRES DECIMAUX I. Les programmes Au cycle des approfondissements (Cours Moyen), une toute première approche des fractions est entreprise, dans le but d aider à la compréhension des nombres décimaux.

Plus en détail

RÉSOLUTION DE SYSTÈMES À DEUX INCONNUES

RÉSOLUTION DE SYSTÈMES À DEUX INCONNUES RÉSOLUTION DE SYSTÈMES À DEUX INCONNUES Sommaire 1 Méthodes de résolution... 3 1.1. Méthode de Substitution... 3 1.2. Méthode des combinaisons linéaires... 6 La rubrique d'aide qui suit s'attardera aux

Plus en détail

LOT 10 PLOMBERIE SANITAIRES

LOT 10 PLOMBERIE SANITAIRES 10-1 LOT 10 PLOMBERIE SANITAIRES SOMMAIRE 00 GENERALITES 2 00.01 CONSISTANCE DES OVRAGES 2 00.02 DISPOSITIONS ADMINISTRATIVES 2 00.03 DISPOSITIONS TECHNIQES GENERALES 4 01 DESCRIPTIF TECHNIQE 16 01.01

Plus en détail

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007 Vision industrielle et télédétection - Détection d ellipses Guillaume Martinez 17 décembre 2007 1 Table des matières 1 Le projet 3 1.1 Objectif................................ 3 1.2 Les choix techniques.........................

Plus en détail

CAPTEURS - CHAINES DE MESURES

CAPTEURS - CHAINES DE MESURES CAPTEURS - CHAINES DE MESURES Pierre BONNET Pierre Bonnet Master GSI - Capteurs Chaînes de Mesures 1 Plan du Cours Propriétés générales des capteurs Notion de mesure Notion de capteur: principes, classes,

Plus en détail

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie Partie I : Séries statistiques descriptives univariées (SSDU) A Introduction Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie et tous sont organisés selon le même

Plus en détail

Proposition d activité utilisant l application. Tripatouille. (http://www.malgouyres.fr/tripatouille/)

Proposition d activité utilisant l application. Tripatouille. (http://www.malgouyres.fr/tripatouille/) IREM Clermont-Ferrand Algorithmique au lycée Malika More malika.more@u-clermont1.fr 28 janvier 2011 Proposition d activité utilisant l application Tripatouille (http://www.malgouyres.fr/tripatouille/)

Plus en détail

PLAN DE CLASSIFICATION UNIFORME DES DOCUMENTS DU MSSS

PLAN DE CLASSIFICATION UNIFORME DES DOCUMENTS DU MSSS PLAN DE CLASSIFICATION UNIFORME DES DOCUMENTS DU MSSS Février 2011 Édition produite par : Le Service de l accès à l information et des ressources documentaires du ministère de la Santé et des Services

Plus en détail

Objectif du groupe GT1.1 Fusion de Données

Objectif du groupe GT1.1 Fusion de Données Objectif du groupe GT1.1 Fusion de Données Le groupe travaille dans trois directions Le vocabulaire (piloté par ADVITAM et l aide de SITE) L état de l art (piloté par SYROKKO) Deux applications illustratives

Plus en détail

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et

Plus en détail

Extraction d informations stratégiques par Analyse en Composantes Principales

Extraction d informations stratégiques par Analyse en Composantes Principales Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

Fascicule u7.05 : Impression de résultat pour visualisation

Fascicule u7.05 : Impression de résultat pour visualisation Titre : Procédure IMPR_RESU (FORMAT 'MED' Date : 06/05/2013 Page : 1/10 Procédure IMPR_RESU (FORMAT 'MED' 1 But Écrire le résultat d un calcul dans un fichier au format MED. On décrit l ensemble des mots

Plus en détail

1. Vocabulaire : Introduction au tableau élémentaire

1. Vocabulaire : Introduction au tableau élémentaire L1-S1 Lire et caractériser l'information géographique - Le traitement statistique univarié Statistique : le terme statistique désigne à la fois : 1) l'ensemble des données numériques concernant une catégorie

Plus en détail

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine

Plus en détail

Paiement sécurisé sur internet

Paiement sécurisé sur internet Paieent sécurisé sur internet CHAIGNEAU Delphine DANTE Alexandra GARNODIER Karine RICM3 25 janvier 2002 1.1 Internet et coerce 1.2 Modes de paieent 1.3 Qualités d un procédé 1.1 Internet et coerce 1.1

Plus en détail

PHANTOM 3. Guide de démarrage rapide PROFESSIONAL V1.0

PHANTOM 3. Guide de démarrage rapide PROFESSIONAL V1.0 PHANTOM 3 PROFESSIONAL Guide de déarrage rapide V.0 Phanto 3 Professional Découvrez votre Phanto 3 Professional. La caéra du Phanto 3 Professional vous peret d'enregistrer des vidéos en 4K et de prendre

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail