Réseaux neuronaux avancés pour la cartographie de la science et de la technologie : APPLICATION A L ANALYSE DES BREVETS

Dimension: px
Commencer à balayer dès la page:

Download "Réseaux neuronaux avancés pour la cartographie de la science et de la technologie : APPLICATION A L ANALYSE DES BREVETS"

Transcription

1 VSST'2001 Réseaux neuronaux avancés pour la cartographie de la science et de la technologie : APPLICATION A L ANALYSE DES BREVETS Jean-Charles LAMIREL (*), Yannick TOUSSAINT (*), Jacques DUCLOY (**), Catherine CZYSZ(**), Claire FRANCOIS (**) Francelamirel@loria.fr, yannick@loria.fr, ducloy@inist.fr, claire.francois@inist.fr, czysz@inist.fr (*) LORIA B.P. 239, Vandoeuvre-lès-Nancy Cedex (**) INIST-CNRS, 2, allée du Parc de Brabois Vandoeuvre-lès-Nancy Cedex France Résumé Cet article présente une méthode cartographique neuronale originale, appelée MULTISOM. La méthode MULTISOM a été dans un premier temps utilisée dans le cadre de systèmes de recherche d information. Elle représente l extension à un contexte multicartes de la méthode topographique classique SOM de Kohonen. Cette dernière méthode utilise comme principes de base un apprentissage non supervisé et une organisation spatiale prédéfinie des données. La méthode MULTISOM étend la méthode SOM en introduisant les principes de points de vue, par l intermédiaire de cartes multiples, et de dynamique dans l analyse des données, par l intermédiaire de mécanismes de généralisation et de communication intercartes. L échange dynamique d information entre les cartes peut être exploité par un analyste de l information pour opérer des déductions entre plusieurs analyses qui ont été menées sur le même corpus de données. Le contexte expérimental de l article est représenté par une base de 1000 brevets relatifs à l ingénierie des huiles moteurs. L organisation structurelle ainsi que la sémantique des champs des brevets sont exploités pour générer différents points de vue correspondant aux différents centres d intérêt de l analyste. Dans l expérience qui est décrite les points de vue sélectionnés correspondent aux champs Utilisation, Avantages, Déposants et Titre des brevets. Le vocabulaire d indexation associé à chaque champ est extrait automatiquement du plein texte des champs par l intermédiaire d une analyse lexicale. Le vocabulaire résultant est ensuite utilisé pour reconstruire les descriptions des différents brevets selon chaque point de vue. Ces descriptions sont finalement classifiées en utilisant la méthode MULTISOM, générant autant de cartes qu il existe de points de vue. La section 1 de cet article présente la méthode SOM de Kohonen, ainsi que ses principales applications à la cartographie de la science et de la technologie. La section 2 présente quelques aménagements de base de la méthode SOM, principalement utilisés pour l analyse des données documentaires. La section 3 décrit la méthode MULTISOM proprement dite. Elle présente plus particulièrement les fonctionnalités les plus originales de la méthode MULTISOM, tel que la définition des points de vue, l étiquetage des cartes, le mécanisme de généralisation, et le modèle de communication intercartes, incluant les protocoles de détection de signaux fort et faibles entre points de vue. Le contexte de l expérience concernant l analyse les brevets sur l ingénierie des huiles moteur est décrit dans la section 4. Cette dernière section contient également une comparaison succinte des résultats obtenus avec ceux fournis par une méthode K-means axiale. La section 5 décrit la connexion de la méthode MULTISOM avec des méthodes symboliques de type treillis de Gallois, et propose une évaluation empirique de la valeur ajoutée obtenue. Les conclusions sont finalement exposées. 210

2 TEXTES DES COMMUNICATIONS - Tome II 1 INTRODUCTION Les cartes thématiques représentent de puissants outils d analyse. En effet, une présentation appropriée des classes thématiques et de leur interrelations sous forme de cartographie peut fournir à un analyste des indications qui s avèrent impossible à obtenir par le biais de la simple lecture de tables de sorties ou de statistiques élémentaires. Pour certaines tâches d analyse, comme dans le cas de l analyse de brevets, une visualisation appropriée peut même représenter la seule voie possible pour résoudre un problème, ou encore pour confirmer une hypothèse, même si cette méthode n est pas habituellement envisagée. De nombreuses méthodes de cartographie thématiques ont été proposées. Celles que nous retiendrons ici sont basées sur des modèles neuronaux artificiels (MNA). Un MNA peut être considéré comme un ensemble de nœuds, ou neurones, interreliés entre eux, et généralement organisés en plusieurs couches. La puissance d un tel modèle est principalement liée à sa capacité d apprentissage qui peut elle-même être définie comme la variation d une matrice de poids (W) qui définit la force des liaisons entre les différents nœuds. La similitude du comportement de tels modèles avec les modèles d analyse multivariée, ainsi que leurs capacités de projection non linéaires représentent de sérieuses valeurs ajoutées pour la classification et la projection de données. Le modèle de carte autoorganisatrice proposé par Kohonen (SOM) matérialise une catégorie particulière de MNA qui implémente en une seule étape les tâches de classification et de projection de données. Dans le cas de ce modèle, l apprentissage se déroule de manière compétitive et non supervisée sous la contrainte de règles d organisation spatiales préalablement définies. Ce type d apprentissage, dit également topographique, permet de comprimer l information véhiculée par les données initiales à classifier tout en réduisant significativement la perte d information liée aux interrelations entre ces dernières. Les principaux avantages du modèle SOM original sont la bonne robustesse du processus de construction et son très bon pouvoir illustratif. Cependant le fait que modèle ne permette de traiter qu une seule classification à la fois peut être considéré comme un inconvénient sérieux pour son exploitation dans le cadre de la fouille de données. Pour répondre aux limitations du modèle SOM, nous aborderons dans cet article un modèle innovant qui a été dans un premier temps introduit pour optimiser le comportement des systèmes de recherche d information (Lamirel, 1995). Celui-ci a pu ensuite être testé avec succès dans le cadre de tâches de fouille de données et de feuilletage multimédia interactifs, en exploitant plus particulièrement les concepts de cartes multiples et la synergie entre textes et images pouvant apparaître sur une même carte (Lamirel, 2000a). Le modèle proposé, qui représente une extension aux cartes multiples du modèle SOM de Kohonen, sera désigné par la suite sous le nom de MULTISOM. Le modèle MULTISOM introduit les principes de points de vue, par l intermédiaire de cartes multiples, et de dynamique dans l analyse des données, par l intermédiaire de mécanismes de généralisation et de communication intercartes. L échange dynamique d information entre les cartes peut être exploité par un analyste de l information pour opérer des déductions entre plusieurs analyses qui ont été menées sur le même corpus de données. Un des buts de cet article est de montrer que le modèle MULTISOM peut-être considéré comme le modèle neuronal de référence pour les tâches d analyse de données. La section 1 de cet article présente la méthode SOM de Kohonen, ainsi que ses principales applications à la cartographie de la science et de la technologie. La section 2 présente quelques aménagements de base de la méthode SOM, principalement utilisés pour l analyse des données documentaires. La section 3 décrit la méthode MULTISOM proprement dite. Elle présente plus particulièrement les fonctionnalités les plus originales de la méthode MULTISOM, tel que la définition des points de vue, l étiquetage des cartes, le mécanisme de généralisation, et le modèle de communication intercartes, incluant les protocoles de détection de signaux forts et faibles entre points de vue. Le contexte de l expérience concernant l analyse les brevets sur l ingénierie des huiles moteur est décrit dans la section 4. Cette dernière section contient également une comparaison succinte des résultats obtenus avec ceux fournis par une méthode K-means axiale. La section 5 décrit la connexion de la méthode MULTISOM avec des méthodes symboliques de type treillis de Gallois, et propose une évaluation empirique de la valeur ajoutée obtenue. Les conclusions sont finalement exposées. IRIT - DELTA VEILLE 211

3 VSST' LE MODELE DE CARTE AUTO-ORGANISATRICE DE KOHONEN (SOM) L hypothèse de base défendue par le modèle SOM est celle que la construction des connaissances opérée par le cortex repose sur des algorithmes d apprentissage qui privilégient l auto-organisation spatiale (voir Kohonen, 1984, 1990, 1991, 1993, et 1997; voir ég. Ritter and Kohonen, 1989). Le modèle SOM proposé par Kohonen simule ce mécanisme sous la forme d un processus de classification topographique. Selon ce processus, les données d entrée, représentables dans le cas général comme des vecteurs N-dimensionnels, sont donc ramenées à des classes qui s auto-organisent selon une structure bidimensionnelle de nœuds, ou neurones, sur laquelle les relations de voisinage sont prédéfinies. Le processus de classification topographique du modèle SOM combine donc une étape de classification avec une étape de projection des données. 1 Dans le modèle SOM, la structure de voisinage entre les nœuds peut, tout en conservant son caractère bidimensionnel, obéir à de nombreuses variantes différentes : structure carrée, rectangulaire, hexagonale ou même irrégulière. Le modèle SOM appartient, tout comme le modèle ART de Grossberg et Carpenter, basé sur la théorie résonance adaptative, à la catégorie des modèle neuronaux dit à apprentissage compétitif non supervisé (Hinton, 1989; Joudoin, 1994; Kohonen, 1997). L apprentissage compétitif se traduit par une concurrence d activité des nœuds du modèle vis à vis des données d entrée. Si aucune information sur les classes résultantes susceptibles d être obtenues n est fournie au réseau, cet apprentissage est également dit non supervisé. Ce dernier comportement est similaire à celui des méthodes de classification non supervisée. Comme ces dernières, le modèle SOM est donc utilisé pour identifier des classes associées à des données d entrée, et a posteriori, pour classifier des données inconnues. De plus, comme il produit une cartographie d un espace R n, pouvant s avérer fortement multidimensionnel, vers un espace bidimensionnel ordonné (R 2 ), il permet de visualiser de manière simplifiée des relations d ordre de nature métrique entre les données d entrée. A titre de conclusion, citons finalement Kohonen (1997) : «Les principales applications de SOM sont la visualisation de données complexes selon une affichage bidimensionnel, mais également la création d abstractions, comme c est le cas de nombreuses techniques de classification» L algorithme d apprentissage du modèle SOM est présenté de manière détaillée dans (Kohonen, 1997; Lin, 1991; Jodouin, 1994; Lamirel, 1995; Lippmann, 1987). Il comprend principalement deux étapes: [1] sélection d un nœud gagnant et [2] mise à jour du profil du nœud gagnant et de ceux des nœuds appartenant à son voisinage. L obtention d une carte valide, et au mieux d une carte optimale, nécessite cependant de générer de nombreuses cartes en parallèle en faisant varier les paramètres d apprentissage, et de comparer les cartes obtenues (Varsis 1992; Lamirel 1995). 1 Sélection du nœud gagnant : Soit x(t) = {x 1 (t), x 2 (t),, x N (t)} le vecteur d entrée (i.e. la donnée) sélectionné au temps t, et W k (t) = {W k1 (t), W k2 (t),, W kn (t)} le vecteur de poids associé au nœud k au temps t. La distance euclidienne la plus faible x(t) W k (t) permet de définir le nœud gagnant s, soit : x(t) W s (t) = min x(t) W k (t) 2 Apprentissage non supervisé et sélection du voisinage : Après la sélection du nœud gagnant s, le vecteur de poids associé à ce nœud, ainsi que les vecteurs de poids associés aux nœuds se trouvant dans un voisinage donné du nœud s (par ex. les nœuds se trouvant dans un carré ou dans un cercle centrés autour de s) sont ajustés de manière à ce que leur profil se rapproche de celui de la donnée d entrée. Cet ajustement de poids qui caractérise l apprentissage non supervisé du modèle peut être décrit par l équation : W ki (t+1) = W ki (t) + α(t) h(t) [X i (t) W ki (t)] for 1 i N 1 Selon Kohonen, le modèle SOM peut également être considéré, sous une forme plus abstraite, comme un réseau élastique de points (matérialisant des paramètres, des références, ou des vecteurs de codage) introduits dans l espace initial de description des données et dont le rôle est celui d approximer la fonction de densité de ces données (Kohonen, 1997) (Kohonen, 1997). 212

4 TEXTES DES COMMUNICATIONS - Tome II où α(t) est un terme de gain (0 α(t) 1) décroissant en fonction du temps et convergent vers 0, et h(t) est une fonction de voisinage. A l issue de l algorithme d apprentissage, les données d entrée peut être reprojetées sur la carte obtenue. Le nœud d affectation d une donnée représente alors celui dont le vecteur de poids est le plus proche du vecteur descriptif de la donnée. Il peut donc être sélectionné en réutilisant l étape 1 susmentionnée. Les cartes SOM de Kohonen ont été utilisées avec succès dans l évaluation qualitative des sciences, notamment pour l analyse des réseaux de publications (Campanario, 1995) et des réseaux d auteurs (White et al., 1998). Elles ont également fourni des résultats significatifs pour d autres types de tâches de traitement de l information comme la classification de comptes-rendus de réunion (Orwig, 1997), la classification de données socio-économiques (Varsis, 1992), et la cartographie du contenu des bases documentaires (Lin, 1991; Lin 1997). Un panorama plus exhaustif des applications du modèle SOM peut être trouvé dans (SOM, 1998). 3 AMELIORATION DU MODELE SOM POUR L ASSISTANCE A L ANALYSE DE DONNEES Après la phase préliminaire d'apprentissage, chaque carte doit être organisée de manière à être rendue lisible à l'utilisateur, en lui fournissant notamment une vue générale des résultats de la classification. Cette tâche, correspond dans la pratique une labelisation des nœuds de la carte, dont les profils contiennent la description des classes obtenues. Elle s avère délicate du fait que ces profils représentent le plus souvent des combinaisons complexes des composantes descriptives extraites des données. De fait, les stratégies de labelisation élémentaires telles que celles proposée par Lin (Lin, 1991) peuvent induire des raccourcis ou des erreurs dans l interprétation du contenu des classes. Nous explicitons à la section suivante un premier ensemble de solutions simples pour résoudre ce problème. Un second ensemble de solutions, plus générales, est présenté à la section 5. Dans l ensemble des sections qui suivent, nous considérerons, pour faciliter les explications, que le processus de classification gère des documents électroniques dont la description se trouve résumée par des vecteurs d index. Les classes seront, quant à elles, représentées par des profils, eux-mêmes matérialisés par des vecteurs de poids, associés aux nœuds, ou neurones, d une carte : chaque composante d un profil correspondra à un index (i.e. un mot-clé) différent dans l espace de description des documents. La liste des données d entrée associées à une classe représentera une liste de documents. L ensemble des documents associés à une classe représentera le profil des membres de la classe. La sémantique véhiculée globalement par le profil d une classe, ou encore par le profil de ses membres, représentées par des combinaisons pondérées de mots-clé, sera appelée une thématique. 3.1 Labelisation d une carte Une première phase de l assistance à l analyse des informations fournies par une carte consiste à définir des noms de classes qui représentent au mieux le contenu de ces dernières lorsque la carte est présentée à l'utilisateur. En tenant compte du fait qu'il n'y a pas de solution absolue pour résoudre ce problème dit de "dénomination de classe", bien connu par les spécialistes de la classification, nous avons choisi d'adopter deux types de stratégies qui peuvent être indifféremment utilisés lors de la consultation des cartes : Les stratégies dirigées par les profils des classes consistent à attribuer à chaque classe un nom qui représente la composition des labels des composantes dominantes de son vecteur de profil. Ces stratégies sont particulièrement adaptées pour mettre en évidence les thématiques majeures isolées par le processus de classification. Les stratégies dirigées par les profils des données consistent à attribuer à chaque classe un nom qui représente la combinaison des labels des composantes dominantes, qui du vecteur de profil du membre le plus caractéristique de la classe, qui d'un vecteur de profil calculé représentant le profil moyen de l'ensemble des membres de la classe. Ces stratégies sont utiles pour fournir des informations complémentaires pour l'interprétation des thématiques. Ce phénomène est dû au fait que les profils de IRIT - DELTA VEILLE 213

5 VSST'2001 classes représente une information indirecte, issue du processus de classification proprement dit, alors que les profils des documents représentent une information directe issue du contenu des documents. 3.2 Division d une carte en aires logiques Une seconde phase de l assistance à l analyse des informations fournies par une carte l'analyse consiste à diviser la carte en "aires logiques fermées" représentées par des groupes cohérents de nœuds. Chaque aire, qui peut être considérée comme une macro-thématique, fournira alors une information fiable sur l'importance relative des différentes thématiques de base. Les thématiques les plus riches en données seront représentées par des aires plus importantes que les thématiques correspondant à des données marginales. Ce type de d'effet illustre assez bien le comportement non linéaire inhérent à la méthode de classification topographique de Kohonen. L'algorithme de calcul des aires est basé sur les propriétés topographiques des vecteurs de profils associées aux nœuds d une carte SOM. Ces propriétés, qui ne sont valides que sur une carte cohérente, garantissent d obtenir des aires fermées et continues. L algorithme que nous utilisons représente une généralisation de celui proposé par Lin (Lin, 1991). Il est décrit en détail dans (Lamirel, 1995). 3.3 Mécanisme de généralisation Une fonctionnalité que nous avons jugée également importante pour assister à l analyse des informations fournies par une carte consiste à résumer le contenu de cette dernière sous la forme d un ensemble de classes plus génériques par l intermédiaire d un processus de généralisation en ligne. La méthode que nous avons proposée pour atteindre ce but consiste à réduire le nombre de classes (i.e. le nombre de nœuds) d une carte de manière cohérente. Il s agit, à partir de la carte originale, d introduire de nouveaux niveaux de classification plus synthétiques, correspondant à de nouvelles cartes, en réduisant progressivement le nombre de nœuds de ces dernières. Comme les cartes originales ont été construites sur la base d une structure de voisinage carrée entre les nœuds, la transition d un niveau de généralisation vers un autre s opère alors en construisant un nouvel ensemble de nœuds, dans lequel le profil de chaque nœud représente la composition moyenne des profils de quatre voisins immédiats sur le niveau original. La figure 3 illustre le fonctionnement du processus de généralisation. Cartes générées Noeud de synthèse (Niveau M + 1) Carte source Noeuds voisins (Niveau M) Figure 1: Mécanisme de généralisation. Cette figure illustre le fonctionnement du processus de généralisation. La figure illustre plus particulièrement les correspondances existant entre la carte de Kohonen originale, issue du processus d apprentissage sur les données, et les différentes cartes synthétiques générées en ligne. Elle montre également comment les profils des nœuds voisins d un niveau de synthèse donné sont utilisés pour générer le profil d un nœud de niveau de synthèse plus général. La méthode de généralisation proposée peut être vue comme la détermination de l ensemble des centres de gravité d un niveau source pour construire un nouveau niveau. Soit n m (n, m 2) les dimensions en nombre de nœuds d une carte d un niveau donné, le processus de généralisation produira alors à l étape suivante une carte de niveau immédiatement plus général de dimensions (n 1) (m 1). L avantage de cette méthode est celui de préserver la structure originale de voisinage sur l ensemble des niveaux générés. Elle permet de plus d assurer la conservation des propriétés topographiques des vecteurs de profils de nœuds, et par conséquent la cohérence des aires sur les 214

6 TEXTES DES COMMUNICATIONS - Tome II cartes générées (voir Lamirel, 2000a). Cette méthode peut finalement s apparenter à une forme implicite et distribuée de classification hiérarchique ascendante basée sur le voisinage réciproque (pour ce point, voir De Rham, 1980). La méthode de généralisation peut être plus spécifiquement utilisée pour mesurer la cohérence des classes qui ont été déterminées sur la carte originale. En effet, du fait des propriétés topographiques inhérentes aux cartes (SOM), la cohérence d une thématique donnée est directement liée à la stabilité, durant les différentes étapes de la généralisation, du nombre de nœuds qui la représente et de celle des frontières des aires auxquelles elle est associée. 4 POINTS DE VUE ET CARTES MULTIPLES POUR L ANALYSE DE L INFORMATION La communication entre cartes de Kohonen, introduite pour la première fois dans le contexte des systèmes de recherche d information (Lamirel 1995), représente une amélioration majeure du modèle standard. Ce mécanisme original permet en effet d introduire la notion de point de vue dans l analyse de l information, chaque point de vue étant représenté par une carte différente. Etant donné que chaque carte matérialise une organisation thématique spatiale selon laquelle l information est représentée sur forme de nœuds (classes/thématiques) et d aires logiques (groupes de classes/thématiques), le mécanisme de communication entre cartes permet à l utilisateur de mettre en évidence des relations sémantiques entre des thématiques représentées sur des points de vue différents. La figure 6 illustre plus particulièrement ce mécanisme. 4.1 La notion de point de vue Le principe de construction des points de vue est celui de séparer l espace de description des documents en différents sous-espaces rattachés à des sous-ensembles de mots-clés descriptifs différents. L ensemble V des différents points de vue issus du sous-espace de description D d un ensemble de documents peut être définit comme : n V = {v 1, v 2,, v n }, v i P(D), with vi Υ = D i= 1 où chaque v i représente un point de vue et P(D) représente l ensemble des parties de l espace de description D des documents; l union des points de vue recompose l espace initial D de description des documents. La définition proposée ci-avant s avère suffisamment souple pour générer de nombreux sous-ensemble de points de vue différents. Elle permet ainsi de générer des points de vue recouvrants, tout aussi bien que de générer des points de vue qui respectent une structure explicite attachée à la description des documents, telle qu un découpage en champs. Dans ce dernier cas, les différents points de vue correspondront alors aux différents sous-ensembles d index rattachés aux différents champs de la description des documents : ainsi, si les champs «mots-clés», «titre» et «auteurs» sont utilisés comme champs descripteurs d un ensemble de documents, ils peuvent représenter trois points de vue différents sur cet ensemble de documents. Il est cependant à noter que la notion de point de vue proposée ici ne se réduit pas à la notion de champ descripteur des documents, mais qu elle est plus générale. 4.2 Mécanisme de communication intercartes Dans le modèle MULTISOM, cette communication est basée sur l'utilisation des documents qui ont été re-projetées sur les cartes comme neurones intermédiaires de transmission entre les différentes cartes. La communication entre les cartes peut être décomposée en deux étapes successives (voir ég. La figure 2) : Génération d'une activité thématique sur une carte source Transmission de l'activité vers des cartes destination L'activité thématique de la carte source peut être générée directement par l'utilisateur, soit sur des nœuds de la carte, soit plus globalement sur des aires de celle-ci. Cette activité se matérialise sous la forme d'un ensemble de décisions thématiques modales prises par celui-ci (choix catégorique, choix IRIT - DELTA VEILLE 215

7 VSST'2001 nuancé, rejet nuancé, rejet catégorique), puis associées à des activités neuronales prédéfinies [LAM 95]. Les thématiques actives (positivement ou négativement) représenteront les thématiques originelles du croisement thématique. L'activité thématique de la carte source peut aussi être directement définie par la projection d'une requête de l'utilisateur sur la carte. Dans ce cas, la valeur de l activité correspondra à la valeur de la mesure cosinus entre le vecteur de profil du nœud et le vecteur correspondant à la requête (Salton, 1971). L'effet obtenu est cette fois celui d'isoler les thématiques qui sont en relation plus ou moins forte avec la requête sur la carte source. La transmission d'activité aux cartes destinations s opère elle-même en deux étapes : une transmission descendante de la carte source vers les neurones-documents, puis une transmission ascendante des neurones-documents vers les cartes destinations. Le processus de transmission d'activité entre cartes peut être vu comme un moyen d'estimer les corrélations (càd les croisements) existant entre des thématiques rattachées à des points de vue différents, que ces derniers soient concurrents ou complémentaires, comme le montre l'exemple de la figure 6. Il s'apparente donc à une forme générale de déduction non supervisée. L'activité d'une classe i d'une carte destination T dérivant de l'activité d'une carte source S peut être T A f ( g( A )), A = g( A i = n i n n S j n ) calculée comme : où n représente un neurone associé à une donnée, j n sa classe d'appartenance sur la carte source, f est une fonction évaluant la force de croisement transthématique telle que celle décrites ci-après g est une fonction de biais décrite ci-après. Signal source : activation directe par l utilisateur ou activation par une requête [1] Carte source [2] [3] Carte destination Figure 2: Mécanisme de communication intercartes. La figure décrit les étapes principales du processus de communication intercartes. [1] L'activité est générée par l'utilisateur sur un ou plusieurs nœuds de la carte source, soit directement, soit par l'intermédiaire d'une requête. [2] L'activité est transmise aux neurones-documents associés aux nœuds actifs de la carte source. [3] L'activité est transmise par les neurones-documents aux nœuds des cartes destination auxquelles sont associés ces premiers. Le processus de communication peut gérer conjointement des activités positives (choix) et des activités négatives (rejets). Il faut noter que les données représentent ici les documents indexés. Les paramètres du mécanisme de communication entre les cartes susceptibles d être choisis par l analyste correspondent aux modes de calcul de la corrélation sémantique matérialisé par la fonction f de l équation de propagation précédemment décrite. Ce mode peut être soit probabiliste, soit possibiliste. En mode possibiliste, chaque classe d'une carte destination hérite de l'activité retransmise par ses données les plus actives. La fonction f peut alors être décrite comme : + f = Max ( An ) + Max ( An ) n i n i A + représente une valeur d'activité positive (matérialisant un choix), A - une valeur d'activité négative (matérialisant un rejet). Cette approche peut permettre à l'utilisateur de détecter des croisements 216

8 TEXTES DES COMMUNICATIONS - Tome II faibles, ou signaux faibles, entre des thèmes appartenant à des points de vue différents. Pour plus de précisions sur la théorie des possibilités, voir (Dubois and Prade, 1988). En mode probabiliste, chaque classe hérite de l'activité moyenne retransmise par l'ensemble ses données associées. La fonction f peut alors être décrite comme : 1 f = A n i n i i représente le nombre de données associées à la classe i. Contrairement au calcul possibiliste, le calcul probabiliste donne une indication plus fiable de la force de croisement transthématique. Il peut donc être utilisé pour distinguer entre les croisements forts et les croisements faibles. Le rôle de la fonction de biais g, qui peut être utilisée de manière optionnelle, est celui de moduler la transmission de l activité d une classe source vers ses neurones-documents associés (activation descendante), et par la suite, desdits neurones-documents vers leurs classes destination associées (activation montante), en considérant le degré d appartenance d un document à une classe comme un facteur d atténuation de la transmission. On pourra remarquer que pour fonctionner efficacement, le mécanisme de communication intercartes nécessite qu'une partie significative des données puisse jouer le rôle d'intermédiaire entre les différentes cartes. Cette condition peut être facilement vérifiée si l'ensemble des profils des données d entrée utilisés pour la génération des différentes cartes indexent chacun un nombre significatif de données. 5 APPLICATION Dans les deux sections précédentes nous avons introduit le modèle MULTISOM après avoir présenté le modèle SOM à partir duquel il a été dérivé. Dans la section qui suit, nous allons présenter un exemple typique d application du modèle MULTISOM. Cet exemple démontera le bien-fondé du principe de la visualisation cartographique multiple proposé par ce modèle pour résoudre les questions de veille technologique, de veille scientifique, aussi bien que celles liés à la découverte de connaissances. Notre corpus d exemple est représenté par un ensemble de 1000 brevets issus du domaine de l ingénierie des huiles moteur. Ces brevets ont été établis durant l année Cette section est organisée de manière à décrire deux aspects différents de l application. Le premier concerne le mode d analyse. Il suppose la détermination du problème à résoudre, ainsi que la mise en place de la stratégie pour le résoudre (section 4.1). Un autre aspect concerne la répartition des tâches lors de l analyse, entre l analyste et le logiciel. Cette répartition est décrite à la section 4.2. La section 4.3 décrit l utilisation du mécanisme de communication intercartes dans le contexte de l application. 5.1 La phase d analyse Le rôle général de l application MULTISOM a dans un premier temps été défini par un expert du domaine des huiles moteur. L application devait pouvoir être utilisée pour répondre directement à des questions aussi variées que les suivantes : Quelles sont les relations de coopération/dépendance entre les déposants?, Quels sont les avantages des différents types d huile moteur?, Un déposant donné travaille-t-il sur une technologie précise, pour quels avantages et pour quelle utilisation?, Quelle est technologie qui est utilisée par tel déposant mais qui n est pas utilisée par tel autre?, Quels sont les avantages majeurs de tel composant intervenant dans la fabrication des huiles? Ces avantages ont-ils été mentionnés dans tous les brevets utilisant ce composant?. Une analyse plus précise de l ensemble des questions possibles a ensuite amené l expert à définir différents points de vue sur les brevets, ces points de vue correspondant eux-mêmes aux différents domaines sémantiques fermés représentés dans les questions. Durant cette phase de l analyse, une des préoccupations principales de l expert a été celle de pouvoir utiliser chaque point de vue séparément pour répondre à des questions monodomaines (telles que les questions 1,2), tout en maintenant la IRIT - DELTA VEILLE 217

9 VSST'2001 possibilité d une communication multi points de vue dans le but de répondre à des questions multidomaines (telles que les questions 3,4,5). Les points de vue qui ont été isolés par l expert en fonction des questions potentielles ont été les suivants : 1: Déposants, 2: Titre (contient souvent des informations précises sur les composants utilisés dans les brevets), 3: Utilisation, 4: Avantages. 5.2 La réalisation technique Le rôle principal de cette phase a été celui de construire les cartographies associées aux différents points de vue mis en évidence par l expert. Une tâche préliminaire a consisté à construire les ensembles d index (i.e. le vocabulaire descriptif associé) rattaché à chaque point de vue en analysant le plein texte des brevets. Cette dernière tâche a été elle-même décomposée en trois phases. Durant la phase 1, la structure des résumés des brevets a été analysée de manière à en extraire les sous-champs correspondant aux points de vue Utilisation et Avantages 2. Durant la phase 2, un premier ensemble d index bruts a été constitué pour chaque point de vue en utilisant un outil d analyse lexicologique. L outil choisi, développé en interne, nous a permis d extraire des termes simples ou des expressions composées du contenu des sous-champs en se basant sur une terminologie normalisée et sur les variations syntaxiques possibles, tout en éliminant les tournures langagières usuelles. L expert du domaine est intervenu durant la phase 3 pour normaliser les ensembles d index bruts obtenus lors de la phase antécédente, et obtenir ainsi des ensembles d index finalisés. La normalisation des ensembles d index associés points de vue Titre, Utilisation et Avantages a consisté à sélectionner un meilleur représentant dans chaque groupe de termes/expressions composées décrivant le même concept (par ex. les expressions «fabrication des huiles» et «ingénierie des huiles» peuvent être toutes les deux assimilées à la seule expression «ingénierie des huiles»). La normalisation de l ensemble d index associé au point de vue Déposants s est opérée de manière similaire en considérant qu un déposant était susceptible d apparaître sous plusieurs noms différents dans les brevets. Après la construction des ensembles d index finalisés, les brevets ont été réindexés selon chaque point de vue, en s appuyant sur ces ensembles. La figure 3 donne un exemple résumé du contenu d un brevet et de l indexation obtenue. La dernière étape a consisté à construire les cartes associées aux différents points de vue, en utilisant les algorithmes de classification décrits dans les sections 2.3 et 2.4. Cette étape a été précédée d un protocole de Log-Normalisation (Wilkinson, 1994) des vecteurs d index associés aux brevets dans le but de réduire l influence des termes d index les plus répandus. Une carte de dimension 10x10 nœuds (classes) a été finalement générée pour chaque point de vue. La figure 4 donne un exemple d une telle carte résultat. 2 Les champs Déposants et Titre sont directement représentés dans la structure originale des brevets, ene nécéssitant ainsi aucune extraction. 218

10 TEXTES DES COMMUNICATIONS - Tome II Figure 3: Exemple du résumé du contenu d un brevet et de l index généré associé. L index qui a été généré pour le brevet ci-dessus présenté est matérialisé par le contenu du champ Final indexation. Les termes de cet index sont préfixés par le nom du point de vue auquel ils sont associés : adv. pour le point de vue Avantages, titre. pour le point de vue Titre, use. pour le point de vue Utilisation, soc. pour le point de vue Déposants. Figure 4: Exemple de carte générée. Vue partielle d une carte topographique de 10 x 10 neurones (i.e. classes). La carte est initialement organisée comme une grille carrée 2D de neurones. Les profils de classes sont ensuite générés par l'intermédiaire d'un apprentissage compétitif non supervisé mené sur les profils des 300 images de la base iconographique BIBAN considérées selon un point de vue spécifique. Le point de vue choisi ici IRIT - DELTA VEILLE 219

11 VSST'2001 est celui des Avantages décrits dans les brevets. Les noms des classes illustrent les thématiques (relatives au point de vue choisi) qui ont été isolées par le processus d'apprentissage. Après l'apprentissage, les neurones globalement rattachés aux mêmes thématiques ont été regroupés en aires logiques en utilisant les propriétés topographiques de la carte. Le nombre de neurones de chaque aire peut être considéré comme un bon indicateur du poids de la thématique associée dans le fonds étudié. Les thématiques ou les aires se trouvant proches sur la carte représentent des notions proches et/ou associées. Par exemple, l aire «extension de la durée de vie de l huile» ( «extending oil live») partage sur la carte plusieurs de ses frontières avec l aire «contrôle de la formation de boue noire» («black sludge control»). La proximité de ces deux aires illustre le fait que l extension de la durée de vie d une huile dépend directement et fortement de la maintenance d un faible niveau de boue noire dans celle-ci. Les cercles de couleurs rouge matérialisent les centres de gravité des différentes aires de la carte. Déposants Titre Utilisation Avantages Nombre de documents indexés Nombre d index bruts générés Nombre final d index (après filtrage) Nombre de classes non vides par carte Figure 5: Tableau résumé des caractéristiques résultantes à l indexation et à la construction des cartes. Le tableau de la figure 5 résume les résultats de l indexation des brevets et de la construction des cartes. Ces résultats appellent quelques remarques. [1] La taille de l ensemble d index associé au point de vue Titre est significativement plus importante que celle des ensembles d index associés aux autres points de vue. Une analyse des index générés, opérée par l expert du domaine, a mis en évidence le fait que l information contenue dans les titres des brevets était à la fois plus diversifiée, moins dense et plus précise que celle contenues dans les autres champs descriptifs de contenu retenus pour les brevets, à savoir les sous-champs extraits Utilisation et Avantages. Selon l expert, le niveau de généralité plus important des sous-champs Utilisation et Avantages, qui conduit par conséquent à un index plus pauvre, peut être expliqué comme la conséquence d une stratégie délibérée des déposants visant à protéger leur technologie. [2] Le nombre final de déposants (32) a été réduit de manière significative par l expert, en comparaison de celui généré initialement par l analyseur lexical. La majeure partie de cette réduction n est pas due à des variations apparaissant dans les noms de déposants. Elle est relative au fait que l expert a décider de centrer l étude sur les déposants les plus importants et sur leur interrelations. Ainsi les déposants les moins importants ont été regroupés sous le même index : Divers. [3] Sur la carte des déposants, le nombre de classes non vides apparaît être très proche du nombre final de déposants retenus. Cela permet de conclure que la plupart des déposants se verront attribuer des classes propres sur la carte de déposants. [4] Seuls 62% des brevets possèdent un sous-champ Avantages, et 75% un sous-champ Utilisation. En conséquence, certain des brevets ne seront pas indexés selon l ensemble des points de vue. Le rôle du mécanisme de communication entre les points de vue (voir la section suivante) va donc dans ce cas celui de générer une évaluation indirecte du contenu de ces brevets selon les points de vue pour lesquels ils ne sont pas indexés, ceci en utilisant leurs association avec d autres brevets possédant une indexation plus exhaustive. 5.3 Utilisation de la communication intercartes pour l analyse des brevets En comparaison avec les méthodes usuelles de cartographie, comme l analyse en composantes principale (ACP) ou le «multidimensionnal scaling» (MDS), la force du modèle MULTISOM est 220

12 TEXTES DES COMMUNICATIONS - Tome II clairement représentée par la souplesse du mécanisme de cartographie multicartes combiné au processus de communication intercartes. Chaque carte est ainsi susceptible de représenter un point de vue différent sur les données. Chaque point de vue pouvant être rattaché à une catégorie sémantique, ou catégorie de sujets, propre concernant ces données. Le mécanisme de communication intercartes permet alors d assister intelligemment l utilisateur dans ses croisements d information entre les différentes catégories de sujets, tout en lui laissant le libre choix de ses sources de croisement. Dans tous les cas, les réponses du modèle sont à la fois fournies sous la forme de profils d activité sur les cartes, et par l intermédiaire des exemples de brevets associés aux classes les plus actives. L estimation de la qualité des déductions thématiques peut s opérer automatiquement par l intermédiaire d une mesure de la focalisation de l activité sur les cartes destination (voir Lamirel, 2000a). La figure 6 illustre une déduction thématique s opérant entre les 4 différents points de vue de l étude Titre Utilisation Déposants Avantage Figure 6: Exemple d exploitation du mécanisme de communication intercartes pour la veille technologique. La décision de l analyste d activer l aire correspondant au déposant TONEN CORP. sur la carte des Déposants et de propager cette activité vers les cartes thématiques associées aux points de vue Utilisation, Avantages et Titre correspond à une requête transthématique dont la formulation explicite pourrait être la suivante : "Je voudrais connaître les domaines de compétence spécifiques du déposant TONEN CORP. (concernant l utilisation des huiles, leur composition et les avantages attendus), si ceux-ci existent. L application MULTISOM lui permet de trouver de manière interactive que le déposant TONEN CORP. est un spécialiste de la lubrification des transmissions automatiques [flèche n 2 sur la carte] et que ce déposant a adopté pour ce type de lubrification des composés à base d organo-molybdène [flèche n 1] dont les avantages principaux sont de fournir des huiles dont le coefficient de friction est stable sur une large gamme de températures [flèche n 3]. Dans ce cas de figure, une propagation inverse depuis les thématiques cibles aurait également due être utilisée pour vérifier que ces thématiques sont parties exclusives des domaines de compétence du déposant (ce qui est le cas). Plus la couleur des nœuds des cartes se rapproche du blanc, plus forte est leur activité résultante. A titre de comparaison avec la méthode MULTISOM, nous avons mené a bien une seconde classification des brevets en utilisant une méthode de classification de type K-Means axiale, suivie d une phase de projection de type ACP (cette méthode est décrite de manière plus explicite dans Polanco et François, 2000). Comme cette dernière méthode ne permet pas, contrairement à la méthode IRIT - DELTA VEILLE 221

13 VSST'2001 MULTISOM, de mettre en parallèle plusieurs classification différentes, les termes d index des documents rattachés aux différents points de vue ont été regroupés pour former un seul et même ensemble d index. A l issue de ce regroupement, chaque document s est donc vu attribuer un profil global, faisant office de profil d entrée à la méthode K-means axiale. En procédant de la sorte, cette dernière méthode a finalement produit 22 classes différentes (à comparer aux 201 classes produites par la méthode MULTISOM). Les avantages de la méthode MULTISOM sont apparus évidents à l expert du domaine à qui les résultats des deux méthodes ont été fournis : la classification MULTISOM, basée sur les points de vue multiples, à tendance à réduire le bruit nécessairement produit par une classification globale, tout en accroissant la flexibilité et la granularité possible des analyses. De plus, dans le cas d une classification globale, et même si celle-ci, à l exemple de la méthode K-means axiale, est basée sur la construction de classes recouvrantes, des relations importantes entre des sousthématiques peuvent rester cachées à l analyste même si elles apparaissent dans une même classe. Ce phénomène est principalement dû à la complexité des profils de classes susceptibles d être ainsi générés. L utilisation de la méthode MULTISOM, a ainsi permis à l expert de répertorier une trentaine de relations cachées par la méthode K-means sur le corpus des brevets. Un exemple d une telle relation est donné à la figure 7, en parallèle avec la présentation des résultats généraux de la méthode K-means. L expert a également souligné que la possibilité d activer, positivement ou négativement, les classes des cartes MULTISOM représentait une aide précieuse pour régler de manière fine le processus d analyse. Figure 7: Résultats généraux de la méthode K-means. La partie gauche de la figure représente la projection ACP sur les deux axes principaux des 22 classes obtenues par la méthode des K-means axiale. La partie droite de la carte représente la description explicite de la classe «huile moteur» («engine oil»). On peut constater sur la figure, que la relation importante entre la thématique «contrôle de la formation de boue noire» («black sludge control») et la thématique «extension de la durée de vie de l huile» («extending oil life»), qui a été mise en évidence sur la carte de la figure 4, est ici caché par la complexité du profil de la classe K-means. De la même manière, et pour la même raison, la nature de la relation entre les déposants «ASAHI DENKA» et «CHEVRON» n apparaît pas clairement lors d un simple examen du profil de la classe K-means. 222

14 TEXTES DES COMMUNICATIONS - Tome II 6 INTERACTION DE LA METHODE MULTISOM AVEC UN TREILLIS DE GALLOIS Nous avons commencé à défricher une voie de recherche intéressante, de manière à fournir à l utilisateur de meilleures indications concernant le contenu de classes apparaissant sur les cartes, mais également pour permettre une validation plus solide des déductions thématiques qui peuvent s opérer entre les cartes. Elle consiste à coupler le modèle MULTISOM avec un modèle symbolique utilisant une classification conceptuelle basée sur les treillis de Gallois. Dans le cas des brevets, cette classification s opère sur le même ensemble de points de vue que celui utilisé pour les cartes. Dans notre approche, un treillis de Gallois, L(D,T), représente une hiérarchie conceptuelle construite à partir d un ensemble de documents D (i.e. les brevets) qui sont décrits par un ensemble de termes T (i.e. le vocabulaire descriptif extrait des brevets). Une classe de la hiérarchie, également appelée «concept formel», est définie comme une paire (E,I) où E représente l extension du concept, i.e. un sous-ensemble de D, et I représente l intention du concept, i.e. un sous-ensemble de T. La structure d un treillis de Gallois peut être utilisée pour découvrir des règles d association de type A B entre les termes. Si A et B sont des conjonctions de termes, la règle A B signifie que chaque fois qu un document possède l ensemble des termes de A, alors il possède nécessairement l ensemble des termes de B. La projection des classes d une carte sur un treillis de Gallois, qui est basée sur la mesure de similarité cosinus (Salton, 1971), est utilisée pour associer aux classes des cartes des propriétés symboliques et des règles de déduction qui s avèrent plus aisées à interpréter par l utilisateur que des profils vectoriel pondérés, tel que ceux apparaissant originellement sur les classes des cartes. La validité et la stabilité de cette méthode de projection ont été démontrés dans (Lamirel, 2000b). La méthode proposée nous a finalement permis d ajouter un nouvel ensemble de fonctionnalités pour l assistance à l interprétation des cartes : Génération d explications à différentes niveau d échelle et de généralité sur les cartes, tout en respectant la cohérence des aires de ces cartes (pour cette dernière propriété importante dans le carte de modèle topographiques, voir la section 2), Estimation de la qualité des classes, par l intermédiaire du nombre de règles de déduction associées à chaque classe. Cette méthode peut être considérée comme un alternative intéressante aux méthodes classiques d estimation de qualité de type variance inter/ intra-classe, qui sont souvent insuffisantes, car peu informatives. Validation de propriétés déduites qui sont transmises d une carte vers une autre par estimation des propriétés symboliques communes aux neurones-documents transmetteurs. La classification conceptuelle de Gallois, ou treillis de Gallois, est générée en convertissant les vecteurs de description associés aux différents points de vue sur les documents en index booléens. Un schéma de pondération de type Log-Normalisation proposé à la section 4 est ensuite appliqué sur les profils booléens des classes du treillis de Gallois résultant de manière à pouvoir leur appliquer, de manière cohérente, des mesures de similarité avec les classes des cartes topographiques (Toussaint, 2001). 7 CONCLUSION Nous avons présenté dans cet article un nouvel environnement de visualisation intégré. Cet environnement est basé sur un modèle innovant de cartes auto-organisatrice multiples de Kohonen. Nous avons montré que cet environnement pouvait jouer un rôle primordial dans l analyse de l information scientifique et technique, comme l analyse de brevets. La valeur ajoutée la plus importante fournie par cet environnement n est certainement pas la notion de carte proprement dite, mais plutôt la notion de communication entre des cartes multiples, chaque carte élémentaire étant susceptible de représenter un point de vue différent sur les données. Comme nous l avons montré, la construction de ces points de vue peut être dirigée, soit par le problème à résoudre, soit par les résultats partiels fournis par le mécanisme de communication proprement dit. Un des principaux arguments en faveur de l utilisation de modèles de type MNA pour les études quantitatives concernant la science et la technologie est leur capacité à créer des abstractions de haut niveau, et ceci automatiquement, à partir des données brutes. L intelligence des tels réseaux est donc IRIT - DELTA VEILLE 223

15 VSST'2001 liée à leur pouvoir d abstraction, et non à des règles heuristiques ou à des règles logiques ne pouvant être exploités que manuellement. Un des principaux challenges des modèles de type MNA, tel que le modèle MULTISOM, reste cependant celui de fournir à l analyste qui désire obtenir des résultats approfondis et consolidés en exploitant à la fois la grande puissance expressive et les fortes capacités de déductions de tels modèles, sans être toutefois familier avec les théories neuronales et leur comportement de fond, des outils simples leur permettant de vérifier leurs hypothèses. Nous pensons qu une solution pour atteindre ce but nous semble être, comme nous l avons montré, la connexion entre ce type de modèle et les modèles symboliques. REFERENCES [1.] J. M. Campanario, «Using Neural Networks To Study Networks of Scientific Journals,» Scientometrics, 33 (1995) No. 1, p [2.] J-F. Jodouin, Les réseaux neuromimétiques, HERMES, Paris, [3.] G. E. Hinton, «Connectionist Learning Procedures,» Artificial Intelligence, 40 (1989) p [4.] T. Kohonen, Self-Organisation and Associative Memory, Springer Verlag, Third edition, Berlin, [5.] T. Kohonen «The Self-Organizing Map,» Proceedings of the IEEE, 78 (1990) No 9, p [6.] T. Kohonen, «Self-Organizing Maps: Optimization Approaches,» in Artificial Neural Networks, T. Kohonen, K. Mäkisara, O. Simula, J. Kanges, Editors, Elsevier Science Publishers B.V, North Holland, Amsterdam, 1991, p [7.] T. Kohonen, «Things You Haven't Heard about the Self-Organizing Map,» IEEE International Conference on Neural Networks, San Francisco, Calif., March 28 April 1, (1993) p [8.] T. Kohonen, Self-Organizing Maps. Springer Verlag, Berlin, [9.] J-Ch. Lamirel, Application d une approche symbolico-connexionniste pour la conception d un système documentaire hautement interactif, Thèse de l Université de Nancy 1 Henri Poincaré, [10.] J-Ch. Lamirel, J. Ducloy, G. Oster, «Adaptative browsing for information discovery in an iconographic context,» In Conference Proceedings RIAO, Paris, Volume 2, 2000, p [11.] J.C. Lamirel, Y. Toussaint, «Combining Symbolic and Numeric Techniques for Digital Libraries Contents Classification and Analysis». Proceedings of First DELOS Network of Excellence Worshop, Zurich, December [12.] X. Lin, D. Soergel, G. Marchionini, «A Self-Organizing Semantic Map for Information Retrieval,» in Proceedings of the 4 th International SIGIR Conference on R&D in Information Retrieval, October, Chicago, 1991, p [13.] X. Lin., «Map Displays for Information Retrieval,» JASIS, 48 (1) : 40-54, [14.] R. P Lippmann., «An Introduction to Computing with Neural Nets,» IEEE ASSP Magazine, April, p (1987) p [15.] R. E. Orwig, H. Chen and J. F. Nunamaker Jr., «A graphical, Self Organizing Approach to Classifying Electronic Meeting Output,» JASIS, 48 (1) : , [16.] X. Polanco, C. François, «Data Classing and Class Mapping or Visualization in Text Processing and Mining,» Dynamism and Stability in Knowledge Organization. Proceedings of the Sixth international ISKO Conference, July 2000, Toronto, Canada. Edited by C. Beghtol, C. L. Howarth, N. J. Williamson. Advances in Knowledge Organization, 7 (2000a), p [17.] C. Rham, «La classing hiérarchique ascendante selon la méthode des voisins réciproques,» Les cahiers de l analyse de données, 5 (1980) No. 2, p

16 TEXTES DES COMMUNICATIONS - Tome II [18.] H. Ritter, T. Kohonen, «Self-Organizing Semantic Maps,» Biological Cybernetics, 61 (1989) p [19.] G. Salton, The SMART Retrieval System: Experiments in Automatic Document Processing, Prentice Hall Inc., Englewood Cliffs, New Jersey, [20.] SOM papers, [21.] Y. Toussaint, J.C. Lamirel, M. d Aquin, «Combining Symbolic and Numeric Techniques for Database Content Analysis,» Proceedings of IEA01, Budapest, Hungary, [22.] Varsis and C. Versino «Clustering of Socio-Economic Data with Kohonen Maps,» In Proceedings of third International Workshop on Parallel Applications in Statistics and Economics, Pragues, Czechoslovakia, december [23.] H. D. White, X. Lin, K.W. McCain, «Two Modes of Automated Domain Analysis: Multidimensional Scaling vs Kohonen Feature Mapping of Information Science Authors,» in Structures and Relations in Knowledge Organization. Proceeding of the Fifth International ISKO Conference, Lille, August Edited by W. Mustafa el Hadi, J. Maniez, S.. A. Politt. Advances in Knowledge Organization, 6 (1998) p [24.] P. H. Winston, Artificial Intelligence. Addison-Wesley Publishing Company, Reading, Mass., 1977 IRIT - DELTA VEILLE 225

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

Apprentissage Automatique

Apprentissage Automatique Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs

Plus en détail

Extraction d informations stratégiques par Analyse en Composantes Principales

Extraction d informations stratégiques par Analyse en Composantes Principales Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

LES CARTES À POINTS : POUR UNE MEILLEURE PERCEPTION

LES CARTES À POINTS : POUR UNE MEILLEURE PERCEPTION LES CARTES À POINTS : POUR UNE MEILLEURE PERCEPTION DES NOMBRES par Jean-Luc BREGEON professeur formateur à l IUFM d Auvergne LE PROBLÈME DE LA REPRÉSENTATION DES NOMBRES On ne conçoit pas un premier enseignement

Plus en détail

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines

Plus en détail

1 Complément sur la projection du nuage des individus

1 Complément sur la projection du nuage des individus TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

L apprentissage automatique

L apprentissage automatique L apprentissage automatique L apprentissage automatique L'apprentissage automatique fait référence au développement, à l analyse et à l implémentation de méthodes qui permettent à une machine d évoluer

Plus en détail

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN Les contenues de ce document sont la propriété exclusive de la société REVER. Ils ne sont transmis qu à titre d information et ne peuvent en aucun cas

Plus en détail

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et

Plus en détail

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes. Introduction L'objectif de mon TIPE est la reconnaissance de sons ou de notes de musique à l'aide d'un réseau de neurones. Ce réseau doit être capable d'apprendre à distinguer les exemples présentés puis

Plus en détail

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57 Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation

Plus en détail

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML http://olivier-augereau.com Sommaire Introduction I) Les bases II) Les diagrammes

Plus en détail

Pourquoi l apprentissage?

Pourquoi l apprentissage? Pourquoi l apprentissage? Les SE sont basés sur la possibilité d extraire la connaissance d un expert sous forme de règles. Dépend fortement de la capacité à extraire et formaliser ces connaissances. Apprentissage

Plus en détail

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques

Plus en détail

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine

Plus en détail

Traitement bas-niveau

Traitement bas-niveau Plan Introduction L approche contour (frontière) Introduction Objectifs Les traitements ont pour but d extraire l information utile et pertinente contenue dans l image en regard de l application considérée.

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

Manuel d utilisation 26 juin 2011. 1 Tâche à effectuer : écrire un algorithme 2

Manuel d utilisation 26 juin 2011. 1 Tâche à effectuer : écrire un algorithme 2 éducalgo Manuel d utilisation 26 juin 2011 Table des matières 1 Tâche à effectuer : écrire un algorithme 2 2 Comment écrire un algorithme? 3 2.1 Avec quoi écrit-on? Avec les boutons d écriture........

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes. Promotion X 004 COURS D ANALYSE DES STRUCTURES MÉCANIQUES PAR LA MÉTHODE DES ELEMENTS FINIS (MEC 568) contrôle non classant (7 mars 007, heures) Documents autorisés : polycopié ; documents et notes de

Plus en détail

Disparités entre les cantons dans tous les domaines examinés

Disparités entre les cantons dans tous les domaines examinés Office fédéral de la statistique Bundesamt für Statistik Ufficio federale di statistica Uffizi federal da statistica Swiss Federal Statistical Office EMBARGO: 02.05.2005, 11:00 COMMUNIQUÉ DE PRESSE MEDIENMITTEILUNG

Plus en détail

LIVRE BLANC Décembre 2014

LIVRE BLANC Décembre 2014 PARSING MATCHING EQUALITY SEARCH LIVRE BLANC Décembre 2014 Introduction L analyse des tendances du marché de l emploi correspond à l évidence à une nécessité, surtout en période de tension comme depuis

Plus en détail

Évaluation et implémentation des langages

Évaluation et implémentation des langages Évaluation et implémentation des langages Les langages de programmation et le processus de programmation Critères de conception et d évaluation des langages de programmation Les fondations de l implémentation

Plus en détail

MODELISATION UN ATELIER DE MODELISATION «RATIONAL ROSE»

MODELISATION UN ATELIER DE MODELISATION «RATIONAL ROSE» MODELISATION UN ATELIER DE MODELISATION «RATIONAL ROSE» Du cours Modélisation Semi -Formelle de Système d Information Du Professeur Jean-Pierre GIRAUDIN Décembre. 2002 1 Table de matière Partie 1...2 1.1

Plus en détail

3 Approximation de solutions d équations

3 Approximation de solutions d équations 3 Approximation de solutions d équations Une équation scalaire a la forme générale f(x) =0où f est une fonction de IR dans IR. Un système de n équations à n inconnues peut aussi se mettre sous une telle

Plus en détail

Fonctions de plusieurs variables

Fonctions de plusieurs variables Module : Analyse 03 Chapitre 00 : Fonctions de plusieurs variables Généralités et Rappels des notions topologiques dans : Qu est- ce que?: Mathématiquement, n étant un entier non nul, on définit comme

Plus en détail

Calculer avec Sage. Revision : 417 du 1 er juillet 2010

Calculer avec Sage. Revision : 417 du 1 er juillet 2010 Calculer avec Sage Alexandre Casamayou Guillaume Connan Thierry Dumont Laurent Fousse François Maltey Matthias Meulien Marc Mezzarobba Clément Pernet Nicolas Thiéry Paul Zimmermann Revision : 417 du 1

Plus en détail

Intérêt du découpage en sous-bandes pour l analyse spectrale

Intérêt du découpage en sous-bandes pour l analyse spectrale Intérêt du découpage en sous-bandes pour l analyse spectrale David BONACCI Institut National Polytechnique de Toulouse (INP) École Nationale Supérieure d Électrotechnique, d Électronique, d Informatique,

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

UML (Diagramme de classes) Unified Modeling Language

UML (Diagramme de classes) Unified Modeling Language UML (Diagramme de classes) Unified Modeling Language Sommaire Introduction Objectifs Diagramme de classes Classe (Nom, attribut, opération) Visibilité et portée des constituants d une classe Association

Plus en détail

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Classe de terminale de la série Sciences et Technologie du Management et de la Gestion Préambule Présentation Les technologies de l information

Plus en détail

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies Régis Boulet Charlie Demené Alexis Guyot Balthazar Neveu Guillaume Tartavel Sommaire Sommaire... 1 Structure

Plus en détail

Les indices à surplus constant

Les indices à surplus constant Les indices à surplus constant Une tentative de généralisation des indices à utilité constante On cherche ici en s inspirant des indices à utilité constante à définir un indice de prix de référence adapté

Plus en détail

Les algorithmes de base du graphisme

Les algorithmes de base du graphisme Les algorithmes de base du graphisme Table des matières 1 Traçage 2 1.1 Segments de droites......................... 2 1.1.1 Algorithmes simples.................... 3 1.1.2 Algorithmes de Bresenham (1965).............

Plus en détail

Créer le schéma relationnel d une base de données ACCESS

Créer le schéma relationnel d une base de données ACCESS Utilisation du SGBD ACCESS Polycopié réalisé par Chihab Hanachi et Jean-Marc Thévenin Créer le schéma relationnel d une base de données ACCESS GENERALITES SUR ACCESS... 1 A PROPOS DE L UTILISATION D ACCESS...

Plus en détail

EXCEL TUTORIEL 2012/2013

EXCEL TUTORIEL 2012/2013 EXCEL TUTORIEL 2012/2013 Excel est un tableur, c est-à-dire un logiciel de gestion de tableaux. Il permet de réaliser des calculs avec des valeurs numériques, mais aussi avec des dates et des textes. Ainsi

Plus en détail

Méthodes d évolution de modèle produit dans les systèmes du type PLM

Méthodes d évolution de modèle produit dans les systèmes du type PLM Résumé de thèse étendu Méthodes d évolution de modèle produit dans les systèmes du type PLM Seyed Hamedreza IZADPANAH Table des matières 1. Introduction...2 2. Approche «Ingénierie Dirigée par les Modèles»

Plus en détail

Rapport d'analyse des besoins

Rapport d'analyse des besoins Projet ANR 2011 - BR4CP (Business Recommendation for Configurable products) Rapport d'analyse des besoins Janvier 2013 Rapport IRIT/RR--2013-17 FR Redacteur : 0. Lhomme Introduction...4 La configuration

Plus en détail

TRAITEMENT DES DONNEES MANQUANTES AU MOYEN DE L ALGORITHME DE KOHONEN

TRAITEMENT DES DONNEES MANQUANTES AU MOYEN DE L ALGORITHME DE KOHONEN TRAITEMENT DES DONNEES MANQUANTES AU MOYEN DE L ALGORITHME DE KOHONEN Marie Cottrell, Smaïl Ibbou, Patrick Letrémy SAMOS-MATISSE UMR 8595 90, rue de Tolbiac 75634 Paris Cedex 13 Résumé : Nous montrons

Plus en détail

Aide : publication de décisions VS

Aide : publication de décisions VS Aide : publication de décisions VS Table des Matières Introduction... 2 Recherche (Recherche dans le texte intégral)... 2 Filtres... 3 Collection d arrêts... 4 Date de la décision et date de publication...

Plus en détail

DÉVERSEMENT ÉLASTIQUE D UNE POUTRE À SECTION BI-SYMÉTRIQUE SOUMISE À DES MOMENTS D EXTRÉMITÉ ET UNE CHARGE RÉPARTIE OU CONCENTRÉE

DÉVERSEMENT ÉLASTIQUE D UNE POUTRE À SECTION BI-SYMÉTRIQUE SOUMISE À DES MOMENTS D EXTRÉMITÉ ET UNE CHARGE RÉPARTIE OU CONCENTRÉE Revue Construction étallique Référence DÉVERSEENT ÉLASTIQUE D UNE POUTRE À SECTION BI-SYÉTRIQUE SOUISE À DES OENTS D EXTRÉITÉ ET UNE CHARGE RÉPARTIE OU CONCENTRÉE par Y. GALÉA 1 1. INTRODUCTION Que ce

Plus en détail

THOT - Extraction de données et de schémas d un SGBD

THOT - Extraction de données et de schémas d un SGBD THOT - Extraction de données et de schémas d un SGBD Pierre-Jean DOUSSET (France), Benoît ALBAREIL (France) pj@miningdb.com, benoit@miningdb.com Mots clefs : Fouille d information, base de données, système

Plus en détail

Entrepôt de données 1. Introduction

Entrepôt de données 1. Introduction Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de

Plus en détail

PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées

PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées PRODIGE V3 Manuel utilisateurs Consultation des métadonnées Pour plus d'information sur le dispositif : à remplir par chaque site éventuellement 2 PRODIGE V3 : Consultation des métadonnées SOMMAIRE 1.

Plus en détail

Chapitre 2 Le problème de l unicité des solutions

Chapitre 2 Le problème de l unicité des solutions Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)

Plus en détail

EP 2 533 063 A1 (19) (11) EP 2 533 063 A1 (12) DEMANDE DE BREVET EUROPEEN. (43) Date de publication: 12.12.2012 Bulletin 2012/50

EP 2 533 063 A1 (19) (11) EP 2 533 063 A1 (12) DEMANDE DE BREVET EUROPEEN. (43) Date de publication: 12.12.2012 Bulletin 2012/50 (19) (12) DEMANDE DE BREVET EUROPEEN (11) EP 2 33 063 A1 (43) Date de publication: 12.12.12 Bulletin 12/0 (1) Int Cl.: G01R 31/318 (06.01) (21) Numéro de dépôt: 1216093.1 (22) Date de dépôt: 23.04.12 (84)

Plus en détail

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications L intelligence économique outil stratégique pour l entreprise Professeur Bernard DOUSSET dousset@irit.fr http://atlas.irit.fr Institut de Recherche en Informatique de Toulouse (IRIT) Equipe Systèmes d

Plus en détail

Les algorithmes de fouille de données

Les algorithmes de fouille de données Février 2005 Les algorithmes de fouille de données DATAMINING Techniques appliquées à la vente, aux services client, interdictions. Cycle C Informatique Remerciements Je remercie les personnes, les universités

Plus en détail

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique DOMAINE P3.C3.D1. Pratiquer une démarche scientifique et technologique, résoudre des

Plus en détail

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction. Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction. Etudes et traitements statistiques des données : le cas illustratif de la démarche par sondage INTRODUCTION

Plus en détail

TRAITEMENT AUTOMATIQUE DES LANGUES. Licence d'informatique 2ème Année Semestre 1. Département d'informatique Université de Caen Basse-Normandie

TRAITEMENT AUTOMATIQUE DES LANGUES. Licence d'informatique 2ème Année Semestre 1. Département d'informatique Université de Caen Basse-Normandie TRAITEMENT AUTOMATIQUE DES LANGUES Licence d'informatique 2ème Année Semestre 1 Département d'informatique Université de Caen Basse-Normandie https://dias.users.greyc.fr/?op=paginas/tal.html Plan Définition

Plus en détail

Utilisation d informations visuelles dynamiques en asservissement visuel Armel Crétual IRISA, projet TEMIS puis VISTA L asservissement visuel géométrique Principe : Réalisation d une tâche robotique par

Plus en détail

Item 169 : Évaluation thérapeutique et niveau de preuve

Item 169 : Évaluation thérapeutique et niveau de preuve Item 169 : Évaluation thérapeutique et niveau de preuve COFER, Collège Français des Enseignants en Rhumatologie Date de création du document 2010-2011 Table des matières ENC :...3 SPECIFIQUE :...3 I Différentes

Plus en détail

4.2 Unités d enseignement du M1

4.2 Unités d enseignement du M1 88 CHAPITRE 4. DESCRIPTION DES UNITÉS D ENSEIGNEMENT 4.2 Unités d enseignement du M1 Tous les cours sont de 6 ECTS. Modélisation, optimisation et complexité des algorithmes (code RCP106) Objectif : Présenter

Plus en détail

INTRODUCTION AUX METHODES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES

INTRODUCTION AUX METHODES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES INTRODUCTION AUX METHODES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES Les contenus de ce document sont la propriété exclusive de la société REVER. Ils ne sont transmis qu à titre d information et

Plus en détail

Coup de Projecteur sur les Réseaux de Neurones

Coup de Projecteur sur les Réseaux de Neurones Coup de Projecteur sur les Réseaux de Neurones Les réseaux de neurones peuvent être utilisés pour des problèmes de prévision ou de classification. La représentation la plus populaire est le réseau multicouche

Plus en détail

CONSEILS POUR LA REDACTION DU RAPPORT DE RECHERCHE. Information importante : Ces conseils ne sont pas exhaustifs!

CONSEILS POUR LA REDACTION DU RAPPORT DE RECHERCHE. Information importante : Ces conseils ne sont pas exhaustifs! CONSEILS POUR LA REDACTION DU RAPPORT DE RECHERCHE Information importante : Ces conseils ne sont pas exhaustifs! Conseils généraux : Entre 25 et 60 pages (hormis références, annexes, résumé) Format d un

Plus en détail

Théorie et Codage de l Information (IF01) exercices 2013-2014. Paul Honeine Université de technologie de Troyes France

Théorie et Codage de l Information (IF01) exercices 2013-2014. Paul Honeine Université de technologie de Troyes France Théorie et Codage de l Information (IF01) exercices 2013-2014 Paul Honeine Université de technologie de Troyes France TD-1 Rappels de calculs de probabilités Exercice 1. On dispose d un jeu de 52 cartes

Plus en détail

LA PHYSIQUE DES MATERIAUX. Chapitre 1 LES RESEAUX DIRECT ET RECIPROQUE

LA PHYSIQUE DES MATERIAUX. Chapitre 1 LES RESEAUX DIRECT ET RECIPROQUE LA PHYSIQUE DES MATERIAUX Chapitre 1 LES RESEAUX DIRECT ET RECIPROQUE Pr. A. Belayachi Université Mohammed V Agdal Faculté des Sciences Rabat Département de Physique - L.P.M belayach@fsr.ac.ma 1 1.Le réseau

Plus en détail

Analyse dialectométrique des parlers berbères de Kabylie

Analyse dialectométrique des parlers berbères de Kabylie Saïd GUERRAB Analyse dialectométrique des parlers berbères de Kabylie Résumé de la thèse (pour affichage) Il est difficile de parler du berbère sans parler de la variation. Il y a d abord une variation

Plus en détail

L ANALYSE COUT-EFFICACITE

L ANALYSE COUT-EFFICACITE L ANALYSE COUT-EFFICACITE 1 Pourquoi utiliser cet outil en évaluation? L analyse coût-efficacité est un outil d aide à la décision. Il a pour but d identifier la voie la plus efficace, du point de vue

Plus en détail

Projet de Traitement du Signal Segmentation d images SAR

Projet de Traitement du Signal Segmentation d images SAR Projet de Traitement du Signal Segmentation d images SAR Introduction En analyse d images, la segmentation est une étape essentielle, préliminaire à des traitements de haut niveau tels que la classification,

Plus en détail

1. Vocabulaire : Introduction au tableau élémentaire

1. Vocabulaire : Introduction au tableau élémentaire L1-S1 Lire et caractériser l'information géographique - Le traitement statistique univarié Statistique : le terme statistique désigne à la fois : 1) l'ensemble des données numériques concernant une catégorie

Plus en détail

L utilisation d un réseau de neurones pour optimiser la gestion d un firewall

L utilisation d un réseau de neurones pour optimiser la gestion d un firewall L utilisation d un réseau de neurones pour optimiser la gestion d un firewall Réza Assadi et Karim Khattar École Polytechnique de Montréal Le 1 mai 2002 Résumé Les réseaux de neurones sont utilisés dans

Plus en détail

Document d orientation sur les allégations issues d essais de non-infériorité

Document d orientation sur les allégations issues d essais de non-infériorité Document d orientation sur les allégations issues d essais de non-infériorité Février 2013 1 Liste de contrôle des essais de non-infériorité N o Liste de contrôle (les clients peuvent se servir de cette

Plus en détail

Optimisation, traitement d image et éclipse de Soleil

Optimisation, traitement d image et éclipse de Soleil Kléber, PCSI1&3 014-015 I. Introduction 1/8 Optimisation, traitement d image et éclipse de Soleil Partie I Introduction Le 0 mars 015 a eu lieu en France une éclipse partielle de Soleil qu il était particulièrement

Plus en détail

(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01)

(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01) (19) TEPZZ 8 8 4_A_T (11) EP 2 838 241 A1 (12) DEMANDE DE BREVET EUROPEEN (43) Date de publication: 18.02.1 Bulletin 1/08 (1) Int Cl.: H04L 29/06 (06.01) G06F 21/ (13.01) (21) Numéro de dépôt: 141781.4

Plus en détail

SIMULATION HYBRIDE EN TEMPOREL D UNE CHAMBRE REVERBERANTE

SIMULATION HYBRIDE EN TEMPOREL D UNE CHAMBRE REVERBERANTE SIMULATION HYBRIDE EN TEMPOREL D UNE CHAMBRE REVERBERANTE Sébastien LALLECHERE - Pierre BONNET - Fatou DIOUF - Françoise PALADIAN LASMEA / UMR6602, 24 avenue des landais, 63177 Aubière pierre.bonnet@lasmea.univ-bpclermont.fr

Plus en détail

INTRODUCTION AUX TECHNOLOGIES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES

INTRODUCTION AUX TECHNOLOGIES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES INTRODUCTION AUX TECHNOLOGIES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES Les contenus de ce document sont la propriété exclusive de la société REVER. Ils ne sont transmis qu à titre d information

Plus en détail

FONDEMENTS MATHÉMATIQUES 12 E ANNÉE. Mathématiques financières

FONDEMENTS MATHÉMATIQUES 12 E ANNÉE. Mathématiques financières FONDEMENTS MATHÉMATIQUES 12 E ANNÉE Mathématiques financières A1. Résoudre des problèmes comportant des intérêts composés dans la prise de décisions financières. [C, L, RP, T, V] Résultat d apprentissage

Plus en détail

L'évolution de VISUAL MESSAGE CENTER Architecture et intégration

L'évolution de VISUAL MESSAGE CENTER Architecture et intégration L'évolution de VISUAL MESSAGE CENTER Architecture et intégration Sommaire Résumé exécutif Base technologique : VISUAL Message Center 2 3 VISUAL Message Center Core Engine VISUAL Message Center Extended

Plus en détail

Utilisation des tableaux sémantiques dans les logiques de description

Utilisation des tableaux sémantiques dans les logiques de description Utilisation des tableaux sémantiques dans les logiques de description IFT6281 Web Sémantique Jacques Bergeron Département d informatique et de recherche opérationnelle Université de Montréal bergerja@iro.umontreal.ca

Plus en détail

La Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1

La Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1 La Geo-Business Intelligence selon GALIGEO avec ESRI 2005 session «Décisionnel» 26/10/2005 1 La Business Intelligence : Une Définition La Business intelligence permet l utilisation des données opérationnelles

Plus en détail

Production des Services d Assurance non-vie selon le SCN 2008

Production des Services d Assurance non-vie selon le SCN 2008 REPUBLIQUE DU CAMEROUN Paix - Travail Patrie ---------- INSTITUT NATIONAL DE LA STATISTIQUE ---------- REPUBLIC OF CAMEROON Peace - Work Fatherland ---------- NATIONAL INSTITUTE OF STATISTICS ----------

Plus en détail

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG Exploitations pédagogiques du tableur en STG Académie de Créteil 2006 1 EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG Commission inter-irem lycées techniques contact : dutarte@club-internet.fr La maquette

Plus en détail

Sciences de Gestion Spécialité : GESTION ET FINANCE

Sciences de Gestion Spécialité : GESTION ET FINANCE Sciences de Gestion Spécialité : GESTION ET FINANCE Classe de terminale de la série Sciences et Technologie du Management et de la Gestion I. PRESENTATION GENERALE 1. Les objectifs du programme Le système

Plus en détail

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining. 2 jours : Mardi 15 et mercredi 16 novembre 2005 de 9 heures 30 à 17 heures 30 Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining. Madame, Monsieur, On parle

Plus en détail

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) 87 FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) Dans le cadre de la réforme pédagogique et de l intérêt que porte le Ministère de l Éducation

Plus en détail

Mesure agnostique de la qualité des images.

Mesure agnostique de la qualité des images. Mesure agnostique de la qualité des images. Application en biométrie Christophe Charrier Université de Caen Basse-Normandie GREYC, UMR CNRS 6072 Caen, France 8 avril, 2013 C. Charrier NR-IQA 1 / 34 Sommaire

Plus en détail

I Stabilité, Commandabilité et Observabilité 11. 1 Introduction 13 1.1 Un exemple emprunté à la robotique... 13 1.2 Le plan... 18 1.3 Problème...

I Stabilité, Commandabilité et Observabilité 11. 1 Introduction 13 1.1 Un exemple emprunté à la robotique... 13 1.2 Le plan... 18 1.3 Problème... TABLE DES MATIÈRES 5 Table des matières I Stabilité, Commandabilité et Observabilité 11 1 Introduction 13 1.1 Un exemple emprunté à la robotique................... 13 1.2 Le plan...................................

Plus en détail

Optimisation de la compression fractale D images basée sur les réseaux de neurones

Optimisation de la compression fractale D images basée sur les réseaux de neurones Optimisation de la compression fractale D images basée sur les réseaux de neurones D r BOUKELIF Aoued Communication Networks,Architectures and Mutimedia laboratory University of S.B.A aoued@hotmail.com

Plus en détail

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications A. Optimisation sans contrainte.... Généralités.... Condition nécessaire et condition suffisante

Plus en détail

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques

Plus en détail

Quels outils pour prévoir?

Quels outils pour prévoir? modeledition SA Quels outils pour prévoir? Les modèles de prévisions sont des outils irremplaçables pour la prise de décision. Pour cela les entreprises ont le choix entre Excel et les outils classiques

Plus en détail

PROBABILITES ET STATISTIQUE I&II

PROBABILITES ET STATISTIQUE I&II PROBABILITES ET STATISTIQUE I&II TABLE DES MATIERES CHAPITRE I - COMBINATOIRE ELEMENTAIRE I.1. Rappel des notations de la théorie des ensemble I.1.a. Ensembles et sous-ensembles I.1.b. Diagrammes (dits

Plus en détail

Merise. Introduction

Merise. Introduction Merise Introduction MERISE:= Méthode d Etude et de Réalisation Informatique pour les Systèmes d Entreprise Méthode d Analyse et de Conception : Analyse: Etude du problème Etudier le système existant Comprendre

Plus en détail

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Karima Dhouib, Sylvie Després Faiez Gargouri ISET - Sfax Tunisie, BP : 88A Elbustan ; Sfax karima.dhouib@isets.rnu.tn,

Plus en détail

Cours d Analyse. Fonctions de plusieurs variables

Cours d Analyse. Fonctions de plusieurs variables Cours d Analyse Fonctions de plusieurs variables Licence 1ère année 2007/2008 Nicolas Prioux Université de Marne-la-Vallée Table des matières 1 Notions de géométrie dans l espace et fonctions à deux variables........

Plus en détail

Université de Bangui. Modélisons en UML

Université de Bangui. Modélisons en UML Université de Bangui CRM Modélisons en UML Ce cours a été possible grâce à l initiative d Apollinaire MOLAYE qui m a contacté pour vous faire bénéficier de mes connaissances en nouvelles technologies et

Plus en détail

Chapitre VIII. Les bases de données. Orientées Objet. Motivation

Chapitre VIII. Les bases de données. Orientées Objet. Motivation Chapitre VIII Motivation Le modèle relationnel connaît un très grand succès et s avère très adéquat pour les applications traditionnelles des bases de données (gestion) Les bases de données Orientées Objet

Plus en détail

COURS EULER: PROGRAMME DE LA PREMIÈRE ANNÉE

COURS EULER: PROGRAMME DE LA PREMIÈRE ANNÉE COURS EULER: PROGRAMME DE LA PREMIÈRE ANNÉE Le cours de la première année concerne les sujets de 9ème et 10ème années scolaires. Il y a bien sûr des différences puisque nous commençons par exemple par

Plus en détail

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux.

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux. UEO11 COURS/TD 1 Contenu du semestre Cours et TDs sont intégrés L objectif de ce cours équivalent a 6h de cours, 10h de TD et 8h de TP est le suivant : - initiation à l algorithmique - notions de bases

Plus en détail

BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous :

BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous : BASE BioArray Software Environment (BASE) est une base de données permettant de gérer l importante quantité de données générées par des analyses de bio-puces. BASE gère les informations biologiques, les

Plus en détail

Application de la méthode QFD comme outil d'extraction des connaissances métier en conception intégrée

Application de la méthode QFD comme outil d'extraction des connaissances métier en conception intégrée Application de la méthode QFD comme outil d'extraction des connaissances métier en conception intégrée Estelle FREY, Samuel GOMES, Jean-Claude SAGOT Laboratoire Systèmes et Transports Equipe ERgonomie

Plus en détail

Raisonnement probabiliste

Raisonnement probabiliste Plan Raisonnement probabiliste IFT-17587 Concepts avancés pour systèmes intelligents Luc Lamontagne Réseaux bayésiens Inférence dans les réseaux bayésiens Inférence exacte Inférence approximative 1 2 Contexte

Plus en détail

NON-LINEARITE ET RESEAUX NEURONAUX

NON-LINEARITE ET RESEAUX NEURONAUX NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail

Plus en détail