RN s et prédiction de la structure secondaire des protéines. Rapport du projet d apprentissage automatique
|
|
- Jean-François Lortie
- il y a 8 ans
- Total affichages :
Transcription
1 COUTURIER Olivier LETOMBE Florian RN s et prédiction de la structure secondaire des protéines Rapport du projet d apprentissage automatique Année universitaire 200/2002
2 SOMMAIRE I Introduction Page 2 II Aspects biologiques Page 3 III La méthode MLP Page 5 IV Présentation d autres méthodes Page 9 V Conclusion Page 3 VI Bibliographie Page 4 2
3 Introduction Le connexionnisme, par opposition au cognitivisme, est la démarche d apprentissage automatique par laquelle le neurone humain est dupliqué de manière formelle. Cette méthode est née du fait que le programmeur a cherché à reproduire un simulacre de raisonnement et de pensée s' assimilant à celui du cerveau. Les réseaux de neurones permettent entre autres de classifier des données à partir d un grand nombre d éléments. C est pourquoi il est naturel de penser à appliquer cette méthode à la prédiction de la structure secondaire des protéines. La connaissance de cette structure de la protéine est essentielle car elle permet de deviner son fonctionnement ce qui constitue une avancée intéressante, notamment dans le domaine de la pharmaceutique et du Drug Design. «Les algorithmes de prédiction fournissent des informations sur la structure secondaire à partir de la structure primaire sans aucun travail biochimique supplémentaire». La méthode par réseaux de neurones est donc peu coûteuse, contrairement à la Résonance Magnétique Nucléaire (RMN). D autres méthodes existent telles que Chou-Fasman qui est une approche statistique, le repliement inverse, une approche plus algorithmique ou encore les HMM et la méthode des «plus proches voisins». Mais nous n allons pas nous attarder plus longuement sur ces dernières. Dans un premier temps, nous allons présenter ce qu est une protéine ainsi que les autres aspects biologiques du problème. Nous nous intéresserons ensuite aux réseaux de neurones appliqués à la prédiction de la structure secondaire après avoir étudié plus en détails leurs principes. Plus précisément, cette seconde partie sera consacrée à l une des méthodes pionnières proposée par Qian et Sejnowski. Enfin, les autres méthodes et leurs résultats obtenus feront l objet du dernier chapitre. 3
4 Aspects biologiques Nous allons exposer dans un premier temps à quoi correspondent les différents niveaux de la structure d une protéine ; mais penchons-nous tout d abord sur ce qu est une protéine. On distingue 20 acides aminés (AA) : A Ala alanine C Cys cystéine D Asp aspartate E Glu glutamine F Phe phénylalanine G Gly glycine H His histidine I Ile isoleucine K Lys lysine L Leu leucine M Met méthionine N Asn asparagine P Pro proline Q Gin glutamine R Arg arginine S Ser serine T Thr thréonine V Val valine W Trp tryptophane X Tyr tyrosine Une protéine est une séquence - parfois plus - d AA. La structure primaire tout d abord correspond à la séquence d AA elle-même. C est le niveau le plus bas de description d une protéine. Elle se présente de la manière suivante : n NH 2 -A-G-T-F-H-N.-I-K-N-M-D-A-COOH Toujours à gauche = Toujours à droite = Extrémité N-terminal Extrémité C-terminal 4
5 Apprentissage Automatique Attardons-nous à présent à la structure qui nous intéresse, la secondaire. Elle représente les interactions entre les AA dues à la formation de liaisons hydrogènes entre O (Oxygène) d un groupe carboné et H (Hydrogène) attaché à l azote du groupe aminé d un autre résidu. On distingue trois types de structures secondaires : L hélice Les boucles (parties résiduelles, structure irrégulière) parmi lesquelles : Les random coils ou chaînes aléatoires : - "!# %$'&() : Restent la structure tertiaire et la structure quaternaire qui sont respectivement le repliement d une séquence, sa configuration spatiale et l organisation des différentes séquences. C est cette dernière qui définit le fonctionnement de la protéine. Cette organisation ne se produit que chez certaines protéines. Toute modification de la structure tertiaire ou quaternaire d une protéine conduit à son inactivation. 5
6 Apprentissage Automatique La méthode MLP Ou Multi-Layer Perceptron Le perceptron Le perceptron fut créé par Frank Rosenblatt en 958. Il s agit d un modèle de réseau de neurones avec algorithme d apprentissage. La définition qui suit est tirée des notes de cours de F. Denis et R. Gilleron intitulé «Apprentissage à partir d exemples» [DG]. Définition : Un perceptron linéaire à seuil prend en entrée n valeurs x,, x n et calcule une sortie o. Un perceptron est défini par la donnée de n+ constantes : les coefficients synaptiques w,, w n et le seuil (ou le biais) ée par la formule : o = n si i= 0 sinon w i x i > Les entrées x,, x n peuvent être à valeurs dans {0, } ou réelles, les poids peuvent être entiers ou réels. Une variante très utilisée de ce modèle est de considérer une fonction de sortie prenant ses valeurs dans {-, } plutôt que dans {0, }. x w x 2 w 2 "!#%$ &..n w i x i > ' o = 0 sinon w n x n 6
7 Notons que les coefficients synaptiques sont déterminés par apprentissage sur un ensemble appelé ensemble d entraînement. Cette notion est très importante et sera donc toujours en vigueur au cours de la section suivante. 7
8 Le MLP L idée du MLP ou perceptron multi-couches est partie de l observation suivante : en ajoutant des couches cachées au perceptron, sa puissance de calcul est augmentée. Une définition en est donnée dans l article cité précédemment [DG]. Définition : Un réseau de neurones à couches cachées est défini par une architecture vérifiant les propriétés suivantes : les cellules sont réparties de façon exclusive dans des couches C 0, C,, C q, la première couche C 0 est la rétine composée des cellules d entrée qui correspondent aux n variables d entrée ; les couches C,, C q- sont les couches cachées ; la couche C q est composée de la (ou les) cellule(s) de décision, les entrées d une cellule d une couche C i avec i couche C i- et aucune autre cellule. La dynamique du réseau est synchrone. Grâce à ce type d architectures, de nombreux calculs par réseau de neurones sont devenus réalisables. Ainsi, la fonction booléenne du ou exclusif (ou XOR) est devenue facilement réalisable, alors qu elle ne l était pas avec un simple perceptron : x 0 = x -2 x XOR x 2 x 2 8
9 Cette partie est inspirée d une libre traduction du chapitre 6.2. de [BB]. Les premières applications du MLP à la prédiction de la structure secondaire des protéines ont été réalisées par Qian et Sejnowski. L architecture de base utilisée est un MLP totalement connecté comprenant une seule couche cachée. Nos chercheurs ont déterminé que la couche d entrée avait une taille optimale de 3 AA pour un alphabet de taille 2 : 20 représentant les 20 différents AA et un symbole terminal pour encoder le N ou C-terminal. Ils ont donc obtenu une couche d entrée de 273 unités. A cela, ils ont ajouté une unique couche cachée de 40 unités sigmoïdes et enfin une couche de sortie qui en est composée de 3. Chacune de ces 3 dernières correspond aux types de structures secondaires décrits "!#!$&%'(% )! *%,+-./ précédemment : l hélice éterminée par l unité de sortie ayant la plus grande activité selon le principe du «winner-takes-all» ou de décision majoritaire. Penchons-nous à présent sur la manière dont a été construit ce réseau de neurones. Il a été initialisé avec des poids tirés au hasard dans l intervalle [-0.3, 0.3]. L apprentissage s est fait à partir d un ensemble d entraînement de résidus extraits du Brookhaven PDB (Protein Data Bank) par rétropropagation à l aide de la fonction d erreur du LMS (Least Mean Square) ou la méthode des moindres carrés. Cette méthode nous permet de passer de 33% à précisément 62.7% de prédiction correcte, avec des coefficients de corrélation C0 = 0.35, C = 0.29 et C c = Ces derniers, meilleurs indicateurs de la performance de prédiction qu un simple pourcentage de prédiction correcte, se calculent de la manière suivante : f f (Px N x ) - (N xpx ) C x = f f f f (N x + N x ) (N x + Px ) (Px + N x ) (Px + Px ) où x = hélice, feuillet, boucle ou 2 ou 3 de ces catégories ; réalisées et P x et N x sont respectivement les prédictions positives ou négatives correctement f P x et f N x sont au contraire les prédictions positives ou négatives incorrectes. Une prédiction parfaite donne C x = alors qu une prédiction totalement incorrecte donne C x = -. La principale amélioration est obtenue en ajoutant à l architecture décrite précédemment un nouveau réseau ayant pour entrée 3 neurones (les mêmes que pour la première architecture) pour chaque sortie du précédent, soit 3*3 = 39 unités. La couche cachée et la sortie seraient de la même forme que pour le précédent réseau, donc respectivement 40 et 3 unités. Une telle architecture en cascade atteint une performance de Q 3 = 64.3%, avec les corrélations C2 = 0.4, C3 = 0.3 et C c =
10 En 988, cette architecture apparaît comme la plus performante de toutes les précédentes méthodes, y compris la méthode Chou-Fasman pourtant la plus renommée à l époque. 0
11 Présentation d autres méthodes De nouvelles méthodes basées sur les anciennes sont apparues au cours des années. Parmi celles-ci, nous pouvons citer la combinaison qui a été faite entre les Réseaux de Neurones (RN) et la méthode de Chou-Fasman. Ainsi, on a utilisé les règles de Chou-Fasman comme initialisation d un RN auquel on a ajouté quelques connexions. La méthode Qian- Sejnowski a été légèrement battue mais les règles de Chou-Fasman ont été largement dépassées. On a également comparé le MLP et la méthode Bayésienne. L hypothèse qui a été faite est que la probabilité des occurrences d AA dans une protéine était indépendante de celle des AA ailleurs. On s est rendu compte que l exactitude des RN n était que légèrement supérieure à celle de la méthode Bayésienne. Cette observation a conduit à un formalisme neuronal nouveau : la sortie représente directement les probabilités conditionnelles des classes structurelles. Une nouvelle fonction objectif est donc définie, basée sur l information mutuelle. Cette nouvelle mesure, finalement assez proche des anciennes puisque utilisant l erreur des moindres carrée, produit pourtant un ensemble d entraînement obtenant de meilleurs résultats bien que le nombre de paramètres ajustables reste le même. Il a été conclu que cette méthode mesurant l information mutuelle prédisait mieux les hélices et les feuillets que la méthode des moindres carrés, au détriment des boucles. Il est essentiel à présent de citer la méthode ayant obtenu les meilleurs résultats achevés jusqu ici. Il s agit du serveur de prédiction PHD proposé par Rost et Sander. En 996, cette méthode a remporté la compétition CASP2 (Critical Assessment of Protein Structure Prediction) qui a eu lieu à Asilomar (Californie). Il s agit là de l unique expérimentation de la méthode ce qui permet de jauger la prédiction de la structure secondaire comme «prédiction aveugle» [BB]. Les performances de la méthode PHD ont atteint 74% d exactitude sur un ensemble contenant des prédictions de simulations de contacts, de structures secondaires et moléculaires. Cette dernière est la catégorie la plus prestigieuse car la plus difficile : le seul prior pris en compte ici est la structure primaire de la séquence d AA. Notons que les trois catégories de prédiction citées ci-dessus sont regroupées dans ce que l on appelle la classification trois états (three-state).
12 Cette classification semblait être limitée à 65-67% de précision mais au milieu de années 80, nous n étions qu à 50-55% et 65% ont été atteints (en 988) ce qui constitue un point de vue optimiste concernant la prédiction. L information évolutionnaire a atteint plus de 72% d exactitude avec des coefficients de corrélation de 0.64 C pour et 0.53 pour C. La méthode d utilisation de l information évolutionnaire est la suivante :. une base de données de séquences connues est examinée par des méthodes d alignement pour des séquences similaires, 2. la liste des séquences est filtrée par un seuil (dépendant de la taille) pour une identité de séquence significative, 3. un profile d échanges d AA est compilé, 4. utilisation du profile pour la prédiction. La première méthode soutenant plus de 72% de validation sur une classification trois états est le système de RN qu est le PHD. Les profiles de cette méthode, dont le supplément d information est dérivé des alignements multiples des séquences et de la teneur en AA de la protéine, sont pris comme entrée dans un RN. L entrée est basée sur un profile réalisé à partir des occurrences d AA dans les colonnes d un alignement multiple de séquences avec beaucoup de similarités avec la séquence recherchée. Le réseau complet pour la prédiction de la structure secondaire des protéines consiste en trois couches : deux couches de réseaux et une couche faisant une moyenne à travers les réseaux indépendamment entraînés. Les profiles en question ont été tirés de la base de données HSSP qui mélange l information structurelle et séquentielle. L entraînement par rétropropagation des réseaux peut être équilibré ou non. En général, les bases de données de protéines ont grossièrement 30% d hélices de 50% de boucles. En version déséquilibrée, c est cette fréquence qui est utilisée pour les profiles présentés. Avec l approche équilibrée, tous les types sont présentés aussi souvent ce qui entraîne de meilleurs résultats. Le principal danger des architectures de Qian-Sejnowski est la surspécialisation. Rost et Sander se sont basés sur la même architecture mais utilisent deux méthodes pour éviter ce genre de problèmes : arrêt rapide, moyennes d ensembles sur différents réseaux indépendants, utilisant différentes informations d entrée et procédures d apprentissage. 2
13 La principale nouveauté de leur méthode reste quand même l alignement multiple : des profiles en entrée sont préférés aux séquences brutes d AA. L idée vient du fait qu un alignement multiple fournit plus d informations que les séquences uniques. 3
14 Conclusion Nous avons exposé ce qu était une protéine et surtout qu il en existait différentes structures dont la secondaire. Les trois principaux types de cette dernière sont les hélices "!$#&%(' édiction de ces différents types appartient au domaine de l apprentissage automatique et plus particulièrement de la classification supervisée à l aide des réseaux de neurones. Le MLP en constitue une approche dont la première implantation appliquée à la prédiction de la structure secondaire des protéines fût réalisée en 988 par Qian et Sejnowski. Les résultats très probants de cette méthode ont donné lieu à d autres travaux basés sur cette même technique dont la meilleure approche fut proposée par Rost et Sander en 996. Les performances obtenues sont bien supérieures à celles escomptées mais restent insatisfaisantes, bien que les progrès de ces quinze dernières années dans ce domaine permettent d afficher un certain optimisme quant à une prédiction un peu moins «aveugle». La méthode la plus récente de prédiction par RN a été proposée par Riis et Krogh qui tente de pallier le problème de surspécialisation en jouant sur l architecture du RN. Ils ont atteint un précision d environ 70%, ce qui semble une limite pour les méthodes de prédiction ne se fondant que sur des informations locales. Comme nous l avons déjà remarqué, les autres méthodes telles que Chou-Fasman ou les chaînes de Markov cachées ont été dépassées pour la première ou insatisfaisantes pour la seconde. Seule la méthode des plus proches voisins semble approcher sans jamais les égaler les performances des RN. Les méthodes exactes de prédiction de structure secondaire des protéines sont actuellement beaucoup trop coûteuses. C est pourquoi il est de l avis de beaucoup que les RN constituent un avenir certain dans ce domaine. 4
15 Bibliographie [BB] P. Baldi et S. Brunak. Bioinformatics, the machine learning approach. [DG] François Denis et Rémi Gilleron. Apprentissage à partir d exemples, notes de cours. Université Charles de Gaule, Lille 3, 4 avril [HT] Hélène Touzet. Fonction et Structure des Protéines, notes de cours. LIFL, Lille. 5
Leslie REGAD ; Gaëlle LELANDAIS. leslie.regad@univ- paris- diderot.fr ; gaelle.lelandais@univ- paris- diderot.fr
Programmation avec R Polycopié d exercices Leslie REGAD ; Gaëlle LELANDAIS leslie.regad@univ- paris- diderot.fr ; gaelle.lelandais@univ- paris- diderot.fr Ce polycopié rassemble différents exercices vous
Plus en détailL utilisation d un réseau de neurones pour optimiser la gestion d un firewall
L utilisation d un réseau de neurones pour optimiser la gestion d un firewall Réza Assadi et Karim Khattar École Polytechnique de Montréal Le 1 mai 2002 Résumé Les réseaux de neurones sont utilisés dans
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailInsulinothérapie et diabète de type 1
Insulinothérapie et diabète de type 1 Introduction: la molécule d insuline L instauration de l insulinothérapie Dispositif d administration de l insuline Les propriétés de l insuline Insuline et schémas
Plus en détailCoup de Projecteur sur les Réseaux de Neurones
Coup de Projecteur sur les Réseaux de Neurones Les réseaux de neurones peuvent être utilisés pour des problèmes de prévision ou de classification. La représentation la plus populaire est le réseau multicouche
Plus en détailCorrection du baccalauréat STMG Polynésie 17 juin 2014
Correction du baccalauréat STMG Polynésie 17 juin 2014 EXERCICE 1 Cet exercice est un Q.C.M. 4 points 1. La valeur d une action cotée en Bourse a baissé de 37,5 %. Le coefficient multiplicateur associé
Plus en détailClassification Automatique de messages : une approche hybride
RECIAL 2002, Nancy, 24-27 juin 2002 Classification Automatique de messages : une approche hybride O. Nouali (1) Laboratoire des Logiciels de base, CE.R.I.S., Rue des 3 frères Aïssiou, Ben Aknoun, Alger,
Plus en détailInstallation et configuration de base de l active Directory
SCHMITT Année 2012/2014 Cédric BTS SIO Installation et configuration de base de l active Directory Description: Ce projet a pour but d installer l active directory et de créer une redondance en cas de
Plus en détailLe Data Mining au service du Scoring ou notation statistique des emprunteurs!
France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative
Plus en détailSéquence 2. L expression du patrimoine génétique. Sommaire
Séquence 2 L expression du patrimoine génétique Sommaire 1. La synthèse des protéines 2. Phénotypes, génotypes et environnement Synthèse de la séquence 2 Exercices de la séquence 2 Glossaire des séquences
Plus en détailPrédiction de la structure d une
Prédiction de la structure d une protéine Soluscience Guillaume Chakroun guillaume chakroun@hotmail.com Copyright c 2004 Guillaume Chakroun TABLE DES MATIÈRES Table des matières 1 Les structures protéiques
Plus en détailL apprentissage automatique
L apprentissage automatique L apprentissage automatique L'apprentissage automatique fait référence au développement, à l analyse et à l implémentation de méthodes qui permettent à une machine d évoluer
Plus en détail4.2 Unités d enseignement du M1
88 CHAPITRE 4. DESCRIPTION DES UNITÉS D ENSEIGNEMENT 4.2 Unités d enseignement du M1 Tous les cours sont de 6 ECTS. Modélisation, optimisation et complexité des algorithmes (code RCP106) Objectif : Présenter
Plus en détailArithmétique binaire. Chapitre. 5.1 Notions. 5.1.1 Bit. 5.1.2 Mot
Chapitre 5 Arithmétique binaire L es codes sont manipulés au quotidien sans qu on s en rende compte, et leur compréhension est quasi instinctive. Le seul fait de lire fait appel au codage alphabétique,
Plus en détailLe Collège de France crée une chaire pérenne d Informatique, Algorithmes, machines et langages, et nomme le Pr Gérard BERRY titulaire
Communiquédepresse Mars2013 LeCollègedeFrancecréeunechairepérenned Informatique, Algorithmes,machinesetlangages, etnommeleprgérardberrytitulaire Leçoninauguralele28mars2013 2009avait marquéunpas importantdans
Plus en détailFONDEMENTS MATHÉMATIQUES 12 E ANNÉE. Mathématiques financières
FONDEMENTS MATHÉMATIQUES 12 E ANNÉE Mathématiques financières A1. Résoudre des problèmes comportant des intérêts composés dans la prise de décisions financières. [C, L, RP, T, V] Résultat d apprentissage
Plus en détailCENTRE INTERNATIONAL D ETUDES SUPERIEURES EN SCIENCES AGRONOMIQUES MONTPELLIER SUPAGRO THESE. Pour obtenir le grade de
CENTRE INTERNATIONAL D ETUDES SUPERIEURES EN SCIENCES AGRONOMIQUES MONTPELLIER SUPAGRO THESE Pour obtenir le grade de DOCTEUR DU CENTRE INTERNATIONAL D ETUDES SUPERIEURES EN SCIENCES AGRONOMIQUES MONTPELLIER
Plus en détail5255 Av. Decelles, suite 2030 Montréal (Québec) H3T 2B1 T: 514.592.9301 F: 514.340.6850 info@apstat.com www.apstat.com
Application des réseaux de neurones au plan de répartition des risques 5255 Av. Decelles, suite 2030 Montréal (Québec) H3T 2B1 T: 514.592.9301 F: 514.340.6850 info@apstat.com www.apstat.com Copyright c
Plus en détailIntelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com
Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines
Plus en détailLeçon N 4 : Statistiques à deux variables
Leçon N 4 : Statistiques à deux variables En premier lieu, il te faut relire les cours de première sur les statistiques à une variable, il y a tout un langage à se remémorer : étude d un échantillon d
Plus en détailINF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
Plus en détailPARTIE I Compte pour 75 %
PARTIE I Compte pour 75 % Instructions : Noircissez la lettre correspondant à la bonne réponse sur la feuille de réponse fournie. 1. Dans le diagramme, quelles structures font partie du système nerveux
Plus en détailOptimisation de la compression fractale D images basée sur les réseaux de neurones
Optimisation de la compression fractale D images basée sur les réseaux de neurones D r BOUKELIF Aoued Communication Networks,Architectures and Mutimedia laboratory University of S.B.A aoued@hotmail.com
Plus en détailProjet SINF2275 «Data mining and decision making» Projet classification et credit scoring
Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems
Plus en détailFormavie 2010. 2 Différentes versions du format PDB...3. 3 Les champs dans les fichiers PDB...4. 4 Le champ «ATOM»...5. 6 Limites du format PDB...
Formavie 2010 Les fichiers PDB Les fichiers PDB contiennent les informations qui vont permettre à des logiciels de visualisation moléculaire (ex : RasTop ou Jmol) d afficher les molécules. Un fichier au
Plus en détailIntroduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.
Introduction L'objectif de mon TIPE est la reconnaissance de sons ou de notes de musique à l'aide d'un réseau de neurones. Ce réseau doit être capable d'apprendre à distinguer les exemples présentés puis
Plus en détailDétermination du besoin en protéines de la canette mulard en phase de démarrage :
TECHNIQUE Détermination du besoin en protéines de la canette mulard en phase de démarrage : effet sur la croissance et les rejets azotés RÉSUMÉ Cette étude avait pour objet de définir le besoin en protéines
Plus en détailModule 16 : Les fonctions de recherche et de référence
Module 16 : Les fonctions de recherche et de référence 16.0 Introduction L une des fonctions les plus importantes d Excel, c est la possibilité de chercher une valeur spécifique dans un grand nombre de
Plus en détailRésumé du projet (french) http://www.univie.ac.at/phc. Karl Krajic Jürgen Pelikan Petra Plunger Ursula Reichenpfader
Résumé du projet (french) http://www.univie.ac.at/phc Karl Krajic Jürgen Pelikan Petra Plunger Ursula Reichenpfader Institut Ludwig Boltzmann de sociologie de la santé et de la médecine Avril 2001 Introduction
Plus en détailAlgorithme des fourmis appliqué à la détection et au suivi de contours dans une image
IN52-IN54 A2008 Algorithme des fourmis appliqué à la détection et au suivi de contours dans une image Etudiants : Nicolas MONNERET Alexandre HAFFNER Sébastien DE MELO Responsable : Franck GECHTER Sommaire
Plus en détailFORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)
87 FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) Dans le cadre de la réforme pédagogique et de l intérêt que porte le Ministère de l Éducation
Plus en détailSemestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»
Master In silico Drug Design Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments» 30NU01IS INITIATION A LA PROGRAMMATION (6 ECTS) Responsables : D. MESTIVIER,
Plus en détailApplication Note. WeOS Création de réseaux et de réseaux virtuels VLAN
Application Note WeOS Création de réseaux et de réseaux virtuels VLAN Table des matières 1 Création de VLANs... 3 2 Les réseaux routés... 7 Cette fiche applicative présente la création de réseaux dans
Plus en détailManuel de System Monitor
Chris Schlaeger John Tapsell Chris Schlaeger Tobias Koenig Traduction française : Yves Dessertine Traduction française : Philippe Guilbert Traduction française : Robin Guitton Relecture de la documentation
Plus en détailTD n o 8 - Domain Name System (DNS)
IUT Montpellier - Architecture (DU) V. Poupet TD n o 8 - Domain Name System (DNS) Dans ce TD nous allons nous intéresser au fonctionnement du Domain Name System (DNS), puis pour illustrer son fonctionnement,
Plus en détailDruais Cédric École Polytechnique de Montréal. Résumé
Étude de load balancing par un réseau de neurones de types HME (Hierarchical Mixture of s). Druais Cédric École Polytechnique de Montréal Résumé Cet article tente d introduire le principe de load balancing
Plus en détailMASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS. Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.
MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.fr Plan Introduction Généralités sur les systèmes de détection d intrusion
Plus en détailDescriptif de Kelio Protect
Descriptif de Kelio Protect Réf : 654070A Bodet France - Tél. : 08.25.81.44.00 - Fax : 08.25.81.44.01 - http : www.bodet.fr mail : commercial.gtp@bodet.com Bodet Export - Tel: +33(0)2.41.71.44.82 - Fax
Plus en détailCombinaison de modèles phylogénétiques et longitudinaux pour l analyse des séquences biologiques : reconstruction de HMM profils ancestraux
Combinaison de modèles phylogénétiques et longitudinaux pour l analyse des séquences biologiques : reconstruction de HMM profils ancestraux Jean-Baka Domelevo Entfellner To cite this version: Jean-Baka
Plus en détailConstruction de bases biométriques pour l assurance dépendance. SCOR inform - Novembre 2012
Construction de bases biométriques pour l assurance dépendance SCOR inform - Novembre 2012 Construction de bases biométriques pour l assurance dépendance Auteur Laure de Montesquieu Responsable Centre
Plus en détailImpact du mobile banking sur les comportements d épargne et de transferts à Madagascar. Florence Arestoff Baptiste Venet
Impact du mobile banking sur les comportements d épargne et de transferts à Madagascar Florence Arestoff Baptiste Venet 1 Introduction : contexte du contrat de recherche Ce contrat de recherche fait suite
Plus en détailVOCABULAIRE LIÉ AUX ORDINATEURS ET À INTERNET
VOCABULAIRE LIÉ AUX ORDINATEURS ET À INTERNET Brancher / débrancher l ordinateur de la prise Allumer / éteindre l ordinateur : pour allumer ou éteindre l ordinateur vous devez appuyer sur le bouton On/off
Plus en détailTABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.
STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,
Plus en détailNUTRINEAL MC PD4 MONOGRAPHIE. Solution d acides aminés à 1,1 % pour la dialyse péritonéale. Solution pour dialyse péritonéale
MONOGRAPHIE NUTRINEAL MC PD4 Solution d acides aminés à 1,1 % pour la dialyse péritonéale Solution pour dialyse péritonéale Corporation Baxter 7125, Mississauga Road Mississauga (Ontario) L5N 0C2 www.baxter.ca
Plus en détailSudoClick Reconnaissance de grilles de sudoku pour téléphones portables
SudoClick Reconnaissance de grilles de sudoku pour téléphones portables Patrick Anagnostaras 1 24 mai 2008 Department of Informatics - Master Project Report Département d Informatique - Departement für
Plus en détailTravaux pratiques avec RapidMiner
Travaux pratiques avec RapidMiner Master Informatique de Paris 6 Spécialité IAD Parcours EDOW Module Algorithmes pour la Fouille de Données Janvier 2012 Prise en main Généralités RapidMiner est un logiciel
Plus en détailTHEME : CLES DE CONTROLE. Division euclidienne
THEME : CLES DE CONTROLE Division euclidienne Soit à diviser 12 par 3. Nous pouvons écrire : 12 12 : 3 = 4 ou 12 3 = 4 ou = 4 3 Si par contre, il est demandé de calculer le quotient de 12 par 7, la division
Plus en détailTableau récapitulatif : composition nutritionnelle de la spiruline
Tableau récapitulatif : composition nutritionnelle de la spiruline (Valeur énergétique : 38 kcal/10 g) Composition nutritionnelle Composition pour 10 g Rôle Protéines (végétales) 55 à 70 % Construction
Plus en détailModélisation aléatoire en fiabilité des logiciels
collection Méthodes stochastiques appliquées dirigée par Nikolaos Limnios et Jacques Janssen La sûreté de fonctionnement des systèmes informatiques est aujourd hui un enjeu économique et sociétal majeur.
Plus en détailDéveloppement itératif, évolutif et agile
Document Développement itératif, évolutif et agile Auteur Nicoleta SERGI Version 1.0 Date de sortie 23/11/2007 1. Processus Unifié Développement itératif, évolutif et agile Contrairement au cycle de vie
Plus en détailCapacité d un canal Second Théorème de Shannon. Théorie de l information 1/34
Capacité d un canal Second Théorème de Shannon Théorie de l information 1/34 Plan du cours 1. Canaux discrets sans mémoire, exemples ; 2. Capacité ; 3. Canaux symétriques ; 4. Codage de canal ; 5. Second
Plus en détailProgrammation linéaire
1 Programmation linéaire 1. Le problème, un exemple. 2. Le cas b = 0 3. Théorème de dualité 4. L algorithme du simplexe 5. Problèmes équivalents 6. Complexité de l Algorithme 2 Position du problème Soit
Plus en détailProduction de Protéines d Organismes Unicellulaires Cultivés sur Corn Steep Liquor et Evaluation Nutritionnelle de la Biomasse
Rev. Energ. Ren. : Production et Valorisation Biomasse, (2001) 11-28 Production de Protéines d Organismes Unicellulaires Cultivés sur Corn Steep Liquor et Evaluation Nutritionnelle de la Biomasse N. Badid
Plus en détailRelation entre deux variables : estimation de la corrélation linéaire
CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence
Plus en détailSouad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/
Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation
Plus en détailEXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG
Exploitations pédagogiques du tableur en STG Académie de Créteil 2006 1 EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG Commission inter-irem lycées techniques contact : dutarte@club-internet.fr La maquette
Plus en détailDirection des bibliothèques. Sondage Ithaka S+R. Questionnaire français Université de Montréal
Direction des bibliothèques Sondage Ithaka S+R Questionnaire français Université de Montréal Décembre 2014 Modules retenus Découverte Activités de recherche numérique Compétences informationnelles des
Plus en détailCOMPTABILITE SAGE LIGNE 30
COMPTABILITE SAGE LIGNE 30 Date : 25/09/2006 Auteur : Pascal VIGUIER Réf. : SAGE092006 SOMMAIRE SOMMAIRE... 1 1. MENU FICHIER... 3 1.1 1.2 AUTORISATION D ACCES... 3 A PROPOS DE VOTRE SOCIETE... 4 1.2.1
Plus en détail(Third-Man Attack) PASCAL BONHEUR PASCAL BONHEUR@YAHOO.FR 4/07/2001. Introduction. 1 Domain Name Server. 2 Commandes DNS. 3 Hacking des serveurs DNS
Détournement de serveur DNS (Third-Man Attack) PASCAL BONHEUR PASCAL BONHEUR@YAHOO.FR 4/07/2001 Introduction Ce document traite de la possibilité d exploiter le serveur DNS pour pirater certains sites
Plus en détail1 Recherche en table par balayage
1 Recherche en table par balayage 1.1 Problème de la recherche en table Une table désigne une liste ou un tableau d éléments. Le problème de la recherche en table est celui de la recherche d un élément
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailCours n 3 Valeurs informatiques et propriété (2)
Cours n 3 Valeurs informatiques et propriété (2) - Les Bases De Données - Le multimédia - Les puces et topographies - La création générée par ordinateur 1 LES BASES DE DONNEES Depuis 1998, les Bases De
Plus en détailManage Yourself. Rapport de planification. Projet de 4ème année informatique. Equipe :
Manage Yourself Rapport de planification Projet de 4ème année informatique Equipe : Etienne Alibert, Florian Barbedette, Pierre Chesneau, Mathias Deshayes, Sevan Hartunians, Mathieu Poignet. Encadrant
Plus en détailMEMOIRES MAGNETIQUES A DISQUES RIGIDES
MEMOIRES MAGNETIQUES A DISQUES RIGIDES PARTIE ELECTRONIQUE Le schéma complet de FP5 est donnée en annexe. Les questions porterons sur la fonction FP5 dont le schéma fonctionnel de degré 2 est présenté
Plus en détailDéfinition 0,752 = 0,7 + 0,05 + 0,002 SYSTÈMES DE NUMÉRATION POSITIONNELS = 7 10 1 + 5 10 2 + 2 10 3
8 Systèmes de numération INTRODUCTION SYSTÈMES DE NUMÉRATION POSITIONNELS Dans un système positionnel, le nombre de symboles est fixe On représente par un symbole chaque chiffre inférieur à la base, incluant
Plus en détailInstaller Joomla. 2013 Pearson France Joomla! Le guide officiel Jennifer Marriott, Elin Waring
3 Installer Joomla Dans ce chapitre, nous procéderons au téléchargement et à l installation manuelle de Joomla, et nous expliquerons la configuration de base. Les captures d écran et les instructions font
Plus en détailINSTALLATION DES SERVICES DE DOMAINE ACTIVE DIRECTORY Windows Server 2008 R2
INSTALLATION DES SERVICES DE DOMAINE ACTIVE DIRECTORY Windows Server 2008 R2 Introduction Active Directory est un ensemble de services centralisés d identification et d authentification à un réseau d ordinateurs
Plus en détail$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU
$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU Fabien FIGUERES fabien.figueres@mpsa.com 0RWVFOpV : Krigeage, plans d expériences space-filling, points de validations, calibration moteur. 5pVXPp Dans le
Plus en détailManuel d utilisation du prototype d étiquetage et première expérimentation (fin 2008)
Manuel d utilisation du prototype d étiquetage et première expérimentation (fin 008) Julien Legueries 1 Installation Le prototype est constitué d une archive Java (fichier jar), d un fichier de propriétés
Plus en détailConception de Médicament
Conception de Médicament Approche classique HTS Chimie combinatoire Rational Drug Design Ligand based (QSAR) Structure based (ligand et ou macromolec.) 3DQSAR Docking Virtual screening Needle in a Haystack
Plus en détailL axe 5 du Cancéropole Nord Ouest
L axe 5 du Cancéropole Nord Ouest Cancers, Individu id & Société L état des lieux d un pari Le Rapport Cordier 1 Biomarqueurs prédictifs 2 L axe 5 du Cancéropole Nord Ouest Cancers, Individu & Société
Plus en détailDOSSIER SCIENTIFIQUE DE L IFN N 9 LES PROTEINES
DOSSIER SCIENTIFIQUE DE L IFN N 9 LES PROTEINES Tome 1 : Le métabolisme et les besoins protéiques chez l homme Février 1997 AVANT PROPOS LOUISOT P. L Institut Français pour la Nutrition a pris depuis cinq
Plus en détailLes réseaux cellulaires
Les réseaux cellulaires Introduction Master 2 Professionnel STIC-Informatique Module RMHD 1 Introduction Les réseaux cellulaires sont les réseaux dont l'évolution a probablement été la plus spectaculaire
Plus en détailLa gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.
La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. Gaël Le Mahec - p. 1/12 L algorithme BLAST. Basic Local Alignment Search Tool est un algorithme de recherche
Plus en détailJulien MATHEVET Alexandre BOISSY GSID 4. Rapport RE09. Load Balancing et migration
Julien MATHEVET Alexandre BOISSY GSID 4 Rapport Load Balancing et migration Printemps 2001 SOMMAIRE INTRODUCTION... 3 SYNTHESE CONCERNANT LE LOAD BALANCING ET LA MIGRATION... 4 POURQUOI FAIRE DU LOAD BALANCING?...
Plus en détailApplication 1- VBA : Test de comportements d'investissements
Application 1- VBA : Test de comportements d'investissements Notions mobilisées Chapitres 1 à 5 du cours - Exemple de récupération de cours en ligne 1ère approche des objets (feuilles et classeurs). Corps
Plus en détailDESCRIPTION DES PRODUITS ET MÉTRIQUES
DESCRIPTION DES PRODUITS ET MÉTRIQUES DPM Adobe - Adobe Analytics (2015v1) Les Produits et Services décrits dans cette DPM sont soit des Services On-demand soit des Services Gérés (comme décrits ci-dessous)
Plus en détailNON-LINEARITE ET RESEAUX NEURONAUX
NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme
Plus en détailCONSEILS POUR LA REDACTION DU RAPPORT DE RECHERCHE. Information importante : Ces conseils ne sont pas exhaustifs!
CONSEILS POUR LA REDACTION DU RAPPORT DE RECHERCHE Information importante : Ces conseils ne sont pas exhaustifs! Conseils généraux : Entre 25 et 60 pages (hormis références, annexes, résumé) Format d un
Plus en détailMaster IAD Module PS. Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique. Gaël RICHARD Février 2008
Master IAD Module PS Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique Gaël RICHARD Février 2008 1 Reconnaissance de la parole Introduction Approches pour la reconnaissance
Plus en détailMATHÉMATIQUES FINANCIÈRES
MATHÉMATIQUES FINANCIÈRES Table des matières Version 2012 Lang Fred 1 Intérêts et taux 2 1.1 Définitions et notations................................ 2 1.2 Intérêt simple......................................
Plus en détailCours Informatique 1. Monsieur SADOUNI Salheddine
Cours Informatique 1 Chapitre 2 les Systèmes Informatique Monsieur SADOUNI Salheddine Un Système Informatique lesystème Informatique est composé de deux parties : -le Matériel : constitué de l unité centrale
Plus en détailProbabilités stationnaires d une chaîne de Markov sur TI-nspire Louis Parent, ing., MBA École de technologie supérieure, Montréal, Québec 1
Introduction Probabilités stationnaires d une chaîne de Markov sur TI-nspire Louis Parent, ing., MBA École de technologie supérieure, Montréal, Québec 1 L auteur remercie Mme Sylvie Gervais, Ph.D., maître
Plus en détailPARTIE 1 : RENSEIGNEMENTS GÉNÉRAUX Les questions suivantes visent toutes les couvertures demandées. SECTION A : RENSEIGNEMENTS GÉNÉRAUX
PROPOSIP ITION POUR LE RENOUVELLEMENT D UNE ASSURANCE TECHNOLOGIE REMARQUES IMPORTANTES : La présente proposition est soumise à La Compagnie d Assurance Travelers du Canada («CATC») et à La Compagnie d
Plus en détailC est quoi un tableur?
C est quoi un tableur? Initiation au tableur Un Tableur c'est une grande feuille électronique, où vous pourrez travailler comme vous le feriez sur une feuille de papier, mais avec une plus grande rapidité,
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détailEbauche Rapport finale
Ebauche Rapport finale Sommaire : 1 - Introduction au C.D.N. 2 - Définition de la problématique 3 - Etat de l'art : Présentatio de 3 Topologies streaming p2p 1) INTRODUCTION au C.D.N. La croissance rapide
Plus en détailProjet de Traitement du Signal Segmentation d images SAR
Projet de Traitement du Signal Segmentation d images SAR Introduction En analyse d images, la segmentation est une étape essentielle, préliminaire à des traitements de haut niveau tels que la classification,
Plus en détailF7n COUP DE BOURSE, NOMBRE DÉRIVÉ
Auteur : S.& S. Etienne F7n COUP DE BOURSE, NOMBRE DÉRIVÉ TI-Nspire CAS Mots-clés : représentation graphique, fonction dérivée, nombre dérivé, pente, tableau de valeurs, maximum, minimum. Fichiers associés
Plus en détailBaccalauréat ES Pondichéry 7 avril 2014 Corrigé
Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient
Plus en détailAlgorithmique et structures de données I
Algorithmique et structures de données I Riadh Ben Messaoud Université 7 novembre à Carthage Faculté des Sciences Économiques et de Gestion de Nabeul 1ère année Licence Fondamentale IAG 1ère année Licence
Plus en détailConstat. Nicole DAUSQUE, dausque@urec.cnrs.fr CNRS/UREC
Utilisation de produits de simulation d intrusions Nicole DAUSQUE, dausque@urec.cnrs.fr CNRS/UREC Bon nombre des 1 250 unités du CNRS communiquent sur l Internet pour l ordinaire : messagerie électronique,
Plus en détailLES DECIMALES DE π BERNARD EGGER
LES DECIMALES DE π BERNARD EGGER La génération de suites de nombres pseudo aléatoires est un enjeu essentiel pour la simulation. Si comme le dit B Ycard dans le cours écrit pour le logiciel SEL, «Paradoxalement,
Plus en détailContinuité et dérivabilité d une fonction
DERNIÈRE IMPRESSIN LE 7 novembre 014 à 10:3 Continuité et dérivabilité d une fonction Table des matières 1 Continuité d une fonction 1.1 Limite finie en un point.......................... 1. Continuité
Plus en détailConcours interne d ingénieur des systèmes d information et de communication. «Session 2010» Meilleure copie "étude de cas architecture et systèmes"
Concours interne d ingénieur des systèmes d information et de communication «Session 2010» Meilleure copie "étude de cas architecture et systèmes" Note obtenue : 14,75/20 HEBERGE-TOUT Le 25 mars 2010 A
Plus en détailAir Transat. Contexte. Buts. Défis. Solution. Industry Travelling, Transport
Air Transat www.airtransat.ca Industry Travelling, Transport Partner r42 communication Cooper Building 3981 boul. Saint-Laurent, suite 215 Montreal H2W1Y5 Quebec, Canada Ralph Spandl ralph@r42.ca Contexte
Plus en détailLE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE.
LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE. Synthèse des travaux réalisés 1. Problématique La question D7 du plan d exécution du Programme National de Recherches
Plus en détailLa fonction exponentielle
DERNIÈRE IMPRESSION LE 2 novembre 204 à :07 La fonction exponentielle Table des matières La fonction exponentielle 2. Définition et théorèmes.......................... 2.2 Approche graphique de la fonction
Plus en détailService d accompagnement pédagogique de l Université Sorbonne Paris Cité
Service d accompagnement pédagogique de l Université Sorbonne Paris Cité CATALOGUE DE FORMATION POUR LES ENSEIGNANTS DE USPC 2014-2015 Le service SAPIENS créé en janvier 2014 propose durant l année 2014-2015
Plus en détail