Étienne Lord, étudiant au doctorat en informatique Directeur de recherche : Vladimir Makarenkov Codirecteur : Abdoulaye Baniré Diallo

Dimension: px
Commencer à balayer dès la page:

Download "Étienne Lord, étudiant au doctorat en informatique Directeur de recherche : Vladimir Makarenkov Codirecteur : Abdoulaye Baniré Diallo"

Transcription

1 FLUX DE TRAVAUX ET LEURS APPLICATIONS EN BIOINFORMATIQUE Étienne Lord, étudiant au doctorat en informatique Directeur de recherche : Vladimir Makarenkov Codirecteur : Abdoulaye Baniré Diallo

2 Résumé 1. Les flux de travaux et la phylogénie 2. La comparaison des flux de travaux «k-means, k-medoids, distance Euclidienne, distance cosine, partitionnement hiérarchique» 3. Critère de support des flux de travaux dans le partitionnement 4. Exemples de flux de travaux en bioinformatique 5. Conclusions et perspectives

3 Les flux de travaux Un flux de travaux est un patron de tâches ordonnées pouvant être exécutées de manière répétitive Data-flow / control-flow Galaxy Données individuelles Exécution concurrente Armadillo Taverna Sémantique individuelle Structures de contrôle externes Suspension et reprise de tâches

4 Les arbres phylogénétiques Représentation de la relation évolutive entre des espèces basée sur l étude des gènes M. marshali M. oregonensis M. montanus M. triangularis Modification de l image de Roderic Page. Systematic Biology, couverture Juin 2007, inspiré de Maddison (1997).

5 Quatre méthodologies d inférence d arbres phylogénétiques L inférence d arbres phylogénétique est une méthodologie permettant d émettre des hypothèses sur l évolution des espèces Méthodes de reconstruction phylogénétiques et logiciels associés Méthodes avec modèles d évolution Méthodes basées sur les caractères Maximum de vraisemblance : fastdnaml (~100 taxa) PhyML (~200 taxa) RAxML (~ taxa) FastTree2 (> taxa) Méthodes basées sur les distances Méthode de distances: Neighbor (~1000 taxa) BioNJ (> 1000 taxa) RapidNJ (~ taxa) Ninja (~ taxa) Méthodes sans modèle d évolution Méthodes bayésiennes : BEAST (~100 taxa) MrBayes (~200 taxa) Maximum de parcimonie : DNAPars (~500 taxa) PROTPars (~500 taxa) TNT (~ taxa) Oblong (> taxa)

6 Exemple de flux de travaux en bioinformatique Méthodes (13) 120,000 séquences Logiciels (3) Une reconstruction phylogénétique par Peters et al. (2011) BMC Biology 9, 55.

7 Les plates-formes de flux de travaux en bioinformatiques Plates-formes de flux de travaux bioinformatiques Plateforme Classe Flux de travaux Accès au «nuage» Application Kepler (2004) Galaxy (2005) Taverna (2003) LONI (2003) Bio-Jeti (2009) Triana (1997) Locale Web Locale, services Web Locale, services Web Locale, services Web Client- Serveur Data-flow Data-flow Data-flow Oui (Ecogrid) O ui (Amazon EC2) Oui (mygrid) Général Bioinformatique Bioinformatique Data-flow Oui Bioinformatique Control-flow Oui Bioinformatique Data-flow/ Control-flow Oui Général Kepler ( Galaxy ( Taverna ( LONI ( Bio-Jeti ( Triana (

8 Une nouvelle plate-forme de flux de travaux Armadillo adn.bioinfo.uqam.ca/armadillo Lord, E., Leclercq, M., Boc, A., Diallo, A.B., et Makarenkov, V. (2012). Armadillo 1.1: an original workflow platform for designing and conducting phylogenetic analysis and simulations. PloS One, 7(1), e

9 Armadillo v1.0 (adn.bioinfo.uqam.ca/armadillo) Locale Langage Java Données internes Data-flow et Control-flow sans programmation Phylogénétique (A)Une structure de control-flow (If). (B) Différents types d alignements de séquences. (C)Différentes couleurs pour ajouter au processus cognitif. (D)Exécution conditionnelle de code source Java.

10 Inclut les logiciels nécessaires pour inférer les arbres phylogénétiques Transfert horizontaux de gènes Alignement de séquences multiples Détection de transfert horizontaux de gènes Logiciel PHYLIP Reconstruction Alignement de séquences ancestralesde Évaluation des modèles d'évolution séquences Détection de la pression sélective Scripts locaux Applications externes Arbres et séquences alléatoires Visualisation Accès à des bases de données Blast Accès à des bases de données biologiques Inférence phylogénétique Alignement de séquences multiples Détection de transfert horizontaux de gènes Logiciel PHYLIP Reconstruction de séquences ancestrales Évaluation des modèles d'évolution Détection de la pression sélective Scripts locaux Applications externes Méthodes Arbres et séquences alléatoires Visualisation propres à Armadillo Accès à des bases de données Blast Accès à des bases de données biologiques Micro- ARNs * (en développement) Alignment information Figure 3.7b BAli- phy ClustalW ClustalW2 GBlock Kalign Garli Mafft Muscle TBA Probcons T- Coffee HGT PhyloNet - Ancestor Detection LatTrans RiataHGT (UQAM) (UQAM) ClustalO MAQ* Bowtie* PIRN Ranger- dtl SPR- DIST EEEP jmodeltest (Nucleic Acid) GARLI MrBayes RAxML FastTree2 NINJA BioNJ TNT Oblong fastdnaml PhyML DNAPARS NEIGHBOR (Phylip) (Phylip) Convert to Protein or DNA Rename Generate HTML Filter Remove Archaeopteryx mirdup mircheck Détec&on des gènes ancestraux RootTree Robinson& (using Fould MidPoint) (UQAM) PROML (Phylip) Concatenate Save to File Scriptree PRODIST (Phylip) Create Groups Split Output to Screen TreeDist (Phylip) RETREE (Phylip) Download from WWW CONSENSE DNADIST (Phylip) (Phylip) SEQBOOT (Phylip) Load Files PaML (baseml) Load Sequences Custom Run Java Random Program (Code) Sequences Rshell Base de données Web Fetch dbfetch EB- Eye Ncbi Ncbi eutils Sequences (Web EBI) (Web EBI) Download (Pubmed) Ncbi SQL Blast Database Download query BioMart* Blast EBI Blast Web Ncbi ProtTest (Amino Acid) SPR Hybrid- IdentiRicati Interleave on tool DNAML (Phylip) PaML (codeml) Load Trees Random Trees Create Local BlastDB Gene Ontology Modèles d évolu&on k- means/ k- medoids DNAML- Erate PaML (yn00) Regular Expression Seq- Gen LocalBlast Phylogénétique Analyse de la pression sélec&ve Recherche de séquences Blast

11 La plate-forme Armadillo : utilisations et statistiques Projets en cours ( ) Protocoles basés sur l ontologie et l analyse sémantique Cours sur la phylogénomique Séquençage de nouvelle génération Métagénomique Version en ligne (version 2.0 )

12 Problématique Problématique: une expérimentation in silico évolue et résulte en différentes versions d un flux de travaux. Comment les comparer?

13 Comparaison de Flux de travaux Lord, E., Diallo, A. B., et Makarenkov, V. (2014a). Workflow classification using partitioning and hierarchical clustering algorithms (soumis à Advances in Data Analysis and Classification).

14 Classification de flux de travaux Travaux récents sur la comparaison et le regroupement de flux de travaux Costa et al. (2012) Resource Discovery. Springer Berlin Heidelberg, Regroupement basé sur les metadata et la description en langage naturel. Silva et al. (2011) Journal of Computational Interdisciplinary Sciences, 2(1), Regroupement basé sur la similarité des relations entre les composants et sur les flux de travaux internes. Wombacher et Li (2010) IEEE International Conference on Services Computing, Regroupement basé sur des N-gram (décomposition du flux de travaux dans un langage). Kastner et al. (2009) Computer Aided Systems Theory. Springer Berlin Heidelberg, Regroupement k-means en utilisant la distance cosine et des vecteurs de poids représentants les transitions entre les tâches. Santos et al. (2008) Provenance and Annotation of Data and Processes. Springer Berlin Heidelberg, Regroupement k-means en utilisant un espace vectoriel et la distance du maximum common induced subgraph (MCIS) (Information structurelle). Goderis (2008) Thèse de doctorat, University of Manchester. Regroupement structurel basé sur l identification des activités. Jung et Bae (2006) Computational Science and Its Applications. Springer Berlin Heidelberg, Regroupement structurel basé sur les composants similaires.

15 Différent encodages des flux de travaux : type I et type II Flux de travaux Encodage mesure de distance Matrice binaire méthode de regroupement Nombre de groupes Encoding of Type I W1 W2 W3 W4 W5 Weights for Encoding of Type I Blast (NCBI) ClustalW HGT Detector Muscle PROTML (Phylip) PhyML (1) PhyML (2) Probcons Robinson&Foulds distance SEQBOOT Seq- Gen Disperser les tâches similaires pour des exécutions plus rapides Vecteur de temps moyens Encoding of Type II W1 W2 W3 W4 W5 Weights for Encoding of Type II Blast (NCBI) ClustalW HGT Detector Muscle PROTML (Phylip) PhyML Probcons Robinson&Foulds distance SEQBOOT Seq- Gen Vecteur de poids Grouper les flux de travaux similaires en fonction de mots-clés Encoding of Type III W1 W2 W3 W4 W5 Weights for Encoding of Type III Matrice d occurrence Blast (NCBI) HGT Detector Robinson&Foulds distance ClustalW2 PhyML Muscle PhyML Muscle SEQBOOT (Phylip)

16 Paire de tâches PhyML Différent Probcons encodages 0 0des 1 0 flux 0 de 0.10 travaux : type III et type IV Robinson&Foulds distance SEQBOOT Matrice d occurrence Seq- Gen Encoding of Type III W1 W2 W3 W4 W5 Weights for Encoding of Type III Blast (NCBI) HGT Detector Robinson&Foulds distance ClustalW2 PhyML Muscle PhyML Muscle SEQBOOT (Phylip) PROTML (Phylip) HGT Detector PhyML HGT Detector Probcons PhyML SEQBOOT (Phylip) PROTML (Phylip) Seq- Gen Blast (NCBI) Seq- Gen ClustalW Encoding of Type IV W1 W2 W3 W4 W5 Weights for Encoding of Type IV Blast (NCBI) HGT Detector Robinson&Foulds distance ClustalW2 PhyML Muscle PhyML Muscle SEQBOOT (Phylip) PROTML (Phylip) HGT Detector PhyML HGT Detector Probcons PhyML SEQBOOT (Phylip) PROTML (Phylip) Seq- Gen Blast (NCBI) Seq- Gen ClustalW INPUT_Sequences INPUT_Tree OUTPUT_Blast (NCBI) OUTPUT_Matrix OUTPUT_MultipleTrees OUTPUT_OutputText OUTPUT_Results Vecteur de temps moyens Vecteur de poids Disperser les tâches similaires pour des exécutions plus rapides Encourager la réutilisation des données (génomiques) Matrice d occurrence

17 Distance entre les flux de travaux Flux de travaux Encodage mesure de distance méthode de regroupement Nombre de groupes Soit w une matrice bidimensionnelle contenant des mesures pour n éléments (i.e. des flux de travaux) et m variables (i.e. des tâches individuelles ou des paires de tâches). Soit y = {y 1,, y m } le vecteur de coefficients de pondérations attribués aux variables, on retrouve les distances d : Distance Euclidienne pondérée: d ij = m p= 1 y p ( w ip w jp ) 2 Distance cosine pondérée: d ij = 1 cosθ = 1 m p= 1 m p= 1 y p y p w ( w 2 ip ip w m p= 1 jp y ) p w 2 jp

18 Méthodes de regroupement Flux de travaux Encodage mesure de distance méthode de regroupement Nombre de groupes Méthodes hiérarchiques UPGMA (Sokal et Michener, 1958) Neighbor Joining (Saitou et Nei, 1987) FITCH et KITSCH (Fitch et Margoliash, 1967) Méthodes de partitionnement k-means (MacQueen, 1967) k-medoids (Kauffman et Rousseeuw, 1990)

19 Algorithmes de k- means et k- medoids k=2 k=2 Note: le nombre de groupes (k) est déterminé préalablement.

20 Choix du nombre de classes (K) Flux de travaux Encodage mesure de distance méthode de regroupement Nombre de groupes Indice de Calinski et Harabasz (1974) CH ( K) = SS SS ( n K) ( K 1) K B 2 SSB = nk meank mean W k = 1 SS W = K n k k = 1 i= 1 w ik mean k 2 n k, nombre d éléments dans la classe k; w ik, flux de travaux i dans la classe k. Indice Silhouette (Rousseeuw, 1987) nk b( i) a( i) s( k) / nk max( a( i), b( i)) i 1 K = s( K) = [ s( k) ]/ K = k = 1 a(i), distance moyenne de i avec les autres éléments du groupe k; b(i), la plus petite distance entre les différents groupes. Indice LogSS (Hartigan, 1975) SS logss ( K) = log SS Revue par : B W Milligan et Cooper (1985) Psychometrika, 50(2), Arbelaitz et al. (2013) Pattern Recognition, 46(1),

21 Jeux de données Nombre de flux de travaux (N) Encodage de Types I et II Simulations Deux jeux de données de flux de travaux bioinformatiques et phylogénétiques. Encodage de Type III Encodaged e Type IV Nombre de classes (K) Mots-clés utilisés pour l encodage de Types II et IV Armadillo HGT myexperiment BLAST Évaluation des méthodes de partitionnement : Indice Rand (1971) Évaluation des méthodes hiérarchiques : Distance de Robinson et Foulds (1981) a + b RI = n 2 a, nombre d éléments dans les mêmes classes dans les deux partitions. b, nombre d éléments qui sont dans des classes différentes dans les deux partitions. ( B1 ) ( B2 ) + ( B2 ) ( B1 ) d RF ( T1, T2 ) =. 2 B 1 et B 2 représentent le nombre de bipartitions non triviales entre les arbres T 1 et T 2.

22 Résultats pour le jeu de données d Armadillo (n=120) (a) Effet du critère d'optimisation; (b) Effet du type d encodage; (c) Effet de la mesure de distances; (d) Effet de l'algorithme de partitionnement appliqué;

23 Conclusions pour le regroupement par partitionnement (a) Effet des critères d'optimisation pour les encodages non pondérés (les deux premiers jeux de barres) et pondérés (quatre derniers jeux de barres); (b) Effet de la mesure de distances; (c) Effet de l'algorithme de partitionnement appliqué; La distance cosine pondérée, utilisée avec l algorithme k-medoids, l encodage de type I et l indice Silhouette, montre la meilleure performance. N.B. Les plus grandes valeurs de l indice Rand sont les meilleures.

24 Regroupement hiérarchique pour le jeu de données d Armadillo Classification hiérarchique des stratégies de regroupement évaluées sur le jeu de données d Armadillo (n=120) Évaluation de la distance Euclidienne et cosine pondérée et non-pondérée avec les algorithmes de regroupement hiérarchique UPGMA, Neighbor-Joining, FITCH, KITSCH et les encodages de type I à IV. Classification hiérarchique en utilisant la distance de Robinson et Foulds obtenue par l algorithme Neighbor- Joining avec le logiciel T-Rex et Mega.

25 Conclusions pour le regroupement hiérarchique (a) Effet des critères d'optimisation pour les encodages non pondérés (les deux premiers jeux de barres) et pondérés (quatre derniers jeux de barres); (b) Effet de l'algorithme de partitionnement appliqué; (c) Effet de la mesure de distance; L encodage de type I avec la distance cosine et l algorithme de Fitch ont démontré une meilleure performance. N.B. Les plus petites valeurs de la distance de Robinson et Foulds (RF) sont les meilleurs.

26 Problématique Problématique: les algorithmes de regroupement sont des heuristiques et même avec un nombre de classes fixe, différentes solutions de partitionnement sont obtenues. Peut-on avoir une mesure du support de ce partitionnement? Galphimia Nicotiana Petunia Lycopersi Cypirapea Oenothera 100 Victoria Barclaya 0.01 Arbre phylogénétique avec scores de support obtenus par la méthode de bootstrap.

27 Critère de support pour la Comparaison de flux de travaux Lord, E., Diallo, A. B., et Makarenkov, V. (2014a). Workflow classification using partitioning and hierarchical clustering algorithms (soumis à Advances in Data Analysis and Classification).

28 Nouveau critère de support : idée de base Flux de travaux Partitionnement Exemple: les flux de travaux 1 et 2 sont toujours réunis. Comment décider que l on a trouvé le regroupement par partitionnement idéal si deux indices donnent des résultats différents? Le flux de travaux 3 change souvent de partition. Indice CH (c) Partitions Indice SI (d) Partitions

29 Nouveau critère de support : calcul de la valeur de support par paires PS S q, ij = Valeur de l indice de regroupement sélectionné pour le partitionnement q (S q ), si w i et w j sont dans la même classe lors du partitionnement Sinon, 0 S qi = S q, si w i est dans une classe singleton Sinon, 0 Flux de travaux W1 0 W2 1 0 PS( w, w i j ) W W W W Q q= 1 = Q q= 1 S q, ij S q PS( w ) i Q q= 1 = Q q= 1 S S qi q

30 Nouveau critère de support : calcul du support individuel PSG PSG( w ) = Support individuel (PSG) 1,00 0,95 0,90 0,85 0,80 0,75 0,70 0,65 0,60 0,55 0,50 i ( n j= 1( j i) max( PS( w, w i j ),1 PS( w, w i n j ))) + max( PS( w ),1 PS( w )) i i En conclusion, ce critère de support peut servir à identifier des éléments mal supportés, y compris les outliers, sans avoir à utiliser des techniques telles que le bootstrap ou jacknife (Hennig (2008). Journal of multivariate analysis, 99(6), ).

31 PSG( W ) = 2( n i= 1 i 1 j = 1 Jeu de données d Armadillo (n=120) max( PS( w, w i j ),1 PS( w, w i n 2 j )) + n i= 1 max( PS( w ),1 i PS( w ))) i k-means Critères de regroupement k-means k-medoids Calinski- Harabasz Silhouette logss k-medoids

32 Application du critère de support à d autres jeux de données? Jeu de données de Iris, Fisher (1936) (a) Classification originale Iris setosa Iris virginica Iris setosa Iris versicolor (b) k-means 1.0 Support (PSG) Calinski- Harabasz Silhouette Iris versicolor Iris setosa Iris versicolor Iris virginica (c) k-medoids 1.0 Support (PSG) Calinski- Harabasz Silhouette Iris setosa Iris versicolor Iris virginica Iris virginica

33 Application du critère de support à d autres jeux de données? Jeu de données de Iris, Fisher (1936) (a) Classification originale Iris setosa Iris virginica Iris setosa Méthode de regroupement k-mean Iris versicolor k-medoids Iris versicolor (b) k-means 1.0 Iris Iris Iris 0.8 Indices d optimisation 0.6 setosa versicolor virginica Calinski-Harabasz 0.99± ± ±0.03 Support (PSG) 0.4 Calinski- Harabasz 0.2 Silhouette ±0.01 Silhouette 0.94± ±0.03 Iris setosa Iris versicolor Iris virginica Calinski-Harabasz 0.98± ± ±0.01 (c) k-medoids Silhouette 0.90± ± ± Support (PSG) Calinski- Harabasz Silhouette Iris virginica Iris setosa Iris versicolor Iris virginica

34 Exemples de Flux de travaux bioinformatiques Ransy, D. G., Lord, E., Caty, M., Lapointe, N., Boucher, M., Diallo, A. B., Soudeyns, H. (2014). Subtle Differences in Selective Pressures Applied on the Envelope Gene of HIV-1 in Pregnant Versus Non-Pregnant Women. (soumis à Journal of Virology). Lord, E., Remita, M. A., Agharbaoui, Z., Leclercq, M., Badawi, M. A., Makarenkov, V., Sarhan, F., et Diallo, A. B. (2014b). WMP: A novel comprehensive Wheat mirna database, including related bioinformatics software (soumis à Molecular Biology and Evolution).

35 Exemple: études de l évolution du VIH chez les femmes enceintes Étude de la pression sélective sur la protéine gp120 du virus de l immunodéficience humaine de type I (VIH) chez les femmes enceintes. Ransy, D. G., Lord, E. et al. (soumis à Journal of Virology). (A) Répétition de l analyse de plusieurs jeux de données. (B) Alignement des séquences, à l aide du logiciel Muscle (Edgar, 2004), de la protéine gp120. (C) Inférence de l arbre phylogénétique à partir d une méthode de maximum de vraisemblance. (D) Logiciel PAML utilisé pour l évaluation de la pression sélective à différents sites.

36 Exemple : flux de travaux utilisé pour annoter les séquences cibles Création d une banque de données de petits ARNs chez le blé. Lord, E. et al. (soumis à Molecular Biology and Evolution). (A) Exécution concurrente de l algorithme de recherche de séquences BLAST sur les bases de données de séquences NCBI et SwissProt. (B) Exécution conditionnelle de la recherche ontologique si on a des résultats en (A). (C) Recherche par la méthode BLAST, mais sur la base de données TReMBL et recherche ontologique sur ces résultats, s il n y a pas de résultats en (A).

37 Conclusions et perspectives

38 Conclusions Nous avons analysé, conçu, et implémenté une nouvelle plate-forme de flux de travaux phylogénétique. Nous avons proposé et validé par simulations quatre stratégies d encodage des flux de travaux. Nous avons validé l utilisation d une distance cosine pondérée pour le regroupement des flux de travaux. Un nouveau critère de support a été proposé. Des flux de travaux créés et exécutés dans la plateforme Armadillo pour réaliser une étude sur le VIH de type I chez des femmes enceintes et une nouvelle banque de données de petits ARNs chez le blé.

39 Perspectives : la plate-forme pourrait être adaptée à d autres domaines Alignment informatio n BAli- phy ClustalW ClustalW2 GBlock Kalign Garli Mafft Muscle TBA Probcons T- Coffee HGT Detector (UQAM) LatTrans PhyloNet - RiataHGT Ancestor (UQAM) jmodeltest (Nucleic Acid) ProtTest (Amino Acid) Une sélection de commandes Linux fastdnaml DNAPARS (Phylip) PhyML NEIGHBOR (Phylip) RootTree (using MidPoint) PROML (Phylip) Robinson& Fould (UQAM) PRODIST (Phylip) TreeDist (Phylip) RETREE (Phylip) CONSENSE (Phylip) SEQBOOT (Phylip) DNADIST (Phylip) PaML (baseml) DNAML (Phylip) PaML (codeml) DNAML- Erate PaML (yn00) cd ls rm cp mv chown chmod chgrp Convert to Protein or DNA Filter Concatenat e Create Groups Rename Remove Save to File Split Generate HTML Archaeopteryx Scriptree Output to Screen Download from WWW Custom Progra m Rshell* Load Files Run Java (Code) SQL Database query Load Sequences Random Sequences Blast Download Load Trees Random Trees Create Local BlastDB Regular Expression Seq- Gen LocalBlast pwd mkdir rmdir scp rcp mmv su / sudo date times sleep uniq nice slocate locate df bzip2 tar gzip dbfetch (Web EBI) EB- Eye (Web EBI) Ncbi Download Ncbi eutils (Pubmed) Fetch Sequences Ncbi BioMart* Blast Web Ncbi Phylogénétique man help read paste Rind du sort tsort tree top ps bg cron crontab time env export kill let declare set unset uuencode uudecode alias adduser addgroup printf clear echo exec true false wget awk/ gawk sed command func@on if un@l eval more wc grep/ egrep head case for while continue break less tail cat cut

40 Remerciements Merci au laboratoire de bioinformatique à l Université du Québec à Montréal : Vladimir Makarenkov, Abdoulaye Baniré Diallo, Alix Boc, Mickael Leclercq, Alpha Boubacar Diallo, Dunarel Badescu, Amine Mohamed Remita, Nadia Tahiri

41 Complexités algorithmiques des algorithmes de regroupement K nombre de classes. n nombre d éléments. m nombre de variables pour chaque élément. i nombre d itération de l algorithme. * Basé sur l analyse de Xu, R., et Wunsch, D. (2005). IEEE Transactions on Neural Networks, 16(3), ** Voir Riesen, K., et Bunke, H. (2009). International Journal of Pattern Recognition and Artificial Intelligence, 23(06),

La programmation d un système de flux (workflow) pour pallier à l explosion des données scientifiques - problèmes, défis et solutions -

La programmation d un système de flux (workflow) pour pallier à l explosion des données scientifiques - problèmes, défis et solutions - La programmation d un système de flux (workflow) pour pallier à l explosion des données scientifiques - problèmes, défis et solutions - Etienne Lord Université du Québec à Montréal Séminaire avancé en

Plus en détail

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. Gaël Le Mahec - p. 1/12 L algorithme BLAST. Basic Local Alignment Search Tool est un algorithme de recherche

Plus en détail

Linux et le Shell. Francois BAYART. Atelier du samedi 20 Novembre 2010 http://www.loligrub.be

Linux et le Shell. Francois BAYART. Atelier du samedi 20 Novembre 2010 http://www.loligrub.be Linux et le Shell Francois BAYART Atelier du samedi 20 Novembre 2010 http://www.loligrub.be 1 Le «système» 2 FHS http://fr.wikipedia.org/wiki/filesystem_hierarchy_standard Filesystem Hierarchy Standard

Plus en détail

Atelier individuel. Linux 101. Frédérick Lefebvre & Maxime Boissonneault frederick.lefebvre@calculquebec.ca U. Laval - Janv. 2014

Atelier individuel. Linux 101. Frédérick Lefebvre & Maxime Boissonneault frederick.lefebvre@calculquebec.ca U. Laval - Janv. 2014 Atelier individuel Linux 101 Frédérick Lefebvre & Maxime Boissonneault frederick.lefebvre@calculquebec.ca U. Laval - Janv. 2014!1 !2 Se connecter à Colosse colosse.calculquebec.ca SSH est un protocole

Plus en détail

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY Yvan Le Bras yvan.le_bras@irisa.fr Cyril Monjeaud, Mathieu Bahin, Claudia Hériveau, Olivier Quenez, Olivier Sallou, Aurélien Roult, Olivier

Plus en détail

Introduction à MATLAB R

Introduction à MATLAB R Introduction à MATLAB R Romain Tavenard 10 septembre 2009 MATLAB R est un environnement de calcul numérique propriétaire orienté vers le calcul matriciel. Il se compose d un langage de programmation, d

Plus en détail

Bon ben voilà c est fait!

Bon ben voilà c est fait! Bon ben voilà c est fait! Au programme : - Exploration de l arborescence et informations systèmes - Action sur les dossiers et fichiers - Gestion des autorisations - Conversion pdf en text - Connexion

Plus en détail

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55

Plus en détail

Parallélisation de l algorithme des k-médoïdes. Application au clustering de courbes.

Parallélisation de l algorithme des k-médoïdes. Application au clustering de courbes. Parallélisation de l algorithme des k-médoïdes. Application au clustering de courbes. Benjamin Auder 1 & Jairo Cugliari 2 1 Laboratoire LMO. Université Paris-Sud. Bât 425. 91405 Orsay Cedex, France. benjamin.auder@math.u-psud.fr

Plus en détail

SysFera. Benjamin Depardon

SysFera. Benjamin Depardon SysFera Passage d applications en SaaS Benjamin Depardon CTO@SysFera SysFera Technologie 2001 Création 2010 Spin Off INRIA Direction par un consortium d investisseurs 12 personnes 75% en R&D Implantation

Plus en détail

Application de K-means à la définition du nombre de VM optimal dans un cloud

Application de K-means à la définition du nombre de VM optimal dans un cloud Application de K-means à la définition du nombre de VM optimal dans un cloud EGC 2012 : Atelier Fouille de données complexes : complexité liée aux données multiples et massives (31 janvier - 3 février

Plus en détail

Introduction à Linux (pour le HPC) «Linux 101» Présentation : http://goo.gl/bvfyn

Introduction à Linux (pour le HPC) «Linux 101» Présentation : http://goo.gl/bvfyn Introduction à Linux (pour le HPC) «Linux 101» Présentation : http://goo.gl/bvfyn maxime.boissonneault@calculquebec.ca U. Laval - Mars 2013 1 2 Plan de la présentation 1.Accéder à une grappe 2.Fichiers

Plus en détail

Outils pour la pratique

Outils pour la pratique Cinquième partie Outils pour la pratique 121 CHAPITRE 1 Les bases des séances de TP Avant de lire cettre section, il est suggéré de relire vos notes de cours se rapportant au système d exploitation Unix.

Plus en détail

Aide-Mémoire unix. 9 février 2009

Aide-Mémoire unix. 9 février 2009 Aide-Mémoire unix Nicolas Kielbasiewicz 9 février 2009 Le système d exploitation unix est de plus en plus présent aujourd hui. Comme tous les projets Open Source, on le trouve sous différentes formes :

Plus en détail

Laboratoire 4 Développement d un système intelligent

Laboratoire 4 Développement d un système intelligent DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI LOG770 - SYSTÈMES INTELLIGENTS ÉTÉ 2012 Laboratoire 4 Développement d un système intelligent 1 Introduction Ce quatrième et dernier laboratoire porte sur le développement

Plus en détail

D r o i t s D r o i t s Q u i z z : i n t e r n e t t e x t e

D r o i t s D r o i t s Q u i z z : i n t e r n e t t e x t e Faire un script permettant de mettre l'adresse IP "globale" dans la variable d'environnement PUBLIC_IP (cette adresse peut être trouvée sur http://index.erasme.org/utils/ip.php) Faire un script permettant

Plus en détail

Année Universitaire 2014-2015 3 ième année IMAC Mardi 6 janvier 2015. Cloud computing Travaux Pratiques

Année Universitaire 2014-2015 3 ième année IMAC Mardi 6 janvier 2015. Cloud computing Travaux Pratiques Année Universitaire 2014-2015 3 ième année IMAC Mardi 6 janvier 2015 Cloud computing Travaux Pratiques Objectif Dans un premier temps, on utilisera libvirt : une librairie d accès aux principaux hyperviseurs

Plus en détail

Big data et sciences du Vivant L'exemple du séquençage haut débit

Big data et sciences du Vivant L'exemple du séquençage haut débit Big data et sciences du Vivant L'exemple du séquençage haut débit C. Gaspin, C. Hoede, C. Klopp, D. Laborie, J. Mariette, C. Noirot, MS. Trotard bioinfo@genopole.toulouse.inra.fr INRA - MIAT - Plate-forme

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de

Plus en détail

Perl Orienté Objet BioPerl There is more than one way to do it

Perl Orienté Objet BioPerl There is more than one way to do it Perl Orienté Objet BioPerl There is more than one way to do it Bérénice Batut, berenice.batut@udamail.fr DUT Génie Biologique Option Bioinformatique Année 2014-2015 Perl Orienté Objet - BioPerl Rappels

Plus en détail

Galaxy Training days. Liste des sessions disponibles : http://bioinfo.genotoul.fr. Les formateurs :

Galaxy Training days. Liste des sessions disponibles : http://bioinfo.genotoul.fr. Les formateurs : -- 1 -- Galaxy Training days Durée / Programme : 3 journées. Galaxy : First step. Galaxy : Reads alignment and SNP calling. Galaxy : RNAseq alignment and transcripts assemblies. Public : Personnes souhaitant

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

sshgate Patrick Guiran Chef de projet support pguiran@linagora.com WWW.LINAGORA.COM

sshgate Patrick Guiran Chef de projet support pguiran@linagora.com WWW.LINAGORA.COM sshgate Patrick Guiran Chef de projet support pguiran@linagora.com WWW.LINAGORA.COM Sommaire 1. Problématique des accès aux serveurs Besoins Linagora Recherche d'une solution 2. Présentation de sshgate

Plus en détail

Pharmed. gestion de pharmacie hospitalière. Installation / déploiement

Pharmed. gestion de pharmacie hospitalière. Installation / déploiement Pharmed gestion de pharmacie hospitalière Installation / déploiement Version 1.0 du 23/05/2006 Date Auteur Version Modification 23/05/06 Pierre CARLIER 1.0 14/06/06 Matthieu Laborie Table des matières

Plus en détail

«Astrophysique et instrumentations associées» Cours UNIX. 2006 Benoît Semelin

«Astrophysique et instrumentations associées» Cours UNIX. 2006 Benoît Semelin M2 «Astrophysique et instrumentations associées» Cours UNIX 2006 Benoît Semelin Les OS OS = Operating System : Programme de base qui assure la gestion du matériel (clavier, écran, disque dur...), du système

Plus en détail

TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes

TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes Mohamed Moussaoui,Wajdi Dhifli,Sami Zghal,Engelbert Mephu Nguifo FSJEG, Université de Jendouba,

Plus en détail

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet Beat Wolf 1, Pierre Kuonen 1, Thomas Dandekar 2 1 icosys, Haute École Spécialisée de Suisse occidentale,

Plus en détail

E-Biothon : Une plate-forme pour accélérer les recherches en biologie, santé et environnement.

E-Biothon : Une plate-forme pour accélérer les recherches en biologie, santé et environnement. E-Biothon : Une plate-forme pour accélérer les recherches en biologie, santé et environnement. N.Bard, S.Boin, F.Bothorel, P.Collinet, M.Daydé, B. Depardon, F. Desprez, M.Flé, A.Franc, J.-F. Gibrat, D.

Plus en détail

Séance 0 : Linux + Octave : le compromis idéal

Séance 0 : Linux + Octave : le compromis idéal Séance 0 : Linux + Octave : le compromis idéal Introduction Linux est un système d'exploitation multi-tâches et multi-utilisateurs, basé sur la gratuité et développé par une communauté de passionnés. C'est

Plus en détail

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services 69 Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services M. Bakhouya, J. Gaber et A. Koukam Laboratoire Systèmes et Transports SeT Université de Technologie de Belfort-Montbéliard

Plus en détail

Analyse des données de séquençage massif par des méthodes phylogénétiques

Analyse des données de séquençage massif par des méthodes phylogénétiques Analyse des données de séquençage massif par des méthodes phylogénétiques Roux S., Taib N., Mangot J.F., Hugoni M., Mary I., Ravet V., Bronner G., Enault F., Debroas D. Équipe Microbiologie de l'environnement

Plus en détail

Formation Cloudera Data Analyst Utiliser Pig, Hive et Impala avec Hadoop

Formation Cloudera Data Analyst Utiliser Pig, Hive et Impala avec Hadoop Passez au niveau supérieur en termes de connaissance grâce à la formation Data Analyst de Cloudera. Public Durée Objectifs Analystes de données, business analysts, développeurs et administrateurs qui ont

Plus en détail

Performances. Gestion des serveurs (2/2) Clustering. Grid Computing

Performances. Gestion des serveurs (2/2) Clustering. Grid Computing Présentation d Oracle 10g Chapitre VII Présentation d ORACLE 10g 7.1 Nouvelles fonctionnalités 7.2 Architecture d Oracle 10g 7.3 Outils annexes 7.4 Conclusions 7.1 Nouvelles fonctionnalités Gestion des

Plus en détail

Compte-rendu re union Campus AAR 3 mars 2015

Compte-rendu re union Campus AAR 3 mars 2015 Compte-rendu re union Campus AAR 3 mars 2015 Table des matières Liste d actions... 2 I. Environnement d analyse : INA, Armadillo... 3 a. Connexion de l outil INA avec API Armadillo... 3 b. Outil d analyse

Plus en détail

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013 Cube de textes et opérateur d'agrégation basé sur un modèle vectoriel adapté Text Cube Model and aggregation operator based on an adapted vector space model Lamia Oukid, Ounas Asfari, Fadila Bentayeb,

Plus en détail

SERVEUR DE SAUVEGARDE POUR BCDI3. par. G.Haberer, A.Peuch, P.Saadé

SERVEUR DE SAUVEGARDE POUR BCDI3. par. G.Haberer, A.Peuch, P.Saadé SERVEUR DE SAUVEGARDE POUR BCDI3 par G.Haberer, A.Peuch, P.Saadé Table des matières 1. Introduction........................................................................ 2 1.1. Objectif....................................................................

Plus en détail

L art d ordonnancer. avec JobScheduler. François BAYART

L art d ordonnancer. avec JobScheduler. François BAYART L art d ordonnancer avec JobScheduler François BAYART 30 Octobre 2010 [1] 234567 introduction Introduction Qui suis-je? François Bayart consultant système en solution libre et propriétaire Redhat (1996),

Plus en détail

Introduction aux bases de données: application en biologie

Introduction aux bases de données: application en biologie Introduction aux bases de données: application en biologie D. Puthier 1 1 ERM206/Technologies Avancées pour le Génome et la Clinique, http://tagc.univ-mrs.fr/staff/puthier, puthier@tagc.univ-mrs.fr ESIL,

Plus en détail

BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous :

BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous : BASE BioArray Software Environment (BASE) est une base de données permettant de gérer l importante quantité de données générées par des analyses de bio-puces. BASE gère les informations biologiques, les

Plus en détail

Mac OS X en entreprise

Mac OS X en entreprise Mac OS X en entreprise Déploiement et administration de Mac sous Mac OS X dans le milieu professionnel Des Macs en entreprise : une aberration? I - Des PCs à part I - a - De PowerPC à Intel I - b - Un

Plus en détail

Laboratoire d Automatique et Productique Université de Batna, Algérie

Laboratoire d Automatique et Productique Université de Batna, Algérie Anale. Seria Informatică. Vol. IX fasc. 2 Annals. Computer Science Series. 9 th Tome st Fasc. 2 La sélection de paramètres d un système industriel par les colonies de fourmis Ouahab Kadri, L. Hayet Mouss,

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

Configurer la supervision pour une base MS SQL Server Viadéis Services

Configurer la supervision pour une base MS SQL Server Viadéis Services Configurer la supervision pour une base MS SQL Server Référence : 11588 Version N : 2.2 : Créé par : Téléphone : 0811 656 002 Sommaire 1. Création utilisateur MS SQL Server... 3 2. Configuration de l accès

Plus en détail

Travaux pratiques avec RapidMiner

Travaux pratiques avec RapidMiner Travaux pratiques avec RapidMiner Master Informatique de Paris 6 Spécialité IAD Parcours EDOW Module Algorithmes pour la Fouille de Données Janvier 2012 Prise en main Généralités RapidMiner est un logiciel

Plus en détail

Valorisez vos actifs logiciels avec Rational Asset Manager. Jean-Michel Athané, Certified IT Specialist IBM Rational Software

Valorisez vos actifs logiciels avec Rational Asset Manager. Jean-Michel Athané, Certified IT Specialist IBM Rational Software Valorisez vos actifs logiciels avec Rational Asset Manager Jean-Michel Athané, Certified IT Specialist IBM Rational Software 13 Qu est-ce qu un actif logiciel (Software Asset)? Un asset est une collection

Plus en détail

TP 4 de familiarisation avec Unix

TP 4 de familiarisation avec Unix TP 4 de familiarisation avec Unix Réseau Filtres (suite) Variables Scripts Vincent Berry - vberry@lirmm.fr IMPORTANT : la prise de notes est une pratique très importante et pourtant négligée, elle est

Plus en détail

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments» Master In silico Drug Design Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments» 30NU01IS INITIATION A LA PROGRAMMATION (6 ECTS) Responsables : D. MESTIVIER,

Plus en détail

1 Configuration des Fichiers Hosts, Hostname, Resolv.conf

1 Configuration des Fichiers Hosts, Hostname, Resolv.conf INSTALLATION ET CONFIGURATION ZIMBRA SUR DEBIAN 4.0 ETCH Zimbra est une solution Open Source d e-mail et de partage de calendrier destinée aux entreprises, aux prestataires de service, aux institutions

Plus en détail

Environnements informatiques

Environnements informatiques Environnements informatiques Premiers pas sous Linux (seconde partie) 26 septembre 2008 blansche@dpt-info.u-strasbg.fr 1 /12 Administration sous Linux 2 /12 Démarrage Démarrage de Linux Niveaux de démarrage

Plus en détail

Vers une Optimisation de l Algorithme AntTreeStoch

Vers une Optimisation de l Algorithme AntTreeStoch Revue des Sciences et de la Technologie - RST- Volume 3 N 1 / janvier 2012 Vers une Optimisation de l Algorithme AntTreeStoch O. KADRI, H. MOUSS, A. ABDELHADI, R. MAHDAOUI Laboratoire d Automatique et

Plus en détail

Sauvegarde automatique des données de GEPI

Sauvegarde automatique des données de GEPI Sauvegarde automatique des données de GEPI Sommaire: 1. Sauvegarder en utilisant des scripts a) Sauvegarde automatique de gepi b) Création de l'utilisateur de sauvegarde c) Automatisation de la sauvegarde

Plus en détail

2015 kmeans. September 3, 2015

2015 kmeans. September 3, 2015 2015 kmeans September 3, 2015 1 Kmeans avec PIG auteurs : P. Atalaya, M. Gubri M k-means est un algorithme de clustering relativement simple qu on cherche à paralléliser. In [1]: import pyensae %nb_menu

Plus en détail

Serveur de sauvegardes incrémental

Serveur de sauvegardes incrémental Serveur de sauvegardes incrémental Pierre.Lafaye-de-Micheaux@upmf-grenoble.Fr ddelseny@yahoo.fr Dans cet article, nous allons vous apprendre comment mettre en place un serveur de sauvegardes incrémental

Plus en détail

Installation d'un serveur sftp avec connexion par login et clé rsa.

Installation d'un serveur sftp avec connexion par login et clé rsa. Installation d'un serveur sftp avec connexion par login et clé rsa. 1- Installation d'openssh-server 2 2- Installation de Vim pour modifier plus facilement les fichiers 2 3- Installation et configuration

Plus en détail

CNAM 2010-2011. Déploiement d une application avec EC2 ( Cloud Amazon ) Auteur : Thierry Kauffmann Paris, Décembre 2010

CNAM 2010-2011. Déploiement d une application avec EC2 ( Cloud Amazon ) Auteur : Thierry Kauffmann Paris, Décembre 2010 CNAM 2010-2011 Déploiement d une application avec EC2 ( Cloud Amazon ) Auteur : Thierry Kauffmann Paris, Décembre 2010 Déploiement d une application dans le cloud. 1. Cloud Computing en 2010 2. Offre EC2

Plus en détail

Intégration de la dimension sémantique dans les réseaux sociaux

Intégration de la dimension sémantique dans les réseaux sociaux Intégration de la dimension sémantique dans les réseaux sociaux Application : systèmes de recommandation Maria Malek LARIS-EISTI maria.malek@eisti.fr 1 Contexte : Recommandation dans les réseaux sociaux

Plus en détail

Oracle 11g. Installation et administration. Claude Duvallet 1/36

Oracle 11g. Installation et administration. Claude Duvallet 1/36 Installation et administration Claude Duvallet Université du Havre UFR Sciences et Techniques 25 rue Philippe Lebon - BP 540 76058 LE HAVRE CEDEX Claude.Duvallet@gmail.com http://litis.univ-lehavre.fr/

Plus en détail

Cours 1. I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs

Cours 1. I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs Cours 1 I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs IV-Les facteurs I-1 Généralités sur R R (1995, AT&T Bell Laboratories) est un logiciel d analyse statistique et graphique,

Plus en détail

C.M. 1 & 2 : Prise en main de Linux

C.M. 1 & 2 : Prise en main de Linux Grégory Bonnet gregory.bonnet@unicaen.fr GREYC Université Caen Basse Normandie Diaporama original : Jean-Philippe Métivier - Boris Lesner But de cet enseignement 1 - Apprendre à manipuler un système Unix/Linux

Plus en détail

MRTG & RRD Tool. Multi Router Traffic Grapher

MRTG & RRD Tool. Multi Router Traffic Grapher MRTG & RRD Tool Multi Router Traffic Grapher Plan Principe Historique Principes Généraux Utilisation Installation et configuration Installation Configuration Architecture RRD Tool Étude de cas Historique

Plus en détail

Caroline Hurault-Delarue 1, Cécile Chouquet 2, Nicolas Savy 2, Isabelle Lacroix 1, Christine Damase- Michel 1

Caroline Hurault-Delarue 1, Cécile Chouquet 2, Nicolas Savy 2, Isabelle Lacroix 1, Christine Damase- Michel 1 Trajectoires individuelles d'exposition aux psychotropes au cours de la grossesse et partitionnement en fonction du profil d'exposition : utilisation des K-means pour données longitudinales Caroline Hurault-Delarue

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université

Plus en détail

Programmation C. Apprendre à développer des programmes simples dans le langage C

Programmation C. Apprendre à développer des programmes simples dans le langage C Programmation C Apprendre à développer des programmes simples dans le langage C Notes de cours sont disponibles sur http://astro.u-strasbg.fr/scyon/stusm (attention les majuscules sont importantes) Modalités

Plus en détail

PPe jaune. Domingues Almeida Nicolas Collin Leo Ferdioui Lamia Sannier Vincent [PPE PROJET FTP]

PPe jaune. Domingues Almeida Nicolas Collin Leo Ferdioui Lamia Sannier Vincent [PPE PROJET FTP] PPe jaune Domingues Almeida Nicolas Collin Leo Ferdioui Lamia Sannier Vincent [PPE PROJET FTP] Sommaire 1) Architecture réseau... 3 2) Introduction FTP... 4 3) Le rôle du protocole FTP... 4 4) Diagramme

Plus en détail

Evaluation des performances de programmes parallèles haut niveau à base de squelettes

Evaluation des performances de programmes parallèles haut niveau à base de squelettes Evaluation des performances de programmes parallèles haut niveau à base de squelettes Enhancing the Performance Predictability of Grid Applications with Patterns and Process Algebras A. Benoit, M. Cole,

Plus en détail

Qu'est-ce que c'est??

Qu'est-ce que c'est?? Mobyle 1.0 Hervé Ménager, Vivek Gopalan, Bertrand Néron, Sandrine Larroudé, Julien Maupetit, Adrien Saladin, Pierre Tuffery, Yentram Huyen, Bernard Caudron Qu'est-ce que c'est?? A quoi ça ressemble? Un

Plus en détail

Efficient Object Versioning for Object- Oriented Languages From Model to Language Integration

Efficient Object Versioning for Object- Oriented Languages From Model to Language Integration Efficient Object Versioning for Object- Oriented Languages From Model to Language Integration Pluquet Frédéric July, 3rd 2012 Etude de techniques efficaces de versionnement d objets pour les langages orientés

Plus en détail

Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved.

Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved. Grégoire de Lassence 1 Grégoire de Lassence Responsable Pédagogie et Recherche Département Académique Tel : +33 1 60 62 12 19 gregoire.delassence@fra.sas.com http://www.sas.com/france/academic SAS dans

Plus en détail

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH Boris Hejblum 1,2,3 & Rodolphe Thiébaut 1,2,3 1 Inserm, U897

Plus en détail

Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie

Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie 1 Présenté par: Yacine KESSACI Encadrement : N. MELAB E-G. TALBI 31/05/2011 Plan 2 Motivation

Plus en détail

Iyad Alshabani SysCom - CReSTIC Université de Reims 17/02/2011 1

Iyad Alshabani SysCom - CReSTIC Université de Reims 17/02/2011 1 SysCom - CReSTIC Université de Reims 17/02/2011 1 Motivation Gestion des expérimentations Avec les workflows Simulation Simulation des Systèmes Distribués ANR USS SimGrid Campagne de Test et gestion de

Plus en détail

GPC Computer Science

GPC Computer Science CYCLE ISMIN P2015 GPC Computer Science P LALEVÉE lalevee@emse.fr @p_lalevee A3.01 0442616715 C YUGMA yugma@emse.fr A3.01 0442616715 01/09/2014 Présentation GPC CS - Ph. Lalevée - C Yugma 1 Scolarité Site

Plus en détail

Introduction au Système d Exploitation Unix/Linux

Introduction au Système d Exploitation Unix/Linux 1 iere partie: Système de Gestion de Fichier B. Jacob IC2/LIUM 17 septembre 2013 Plan 1 Notions de fichier 2 Notions de répertoire 3 Organisation des répertoires 4 Identification d un fichier dans l arborescence

Plus en détail

Table des matières. 2011 Hakim Benameurlaine 1

Table des matières. 2011 Hakim Benameurlaine 1 Table des matières 1 OpenSSH... 2 1.1 Introduction... 2 1.2 Installation... 2 1.3 Test de connexion... 2 1.4 Configuration du serveur ssh... 3 1.5 Contrôle du service ssh... 4 1.6 Log... 4 1.7 Client ssh...

Plus en détail

22/06/2015. Linux Initiation. Formation 2015. Le Corguillé 1.07

22/06/2015. Linux Initiation. Formation 2015. Le Corguillé 1.07 22/06/2015 Linux Initiation Formation 2015 Le Corguillé 1.07 INTRODUCTION 2 / Introduction Qu'est-ce? Open-source et gratuit (le plus souvent) Accès au code Modifier / adapter / redistribuer le code Un

Plus en détail

Installation d'un serveur FTP géré par une base de données MySQL

Installation d'un serveur FTP géré par une base de données MySQL BTS INFORMATIQUE DE GESTION Option Administrateur de réseaux développement d applications COMPTE-RENDU D ACTIVITE ACTIVITE N 2 Nom et Prénom : Casanova Grégory Identification (objectif) de l activité Installation

Plus en détail

MCMC et approximations en champ moyen pour les modèles de Markov

MCMC et approximations en champ moyen pour les modèles de Markov MCMC et approximations en champ moyen pour les modèles de Markov Gersende FORT LTCI CNRS - TELECOM ParisTech En collaboration avec Florence FORBES (Projet MISTIS, INRIA Rhône-Alpes). Basé sur l article:

Plus en détail

Linux LTE 2 - ISSBA. Année universitaire 2007-2008. Linux Réseau et Archivage. Jean-Michel RICHER Faculté des Sciences, H206 1

Linux LTE 2 - ISSBA. Année universitaire 2007-2008. Linux Réseau et Archivage. Jean-Michel RICHER Faculté des Sciences, H206 1 Linux LTE 2 - ISSBA Année universitaire 2007-2008 Linux Réseau et Archivage Jean-Michel RICHER Faculté des Sciences, H206 1 Plan L identification Réseau Qu est ce qu un adresse IP Classes de réseau Les

Plus en détail

Lieberman Software Corporation

Lieberman Software Corporation Lieberman Software Corporation Managing Privileged Accounts Ou La Gestion des Comptes à Privilèges 2012 by Lieberman Software Corporation Agenda L éditeur Lieberman Software Les défis Failles sécurité,

Plus en détail

Sauvegarde sous MAC avec serveur Samba

Sauvegarde sous MAC avec serveur Samba Sauvegarde sous MAC avec serveur Samba Possédant un serveur SAMBA sous Debian, je me suis intéressé à la sauvegarde des données d'un mac sous OSX. Malgré mes recherches je n'ai pas trouvé de logiciels

Plus en détail

Analyses croisées de sites Web pour détecter les sites de contrefaçon. Prof. Dr. Olivier Biberstein

Analyses croisées de sites Web pour détecter les sites de contrefaçon. Prof. Dr. Olivier Biberstein Analyses croisées de sites Web pour détecter les sites de contrefaçon Prof. Dr. Olivier Biberstein Division of Computer Science 14 Novembre 2013 Plan 1. Présentation générale 2. Projet 3. Travaux futurs

Plus en détail

Unix/Linux I. 1 ere année DUT. Université marne la vallée

Unix/Linux I. 1 ere année DUT. Université marne la vallée Unix/Linux I 1 ere année DUT Université marne la vallée 1 Introduction 2 Fonctions et spécifité d Unix Architecture 3 4 5 Fichier Unix Arborescence de fichiers Quelques commandes sur les fichiers Chemins

Plus en détail

Once the installation is complete, you can delete the temporary Zip files..

Once the installation is complete, you can delete the temporary Zip files.. Sommaire Installation... 2 After the download... 2 From a CD... 2 Access codes... 2 DirectX Compatibility... 2 Using the program... 2 Structure... 4 Lier une structure à une autre... 4 Personnaliser une

Plus en détail

Programmation Web. Madalina Croitoru IUT Montpellier

Programmation Web. Madalina Croitoru IUT Montpellier Programmation Web Madalina Croitoru IUT Montpellier Organisation du cours 4 semaines 4 ½ h / semaine: 2heures cours 3 ½ heures TP Notation: continue interrogation cours + rendu à la fin de chaque séance

Plus en détail

Introduction aux Systèmes et aux Réseaux

Introduction aux Systèmes et aux Réseaux Introduction aux Systèmes et aux Réseaux Cours 2 : Language de commandes, Scripts Shell D après un cours de Julien Forget (Univ Lille1) Laure Gonnord http://laure.gonnord.org/pro/teaching/ Laure.Gonnord@univ-lyon1.fr

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

VoD ( Video on Demand ) avec VLC

VoD ( Video on Demand ) avec VLC VoD ( Video on Demand ) avec VLC I) Le protocole RTSP ( Real Time Streaming Protocol ) Présentation RTSP a été développé par Henning Schulzrinne qui a aussi fait SIP et SDP en Téléphonie sur IP. ( http://www.cs.columbia.edu/~hgs/rtsp/

Plus en détail

Procédure d installation Trixbox - A2Billing

Procédure d installation Trixbox - A2Billing Procédure d installation Trixbox - A2Billing Filière : Télécommunication Auteurs : Joseline Trachsel Julien Berger Date : 01.02.2007 Table des matières TABLE DES MATIERES...3 1. INTRODUCTION...5 2. INSTALLATION

Plus en détail

Apprentissage statistique dans les graphes et les réseaux sociaux

Apprentissage statistique dans les graphes et les réseaux sociaux Apprentissage statistique dans les graphes et les réseaux sociaux Patrick Gallinari Collaboration : L. Denoyer, S. Peters Université Pierre et Marie Curie AAFD 2010 1 Plan Motivations et Problématique

Plus en détail

Les Biolangages. Thierry Lecroq. Université de Rouen FRANCE. university-logo. Thierry Lecroq (Univ. Rouen) MB2 2008 2009 1 / 16

Les Biolangages. Thierry Lecroq. Université de Rouen FRANCE. university-logo. Thierry Lecroq (Univ. Rouen) MB2 2008 2009 1 / 16 Les Biolangages Thierry Lecroq Université de Rouen FRANCE 2008 2009 Thierry Lecroq (Univ. Rouen) MB2 2008 2009 1 / 16 BioPerl Ensemble de modules Perl Utilise la programmation objet L objectif est de mettre

Plus en détail

Surveiller et contrôler vos applications à travers le Web

Surveiller et contrôler vos applications à travers le Web Surveiller et contrôler vos applications à travers le Web Valérie HELLEQUIN Ingénieur d application Internet permet aujourd hui la diffusion d informations et de ressources que chaque utilisateur peut

Plus en détail

Guide d'installation de la base de données ORACLE 10g (10.2.0.1) pour linux FEDORA CORE 4.

Guide d'installation de la base de données ORACLE 10g (10.2.0.1) pour linux FEDORA CORE 4. Guide d'installation de la base de données ORACLE 10g (10.2.0.1) pour linux FEDORA CORE 4. 1 - Quelques informations à propos de ce guide Ce guide décrit comment installer la base de données Oracle 10g

Plus en détail

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

Modèles à Événements Discrets. Réseaux de Petri Stochastiques Modèles à Événements Discrets Réseaux de Petri Stochastiques Table des matières 1 Chaînes de Markov Définition formelle Idée générale Discrete Time Markov Chains Continuous Time Markov Chains Propriétés

Plus en détail

Traitement et exploration du fichier Log du Serveur Web, pour l extraction des connaissances: Web Usage Mining

Traitement et exploration du fichier Log du Serveur Web, pour l extraction des connaissances: Web Usage Mining Traitement et exploration du fichier Log du Serveur Web, pour l extraction des connaissances: Web Usage Mining Mostafa HANOUNE*, Fouzia BENABBOU* *Université Hassan II- Mohammedia, Faculté des sciences

Plus en détail

Les Boitiers de Vote Electroniques (Clickers)

Les Boitiers de Vote Electroniques (Clickers) Parcours des écoles d'ingénieurs Polytech (PeiP1) Les Boitiers de Vote Electroniques (Clickers) Pour dynamiser et rendre interactif un cours en amphi Qu est ce qu un Boitier de Vote? Une télécommande comme

Plus en détail

CONFIGURATION DU SERVEUR DE MAILS EXIM. par. G.Haberer, A.Peuch, P.Saade

CONFIGURATION DU SERVEUR DE MAILS EXIM. par. G.Haberer, A.Peuch, P.Saade CONFIGURATION DU SERVEUR DE MAILS EXIM par G.Haberer, A.Peuch, P.Saade Table des matieres 1. Introduction........................................................................ 2 1.1. Objectifs....................................................................

Plus en détail

PROXY SQUID-SQARD. procédure

PROXY SQUID-SQARD. procédure PROXY SQUID-SQARD procédure Tableau d évolution Version Date Description Rédacteur Approbateur 0.0 08/12/2014 Ecriture du document Thierry MARTINS 1.0 05/02/2015 1 ère version Thierry MARTINS Guide de

Plus en détail

Projet Administration Réseaux

Projet Administration Réseaux EL KHATIT Zouhair, L3 ASR N : 20072486 Projet Administration Réseaux Thème : SFTP & SCPOnly I- SFTP (Secure File Transfer Protocol) : Introduction: Le SFTP permet de transférer des fichiers par une connexion

Plus en détail

Tuto 2 : Configuration Virtual box, Configuration et installation du serveur XiBO

Tuto 2 : Configuration Virtual box, Configuration et installation du serveur XiBO Tuto 2 : Configuration Virtual box, Configuration et installation du serveur XiBO Dans Virtual box, la machine virtuelle xibo éteinte, sélectionner la et cliquer sur l icône configuration : Dans la fenêtre

Plus en détail