Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure

Dimension: px
Commencer à balayer dès la page:

Download "Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure"

Transcription

1 Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure Marie Verbanck Laboratoire de Mathématiques Appliquées, Agrocampus OUEST Soutenance de thèse - 4 septembre 2013

2 Données transcriptomiques Cellules d un organisme mêmes gènes Tous les gènes ne s expriment pas (production d ARNm) Données transcriptomiques (puce à ADN) mesure du Transcriptome : ensemble des ARNm (tissu, condition expérimentale (CE), temps donnés) Tableau sujets gènes transcriptome : ligne Comparaison des transcriptomes entre les CE hypothèses sur le rôle et les interactions entre les gènes Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 2 / 38

3 Données transcriptomiques Cellules d un organisme mêmes gènes Tous les gènes ne s expriment pas (production d ARNm) Données transcriptomiques (puce à ADN) mesure du Transcriptome : ensemble des ARNm (tissu, condition expérimentale (CE), temps donnés) Tableau sujets gènes transcriptome : ligne Comparaison des transcriptomes entre les CE hypothèses sur le rôle et les interactions entre les gènes Nécessité de développer des outils statistiques adaptés Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 2 / 38

4 Traitements statistiques classiques 1 Tests multiples gènes différentiellement exprimés (DE) en fonction des CE 2 Visualisation des gènes DE analyse factorielle 3 Clustering clusters de gènes coexprimés 4 Caractérisation biologique fonctions biologiques caractéristiques des gènes DE ou des clusters de gènes coexprimés (tests d enrichissement) Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 3 / 38

5 Traitements statistiques classiques : limites Données bruitées variabilité technologique (prétraitement) variabilité biologique (sujets structurés selon un plan) Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 4 / 38

6 Traitements statistiques classiques : limites Données bruitées variabilité technologique (prétraitement) variabilité biologique (sujets structurés selon un plan) Connaissance du seul transcriptome non suffisante relations complexes entre gènes large variété d interprétation Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 4 / 38

7 Traitements statistiques classiques : limites Données bruitées Débruitage des données Connaissance du seul transcriptome non suffisante Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 4 / 38

8 Traitements statistiques classiques : limites Données bruitées Débruitage des données Connaissance du seul transcriptome non suffisante Intégration d information extérieure Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 4 / 38

9 1 Visualisation et débruitage des données transcriptomiques par ACP régularisée Modèle de l ACP Régularisation Résultats 2 Clustering de gènes basé sur l intégration d information biologique de type Gene Ontology Principe Algorithme Résultats Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 5 / 38

10 1 Visualisation et débruitage des données transcriptomiques par ACP régularisée Modèle de l ACP Régularisation Résultats 2 Clustering de gènes basé sur l intégration d information biologique de type Gene Ontology Principe Algorithme Résultats Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 5 / 38

11 Contexte ACP couramment appliquée aux données transcriptomiques Visualisation Débruitage - réduction de la dimension Clustering Estimation matrice de variance-covariance (réseaux) Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 6 / 38

12 Modèle de l ACP ACP X : matrice de données transcriptomiques sujets gènes Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 7 / 38

13 Modèle de l ACP ACP X : matrice de données transcriptomiques sujets gènes Point de vue exploratoire ˆX en rang inférieur (S) qui minimise X ˆX 2 Moindres carrés Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 7 / 38

14 Modèle de l ACP ACP X : matrice de données transcriptomiques sujets gènes Point de vue exploratoire ˆX en rang inférieur (S) qui minimise X ˆX 2 Moindres carrés Point de vue modèle Modèle à effets fixes (Caussinus, 1986) X = X + ε x ij = S ds q is r js + ε ij, ε ij N (0, σ 2 ) s=1 Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 7 / 38

15 Modèle de l ACP ACP X : matrice de données transcriptomiques sujets gènes Point de vue exploratoire ˆX en rang inférieur (S) qui minimise X ˆX 2 Moindres carrés Point de vue modèle Modèle à effets fixes (Caussinus, 1986) X = X + ε x ij = S ds q is r js + ε ij, ε ij N (0, σ 2 ) s=1 Estimateurs du MV du modèle = Estimateurs des MC Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 7 / 38

16 Modèle de l ACP ACP Point de vue exploratoire min X ˆX 2 Point de vue modèle (X = X + ε) min X ˆX 2 Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 8 / 38

17 Modèle de l ACP ACP Point de vue exploratoire min X ˆX 2 Point de vue modèle (X = X + ε) min X ˆX 2 Erreur quadratique moyenne (EQM) EQM = E i,j (ˆx ij x ij ) 2 Minimiser l EQM Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 8 / 38

18 Régularisation Termes de régularisation Estimateurs régularisés réduction de l EQM EQM = E i,j EQM = E i,j (ˆx ij x ij ) 2 min(n 1;p) s=1 ˆx (s) ij x (s) ij 2 Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 9 / 38

19 Régularisation Termes de régularisation Estimateurs régularisés réduction de l EQM Termes de régularisation (φ s ) s=1,...,min(n 1;p) qui minimisent : EQM = E i,j min(n 1;p) s=1 φ s ˆx (s) ij x (s) ij 2 Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 9 / 38

20 Régularisation Minimisation de l EQM EQM = E i,j avec ˆx (s) ij min(n 1;p) s=1 φ s ˆx (s) ij x (s) ij = λ s u is v js et x (s) ij 2 (1) = d s q is r js Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 10 / 38

21 Régularisation Minimisation de l EQM EQM = E i,j avec ˆx (s) ij min(n 1;p) s=1 φ s ˆx (s) ij x (s) ij = λ s u is v js et x (s) ij 2 (1) = d s q is r js Minimisation de l équation (1) comme une fonction de φ s : Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 10 / 38

22 Régularisation Minimisation de l EQM EQM = E i,j avec ˆx (s) ij min(n 1;p) s=1 φ s ˆx (s) ij x (s) ij = λ s u is v js et x (s) ij 2 (1) = d s q is r js Minimisation de l équation (1) comme une fonction de φ s : φ s = d s K min(i 1;K) I = σ2 + d s variance signal (dim s) variance totale (dim s) s = 1,..., S 0 sinon Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 10 / 38

23 Régularisation Minimisation de l EQM EQM = E i,j avec ˆx (s) ij min(n 1;p) s=1 φ s ˆx (s) ij x (s) ij = λ s u is v js et x (s) ij 2 (1) = d s q is r js Minimisation de l équation (1) comme une fonction de φ s : d s K φ s = min(i 1;K) I σ2 + d s 0 K λ s min(i 1;K) I ˆσ2 s = 1,..., S ˆφ s = λ s 0 sinon Rq : Paramètre de réglage S nb de dimensions sous-jacentes du signal Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 10 / 38

24 Régularisation ACP régularisée Définition de l ACP régularisée (ACPr) : ˆx ACPr ij = ˆx ACPr ij = ˆx ACPr ij = S ˆφ s λs u is v js s=1 S λ s s=1 ( S λs s=1 K min(i 1;K) I ˆσ2 λ s λs u is v js K min(i 1;K) I ˆσ2 λs ) u is v js Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 11 / 38

25 Résultats Plan de simulations Simulation jeux de données sous le modèle signal + bruit (X = X + ε, ε ij N (0, σ 2 )) Variation de paramètres I /K (100/20 = 5, 50/50 = 1 and 20/100 = 0.2) S (2, 4, 10) SNR (4, 1, 0.8) Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 12 / 38

26 Résultats Méthodes prises en compte ACP régularisée (vrai S) ACP classique (vrai S) Méthode SURE (Candès et al., 2012) Stratégie de seuillage doux ˆx doux ij = min(i 1;K) ( s=1 λs λ ) + u isv js Choix du λ Minimisation de l estimateur sans biais de Stein (SURE) Paramètre de réglage : pas S, mais variance du bruit (vrai σ 2 ) Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 13 / 38

27 Résultats I K S SNR EQM(ˆX ACP, X) EQM(ˆX ACPr, X) EQM(ˆX SURE, X) E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E-01 Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 14 / 38

28 Résultats I K S SNR EQM(ˆX ACP, X) EQM(ˆX ACPr, X) EQM(ˆX SURE, X) E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E-01 Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 14 / 38

29 Résultats I K S SNR EQM(ˆX ACP, X) EQM(ˆX ACPr, X) EQM(ˆX SURE, X) E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E-01 Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 14 / 38

30 Résultats Application aux données à jeun/nourris Problématique agronomique (Désert et al., 2008) expressions de gènes (puce à ADN) chez 27 poulets CE : 4 états nutritionnels à jeun pendant 16 h (F16) à jeun pendant 16h puis renourris pendant 5h (F16R5) à jeun pendant 16 h puis renourris pendant 16h (F16R16) nourris en continu (N) Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 15 / 38

31 Résultats Heatmaps Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 16 / 38

32 Résultats Heatmaps Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 16 / 38

33 Résultats Heatmaps Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 16 / 38

34 Résultats Conclusions et perspectives ACP régularisée permet de visualiser et débruiter les données transcriptomiques Bon résultats en termes d estimation du signal sous-jacent Intérêt de l ACP régularisée : terme de régularisation explicite Autre domaine d application débruitage d images (Candès et al. 2012) Interaction avec débruitage préalable Estimation du nombre de dimensions sous-jacentes Extension à l AFM Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 17 / 38

35 Intégration d information extérieure Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 18 / 38

36 Intégration d information extérieure Prise en compte du seul transcriptome insuffisante mécanismes de régulation de l expression (transcription) Protéines régulatrices, réseaux de régulation Localisation chromosomique Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 18 / 38

37 Intégration d information extérieure Prise en compte du seul transcriptome insuffisante mécanismes de régulation de l expression (transcription) Protéines régulatrices, réseaux de régulation Intégration d information sur le rôle fonctionnel des gènes d après la littérature : Gene Ontology Localisation chromosomique Étude des données transcriptomiques en lien avec la localisation chromosomique Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 18 / 38

38 1 Visualisation et débruitage des données transcriptomiques par ACP régularisée Modèle de l ACP Régularisation Résultats 2 Clustering de gènes basé sur l intégration d information biologique de type Gene Ontology Principe Algorithme Résultats Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 19 / 38

39 1 Visualisation et débruitage des données transcriptomiques par ACP régularisée Modèle de l ACP Régularisation Résultats 2 Clustering de gènes basé sur l intégration d information biologique de type Gene Ontology Principe Algorithme Résultats Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 19 / 38

40 Contexte Clustering de gènes à partir des données transcriptomiques seules (ex : heatmap, réseau) Interprétation sur la base des clusters à partir d une information extérieure (ex : Gene Ontology) Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 20 / 38

41 Contexte Clustering de gènes à partir des données transcriptomiques seules (ex : heatmap, réseau) connexions biologiques systématiques entre gènes coexprimés Interprétation sur la base des clusters à partir d une information extérieure (ex : Gene Ontology) une partie de l information peut être reliée à l expérience Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 20 / 38

42 Principe Nouveau point de vue Coexpression 2 phénomènes véritables connexions biologiques (ex : dans un réseau de régulation génique) activation indépendante de différentes réponses biologiques Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 21 / 38

43 Principe Nouveau point de vue Coexpression 2 phénomènes véritables connexions biologiques (ex : dans un réseau de régulation génique) activation indépendante de différentes réponses biologiques Conserver véritable coexpression au moyen de l information biologique Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 21 / 38

44 Principe Données Données transcriptomiques un gène est défini par son profil d expression Information biologique : annotations Gene Ontology décrivant l implication d un gène dans des fonctions biologiques un gène est défini par son profil fonctionnel Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 22 / 38

45 Principe Codage de l information biologique Matrice T, T kj = 1 si le gène k est associé à la fonction biologique j, 0 sinon 1 j J Marges 1 T 1. k T kj T k. K T K. Marges T.1 T.j T.J T.. Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 23 / 38

46 Algorithme Principe général Similarité des profils fonctionnels de gènes coexprimés existence de véritables connexions biologiques Intégration d une information de coexpression dans l information biologique obtention de fonctions biologiques coexprimées Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 24 / 38

47 Algorithme Fonctions biologiques coexprimées 1 j J Marges 1 T 1. k T kj T k. K T K. Marges T.1 T.j T.J T.. Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 25 / 38

48 Algorithme Fonctions biologiques coexprimées Fct j gène 1 1 gène 2 0 gène 3 1 gène 4 1 gène 5 0 gène 6 1 gène 7 0 gène 8 0 gène Fct biologique Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 25 / 38

49 Algorithme Fonctions biologiques coexprimées Fct j gène 1 1 gène 2 0 gène 3 1 gène 4 1 gène 5 0 gène 6 1 gène 7 0 gène 8 0 gène Fct biologique S 1 S 2 S 3 S Expressions Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 25 / 38

50 Algorithme Fonctions biologiques coexprimées Fct j gène 1 1 gène 2 0 gène 3 1 gène 4 1 gène 5 0 gène 6 1 gène 7 0 gène 8 0 gène Fct biologique S 1 S 2 S 3 S Expressions Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 25 / 38

51 Algorithme Fonctions biologiques coexprimées Fct j gène 1 1 gène 2 0 gène 3 1 gène 4 1 gène 5 0 gène 6 1 gène 7 0 gène 8 0 gène Fct biologique S 1 S 2 S 3 S Expressions Fcts biologiques coexprimées Fct j 1 Fct j Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 25 / 38

52 Algorithme Matrice T coexp T coexp substitution des fonctions biologiques par des fonctions biologiques coexprimées Gènes de K j l associés avec la lème fonction coexprimée issue de j Fonction 1 Fonction j Fonction J 1 l L j Marges 1 T 1. k T kj 1 k K j l T k. K T K. Marges card(k 1 1 ) card(k j l ) card(k J L J ) T.. Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 26 / 38

53 Algorithme Analyse de la matrice T coexp AFC de la matrice T coexp étude du degré de similarité des profils fonctionnels sous condition de coexpression Deux gènes sont proches s ils ont des profils fonctionnels et d expression similaires Algorithme de clustering sur les coordonnées des gènes sur les axes de l AFC Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 27 / 38

54 Algorithme Évaluation des clusters de gènes Pour interpréter un cluster comme une entité biologique Coexpression Homogénéité biologique Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 28 / 38

55 Algorithme Évaluation des clusters de gènes Pour interpréter un cluster comme une entité biologique Coexpression indicateur de coexpression (CI) Homogénéité biologique indicateur d homogéneité biologique (BHI) Procédure d évaluation : 2 indicateurs multidimensionnels + 2 probabilités critiques (permutations) Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 28 / 38

56 Résultats Plan de simulations Simulation de jeux de données E sim : données d expression simulées (K gènes et I sujets) sujet 1 sujet 2 sujet 3 sujet 4... gène 1 gène 2 gène 3 gène 4 gène 5... Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 29 / 38

57 Résultats Plan de simulations Simulation de jeux de données E sim : données d expression simulées (K gènes et I sujets) T sim : information biologique simulée structure hiérarchique de GO part de l information biologique reliée étude & part non reliée Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 29 / 38

58 Résultats Simulation de l information biologique Jeu de données d expression simulée E sim sujet 1 sujet 2 sujet 3 sujet 4... gène 1 gène 2 gène 3 gène 4 gène 5... Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 30 / 38

59 Résultats Simulation de l information biologique Jeu de données d expression simulée E sim CAH sur les gènes de E sim sujet 1 sujet 2 sujet 3 sujet 4... gène 1 gène 2 gène 3 gène 4 gène 5... Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 30 / 38

60 Résultats Simulation de l information biologique Construction de l information biologique simulée T e sim gène 1 gène 2 gène 3 gène 4 gène 5 Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 30 / 38

61 Résultats Simulation de l information biologique Construction de l information biologique simulée Tsim e A B C D D gène 1 B gène 2 A gène gène C gène Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 30 / 38

62 Résultats Simulation de l information biologique Tsim e : information biologique simulée à partir des données d expression simulées (E sim ) Introduction d information biologique aléatoire par permutations intra-colonnes de T e sim T r sim Obtention de T sim = [T e sim, r T r sim ] r : intensité aléatoire Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 31 / 38

63 Résultats Plan de simulations Simulation de jeux de données E sim : données d expression simulées T sim : information biologique simulée Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 32 / 38

64 Résultats Plan de simulations Simulation de jeux de données E sim : données d expression simulées T sim : information biologique simulée Comparaison clustering Heatmap clustering sur la base d un réseau de régulation (WGCNA, Zhang et Horvath, 2005) Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 32 / 38

65 Résultats Plan de simulations Simulation de jeux de données E sim : données d expression simulées T sim : information biologique simulée Comparaison clustering Heatmap clustering sur la base d un réseau de régulation (WGCNA, Zhang et Horvath, 2005) Evaluation : proportion de clusters significatifs (CI et BHI) Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 32 / 38

66 Résultats Simulations CI BHI Deux I K r H W I H W I H W I Intégration plus grande proportion de bons candidats à l interprétation Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 33 / 38

67 Résultats Application aux données à jeun/nourris I Coexpression I Homogénéité biologique Deux Heatmap WGCNA Integration Intégration plus grande proportion de bon candidats à l interprétation Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 34 / 38

68 Résultats Application aux données à jeun/nourris I Coexpression I Homogénéité biologique Deux Heatmap WGCNA Integration Intégration plus grande proportion de bon candidats à l interprétation Interprétation des clusters de gènes : ex phospolipides et sphingolipides Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 34 / 38

69 Résultats Conclusion Proportion satisfaisante de bons candidats à l interprétation Amélioration des tests d enrichissement (+ cohérence) Validation biologique plus poussée à faire Prise en compte incertitude sur les GO Prise en compte d autres types de données (tableaux multiples) Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 35 / 38

70 Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 36 / 38

71 Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 36 / 38

72 Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 36 / 38

73 Références I Emmanuel J. Candès, Carlos A. Sing-Long, and Joshua D. Trzasko, Unbiased risk estimates for singular value thresholding and spectral estimators, (Submitted), H. Caussinus, Models and uses of principal component analysis (with discussion), p , DSWO Press, C. Désert, MJ. Duclos, P. Blavy, F. Lecerf, F. Moreews, C. Klopp, M. Aubry, F. Herault, P. Le Roy, C. Berri, M. Douaire, C. Diot, and Lagarrigue S., Transcriptome profiling of the feeding-to-fasting transition in chicken liver, BMC Genomics (2008). Michael B. Eisen, Paul T. Spellman, Patrick O. Brown, and David Botstein, Cluster analysis and display of genome-wide expression patterns, Proceedings of the National Academy of Sciences 95 (1998), no. 25, Marie Verbanck, Julie Josse, and François Husson, Regularised PCA to denoise and visualise data, Statistics and Computing (submitted) (2013). Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 37 / 38

74 Références II Marie Verbanck, Sébastien Lê, and Jérôme Pagès, A new unsupervised gene clustering algorithm based on the integration of biological knowledge into expression data, BMC Bioinformatics 14 (2013), no. 1, 42 (en), Highly Accessed. Bin Zhang and Steve Horvath, A general framework for weighted gene co-expression network analysis, Statistical applications in genetics and molecular biology 4 (2005). Marie Verbanck Analyse de données transcriptomiques : de leur visualisation à l intégration d information extérieure 38 / 38

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Soutenance de stage Laboratoire des Signaux et Systèmes

Soutenance de stage Laboratoire des Signaux et Systèmes Soutenance de stage Laboratoire des Signaux et Systèmes Bornes inférieures bayésiennes de l'erreur quadratique moyenne. Application à la localisation de points de rupture. M2R ATSI Université Paris-Sud

Plus en détail

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH Boris Hejblum 1,2,3 & Rodolphe Thiébaut 1,2,3 1 Inserm, U897

Plus en détail

ProxiLens : Exploration interactive de données multidimensionnelles à partir de leur projection

ProxiLens : Exploration interactive de données multidimensionnelles à partir de leur projection ProxiLens : Exploration interactive de données multidimensionnelles à partir de leur projection Nicolas HEULOT (CEA LIST) Michaël AUPETIT (CEA LIST) Jean-Daniel FEKETE (INRIA Saclay) Journées Big Data

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Filtrage stochastique non linéaire par la théorie de représentation des martingales Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de

Plus en détail

MABioVis. Bio-informatique et la

MABioVis. Bio-informatique et la MABioVis Modèles et Algorithmes pour la Bio-informatique et la Visualisation Visite ENS Cachan 5 janvier 2011 MABioVis G GUY MELANÇON (PR UFR Maths Info / EPI GRAVITE) (là, maintenant) - MABioVis DAVID

Plus en détail

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun

Plus en détail

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats Pierre Dagnelie TABLE DES MATIÈRES 2012 Presses agronomiques de Gembloux pressesagro.gembloux@ulg.ac.be www.pressesagro.be

Plus en détail

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55

Plus en détail

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications L intelligence économique outil stratégique pour l entreprise Professeur Bernard DOUSSET dousset@irit.fr http://atlas.irit.fr Institut de Recherche en Informatique de Toulouse (IRIT) Equipe Systèmes d

Plus en détail

Intérêt du découpage en sous-bandes pour l analyse spectrale

Intérêt du découpage en sous-bandes pour l analyse spectrale Intérêt du découpage en sous-bandes pour l analyse spectrale David BONACCI Institut National Polytechnique de Toulouse (INP) École Nationale Supérieure d Électrotechnique, d Électronique, d Informatique,

Plus en détail

TRAITEMENT DES DONNEES MANQUANTES AU MOYEN DE L ALGORITHME DE KOHONEN

TRAITEMENT DES DONNEES MANQUANTES AU MOYEN DE L ALGORITHME DE KOHONEN TRAITEMENT DES DONNEES MANQUANTES AU MOYEN DE L ALGORITHME DE KOHONEN Marie Cottrell, Smaïl Ibbou, Patrick Letrémy SAMOS-MATISSE UMR 8595 90, rue de Tolbiac 75634 Paris Cedex 13 Résumé : Nous montrons

Plus en détail

Introduction aux bases de données: application en biologie

Introduction aux bases de données: application en biologie Introduction aux bases de données: application en biologie D. Puthier 1 1 ERM206/Technologies Avancées pour le Génome et la Clinique, http://tagc.univ-mrs.fr/staff/puthier, puthier@tagc.univ-mrs.fr ESIL,

Plus en détail

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services 69 Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services M. Bakhouya, J. Gaber et A. Koukam Laboratoire Systèmes et Transports SeT Université de Technologie de Belfort-Montbéliard

Plus en détail

Gènes Diffusion - EPIC 2010

Gènes Diffusion - EPIC 2010 Gènes Diffusion - EPIC 2010 1. Contexte. 2. Notion de génétique animale. 3. Profil de l équipe plateforme. 4. Type et gestion des données biologiques. 5. Environnement Matériel et Logiciel. 6. Analyses

Plus en détail

TRAVAUX DE RECHERCHE DANS LE

TRAVAUX DE RECHERCHE DANS LE TRAVAUX DE RECHERCHE DANS LE DOMAINE DE L'EXPLOITATION DES DONNÉES ET DES DOCUMENTS 1 Journée technologique " Solutions de maintenance prévisionnelle adaptées à la production Josiane Mothe, FREMIT, IRIT

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

Une comparaison de méthodes de discrimination des masses de véhicules automobiles

Une comparaison de méthodes de discrimination des masses de véhicules automobiles p.1/34 Une comparaison de méthodes de discrimination des masses de véhicules automobiles A. Rakotomamonjy, R. Le Riche et D. Gualandris INSA de Rouen / CNRS 1884 et SMS / PSA Enquêtes en clientèle dans

Plus en détail

Extraction d informations stratégiques par Analyse en Composantes Principales

Extraction d informations stratégiques par Analyse en Composantes Principales Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction

Plus en détail

Intégration de la dimension sémantique dans les réseaux sociaux

Intégration de la dimension sémantique dans les réseaux sociaux Intégration de la dimension sémantique dans les réseaux sociaux Application : systèmes de recommandation Maria Malek LARIS-EISTI maria.malek@eisti.fr 1 Contexte : Recommandation dans les réseaux sociaux

Plus en détail

Quantification Scalaire et Prédictive

Quantification Scalaire et Prédictive Quantification Scalaire et Prédictive Marco Cagnazzo Département Traitement du Signal et des Images TELECOM ParisTech 7 Décembre 2012 M. Cagnazzo Quantification Scalaire et Prédictive 1/64 Plan Introduction

Plus en détail

Restaurer la confiance? Etudes Empiriques Conclusion et ouverture

Restaurer la confiance? Etudes Empiriques Conclusion et ouverture Restaurer la confiance des investisseurs : une exploration expérimentale systématique de l effet des politiques d investissement socialement responsable. Marco Heimann Sous la direction de Jean-François

Plus en détail

TP N 57. Déploiement et renouvellement d une constellation de satellites

TP N 57. Déploiement et renouvellement d une constellation de satellites TP N 57 Déploiement et renouvellement d une constellation de satellites L objet de ce TP est d optimiser la stratégie de déploiement et de renouvellement d une constellation de satellites ainsi que les

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane

Plus en détail

Application de K-means à la définition du nombre de VM optimal dans un cloud

Application de K-means à la définition du nombre de VM optimal dans un cloud Application de K-means à la définition du nombre de VM optimal dans un cloud EGC 2012 : Atelier Fouille de données complexes : complexité liée aux données multiples et massives (31 janvier - 3 février

Plus en détail

Dr E. CHEVRET UE2.1 2013-2014. Aperçu général sur l architecture et les fonctions cellulaires

Dr E. CHEVRET UE2.1 2013-2014. Aperçu général sur l architecture et les fonctions cellulaires Aperçu général sur l architecture et les fonctions cellulaires I. Introduction II. Les microscopes 1. Le microscope optique 2. Le microscope à fluorescence 3. Le microscope confocal 4. Le microscope électronique

Plus en détail

chargement d amplitude variable à partir de mesures Application à l approche fiabiliste de la tolérance aux dommages Modélisation stochastique d un d

chargement d amplitude variable à partir de mesures Application à l approche fiabiliste de la tolérance aux dommages Modélisation stochastique d un d Laboratoire de Mécanique et Ingénieriesnieries EA 3867 - FR TIMS / CNRS 2856 ER MPS Modélisation stochastique d un d chargement d amplitude variable à partir de mesures Application à l approche fiabiliste

Plus en détail

Protocoles pour le suivi des pontes de tortues marines dans le cadre de Protomac. Professeur Marc Girondot

Protocoles pour le suivi des pontes de tortues marines dans le cadre de Protomac. Professeur Marc Girondot Muséum National d'histoire Naturelle de Paris Département de Systématique et Evolution Laboratoire des Reptiles et Amphibiens 25 rue Cuvier 75005 Paris & Laboratoire Ecologie, Systématique et Evolution

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université

Plus en détail

CHAPITRE 3 LA SYNTHESE DES PROTEINES

CHAPITRE 3 LA SYNTHESE DES PROTEINES CHAITRE 3 LA SYNTHESE DES ROTEINES On sait qu un gène détient dans sa séquence nucléotidique, l information permettant la synthèse d un polypeptide. Ce dernier caractérisé par sa séquence d acides aminés

Plus en détail

Découverte et analyse de dépendances dans des réseaux d entreprise

Découverte et analyse de dépendances dans des réseaux d entreprise Découverte et analyse de dépendances dans des réseaux d entreprise Samer MERHI Sous la direction de: Olivier FESTOR LORIA - Equipe MADYNES - Université Henri Poincaré June 24, 2008 1 / 24 Plan 1 Introduction

Plus en détail

MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS. Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.

MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS. Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln. MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.fr Plan Introduction Généralités sur les systèmes de détection d intrusion

Plus en détail

FONDEMENTS MATHÉMATIQUES 12 E ANNÉE. Mathématiques financières

FONDEMENTS MATHÉMATIQUES 12 E ANNÉE. Mathématiques financières FONDEMENTS MATHÉMATIQUES 12 E ANNÉE Mathématiques financières A1. Résoudre des problèmes comportant des intérêts composés dans la prise de décisions financières. [C, L, RP, T, V] Résultat d apprentissage

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

Conception et contrôle des SMA tolérants aux fautes

Conception et contrôle des SMA tolérants aux fautes Conception et contrôle des SMA tolérants aux fautes Une plate-forme multiagents tolérante aux fautes à base de réplication Nora FACI Contexte SMA large échelle Nombre important d agents Ressources éloignées

Plus en détail

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences

Plus en détail

Mémo d utilisation de ADE-4

Mémo d utilisation de ADE-4 Mémo d utilisation de ADE-4 Jérôme Mathieu http://www.jerome.mathieu.freesurf.fr 2003 ADE-4 est un logiciel d analyses des communautés écologiques créé par l équipe de biostatistiques de Lyon. Il propose

Plus en détail

SysFera. Benjamin Depardon

SysFera. Benjamin Depardon SysFera Passage d applications en SaaS Benjamin Depardon CTO@SysFera SysFera Technologie 2001 Création 2010 Spin Off INRIA Direction par un consortium d investisseurs 12 personnes 75% en R&D Implantation

Plus en détail

De la mesure à l analyse des risques

De la mesure à l analyse des risques De la mesure à l analyse des risques Séminaire ISFA - B&W Deloitte Jean-Paul LAURENT Professeur à l'isfa, Université Claude Bernard Lyon 1 laurent.jeanpaul@free.fr http://laurent.jeanpaul.free.fr/ 0 De

Plus en détail

Une méthode d apprentissage pour la composition de services web

Une méthode d apprentissage pour la composition de services web Une méthode d apprentissage pour la composition de services web Soufiene Lajmi * Chirine Ghedira ** Khaled Ghedira * * Laboratoire SOIE (ENSI) University of Manouba, Manouba 2010, Tunisia Soufiene.lajmi@ensi.rnu.tn,

Plus en détail

Résumés des projets de GMM5-2014/2015

Résumés des projets de GMM5-2014/2015 Résumés des projets de GMM5-2014/2015 Option MMS Statistical analysis of Raman Spectra skin to evaluate the benefit of Pierre Fabre s acne treatment cream Classification appliquée à la biologie structurale

Plus en détail

4.2 Unités d enseignement du M1

4.2 Unités d enseignement du M1 88 CHAPITRE 4. DESCRIPTION DES UNITÉS D ENSEIGNEMENT 4.2 Unités d enseignement du M1 Tous les cours sont de 6 ECTS. Modélisation, optimisation et complexité des algorithmes (code RCP106) Objectif : Présenter

Plus en détail

Valeur ajoutée relative basée sur les comparaisons indirectes Giens 2008, TR 5

Valeur ajoutée relative basée sur les comparaisons indirectes Giens 2008, TR 5 Valeur ajoutée relative basée sur les comparaisons indirectes Giens 2008, TR 5 Claire Le Jeunne Bertrand Xerri Cécile Rey-Coquais Jean-Michel Joubert Jean Delonca Martine Pigeon Michel Lièvre Patricia

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007 Vision industrielle et télédétection - Détection d ellipses Guillaume Martinez 17 décembre 2007 1 Table des matières 1 Le projet 3 1.1 Objectif................................ 3 1.2 Les choix techniques.........................

Plus en détail

Apprentissage Automatique

Apprentissage Automatique Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Data 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients

Data 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients Data 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients Frédérick Vautrain, Dir. Data Science - Viseo Laurent Lefranc, Resp. Data Science Analytics - Altares

Plus en détail

Enjeux mathématiques et Statistiques du Big Data

Enjeux mathématiques et Statistiques du Big Data Enjeux mathématiques et Statistiques du Big Data Mathilde Mougeot LPMA/Université Paris Diderot, mathilde.mougeot@univ-paris-diderot.fr Mathématique en Mouvements, Paris, IHP, 6 Juin 2015 M. Mougeot (Paris

Plus en détail

PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE

PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE Jean-Paul Valois, Claude Mouret & Nicolas Pariset Total, 64018 Pau Cédex MOTS CLEFS : Analyse spatiale, ACP, Lissage, Loess PROBLEMATIQUE En analyse multivariée,

Plus en détail

Détection de têtes dans un nuage de points 3D à l aide d un modèle de mélange sphérique

Détection de têtes dans un nuage de points 3D à l aide d un modèle de mélange sphérique Détection de têtes dans un nuage de points 3D à l aide d un modèle de mélange sphérique Denis Brazey & Bruno Portier 2 Société Prynɛl, RD974 290 Corpeau, France denis.brazey@insa-rouen.fr 2 Normandie Université,

Plus en détail

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production Revue des Sciences et de la Technologie RST- Volume 4 N 1 /janvier 2013 Etude d un cas industriel : Optimisation de la modélisation de paramètre de production A.F. Bernate Lara 1, F. Entzmann 2, F. Yalaoui

Plus en détail

Programmation linéaire

Programmation linéaire Programmation linéaire DIDIER MAQUIN Ecole Nationale Supérieure d Electricité et de Mécanique Institut National Polytechnique de Lorraine Mathématiques discrètes cours de 2ème année Programmation linéaire

Plus en détail

Le Focus Group. - Bases de données, personnes ayant déjà participé à des expériences et acceptant de participer à des études ultérieures.

Le Focus Group. - Bases de données, personnes ayant déjà participé à des expériences et acceptant de participer à des études ultérieures. Le Focus Group I. Définition «Le Focus groupe est une discussion de groupe ouverte, organisée dans le but de cerner un sujet ou une série de questions pertinents (Kitzinger, Markova, & Kalampalikis, 2004).

Plus en détail

CONFERENCE PALISADE. Optimisation robuste d un plan d expériences par simulation Monte-Carlo Concepts de «Design Space» et de «Quality by Design»

CONFERENCE PALISADE. Optimisation robuste d un plan d expériences par simulation Monte-Carlo Concepts de «Design Space» et de «Quality by Design» CONFERENCE PALISADE Optimisation robuste d un plan d expériences par simulation Monte-Carlo Concepts de «Design Space» et de «Quality by Design» 1 SIGMA PLUS Logiciels, Formations et Etudes Statistiques

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

Biomarqueurs en Cancérologie

Biomarqueurs en Cancérologie Biomarqueurs en Cancérologie Définition, détermination, usage Biomarqueurs et Cancer: définition Anomalie(s) quantitative(s) ou qualitative(s) Indicative(s) ou caractéristique(s) d un cancer ou de certaines

Plus en détail

Analyses multivariées avec R Commander (via le package FactoMineR) Qu est ce que R? Introduction à R Qu est ce que R?

Analyses multivariées avec R Commander (via le package FactoMineR) Qu est ce que R? Introduction à R Qu est ce que R? Analyses multivariées avec R Commander Analyses multivariées avec R Commander (via le package FactoMineR) Plate-forme de Support en Méthodologie et Calcul Statistique (SMCS) - UCL 1 Introduction à R 2

Plus en détail

Etude comparative de différents motifs utilisés pour le lancé de rayon

Etude comparative de différents motifs utilisés pour le lancé de rayon Etude comparative de différents motifs utilisés pour le lancé de rayon Alexandre Bonhomme Université de Montréal 1 Introduction Au cours des dernières années les processeurs ont vu leurs capacités de calcul

Plus en détail

Classification Automatique de messages : une approche hybride

Classification Automatique de messages : une approche hybride RECIAL 2002, Nancy, 24-27 juin 2002 Classification Automatique de messages : une approche hybride O. Nouali (1) Laboratoire des Logiciels de base, CE.R.I.S., Rue des 3 frères Aïssiou, Ben Aknoun, Alger,

Plus en détail

Sujet 1 : Diagnostique du Syndrome de l apnée du sommeil par des techniques d analyse discriminante.

Sujet 1 : Diagnostique du Syndrome de l apnée du sommeil par des techniques d analyse discriminante. Sujet 1 : Diagnostique du Syndrome de l apnée du sommeil par des techniques d analyse discriminante. Objectifs et formulation du sujet Le syndrome de l apnée du sommeil (SAS) est un problème de santé publique

Plus en détail

Agrégation des portefeuilles de contrats d assurance vie

Agrégation des portefeuilles de contrats d assurance vie Agrégation des portefeuilles de contrats d assurance vie Est-il optimal de regrouper les contrats en fonction de l âge, du genre, et de l ancienneté des assurés? Pierre-O. Goffard Université d été de l

Plus en détail

BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous :

BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous : BASE BioArray Software Environment (BASE) est une base de données permettant de gérer l importante quantité de données générées par des analyses de bio-puces. BASE gère les informations biologiques, les

Plus en détail

Modélisation et simulation du trafic. Christine BUISSON (LICIT) Journée Simulation dynamique du trafic routier ENPC, 9 Mars 2005

Modélisation et simulation du trafic. Christine BUISSON (LICIT) Journée Simulation dynamique du trafic routier ENPC, 9 Mars 2005 Modélisation et simulation du trafic Christine BUISSON (LICIT) Journée Simulation dynamique du trafic routier ENPC, 9 Mars 2005 Plan de la présentation! Introduction : modèles et simulations définition

Plus en détail

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La licence Mathématiques et Economie-MASS de l Université des Sciences Sociales de Toulouse propose sur les trois

Plus en détail

Liste des notes techniques... xxi Liste des encadrés... xxiii Préface à l édition internationale... xxv Préface à l édition francophone...

Liste des notes techniques... xxi Liste des encadrés... xxiii Préface à l édition internationale... xxv Préface à l édition francophone... Liste des notes techniques.................... xxi Liste des encadrés....................... xxiii Préface à l édition internationale.................. xxv Préface à l édition francophone..................

Plus en détail

Notice d Utilisation du logiciel Finite Element Method Magnetics version 3.4 auteur: David Meeker

Notice d Utilisation du logiciel Finite Element Method Magnetics version 3.4 auteur: David Meeker Notice d Utilisation du logiciel Finite Element Method Magnetics version 3.4 auteur: David Meeker DeCarvalho Adelino adelino.decarvalho@iutc.u-cergy.fr septembre 2005 Table des matières 1 Introduction

Plus en détail

Théorie et Codage de l Information (IF01) exercices 2013-2014. Paul Honeine Université de technologie de Troyes France

Théorie et Codage de l Information (IF01) exercices 2013-2014. Paul Honeine Université de technologie de Troyes France Théorie et Codage de l Information (IF01) exercices 2013-2014 Paul Honeine Université de technologie de Troyes France TD-1 Rappels de calculs de probabilités Exercice 1. On dispose d un jeu de 52 cartes

Plus en détail

Traitement bas-niveau

Traitement bas-niveau Plan Introduction L approche contour (frontière) Introduction Objectifs Les traitements ont pour but d extraire l information utile et pertinente contenue dans l image en regard de l application considérée.

Plus en détail

Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant

Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Parcours: Master 1 : Bioinformatique et biologie des Systèmes dans le Master

Plus en détail

MASTER (LMD) MANAGEMENT DE PROJET ET INNOVATION EN BIOTECHNOLOGIE

MASTER (LMD) MANAGEMENT DE PROJET ET INNOVATION EN BIOTECHNOLOGIE MASTER (LMD) MANAGEMENT DE PROJET ET INNOVATION EN BIOTECHNOLOGIE RÉSUMÉ DE LA FORMATION Type de diplôme : Master (LMD) Domaine ministériel : Sciences, Technologies, Santé Mention : BIOLOGIE SANTE Spécialité

Plus en détail

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU $SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU Fabien FIGUERES fabien.figueres@mpsa.com 0RWVFOpV : Krigeage, plans d expériences space-filling, points de validations, calibration moteur. 5pVXPp Dans le

Plus en détail

Plus courts chemins, programmation dynamique

Plus courts chemins, programmation dynamique 1 Plus courts chemins, programmation dynamique 1. Plus courts chemins à partir d un sommet 2. Plus courts chemins entre tous les sommets 3. Semi-anneau 4. Programmation dynamique 5. Applications à la bio-informatique

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

COURS COLLÉGIAUX PRÉALABLES À L ADMISSION

COURS COLLÉGIAUX PRÉALABLES À L ADMISSION Le candidat est tenu d avoir complété tous les cours préalables à la date limite prévue, soit le 15 septembre pour le trimestre d automne et le 1 er février pour le trimestre d hiver. L Université peut

Plus en détail

Chapitre 2 : Systèmes radio mobiles et concepts cellulaires

Chapitre 2 : Systèmes radio mobiles et concepts cellulaires Chapitre 2 : Systèmes radio mobiles et concepts cellulaires Systèmes cellulaires Réseaux cellulaires analogiques de 1ère génération : AMPS (USA), NMT(Scandinavie), TACS (RU)... Réseaux numériques de 2ème

Plus en détail

TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes

TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes Mohamed Moussaoui,Wajdi Dhifli,Sami Zghal,Engelbert Mephu Nguifo FSJEG, Université de Jendouba,

Plus en détail

ÉdIteur officiel et fournisseur de ServIceS professionnels du LogIcIeL open Source ScILab

ÉdIteur officiel et fournisseur de ServIceS professionnels du LogIcIeL open Source ScILab ÉdIteur officiel et fournisseur de ServIceS professionnels du LogIcIeL open Source ScILab notre compétence d'éditeur à votre service créée en juin 2010, Scilab enterprises propose services et support autour

Plus en détail

Précision d un résultat et calculs d incertitudes

Précision d un résultat et calculs d incertitudes Précision d un résultat et calculs d incertitudes PSI* 2012-2013 Lycée Chaptal 3 Table des matières Table des matières 1. Présentation d un résultat numérique................................ 4 1.1 Notations.........................................................

Plus en détail

Projet de Traitement du Signal Segmentation d images SAR

Projet de Traitement du Signal Segmentation d images SAR Projet de Traitement du Signal Segmentation d images SAR Introduction En analyse d images, la segmentation est une étape essentielle, préliminaire à des traitements de haut niveau tels que la classification,

Plus en détail

Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique

Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique Rapport de stage de deuxième année de DUT Génie Biologique option Bioinformatique Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes

Plus en détail

Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair

Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair Raja Chiky, Bruno Defude, Georges Hébrail GET-ENST Paris Laboratoire LTCI - UMR 5141 CNRS Département Informatique et Réseaux

Plus en détail

Modélisation du comportement habituel de la personne en smarthome

Modélisation du comportement habituel de la personne en smarthome Modélisation du comportement habituel de la personne en smarthome Arnaud Paris, Selma Arbaoui, Nathalie Cislo, Adnen El-Amraoui, Nacim Ramdani Université d Orléans, INSA-CVL, Laboratoire PRISME 26 mai

Plus en détail

Modélisation prédictive et incertitudes. P. Pernot. Laboratoire de Chimie Physique, CNRS/U-PSUD, Orsay pascal.pernot@u-psud.fr

Modélisation prédictive et incertitudes. P. Pernot. Laboratoire de Chimie Physique, CNRS/U-PSUD, Orsay pascal.pernot@u-psud.fr Modélisation prédictive et incertitudes P. Pernot Laboratoire de Chimie Physique, CNRS/U-PSUD, Orsay pascal.pernot@u-psud.fr Le concept de Mesure Virtuelle mesure virtuelle résultat d un modèle visant

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie

Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie 1 Présenté par: Yacine KESSACI Encadrement : N. MELAB E-G. TALBI 31/05/2011 Plan 2 Motivation

Plus en détail

Dr YAO Kouassi Patrick www.yaopatrick.e-monsite.com

Dr YAO Kouassi Patrick www.yaopatrick.e-monsite.com Notion de Bases de données et Gestion de données biologiques Dr YAO Kouassi Patrick www.yaopatrick.e-monsite.com Notion de base de données Une base de données est une collection de données interdépendantes

Plus en détail

Optimisation de la compression fractale D images basée sur les réseaux de neurones

Optimisation de la compression fractale D images basée sur les réseaux de neurones Optimisation de la compression fractale D images basée sur les réseaux de neurones D r BOUKELIF Aoued Communication Networks,Architectures and Mutimedia laboratory University of S.B.A aoued@hotmail.com

Plus en détail

Compte rendu. Réunion du CREA du mercredi 6 juin 2012. Salle : V210

Compte rendu. Réunion du CREA du mercredi 6 juin 2012. Salle : V210 Compte rendu Réunion du CREA du mercredi 6 juin 2012 Salle : V210 Présents : Christine Berthin, Martine Sekali, Anne-Marie Paquet-Deyris, Anny Crunelle, Julie Loison- Charles, Ross Charnock, Caroline Rolland-Diamond,

Plus en détail

Évaluation de la régression bornée

Évaluation de la régression bornée Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement

Plus en détail

Format de l avis d efficience

Format de l avis d efficience AVIS D EFFICIENCE Format de l avis d efficience Juillet 2013 Commission évaluation économique et de santé publique Ce document est téléchargeable sur www.has-sante.fr Haute Autorité de santé Service documentation

Plus en détail

Capital économique en assurance vie : utilisation des «replicating portfolios»

Capital économique en assurance vie : utilisation des «replicating portfolios» Capital économique en assurance vie : utilisation des «replicating portfolios» Anne LARPIN, CFO SL France Stéphane CAMON, CRO SL France 1 Executive summary Le bouleversement de la réglementation financière

Plus en détail

Identification de nouveaux membres dans des familles d'interleukines

Identification de nouveaux membres dans des familles d'interleukines Identification de nouveaux membres dans des familles d'interleukines Nicolas Beaume Jérôme Mickolajczak Gérard Ramstein Yannick Jacques 1ère partie : Définition de la problématique Les familles de gènes

Plus en détail

Environmental Research and Innovation ( ERIN )

Environmental Research and Innovation ( ERIN ) DÉpartEment RDI Environmental Research and Innovation ( ERIN ) Le département «Environmental Research and Innovation» (ERIN) du LIST élabore des stratégies, des technologies et des outils visant à mieux

Plus en détail

Modélisation géostatistique des débits le long des cours d eau.

Modélisation géostatistique des débits le long des cours d eau. Modélisation géostatistique des débits le long des cours d eau. C. Bernard-Michel (actuellement à ) & C. de Fouquet MISTIS, INRIA Rhône-Alpes. 655 avenue de l Europe, 38334 SAINT ISMIER Cedex. Ecole des

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

Spécificités, Applications et Outils

Spécificités, Applications et Outils Spécificités, Applications et Outils Ricco Rakotomalala Université Lumière Lyon 2 Laboratoire ERIC Laboratoire ERIC 1 Ricco Rakotomalala ricco.rakotomalala@univ-lyon2.fr http://chirouble.univ-lyon2.fr/~ricco/data-mining

Plus en détail