Analyse statistique du protéome: cas de données issues de spectrométrie de masse. D. Pecqueur - C. Truntzer Master MIGS 05/11/08

Dimension: px
Commencer à balayer dès la page:

Download "Analyse statistique du protéome: cas de données issues de spectrométrie de masse. D. Pecqueur - C. Truntzer Master MIGS 05/11/08"

Transcription

1 Analyse statistique du protéome: cas de données issues de spectrométrie de masse D. Pecqueur - C. Truntzer Master MIGS 05/11/08

2 La plateforme protéomique de Dijon Protéomique classique Protéomique clinique Plateforme Protéomique Innovation technologique Biostatistique

3 Plan Introduction Prétraitement des spectres de masse Analyse

4 Objectif: recherche de biomarqueurs Diagnostic Classification de la pathologie Pronostic Réponse thérapeutique Mise en évidence d un ou des biomarqueurs permettant de remonter à un(des) mécanisme(s) moléculaire(s) associé(s) à la progression tumorale

5 INTRODUCTION Le protéome Définition Intérêt Applications

6 Définition Protéome : ensemble des PROTéines exprimées par le génome d une cellule, à un moment et dans un environnement donnés. PROTEOME TRANSCRIPTOME GENOME ARN Noyau cellulaire ADN Cellule Protéines

7 Intérêt Pourquoi étudier le protéome? Ni le décryptage du génome ni l analyse à grande échelle des ARNm (transcriptome) ne permettent de prédire le taux d expression des protéines Le protéome donne une image plus complète des processus biologiques. 1 organisme 1 génome très grande diversité de protéomes

8 Applications Détermination de la fonction (rôle dans l organisme) Localisation sub-cellulaire (où retrouve-t-on la protéine dans l organisme?) Quantification différentielle Identification des protéines Analyse Protéomique Analyse différentielle (présence vs absence d une protéine) Interaction protéines avec d autres molécules Caractérisation des modifications post-traductionnelles (modification chimique de la protéine)

9 Protéomique clinique Protéomique classique Protéomique clinique Plateforme Protéomique Innovation technologique Biostatistique

10 Déroulement d une étude Médecins Prélèvements Gestion des échantillons Stockage Patients Traitement des échantillons Analyse Statistique Stockage des échantillons traités Stockage des données Traitement des données Analyse des échantillons Stockage des données brutes

11 INTRODUCTION Le spectromètre de masse Description générale Principe de la mesure

12 Principe de la mesure Mass analyser Detector

13 Description générale Ionisation des molécules (protéines) Séparation des molécules en fonction de leur rapport masse/charge (M/Z) M: masse de la molécule Z: charge de la molécule L entité mesurée est appelée spectre de masse. Spectre de masse

14 Visualisation du principe de mesure

15 INTRODUCTION Exemple d application Mesure des protéines du plasma Simplification d un échantillon

16 Mesure des protéines dans le plasma Plasma = partie du sang (facilement accessible) But: identifier le profil protéomique décrivant le plasma d un individu (profil=spectre représentant toutes les protéines présentes dans le plasma) Difficulté: le plasma est complexe(composé de beaucoup de protéines) Solution: on isole une partie du plasma

17 Acquisition d un spectre à partir de plasma Bind Protein Mixture to Magnetic Beads Unbound Elute Bound Protein Simplification de l échantillon Mesure des protéines de l échantillon Wash Bound Read in MALDI TOF/TOF => spectre MALDI Target

18 INTRODUCTION Exemple d étude Etapes Plan expérimental

19 Etapes d une étude Question biologique Plan expérimental Biologie: Acquisition des données Biopuces Spectres Préparation des données Prétraitement Identificationdes biomarqueurs Analyse statistique: Sélection de biomarqueurs Gènes Protéines Analyse des données Validation statistique et biologique des résultats

20 Répétition technique Plan expérimental Plusieurs acquisitions par sujet Réduction du bruit technique Contrôle de la reproductibilité des études Contrôle de la qualité des données obtenues Répétition biologique Plusieurs sujets par groupe expérimental Seules les répétitions biologiques apportent de l information sur la variabilité inter-sujet et permettent d inférer sur des différences entre les populations représentées par l expérience.

21 Plan expérimental Réplicats techniques Patients 2 purifications 2 *4 dépôts Réplicats biologiques

22 Etapes de l analyse statistique Visualisation des données Prétraitement Identification de biomarqueurs Validation des biomarqueurs Analyse des données Préparation des données

23 PRÉPARATION DES DONNÉES Contrôle visuel des données

24 Visualisation des spectres bruts

25 Analyse en composantes principales Spectres non informatifs

26 Critères de rejet des spectres Automatisation de la procédure de rejet des spectres «douteux» Intensité maximale du spectre Est-ce que le spectre contient de l information? Coefficient de variation global Est-ce qu il y a des pics dans le spectre? Corrélations inter et intra échantillons Est-ce que le spectre ressemble aux autres représentants?

27 PRÉPARATION DES DONNÉES Prétraitement Élimination du bruit de fond Harmonisation Recherche des variables

28 Nature des données Identifier le «vrai» signal biologique: Y(M/Z) = B(M/Z) Bruit de fond Intensité observée + N * S(M/Z) Facteur de normalisation Signal + ε(m/z) Bruit blanc (aléatoire )

29 Étapes du pré-traitement A. Élimination du bruit de fond: 1. Élimination du bruit blanc 2. Soustraction de la ligne de base B. Harmonisation des spectres à analyser 3. Alignement des spectres 4. Normalisation C. Préparation à l analyse 5. Détection des pics

30 Étape 1- Élimination du bruit blanc (1) Utilisation de la transformée en ondelettes du signal (Coombes, 2005) Signal dans la base d origine => Signal dans la base des ondelettes

31

32 Étape 1- Élimination du bruit blanc (2) Bruit blanc = faibles coefficients d ondelettes Élimination des coefficients inférieurs à un seuil défini par l utilisateur Transformée inverse : retour dans la base Transformée inverse : retour dans la base d origine

33 Choix du seuil

34 Étape 1- Résultat

35 Étape 2 -Soustraction de la ligne de base Ajustement d une fonction de lissage aux minima locaux

36 Étape 2 -Résultat

37 Étape 3 - Alignement des spectres Objectif: Détermination d une correspondance unique entre les points des différents spectres Les pics correspondant aux mêmes peptides doivent avoir le même MZ Méthodes: Translation des spectres pour maximiser leur corrélation Déformation du signal

38 Étape 3 - Illustration

39 Étape 4 - Normalisation Objectif: être en mesure de comparer les intensités des différents spectres d une même étude Méthode: division des intensités par le Courant Ionique Total= somme de toutes les intensités mesurées

40 Étape 5 Détection des pics Objectif: identifier les pics (variables) sur lesquels portera l analyse

41 Détection sur les spectres individuels Méthode: Identification de maxima locaux Sélection des pics qui seront conservés pour l analyse selon trois critères: Rapport signal/bruit Intensité Importance relative par rapport à l ensemble des pics du spectre

42 Alignement des pics détectés Objectif: avoir les mêmes variables pour tous les spectres Spectre 1 Spectre ,2 1220,5 2010,3 2440,8 2600,1 2801,4 1000,5 1220,9 1800,4 2010,8 2440,7 2603,9 3050,7 Variables sur lesquelles pourra porter l analyse: 1000,3 1220,7 1800,4 2010,5 2440,7 2600,1 2603,9 2801,4 3050,7

43 Alignement des pics détectés Méthode: regroupement des valeurs M/Z correspondant à un même peptide

44 Difficultés majeures: Détection des pics: les pics identifiés ont-ils un sens biologique? Quantification des pics: Certains pics ne sont présents que dans quelques spectres: comment caractériser les pics absents? Quels pics conserver pour l analyse? Conservation de pics présents dans p% des spectres de l étude Quel p choisir?

45 Détection sur le spectre moyen Principe: Alignement des spectres bruts Moyenne des spectres bruts Prétraitement Détection des pics Spectre moyen Quantification des pics dans les spectres bruts Avantages Pas d alignement des pics Atténuation du bruit de fond

46 Pour résumer

47 Partie III ANALYSE

48 Spectres Sujets Données analysées p pics 1 variable de réponse n sujets

49 A chaque question son analyse Description des données Analyse non supervisée Identification de biomarqueurs caractéristiques d'une classe de tumeurs Analyse différentielle Classement d une tumeur parmi des classes connues, i.e prédire le diagnostic ou le pronostic de nouveaux patients: Classement - Analyse supervisée

50 ANALYSE Analyse non supervisée Classification ascendante hiérarchique Méthode des k-means Analyse en Composantes Principales

51 Analyse non supervisée Classification des données =>Détection de sous-groupes de biomarqueurs ou de patients =>Visualisation de la reproductibité des =>Visualisation de la reproductibité des données

52 Classification

53 Classification ascendante hiérarchique Objectif: regrouper des entités proches dans une même classe (pics ou individus) Construction itérative des classes Arbre de classification = dendrogramme Début: chaque entité constitue une classe Fin: toutes les entités sont regroupées dans la même classe

54 Classification ascendante hiérarchique Définition de deux types de distance: Distance entre les entités distance euclidienne, corrélation, etc Distance entre les classes Saut minimum (Single linkage) Saut maximum (Complete linkage) Saut moyen (Average linkage)

55 Exemple - reproductibilité s: échantillon -> répétitions biologiques p: purification d: jour -> répétitions techniques

56 Exemple: reproductibilité Répétitions techniques et biologiques

57 Exemple: double classification Individus Pics

58 Méthode de réallocation dynamique Méthode des k-means Procédé non hiérarchique Recherche d une partition des entités (individus/variables) en k groupes Choix de k Regroupement d entités au profil similaire Maximisation des distances entre les centroïdes des groupes

59 Méthode de réallocation dynamique Algorithme - cas de regroupement d individus 1. k points placés aléatoirement dans l espace des variables = k centroïdes initiaux 2. Attribution des individus au groupe dont le centroïde est le plus proche: choix d une métrique 3. Mise à jour des positions des centroïdes 4. Itération des étapes 2 et 3 jusqu à stabilité des centroïdes

60 Analyse en Composantes Principales 1 2 Ind i Coordonnée de Ind i sur cet axe 3 4 Minimisation de Maximisation de (sous contrainte) n i= 1 M H i i ² 2 t OH = ( Xu)( Xu) = i i t t u XXu Mi OH OM = OH + H M i 2 i = 2 i OM, u i i = 2 i p j= 1 x j i u j Solution donnée par les vecteurs propres de t XX O u Hi

61 Illustrations

62 Illustrations

63 ANALYSE Analyse différentielle Tests statistiques Tests multiples Puissance

64 Analyse différentielle Identification de biomarqueurs associés à un facteur d intérêt Méthodes univariées: les pics sont considérés «un à un» Application d un test statistique à chacun des éléments puis sélection des éléments pour lesquels les tests sont les plus significatifs

65 Tests statistiques Test d une hypothèse relative à une question biologique définie à priori Définition De l hypothèse nulle H0 De l hypothèse alternative H1 Tests conduisent à deux types d erreur: Erreur de type I (risque de 1 er espèce) Erreur de type II (risque de 2 nd espèce)

66 P-value La p-value correspond à la probabilité d obtenir, sous H0, une valeur de la statistique de test T supérieure ou égale à celle observée t : Distribution des valeurs de la statistique p - val = p( T t H0) Prob(t*<-2.1) Prob(t*>2.1) Décision: si p-value<α H0 rejetée

67 Types d erreur H0 acceptée H0 rejetée H0 vraie 1-β(puissance) α(type I) H0 fausse β(type II) 1-α Erreur de type I: rejet à tort de l hypothèse nulle Notée α Erreur de type II: acceptation à tort de l hypothèse nulle Notée β Reliée à la puissance du test 1-β.

68 Tests multiples Décision H0 acceptée H0 rejetée Total Vérité H0 U (VN) V (FP) p0 H1 T (FN) S (VP) p1 Total 1-R R p Pour un total de p éléments testés U: Vrais positifs V: Faux positifs T: Faux négatifs S: Vrais négatifs

69 Tests multiples Test simultané d un grand nombre d hypothèses Exemple: test de 10 hypothèses indépendantes Probabilité de déclarer un test significatif à tort: 5% Probabilité de déclarer au moins un test significatif à tort parmi les 10: 0.401=1-(0.95) 10 =>le risque explose avec le nombre de variables

70 Contrôle du risque de type I Ajustement des p-values Family Wise Error Rate (FWER) Probabilité d obtenir au moins une erreur de type I Proportion de gènes déclarés significatifs à tort. Contrôler le FWER au seuil de 5%, permet d être confiant à 95% de n avoir aucun faux positif FWER = p(v 1)

71 Ajustement des p-values False Discovery Rate (FDR) Proportion attendue de faux positifs parmi les gènes déclarés significatifs. Contrôler le FDR au seuil de 5% permet d affirmer qu en moyenne, le taux de faux positifs est inférieur à 5%. FDR = E(V/R) Variantes: FDR local, q-value

72 Ajustement: exemples Bonferroni Le plus intuitif maxt utilise la corrélation entre les gènes Benjamini-Hochberg Holm

73 Représentation graphique

74 Puissance d un test Contrôle du risque de type II Distribution sous H1 Distribution sous H0 1-β Capacité du test à mettre en évidence une différence qui existe réellement

75 Lien entre puissance et nombre de sujets 100 sujets Sous H0 Sous H1 300 sujets Sous H0 Sous H1

76 Puissance et taille d échantillon Travail de la thèse en cours de Thomas Jouve

77 ANALYSE Analyse supervisée Sélection de variables Extraction de variables Méthodes qui intègrent la dimension

78 Analyse supervisée Classement d un échantillon parmi des classes connues, i.e prédire le diagnostic ou le pronostic de nouveaux patients Chaque sujet: Décrit par X = Réponse associée (X,...,X Y { 1,...,K} Construction d un «classifieur» C 1 p ŷ = C(x) = ) k

79 Analyse discriminante Objectif: trouver une combinaison linéaire qui Maximise la variance inter-groupes Minimise la variance intra-groupe Notations: Profils moyens {μ k ; k=1 K} Matrice de variance-covariance: k Affectation d un individu au groupe qui minimise d 1 ( x, ) 2 Σ µ k Différents types d analyse discriminante selon la forme de k Méthode proche de l analyse inter-groupes

80 Exemple Données de Khan et al. (2002): étude de 4 types d une tumeur de l abdomen qui affecte essentiellement les enfants CulhaneAC, et al., (2002) Between-group analysis of microarray data. Bioinformatics. 18(12):

81 Problème de la multiplicité Particularité des données: nombre très important de variables étudiées simultanément Conséquences En univarié: pics jugés significatifs par le simple fait du hasard En multivarié: n importe quel modèle peut être parfaitement prédictif par chance uniquement

82 Problème de la multiplicité Nombre de variables (pics) >>Nombre d individus Multi-colinéarité Optimisme Nécessité d adapter les méthodes classiques: Réduction préalable de la dimension: Sélection de variables Extraction de variables Méthodes qui intègrent directement la dimension Knn, random forest, etc Méthodes de régularisation

83 Sélection de variables Sélection univariée Chaque variable est considérée indépendamment des autres Classement des variables selon l importance de leur impact sur la réponse d intérêt Exemples: tests de t, Wilcoxon, etc

84 Extraction de variables Dans la littérature: «réduction de la dimension» Projection des individus dans un espace de dimension inférieure Construction de nouvelles variables qui «résument» les variables d origine

85 Extraction de variables Analyse en composantes principales Maximisation de la variance totale des données Partial Least Squares Maximisation de la covariance entre les données et la réponse Différence majeure : composantes PLS optimisées pour être prédictives du critère d intérêt composantes principales ne font qu extraire le maximum de variance des prédicteurs

86 Méthodes de régularisation Maximisation de la vraisemblance sous contrainte/pénalisation de la vraisemblance Pénalité de type L1 - Lasso: coeff λ - Lars - Sélection d un sous-ensemble de variables Pénalité de type L2 - Régression ridge: coeff ² λ - Conserve toutes les variables dans le modèle Remarque: lien avec SVM

87 Exemples de résultats Exemple L1 Exemple L2

88 Machines à vecteurs de support (SVM) Recherche d un hyperplan optimal -Projection dans un espace de dimension supérieur dans lequel il existe un séparateur linéaire -Maximisation de la marge entre l hyperplan et les points

89 Méthode des k plus proches voisins Basée sur les proximités locales Principe: Identification des k observations les plus proches de celle dont on cherche à prédire la classe Attribution de la classe la plus représentée parmi Attribution de la classe la plus représentée parmi les k voisins

90 Agrégation de modèles Arbres de décision binaire: Découpage successif de l espace engendré par les variables Bagging: N échantillons indépendants remplacés par N échantillons bootstrap Forêt aléatoire: choix aléatoire des variables au niveau de chaque nœud Boosting: Plus de poids aux observations mal ajustées oui Malade oui Pic 2<c 2 Pic 1<c 1 non Non malade non Malade

91 Bilan sur les méthodes Large panel de méthodes Nécessité de mieux comprendre le lien entre les méthodes Pas de méthode «magique» qui surpasse les autres quelque soit le jeu de données Nécessité de bien connaître le jeu de données et les méthodes pour utiliser celle qui s applique le mieux à la structure des données

92 Autre approche Approche fonctionnelle Décomposition des spectres dans une base de fonctions (ondelettes, splines, etc ) Analyse dans cette base de fonctions Intérêt: Détection des pics évitée Limitation du nombre de variables

93 Construction du modèle prédictif Définition d un jeu de travail et d un jeu test A chaque itération: Construction du modèle sur le jeu de travail Evaluation sur le jeu test Estimation de l erreur pour chacun des modèles Sélection du modèle qui minimise les erreurs de classement

94 Exemple: validation croisée Jeu de données Jeu de travail Jeu test Construction MODELE Evaluation Répétition n fois Erreur moyenne

95 ANALYSE Validation des résultats

96 Optimisme Le modèle doit être fiable pour la prédiction du critère d intérêt chez de nouveaux sujets => Différence entre la qualité de l ajustement et les qualités prédictives Puissance = Augmentati on du nombre d échantill ons Validation du modèle sur échantillons tests indépendants OK

97 Importance de la taille des études Evolution de la quantité d information prédictive en fonction du nombre de sujets Truntzeret.al. (2008). Comparative optimism in models involving both classical linical and gene expression information, BMC Bioinformatics, 9:434

98 Validation des modèles Validation interne Séparation des données initiales en un jeu de travail et un jeu test Validation externe Utilisation d un autre jeu de données A privilégier

99 Importance de la validation Baggerly, 2004

100 Influence du choix du jeu de travail Approche: -Génération de 500 jeux de travail de même taille que celui de l étude initiale -Sélection des 50 gènes les plus corrélés à la réponse -Comparaison des «toplistes» obtenues Michiels, S., Koscielny, S. & Hill, C. (2005) Lancet 365,

101 Proportion de mauvais classement et taille de l échantillon En vert: proportion moyenne sur les 500 jeux de travail En rouge: IC 95% Points: proportion de mauvais classement selon les auteurs Michiels, S., Koscielny, S. & Hill, C. (2005) Lancet 365,

102 ANALYSE Exemple Application à la maladie de Exemple Application à la maladie de Hodgkin

103 Maladie de Hodgkin Affection cancéreuse caractérisée par une prolifération cellulaire anormale dans un ou plusieurs ganglions lymphatiques à très haut risque de rechute Recherche et identification de nouveaux biomarqueurs prédictifs de la rechute après traitement Time : 0 Taking blood Detection of the pathology Treatment 3 months Sensitive patient without reccurence Group 1 6 months Non Sensitive patient with reccurence Group 2

104 Maladie de Hodgkin 24 plasmas de patients avec rechute 24 plasmas de patients sans rechute plasma aliquots de 60µl Purification d un sous-protéome en duplicate à l aide de billes magnétiques Pour chaque éluat de billes 4 dépôts sont effectués sur la cible MALDI.... Pour chaque dépôt une somme de 15 spectres est effectué... Pour chaque sous-protéome : analyse en duplicate pour la préparation des échantillons et en quatruplicate pour la mesure de l échantillon

105 Maladie de Hodgkin Spectres moyens obtenu dans les deux classes de plasmas arb. u. *10e Spectre moyen des patients avec rechute Spectre moyen des patients sans rechute m/z Exp : 004_050418_CWCX

106 Analyse descriptive

107 Analyse différentielle

108 Innovation Technologique Protéomique classique Protéomique clinique Plateforme Protéomique Innovation technologique Biostatistique 108

109 MALDI IMAGING : PRINCIPLE I 4 I 5 x5, y1 x4, y1 x3, y1 x2, y1 x1, y1 Relative Intensity (%) 100 I 3 I 2 I 1 I 3 I 4 I 5 50 I 1 I 2 x5, y1 x4, y1 x3, y1 x2, y1 0 x1, y1 Mass (m/z)

110 Imagerie par MALDI-MS Positive Mode m/z 2015 m/z 2030 m/z 4741 m/z HCCA/ANI HCCA/ANI HCCA/ANI HCCA/ANI aca Fmi M1 M2 AOP points 50 Hz Laser repetition rate 100 shots/point Time 5-6 H

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

L'intelligence d'affaires: la statistique dans nos vies de consommateurs

L'intelligence d'affaires: la statistique dans nos vies de consommateurs L'intelligence d'affaires: la statistique dans nos vies de consommateurs Jean-François Plante, HEC Montréal Marc Fredette, HEC Montréal Congrès de l ACFAS, Université Laval, 6 mai 2013 Intelligence d affaires

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction

Plus en détail

STATISTIQUES. UE Modélisation pour la biologie

STATISTIQUES. UE Modélisation pour la biologie STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Annales du Contrôle National de Qualité des Analyses de Biologie Médicale

Annales du Contrôle National de Qualité des Analyses de Biologie Médicale Annales du Contrôle National de Qualité des Analyses de Biologie Médicale ARN du virus de l hépatite C : ARN-VHC ARN-VHC 03VHC1 Novembre 2003 Edité : mars 2006 Annales ARN-VHC 03VHC1 1 / 8 ARN-VHC 03VHC1

Plus en détail

Arbres binaires de décision

Arbres binaires de décision 1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression

Plus en détail

Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant

Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Parcours: Master 1 : Bioinformatique et biologie des Systèmes dans le Master

Plus en détail

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH Boris Hejblum 1,2,3 & Rodolphe Thiébaut 1,2,3 1 Inserm, U897

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

1 Complément sur la projection du nuage des individus

1 Complément sur la projection du nuage des individus TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent

Plus en détail

Biomarqueurs en Cancérologie

Biomarqueurs en Cancérologie Biomarqueurs en Cancérologie Définition, détermination, usage Biomarqueurs et Cancer: définition Anomalie(s) quantitative(s) ou qualitative(s) Indicative(s) ou caractéristique(s) d un cancer ou de certaines

Plus en détail

Quantification Scalaire et Prédictive

Quantification Scalaire et Prédictive Quantification Scalaire et Prédictive Marco Cagnazzo Département Traitement du Signal et des Images TELECOM ParisTech 7 Décembre 2012 M. Cagnazzo Quantification Scalaire et Prédictive 1/64 Plan Introduction

Plus en détail

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU $SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU Fabien FIGUERES fabien.figueres@mpsa.com 0RWVFOpV : Krigeage, plans d expériences space-filling, points de validations, calibration moteur. 5pVXPp Dans le

Plus en détail

Etude des propriétés empiriques du lasso par simulations

Etude des propriétés empiriques du lasso par simulations Etude des propriétés empiriques du lasso par simulations L objectif de ce TP est d étudier les propriétés empiriques du LASSO et de ses variantes à partir de données simulées. Un deuxième objectif est

Plus en détail

Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto. des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

Apprentissage Automatique

Apprentissage Automatique Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs

Plus en détail

Enjeux mathématiques et Statistiques du Big Data

Enjeux mathématiques et Statistiques du Big Data Enjeux mathématiques et Statistiques du Big Data Mathilde Mougeot LPMA/Université Paris Diderot, mathilde.mougeot@univ-paris-diderot.fr Mathématique en Mouvements, Paris, IHP, 6 Juin 2015 M. Mougeot (Paris

Plus en détail

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories : La vision nous permet de percevoir et d interpreter le monde qui nous entoure. La vision artificielle a pour but de reproduire certaines fonctionnalités de la vision humaine au travers de l analyse d images.

Plus en détail

Dr E. CHEVRET UE2.1 2013-2014. Aperçu général sur l architecture et les fonctions cellulaires

Dr E. CHEVRET UE2.1 2013-2014. Aperçu général sur l architecture et les fonctions cellulaires Aperçu général sur l architecture et les fonctions cellulaires I. Introduction II. Les microscopes 1. Le microscope optique 2. Le microscope à fluorescence 3. Le microscope confocal 4. Le microscope électronique

Plus en détail

Une comparaison de méthodes de discrimination des masses de véhicules automobiles

Une comparaison de méthodes de discrimination des masses de véhicules automobiles p.1/34 Une comparaison de méthodes de discrimination des masses de véhicules automobiles A. Rakotomamonjy, R. Le Riche et D. Gualandris INSA de Rouen / CNRS 1884 et SMS / PSA Enquêtes en clientèle dans

Plus en détail

Aide-mémoire de statistique appliquée à la biologie

Aide-mémoire de statistique appliquée à la biologie Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela

Plus en détail

Techniques du Data Mining pour la prédiction de faillite des entreprises et la gestion du risque de crédit

Techniques du Data Mining pour la prédiction de faillite des entreprises et la gestion du risque de crédit Techniques du Data Mining pour la prédiction de faillite des entreprises et la gestion du risque de crédit Adil Belhouari HEC - Montréal - Journées de l Optimisation 2005-09 Mai 2005 PLAN DE LA PRÉSENTATION

Plus en détail

Résumés des projets de GMM5-2014/2015

Résumés des projets de GMM5-2014/2015 Résumés des projets de GMM5-2014/2015 Option MMS Statistical analysis of Raman Spectra skin to evaluate the benefit of Pierre Fabre s acne treatment cream Classification appliquée à la biologie structurale

Plus en détail

LES MODELES DE SCORE

LES MODELES DE SCORE LES MODELES DE SCORE Stéphane TUFFERY CONFERENCE GENDER DIRECTIVE 31 mai 2012 31/05/2012 ActuariaCnam Conférence Gender Directive Stéphane Tufféry 1 Plan Le scoring et ses applications L élaboration d

Plus en détail

Gestion obligataire passive

Gestion obligataire passive Finance 1 Université d Evry Séance 7 Gestion obligataire passive Philippe Priaulet L efficience des marchés Stratégies passives Qu est-ce qu un bon benchmark? Réplication simple Réplication par échantillonnage

Plus en détail

Classification non supervisée

Classification non supervisée AgroParisTech Classification non supervisée E. Lebarbier, T. Mary-Huard Table des matières 1 Introduction 4 2 Méthodes de partitionnement 5 2.1 Mesures de similarité et de dissimilarité, distances.................

Plus en détail

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et

Plus en détail

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques

Plus en détail

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier Détection et reconnaissance des sons pour la surveillance médicale Dan Istrate le 16 décembre 2003 Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier Thèse mené dans le cadre d une collaboration

Plus en détail

Conception de Médicament

Conception de Médicament Conception de Médicament Approche classique HTS Chimie combinatoire Rational Drug Design Ligand based (QSAR) Structure based (ligand et ou macromolec.) 3DQSAR Docking Virtual screening Needle in a Haystack

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

23. Interprétation clinique des mesures de l effet traitement

23. Interprétation clinique des mesures de l effet traitement 23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d

Plus en détail

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57 Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation

Plus en détail

Une application de méthodes inverses en astrophysique : l'analyse de l'histoire de la formation d'étoiles dans les galaxies

Une application de méthodes inverses en astrophysique : l'analyse de l'histoire de la formation d'étoiles dans les galaxies Une application de méthodes inverses en astrophysique : l'analyse de l'histoire de la formation d'étoiles dans les galaxies Ariane Lançon (Observatoire de Strasbourg) en collaboration avec: Jean-Luc Vergely,

Plus en détail

Traitement bas-niveau

Traitement bas-niveau Plan Introduction L approche contour (frontière) Introduction Objectifs Les traitements ont pour but d extraire l information utile et pertinente contenue dans l image en regard de l application considérée.

Plus en détail

Systèmes de transmission

Systèmes de transmission Systèmes de transmission Conception d une transmission série FABRE Maxime 2012 Introduction La transmission de données désigne le transport de quelque sorte d'information que ce soit, d'un endroit à un

Plus en détail

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining. 2 jours : Mardi 15 et mercredi 16 novembre 2005 de 9 heures 30 à 17 heures 30 Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining. Madame, Monsieur, On parle

Plus en détail

Extraction d informations stratégiques par Analyse en Composantes Principales

Extraction d informations stratégiques par Analyse en Composantes Principales Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction

Plus en détail

Mesure agnostique de la qualité des images.

Mesure agnostique de la qualité des images. Mesure agnostique de la qualité des images. Application en biométrie Christophe Charrier Université de Caen Basse-Normandie GREYC, UMR CNRS 6072 Caen, France 8 avril, 2013 C. Charrier NR-IQA 1 / 34 Sommaire

Plus en détail

Optimisation, traitement d image et éclipse de Soleil

Optimisation, traitement d image et éclipse de Soleil Kléber, PCSI1&3 014-015 I. Introduction 1/8 Optimisation, traitement d image et éclipse de Soleil Partie I Introduction Le 0 mars 015 a eu lieu en France une éclipse partielle de Soleil qu il était particulièrement

Plus en détail

L axe 5 du Cancéropole Nord Ouest

L axe 5 du Cancéropole Nord Ouest L axe 5 du Cancéropole Nord Ouest Cancers, Individu id & Société L état des lieux d un pari Le Rapport Cordier 1 Biomarqueurs prédictifs 2 L axe 5 du Cancéropole Nord Ouest Cancers, Individu & Société

Plus en détail

Why Software Projects Escalate: The Importance of Project Management Constructs

Why Software Projects Escalate: The Importance of Project Management Constructs Why Software Projects Escalate: The Importance of Project Management Constructs Why Software Projects Escalate: The Importance of Project Management Constructs 1. Introduction 2. Concepts de la gestion

Plus en détail

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La licence Mathématiques et Economie-MASS de l Université des Sciences Sociales de Toulouse propose sur les trois

Plus en détail

Renforcement des trois compétences : compréhension orale, expression orale et expression écrite à partir de documents et vidéos.

Renforcement des trois compétences : compréhension orale, expression orale et expression écrite à partir de documents et vidéos. Master Mathématiques et Applications Spécialité : Ingénierie mathématique et modélisation Parcours : Mathématique et Informatique : Statistique, Signal, Santé (MI3S) 2015-2016 RÉSUMÉ DES COURS : (dernière

Plus en détail

2D-Differential Differential Gel Electrophoresis & Applications en neurosciences

2D-Differential Differential Gel Electrophoresis & Applications en neurosciences 2D-Differential Differential Gel Electrophoresis & Applications en neurosciences Jean-Etienne Poirrier Centre de Neurobiologie Cellulaire et Moléculaire Centre de Recherches du Cyclotron Université de

Plus en détail

Sujets présentés par le Professeur Olivier CUSSENOT

Sujets présentés par le Professeur Olivier CUSSENOT ANAMACaP Association Nationale des Malades du Cancer de la Prostate 17, bis Avenue Poincaré. 57400 SARREBOURG Sujets présentés par le Professeur Olivier CUSSENOT Place des nouvelles techniques d imagerie

Plus en détail

Identification de nouveaux membres dans des familles d'interleukines

Identification de nouveaux membres dans des familles d'interleukines Identification de nouveaux membres dans des familles d'interleukines Nicolas Beaume Jérôme Mickolajczak Gérard Ramstein Yannick Jacques 1ère partie : Définition de la problématique Les familles de gènes

Plus en détail

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring ESSEC Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring Les méthodes d évaluation du risque de crédit pour les PME et les ménages Caractéristiques Comme les montants des crédits et des

Plus en détail

Cours de méthodes de scoring

Cours de méthodes de scoring UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-

Plus en détail

Régression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr

Régression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr Régression linéaire Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr 2005 Plan Régression linéaire simple Régression multiple Compréhension de la sortie de la régression Coefficient de détermination R

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

Item 169 : Évaluation thérapeutique et niveau de preuve

Item 169 : Évaluation thérapeutique et niveau de preuve Item 169 : Évaluation thérapeutique et niveau de preuve COFER, Collège Français des Enseignants en Rhumatologie Date de création du document 2010-2011 Table des matières ENC :...3 SPECIFIQUE :...3 I Différentes

Plus en détail

Utilisation d informations visuelles dynamiques en asservissement visuel Armel Crétual IRISA, projet TEMIS puis VISTA L asservissement visuel géométrique Principe : Réalisation d une tâche robotique par

Plus en détail

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

K. Ammar, F. Bachoc, JM. Martinez. Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau

K. Ammar, F. Bachoc, JM. Martinez. Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau Apport des modèles de krigeage à la simulation numérique K Ammar, F Bachoc, JM Martinez CEA-Saclay, DEN, DM2S, F-91191 Gif-sur-Yvette, France Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau Apport des

Plus en détail

Formation continue. Ensae-Ensai Formation Continue (Cepe)

Formation continue. Ensae-Ensai Formation Continue (Cepe) CertifiCat de data scientist Formation continue Ensae-Ensai Formation Continue (Cepe) CertifiCat de data scientist La demande de data scientists est croissante mais peu de formations existent. Ce certificat

Plus en détail

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes Université Claude Bernard Lyon 1 Institut de Science Financière et d Assurances Système Bonus-Malus Introduction & Applications SCILAB Julien Tomas Institut de Science Financière et d Assurances Laboratoire

Plus en détail

Formations EViews FORMATIONS GENERALES INTRODUCTIVES INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS

Formations EViews FORMATIONS GENERALES INTRODUCTIVES INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS Formations EViews FORMATIONS GENERALES INTRODUCTIVES DEB : DECOUVERTE DU LOGICIEL EVIEWS INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS FORMATIONS METHODES ECONOMETRIQUES VAR : MODELES

Plus en détail

Apprentissage Statistique :

Apprentissage Statistique : Apprentissage Statistique Apprentissage Statistique : modélisation, prévision et data mining PHILIPPE BESSE & BÉATRICE LAURENT 5ème année GMM - MMS Équipe de Statistique et Probabilités Institut de Mathématiques

Plus en détail

Température corporelle d un castor (une petite introduction aux séries temporelles)

Température corporelle d un castor (une petite introduction aux séries temporelles) Température corporelle d un castor (une petite introduction aux séries temporelles) GMMA 106 GMMA 106 2014 2015 1 / 32 Cas d étude Temperature (C) 37.0 37.5 38.0 0 20 40 60 80 100 Figure 1: Temperature

Plus en détail

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence

Plus en détail

Qu est-ce qu une probabilité?

Qu est-ce qu une probabilité? Chapitre 1 Qu est-ce qu une probabilité? 1 Modéliser une expérience dont on ne peut prédire le résultat 1.1 Ensemble fondamental d une expérience aléatoire Une expérience aléatoire est une expérience dont

Plus en détail

Transmission d informations sur le réseau électrique

Transmission d informations sur le réseau électrique Transmission d informations sur le réseau électrique Introduction Remarques Toutes les questions en italique devront être préparées par écrit avant la séance du TP. Les préparations seront ramassées en

Plus en détail

CAPTEURS - CHAINES DE MESURES

CAPTEURS - CHAINES DE MESURES CAPTEURS - CHAINES DE MESURES Pierre BONNET Pierre Bonnet Master GSI - Capteurs Chaînes de Mesures 1 Plan du Cours Propriétés générales des capteurs Notion de mesure Notion de capteur: principes, classes,

Plus en détail

Agrégation des portefeuilles de contrats d assurance vie

Agrégation des portefeuilles de contrats d assurance vie Agrégation des portefeuilles de contrats d assurance vie Est-il optimal de regrouper les contrats en fonction de l âge, du genre, et de l ancienneté des assurés? Pierre-O. Goffard Université d été de l

Plus en détail

Simulation d'un examen anthropomorphique en imagerie TEMP à l iode 131 par simulation Monte Carlo GATE

Simulation d'un examen anthropomorphique en imagerie TEMP à l iode 131 par simulation Monte Carlo GATE Simulation d'un examen anthropomorphique en imagerie TEMP à l iode 131 par simulation Monte Carlo GATE LAURENT Rémy laurent@clermont.in2p3.fr http://clrpcsv.in2p3.fr Journées des LARD Septembre 2007 M2R

Plus en détail

Algorithmes d'apprentissage

Algorithmes d'apprentissage Algorithmes d'apprentissage 1 Agents qui apprennent à partir d'exemples La problématique : prise de décision automatisée à partir d'un ensemble d'exemples Diagnostic médical Réponse à une demande de prêt

Plus en détail

Une méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données

Une méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données Une méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données Marc Boullé Orange Labs 2 avenue Pierre Marzin 22300 Lannion marc.boulle@orange-ftgroup.com,

Plus en détail

Pierre OLIVIER - Médecine Nucléaire

Pierre OLIVIER - Médecine Nucléaire Diplôme Universitaire Corrélations anatomo-physio-pathologiques en imagerie thoracique 25 mai 2011 Imagerie TEP et pathologie tumorale bronchique Pierre OLIVIER - Médecine Nucléaire Détection en coincidence

Plus en détail

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques

Plus en détail

Le risque Idiosyncrasique

Le risque Idiosyncrasique Le risque Idiosyncrasique -Pierre CADESTIN -Magali DRIGHES -Raphael MINATO -Mathieu SELLES 1 Introduction Risque idiosyncrasique : risque non pris en compte dans le risque de marché (indépendant des phénomènes

Plus en détail

T de Student Khi-deux Corrélation

T de Student Khi-deux Corrélation Les tests d inférence statistiques permettent d estimer le risque d inférer un résultat d un échantillon à une population et de décider si on «prend le risque» (si 0.05 ou 5 %) Une différence de moyennes

Plus en détail

PROGRAMME (Susceptible de modifications)

PROGRAMME (Susceptible de modifications) Page 1 sur 8 PROGRAMME (Susceptible de modifications) Partie 1 : Méthodes des revues systématiques Mercredi 29 mai 2013 Introduction, présentation du cours et des participants Rappel des principes et des

Plus en détail

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 04/04/2008 Stéphane Tufféry - Data Mining - http://data.mining.free.fr

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 04/04/2008 Stéphane Tufféry - Data Mining - http://data.mining.free.fr Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE 1 Plan du cours Qu est-ce que le data mining? A quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data

Plus en détail

Foscolo (1), J Felblinger (2), S Bracard (1) CHU Hôpital central, service de neuroradiologie, Nancy (1) CHU BRABOIS, Centre d investigation clinique

Foscolo (1), J Felblinger (2), S Bracard (1) CHU Hôpital central, service de neuroradiologie, Nancy (1) CHU BRABOIS, Centre d investigation clinique S A l (1) G H (2) S S Aptel (1), G Hossu (2), S Foscolo (1), J Felblinger (2), S Bracard (1) CHU Hôpital central, service de neuroradiologie, Nancy (1) CHU BRABOIS, Centre d investigation clinique innovation

Plus en détail

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur

Plus en détail

NON-LINEARITE ET RESEAUX NEURONAUX

NON-LINEARITE ET RESEAUX NEURONAUX NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail

Plus en détail

ACP Voitures 1- Méthode

ACP Voitures 1- Méthode acp=princomp(voit,cor=t) ACP Voitures 1- Méthode Call: princomp(x = voit, cor = T) Standard deviations: Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 2.1577815 0.9566721 0.4903373 0.3204833 0.2542759 0.1447788

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE

PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE Jean-Paul Valois, Claude Mouret & Nicolas Pariset Total, 64018 Pau Cédex MOTS CLEFS : Analyse spatiale, ACP, Lissage, Loess PROBLEMATIQUE En analyse multivariée,

Plus en détail

CHAPITRE 3 LA SYNTHESE DES PROTEINES

CHAPITRE 3 LA SYNTHESE DES PROTEINES CHAITRE 3 LA SYNTHESE DES ROTEINES On sait qu un gène détient dans sa séquence nucléotidique, l information permettant la synthèse d un polypeptide. Ce dernier caractérisé par sa séquence d acides aminés

Plus en détail

Cours 9 : Plans à plusieurs facteurs

Cours 9 : Plans à plusieurs facteurs Cours 9 : Plans à plusieurs facteurs Table des matières Section 1. Diviser pour regner, rassembler pour saisir... 3 Section 2. Définitions et notations... 3 2.1. Définitions... 3 2.2. Notations... 4 Section

Plus en détail

Sujet 1 : Diagnostique du Syndrome de l apnée du sommeil par des techniques d analyse discriminante.

Sujet 1 : Diagnostique du Syndrome de l apnée du sommeil par des techniques d analyse discriminante. Sujet 1 : Diagnostique du Syndrome de l apnée du sommeil par des techniques d analyse discriminante. Objectifs et formulation du sujet Le syndrome de l apnée du sommeil (SAS) est un problème de santé publique

Plus en détail

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient

Plus en détail

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences

Plus en détail