Analyse statistique du protéome: cas de données issues de spectrométrie de masse. D. Pecqueur - C. Truntzer Master MIGS 05/11/08
|
|
- Jean-Charles Gervais
- il y a 8 ans
- Total affichages :
Transcription
1 Analyse statistique du protéome: cas de données issues de spectrométrie de masse D. Pecqueur - C. Truntzer Master MIGS 05/11/08
2 La plateforme protéomique de Dijon Protéomique classique Protéomique clinique Plateforme Protéomique Innovation technologique Biostatistique
3 Plan Introduction Prétraitement des spectres de masse Analyse
4 Objectif: recherche de biomarqueurs Diagnostic Classification de la pathologie Pronostic Réponse thérapeutique Mise en évidence d un ou des biomarqueurs permettant de remonter à un(des) mécanisme(s) moléculaire(s) associé(s) à la progression tumorale
5 INTRODUCTION Le protéome Définition Intérêt Applications
6 Définition Protéome : ensemble des PROTéines exprimées par le génome d une cellule, à un moment et dans un environnement donnés. PROTEOME TRANSCRIPTOME GENOME ARN Noyau cellulaire ADN Cellule Protéines
7 Intérêt Pourquoi étudier le protéome? Ni le décryptage du génome ni l analyse à grande échelle des ARNm (transcriptome) ne permettent de prédire le taux d expression des protéines Le protéome donne une image plus complète des processus biologiques. 1 organisme 1 génome très grande diversité de protéomes
8 Applications Détermination de la fonction (rôle dans l organisme) Localisation sub-cellulaire (où retrouve-t-on la protéine dans l organisme?) Quantification différentielle Identification des protéines Analyse Protéomique Analyse différentielle (présence vs absence d une protéine) Interaction protéines avec d autres molécules Caractérisation des modifications post-traductionnelles (modification chimique de la protéine)
9 Protéomique clinique Protéomique classique Protéomique clinique Plateforme Protéomique Innovation technologique Biostatistique
10 Déroulement d une étude Médecins Prélèvements Gestion des échantillons Stockage Patients Traitement des échantillons Analyse Statistique Stockage des échantillons traités Stockage des données Traitement des données Analyse des échantillons Stockage des données brutes
11 INTRODUCTION Le spectromètre de masse Description générale Principe de la mesure
12 Principe de la mesure Mass analyser Detector
13 Description générale Ionisation des molécules (protéines) Séparation des molécules en fonction de leur rapport masse/charge (M/Z) M: masse de la molécule Z: charge de la molécule L entité mesurée est appelée spectre de masse. Spectre de masse
14 Visualisation du principe de mesure
15 INTRODUCTION Exemple d application Mesure des protéines du plasma Simplification d un échantillon
16 Mesure des protéines dans le plasma Plasma = partie du sang (facilement accessible) But: identifier le profil protéomique décrivant le plasma d un individu (profil=spectre représentant toutes les protéines présentes dans le plasma) Difficulté: le plasma est complexe(composé de beaucoup de protéines) Solution: on isole une partie du plasma
17 Acquisition d un spectre à partir de plasma Bind Protein Mixture to Magnetic Beads Unbound Elute Bound Protein Simplification de l échantillon Mesure des protéines de l échantillon Wash Bound Read in MALDI TOF/TOF => spectre MALDI Target
18 INTRODUCTION Exemple d étude Etapes Plan expérimental
19 Etapes d une étude Question biologique Plan expérimental Biologie: Acquisition des données Biopuces Spectres Préparation des données Prétraitement Identificationdes biomarqueurs Analyse statistique: Sélection de biomarqueurs Gènes Protéines Analyse des données Validation statistique et biologique des résultats
20 Répétition technique Plan expérimental Plusieurs acquisitions par sujet Réduction du bruit technique Contrôle de la reproductibilité des études Contrôle de la qualité des données obtenues Répétition biologique Plusieurs sujets par groupe expérimental Seules les répétitions biologiques apportent de l information sur la variabilité inter-sujet et permettent d inférer sur des différences entre les populations représentées par l expérience.
21 Plan expérimental Réplicats techniques Patients 2 purifications 2 *4 dépôts Réplicats biologiques
22 Etapes de l analyse statistique Visualisation des données Prétraitement Identification de biomarqueurs Validation des biomarqueurs Analyse des données Préparation des données
23 PRÉPARATION DES DONNÉES Contrôle visuel des données
24 Visualisation des spectres bruts
25 Analyse en composantes principales Spectres non informatifs
26 Critères de rejet des spectres Automatisation de la procédure de rejet des spectres «douteux» Intensité maximale du spectre Est-ce que le spectre contient de l information? Coefficient de variation global Est-ce qu il y a des pics dans le spectre? Corrélations inter et intra échantillons Est-ce que le spectre ressemble aux autres représentants?
27 PRÉPARATION DES DONNÉES Prétraitement Élimination du bruit de fond Harmonisation Recherche des variables
28 Nature des données Identifier le «vrai» signal biologique: Y(M/Z) = B(M/Z) Bruit de fond Intensité observée + N * S(M/Z) Facteur de normalisation Signal + ε(m/z) Bruit blanc (aléatoire )
29 Étapes du pré-traitement A. Élimination du bruit de fond: 1. Élimination du bruit blanc 2. Soustraction de la ligne de base B. Harmonisation des spectres à analyser 3. Alignement des spectres 4. Normalisation C. Préparation à l analyse 5. Détection des pics
30 Étape 1- Élimination du bruit blanc (1) Utilisation de la transformée en ondelettes du signal (Coombes, 2005) Signal dans la base d origine => Signal dans la base des ondelettes
31
32 Étape 1- Élimination du bruit blanc (2) Bruit blanc = faibles coefficients d ondelettes Élimination des coefficients inférieurs à un seuil défini par l utilisateur Transformée inverse : retour dans la base Transformée inverse : retour dans la base d origine
33 Choix du seuil
34 Étape 1- Résultat
35 Étape 2 -Soustraction de la ligne de base Ajustement d une fonction de lissage aux minima locaux
36 Étape 2 -Résultat
37 Étape 3 - Alignement des spectres Objectif: Détermination d une correspondance unique entre les points des différents spectres Les pics correspondant aux mêmes peptides doivent avoir le même MZ Méthodes: Translation des spectres pour maximiser leur corrélation Déformation du signal
38 Étape 3 - Illustration
39 Étape 4 - Normalisation Objectif: être en mesure de comparer les intensités des différents spectres d une même étude Méthode: division des intensités par le Courant Ionique Total= somme de toutes les intensités mesurées
40 Étape 5 Détection des pics Objectif: identifier les pics (variables) sur lesquels portera l analyse
41 Détection sur les spectres individuels Méthode: Identification de maxima locaux Sélection des pics qui seront conservés pour l analyse selon trois critères: Rapport signal/bruit Intensité Importance relative par rapport à l ensemble des pics du spectre
42 Alignement des pics détectés Objectif: avoir les mêmes variables pour tous les spectres Spectre 1 Spectre ,2 1220,5 2010,3 2440,8 2600,1 2801,4 1000,5 1220,9 1800,4 2010,8 2440,7 2603,9 3050,7 Variables sur lesquelles pourra porter l analyse: 1000,3 1220,7 1800,4 2010,5 2440,7 2600,1 2603,9 2801,4 3050,7
43 Alignement des pics détectés Méthode: regroupement des valeurs M/Z correspondant à un même peptide
44 Difficultés majeures: Détection des pics: les pics identifiés ont-ils un sens biologique? Quantification des pics: Certains pics ne sont présents que dans quelques spectres: comment caractériser les pics absents? Quels pics conserver pour l analyse? Conservation de pics présents dans p% des spectres de l étude Quel p choisir?
45 Détection sur le spectre moyen Principe: Alignement des spectres bruts Moyenne des spectres bruts Prétraitement Détection des pics Spectre moyen Quantification des pics dans les spectres bruts Avantages Pas d alignement des pics Atténuation du bruit de fond
46 Pour résumer
47 Partie III ANALYSE
48 Spectres Sujets Données analysées p pics 1 variable de réponse n sujets
49 A chaque question son analyse Description des données Analyse non supervisée Identification de biomarqueurs caractéristiques d'une classe de tumeurs Analyse différentielle Classement d une tumeur parmi des classes connues, i.e prédire le diagnostic ou le pronostic de nouveaux patients: Classement - Analyse supervisée
50 ANALYSE Analyse non supervisée Classification ascendante hiérarchique Méthode des k-means Analyse en Composantes Principales
51 Analyse non supervisée Classification des données =>Détection de sous-groupes de biomarqueurs ou de patients =>Visualisation de la reproductibité des =>Visualisation de la reproductibité des données
52 Classification
53 Classification ascendante hiérarchique Objectif: regrouper des entités proches dans une même classe (pics ou individus) Construction itérative des classes Arbre de classification = dendrogramme Début: chaque entité constitue une classe Fin: toutes les entités sont regroupées dans la même classe
54 Classification ascendante hiérarchique Définition de deux types de distance: Distance entre les entités distance euclidienne, corrélation, etc Distance entre les classes Saut minimum (Single linkage) Saut maximum (Complete linkage) Saut moyen (Average linkage)
55 Exemple - reproductibilité s: échantillon -> répétitions biologiques p: purification d: jour -> répétitions techniques
56 Exemple: reproductibilité Répétitions techniques et biologiques
57 Exemple: double classification Individus Pics
58 Méthode de réallocation dynamique Méthode des k-means Procédé non hiérarchique Recherche d une partition des entités (individus/variables) en k groupes Choix de k Regroupement d entités au profil similaire Maximisation des distances entre les centroïdes des groupes
59 Méthode de réallocation dynamique Algorithme - cas de regroupement d individus 1. k points placés aléatoirement dans l espace des variables = k centroïdes initiaux 2. Attribution des individus au groupe dont le centroïde est le plus proche: choix d une métrique 3. Mise à jour des positions des centroïdes 4. Itération des étapes 2 et 3 jusqu à stabilité des centroïdes
60 Analyse en Composantes Principales 1 2 Ind i Coordonnée de Ind i sur cet axe 3 4 Minimisation de Maximisation de (sous contrainte) n i= 1 M H i i ² 2 t OH = ( Xu)( Xu) = i i t t u XXu Mi OH OM = OH + H M i 2 i = 2 i OM, u i i = 2 i p j= 1 x j i u j Solution donnée par les vecteurs propres de t XX O u Hi
61 Illustrations
62 Illustrations
63 ANALYSE Analyse différentielle Tests statistiques Tests multiples Puissance
64 Analyse différentielle Identification de biomarqueurs associés à un facteur d intérêt Méthodes univariées: les pics sont considérés «un à un» Application d un test statistique à chacun des éléments puis sélection des éléments pour lesquels les tests sont les plus significatifs
65 Tests statistiques Test d une hypothèse relative à une question biologique définie à priori Définition De l hypothèse nulle H0 De l hypothèse alternative H1 Tests conduisent à deux types d erreur: Erreur de type I (risque de 1 er espèce) Erreur de type II (risque de 2 nd espèce)
66 P-value La p-value correspond à la probabilité d obtenir, sous H0, une valeur de la statistique de test T supérieure ou égale à celle observée t : Distribution des valeurs de la statistique p - val = p( T t H0) Prob(t*<-2.1) Prob(t*>2.1) Décision: si p-value<α H0 rejetée
67 Types d erreur H0 acceptée H0 rejetée H0 vraie 1-β(puissance) α(type I) H0 fausse β(type II) 1-α Erreur de type I: rejet à tort de l hypothèse nulle Notée α Erreur de type II: acceptation à tort de l hypothèse nulle Notée β Reliée à la puissance du test 1-β.
68 Tests multiples Décision H0 acceptée H0 rejetée Total Vérité H0 U (VN) V (FP) p0 H1 T (FN) S (VP) p1 Total 1-R R p Pour un total de p éléments testés U: Vrais positifs V: Faux positifs T: Faux négatifs S: Vrais négatifs
69 Tests multiples Test simultané d un grand nombre d hypothèses Exemple: test de 10 hypothèses indépendantes Probabilité de déclarer un test significatif à tort: 5% Probabilité de déclarer au moins un test significatif à tort parmi les 10: 0.401=1-(0.95) 10 =>le risque explose avec le nombre de variables
70 Contrôle du risque de type I Ajustement des p-values Family Wise Error Rate (FWER) Probabilité d obtenir au moins une erreur de type I Proportion de gènes déclarés significatifs à tort. Contrôler le FWER au seuil de 5%, permet d être confiant à 95% de n avoir aucun faux positif FWER = p(v 1)
71 Ajustement des p-values False Discovery Rate (FDR) Proportion attendue de faux positifs parmi les gènes déclarés significatifs. Contrôler le FDR au seuil de 5% permet d affirmer qu en moyenne, le taux de faux positifs est inférieur à 5%. FDR = E(V/R) Variantes: FDR local, q-value
72 Ajustement: exemples Bonferroni Le plus intuitif maxt utilise la corrélation entre les gènes Benjamini-Hochberg Holm
73 Représentation graphique
74 Puissance d un test Contrôle du risque de type II Distribution sous H1 Distribution sous H0 1-β Capacité du test à mettre en évidence une différence qui existe réellement
75 Lien entre puissance et nombre de sujets 100 sujets Sous H0 Sous H1 300 sujets Sous H0 Sous H1
76 Puissance et taille d échantillon Travail de la thèse en cours de Thomas Jouve
77 ANALYSE Analyse supervisée Sélection de variables Extraction de variables Méthodes qui intègrent la dimension
78 Analyse supervisée Classement d un échantillon parmi des classes connues, i.e prédire le diagnostic ou le pronostic de nouveaux patients Chaque sujet: Décrit par X = Réponse associée (X,...,X Y { 1,...,K} Construction d un «classifieur» C 1 p ŷ = C(x) = ) k
79 Analyse discriminante Objectif: trouver une combinaison linéaire qui Maximise la variance inter-groupes Minimise la variance intra-groupe Notations: Profils moyens {μ k ; k=1 K} Matrice de variance-covariance: k Affectation d un individu au groupe qui minimise d 1 ( x, ) 2 Σ µ k Différents types d analyse discriminante selon la forme de k Méthode proche de l analyse inter-groupes
80 Exemple Données de Khan et al. (2002): étude de 4 types d une tumeur de l abdomen qui affecte essentiellement les enfants CulhaneAC, et al., (2002) Between-group analysis of microarray data. Bioinformatics. 18(12):
81 Problème de la multiplicité Particularité des données: nombre très important de variables étudiées simultanément Conséquences En univarié: pics jugés significatifs par le simple fait du hasard En multivarié: n importe quel modèle peut être parfaitement prédictif par chance uniquement
82 Problème de la multiplicité Nombre de variables (pics) >>Nombre d individus Multi-colinéarité Optimisme Nécessité d adapter les méthodes classiques: Réduction préalable de la dimension: Sélection de variables Extraction de variables Méthodes qui intègrent directement la dimension Knn, random forest, etc Méthodes de régularisation
83 Sélection de variables Sélection univariée Chaque variable est considérée indépendamment des autres Classement des variables selon l importance de leur impact sur la réponse d intérêt Exemples: tests de t, Wilcoxon, etc
84 Extraction de variables Dans la littérature: «réduction de la dimension» Projection des individus dans un espace de dimension inférieure Construction de nouvelles variables qui «résument» les variables d origine
85 Extraction de variables Analyse en composantes principales Maximisation de la variance totale des données Partial Least Squares Maximisation de la covariance entre les données et la réponse Différence majeure : composantes PLS optimisées pour être prédictives du critère d intérêt composantes principales ne font qu extraire le maximum de variance des prédicteurs
86 Méthodes de régularisation Maximisation de la vraisemblance sous contrainte/pénalisation de la vraisemblance Pénalité de type L1 - Lasso: coeff λ - Lars - Sélection d un sous-ensemble de variables Pénalité de type L2 - Régression ridge: coeff ² λ - Conserve toutes les variables dans le modèle Remarque: lien avec SVM
87 Exemples de résultats Exemple L1 Exemple L2
88 Machines à vecteurs de support (SVM) Recherche d un hyperplan optimal -Projection dans un espace de dimension supérieur dans lequel il existe un séparateur linéaire -Maximisation de la marge entre l hyperplan et les points
89 Méthode des k plus proches voisins Basée sur les proximités locales Principe: Identification des k observations les plus proches de celle dont on cherche à prédire la classe Attribution de la classe la plus représentée parmi Attribution de la classe la plus représentée parmi les k voisins
90 Agrégation de modèles Arbres de décision binaire: Découpage successif de l espace engendré par les variables Bagging: N échantillons indépendants remplacés par N échantillons bootstrap Forêt aléatoire: choix aléatoire des variables au niveau de chaque nœud Boosting: Plus de poids aux observations mal ajustées oui Malade oui Pic 2<c 2 Pic 1<c 1 non Non malade non Malade
91 Bilan sur les méthodes Large panel de méthodes Nécessité de mieux comprendre le lien entre les méthodes Pas de méthode «magique» qui surpasse les autres quelque soit le jeu de données Nécessité de bien connaître le jeu de données et les méthodes pour utiliser celle qui s applique le mieux à la structure des données
92 Autre approche Approche fonctionnelle Décomposition des spectres dans une base de fonctions (ondelettes, splines, etc ) Analyse dans cette base de fonctions Intérêt: Détection des pics évitée Limitation du nombre de variables
93 Construction du modèle prédictif Définition d un jeu de travail et d un jeu test A chaque itération: Construction du modèle sur le jeu de travail Evaluation sur le jeu test Estimation de l erreur pour chacun des modèles Sélection du modèle qui minimise les erreurs de classement
94 Exemple: validation croisée Jeu de données Jeu de travail Jeu test Construction MODELE Evaluation Répétition n fois Erreur moyenne
95 ANALYSE Validation des résultats
96 Optimisme Le modèle doit être fiable pour la prédiction du critère d intérêt chez de nouveaux sujets => Différence entre la qualité de l ajustement et les qualités prédictives Puissance = Augmentati on du nombre d échantill ons Validation du modèle sur échantillons tests indépendants OK
97 Importance de la taille des études Evolution de la quantité d information prédictive en fonction du nombre de sujets Truntzeret.al. (2008). Comparative optimism in models involving both classical linical and gene expression information, BMC Bioinformatics, 9:434
98 Validation des modèles Validation interne Séparation des données initiales en un jeu de travail et un jeu test Validation externe Utilisation d un autre jeu de données A privilégier
99 Importance de la validation Baggerly, 2004
100 Influence du choix du jeu de travail Approche: -Génération de 500 jeux de travail de même taille que celui de l étude initiale -Sélection des 50 gènes les plus corrélés à la réponse -Comparaison des «toplistes» obtenues Michiels, S., Koscielny, S. & Hill, C. (2005) Lancet 365,
101 Proportion de mauvais classement et taille de l échantillon En vert: proportion moyenne sur les 500 jeux de travail En rouge: IC 95% Points: proportion de mauvais classement selon les auteurs Michiels, S., Koscielny, S. & Hill, C. (2005) Lancet 365,
102 ANALYSE Exemple Application à la maladie de Exemple Application à la maladie de Hodgkin
103 Maladie de Hodgkin Affection cancéreuse caractérisée par une prolifération cellulaire anormale dans un ou plusieurs ganglions lymphatiques à très haut risque de rechute Recherche et identification de nouveaux biomarqueurs prédictifs de la rechute après traitement Time : 0 Taking blood Detection of the pathology Treatment 3 months Sensitive patient without reccurence Group 1 6 months Non Sensitive patient with reccurence Group 2
104 Maladie de Hodgkin 24 plasmas de patients avec rechute 24 plasmas de patients sans rechute plasma aliquots de 60µl Purification d un sous-protéome en duplicate à l aide de billes magnétiques Pour chaque éluat de billes 4 dépôts sont effectués sur la cible MALDI.... Pour chaque dépôt une somme de 15 spectres est effectué... Pour chaque sous-protéome : analyse en duplicate pour la préparation des échantillons et en quatruplicate pour la mesure de l échantillon
105 Maladie de Hodgkin Spectres moyens obtenu dans les deux classes de plasmas arb. u. *10e Spectre moyen des patients avec rechute Spectre moyen des patients sans rechute m/z Exp : 004_050418_CWCX
106 Analyse descriptive
107 Analyse différentielle
108 Innovation Technologique Protéomique classique Protéomique clinique Plateforme Protéomique Innovation technologique Biostatistique 108
109 MALDI IMAGING : PRINCIPLE I 4 I 5 x5, y1 x4, y1 x3, y1 x2, y1 x1, y1 Relative Intensity (%) 100 I 3 I 2 I 1 I 3 I 4 I 5 50 I 1 I 2 x5, y1 x4, y1 x3, y1 x2, y1 0 x1, y1 Mass (m/z)
110 Imagerie par MALDI-MS Positive Mode m/z 2015 m/z 2030 m/z 4741 m/z HCCA/ANI HCCA/ANI HCCA/ANI HCCA/ANI aca Fmi M1 M2 AOP points 50 Hz Laser repetition rate 100 shots/point Time 5-6 H
La classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailL'intelligence d'affaires: la statistique dans nos vies de consommateurs
L'intelligence d'affaires: la statistique dans nos vies de consommateurs Jean-François Plante, HEC Montréal Marc Fredette, HEC Montréal Congrès de l ACFAS, Université Laval, 6 mai 2013 Intelligence d affaires
Plus en détailProjet SINF2275 «Data mining and decision making» Projet classification et credit scoring
Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane
Plus en détailDéroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Plus en détailObjectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique
Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55
Plus en détailIntroduction au datamining
Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des
Plus en détailLe Data Mining au service du Scoring ou notation statistique des emprunteurs!
France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative
Plus en détailAnalyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent
Plus en détailChapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE
UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction
Plus en détailSTATISTIQUES. UE Modélisation pour la biologie
STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détailAnnales du Contrôle National de Qualité des Analyses de Biologie Médicale
Annales du Contrôle National de Qualité des Analyses de Biologie Médicale ARN du virus de l hépatite C : ARN-VHC ARN-VHC 03VHC1 Novembre 2003 Edité : mars 2006 Annales ARN-VHC 03VHC1 1 / 8 ARN-VHC 03VHC1
Plus en détailArbres binaires de décision
1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression
Plus en détailMaster de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant
Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Parcours: Master 1 : Bioinformatique et biologie des Systèmes dans le Master
Plus en détailApproche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH
Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH Boris Hejblum 1,2,3 & Rodolphe Thiébaut 1,2,3 1 Inserm, U897
Plus en détailPrincipe d un test statistique
Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre
Plus en détail1 Complément sur la projection du nuage des individus
TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent
Plus en détailBiomarqueurs en Cancérologie
Biomarqueurs en Cancérologie Définition, détermination, usage Biomarqueurs et Cancer: définition Anomalie(s) quantitative(s) ou qualitative(s) Indicative(s) ou caractéristique(s) d un cancer ou de certaines
Plus en détailQuantification Scalaire et Prédictive
Quantification Scalaire et Prédictive Marco Cagnazzo Département Traitement du Signal et des Images TELECOM ParisTech 7 Décembre 2012 M. Cagnazzo Quantification Scalaire et Prédictive 1/64 Plan Introduction
Plus en détail$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU
$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU Fabien FIGUERES fabien.figueres@mpsa.com 0RWVFOpV : Krigeage, plans d expériences space-filling, points de validations, calibration moteur. 5pVXPp Dans le
Plus en détailEtude des propriétés empiriques du lasso par simulations
Etude des propriétés empiriques du lasso par simulations L objectif de ce TP est d étudier les propriétés empiriques du LASSO et de ses variantes à partir de données simulées. Un deuxième objectif est
Plus en détailData Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.
des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le
Plus en détailINF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
Plus en détailAnalyse de la variance Comparaison de plusieurs moyennes
Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction
Plus en détailApprentissage Automatique
Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Plus en détailEnjeux mathématiques et Statistiques du Big Data
Enjeux mathématiques et Statistiques du Big Data Mathilde Mougeot LPMA/Université Paris Diderot, mathilde.mougeot@univ-paris-diderot.fr Mathématique en Mouvements, Paris, IHP, 6 Juin 2015 M. Mougeot (Paris
Plus en détailL analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :
La vision nous permet de percevoir et d interpreter le monde qui nous entoure. La vision artificielle a pour but de reproduire certaines fonctionnalités de la vision humaine au travers de l analyse d images.
Plus en détailDr E. CHEVRET UE2.1 2013-2014. Aperçu général sur l architecture et les fonctions cellulaires
Aperçu général sur l architecture et les fonctions cellulaires I. Introduction II. Les microscopes 1. Le microscope optique 2. Le microscope à fluorescence 3. Le microscope confocal 4. Le microscope électronique
Plus en détailUne comparaison de méthodes de discrimination des masses de véhicules automobiles
p.1/34 Une comparaison de méthodes de discrimination des masses de véhicules automobiles A. Rakotomamonjy, R. Le Riche et D. Gualandris INSA de Rouen / CNRS 1884 et SMS / PSA Enquêtes en clientèle dans
Plus en détailAide-mémoire de statistique appliquée à la biologie
Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela
Plus en détailTechniques du Data Mining pour la prédiction de faillite des entreprises et la gestion du risque de crédit
Techniques du Data Mining pour la prédiction de faillite des entreprises et la gestion du risque de crédit Adil Belhouari HEC - Montréal - Journées de l Optimisation 2005-09 Mai 2005 PLAN DE LA PRÉSENTATION
Plus en détailRésumés des projets de GMM5-2014/2015
Résumés des projets de GMM5-2014/2015 Option MMS Statistical analysis of Raman Spectra skin to evaluate the benefit of Pierre Fabre s acne treatment cream Classification appliquée à la biologie structurale
Plus en détailLES MODELES DE SCORE
LES MODELES DE SCORE Stéphane TUFFERY CONFERENCE GENDER DIRECTIVE 31 mai 2012 31/05/2012 ActuariaCnam Conférence Gender Directive Stéphane Tufféry 1 Plan Le scoring et ses applications L élaboration d
Plus en détailGestion obligataire passive
Finance 1 Université d Evry Séance 7 Gestion obligataire passive Philippe Priaulet L efficience des marchés Stratégies passives Qu est-ce qu un bon benchmark? Réplication simple Réplication par échantillonnage
Plus en détailClassification non supervisée
AgroParisTech Classification non supervisée E. Lebarbier, T. Mary-Huard Table des matières 1 Introduction 4 2 Méthodes de partitionnement 5 2.1 Mesures de similarité et de dissimilarité, distances.................
Plus en détailL ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Plus en détailChapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens
Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques
Plus en détailDan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier
Détection et reconnaissance des sons pour la surveillance médicale Dan Istrate le 16 décembre 2003 Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier Thèse mené dans le cadre d une collaboration
Plus en détailConception de Médicament
Conception de Médicament Approche classique HTS Chimie combinatoire Rational Drug Design Ligand based (QSAR) Structure based (ligand et ou macromolec.) 3DQSAR Docking Virtual screening Needle in a Haystack
Plus en détailTABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Plus en détail23. Interprétation clinique des mesures de l effet traitement
23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d
Plus en détailAnalyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57
Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation
Plus en détailUne application de méthodes inverses en astrophysique : l'analyse de l'histoire de la formation d'étoiles dans les galaxies
Une application de méthodes inverses en astrophysique : l'analyse de l'histoire de la formation d'étoiles dans les galaxies Ariane Lançon (Observatoire de Strasbourg) en collaboration avec: Jean-Luc Vergely,
Plus en détailTraitement bas-niveau
Plan Introduction L approche contour (frontière) Introduction Objectifs Les traitements ont pour but d extraire l information utile et pertinente contenue dans l image en regard de l application considérée.
Plus en détailSystèmes de transmission
Systèmes de transmission Conception d une transmission série FABRE Maxime 2012 Introduction La transmission de données désigne le transport de quelque sorte d'information que ce soit, d'un endroit à un
Plus en détailOrganisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.
2 jours : Mardi 15 et mercredi 16 novembre 2005 de 9 heures 30 à 17 heures 30 Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining. Madame, Monsieur, On parle
Plus en détailExtraction d informations stratégiques par Analyse en Composantes Principales
Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction
Plus en détailMesure agnostique de la qualité des images.
Mesure agnostique de la qualité des images. Application en biométrie Christophe Charrier Université de Caen Basse-Normandie GREYC, UMR CNRS 6072 Caen, France 8 avril, 2013 C. Charrier NR-IQA 1 / 34 Sommaire
Plus en détailOptimisation, traitement d image et éclipse de Soleil
Kléber, PCSI1&3 014-015 I. Introduction 1/8 Optimisation, traitement d image et éclipse de Soleil Partie I Introduction Le 0 mars 015 a eu lieu en France une éclipse partielle de Soleil qu il était particulièrement
Plus en détailL axe 5 du Cancéropole Nord Ouest
L axe 5 du Cancéropole Nord Ouest Cancers, Individu id & Société L état des lieux d un pari Le Rapport Cordier 1 Biomarqueurs prédictifs 2 L axe 5 du Cancéropole Nord Ouest Cancers, Individu & Société
Plus en détailWhy Software Projects Escalate: The Importance of Project Management Constructs
Why Software Projects Escalate: The Importance of Project Management Constructs Why Software Projects Escalate: The Importance of Project Management Constructs 1. Introduction 2. Concepts de la gestion
Plus en détailLa Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1
La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La licence Mathématiques et Economie-MASS de l Université des Sciences Sociales de Toulouse propose sur les trois
Plus en détailRenforcement des trois compétences : compréhension orale, expression orale et expression écrite à partir de documents et vidéos.
Master Mathématiques et Applications Spécialité : Ingénierie mathématique et modélisation Parcours : Mathématique et Informatique : Statistique, Signal, Santé (MI3S) 2015-2016 RÉSUMÉ DES COURS : (dernière
Plus en détail2D-Differential Differential Gel Electrophoresis & Applications en neurosciences
2D-Differential Differential Gel Electrophoresis & Applications en neurosciences Jean-Etienne Poirrier Centre de Neurobiologie Cellulaire et Moléculaire Centre de Recherches du Cyclotron Université de
Plus en détailSujets présentés par le Professeur Olivier CUSSENOT
ANAMACaP Association Nationale des Malades du Cancer de la Prostate 17, bis Avenue Poincaré. 57400 SARREBOURG Sujets présentés par le Professeur Olivier CUSSENOT Place des nouvelles techniques d imagerie
Plus en détailIdentification de nouveaux membres dans des familles d'interleukines
Identification de nouveaux membres dans des familles d'interleukines Nicolas Beaume Jérôme Mickolajczak Gérard Ramstein Yannick Jacques 1ère partie : Définition de la problématique Les familles de gènes
Plus en détailESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring
ESSEC Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring Les méthodes d évaluation du risque de crédit pour les PME et les ménages Caractéristiques Comme les montants des crédits et des
Plus en détailCours de méthodes de scoring
UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-
Plus en détailRégression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr
Régression linéaire Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr 2005 Plan Régression linéaire simple Régression multiple Compréhension de la sortie de la régression Coefficient de détermination R
Plus en détailChapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Plus en détailItem 169 : Évaluation thérapeutique et niveau de preuve
Item 169 : Évaluation thérapeutique et niveau de preuve COFER, Collège Français des Enseignants en Rhumatologie Date de création du document 2010-2011 Table des matières ENC :...3 SPECIFIQUE :...3 I Différentes
Plus en détailUtilisation d informations visuelles dynamiques en asservissement visuel Armel Crétual IRISA, projet TEMIS puis VISTA L asservissement visuel géométrique Principe : Réalisation d une tâche robotique par
Plus en détailUFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES
Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,
Plus en détailTABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.
STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,
Plus en détailK. Ammar, F. Bachoc, JM. Martinez. Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau
Apport des modèles de krigeage à la simulation numérique K Ammar, F Bachoc, JM Martinez CEA-Saclay, DEN, DM2S, F-91191 Gif-sur-Yvette, France Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau Apport des
Plus en détailFormation continue. Ensae-Ensai Formation Continue (Cepe)
CertifiCat de data scientist Formation continue Ensae-Ensai Formation Continue (Cepe) CertifiCat de data scientist La demande de data scientists est croissante mais peu de formations existent. Ce certificat
Plus en détailContents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes
Université Claude Bernard Lyon 1 Institut de Science Financière et d Assurances Système Bonus-Malus Introduction & Applications SCILAB Julien Tomas Institut de Science Financière et d Assurances Laboratoire
Plus en détailFormations EViews FORMATIONS GENERALES INTRODUCTIVES INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS
Formations EViews FORMATIONS GENERALES INTRODUCTIVES DEB : DECOUVERTE DU LOGICIEL EVIEWS INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS FORMATIONS METHODES ECONOMETRIQUES VAR : MODELES
Plus en détailApprentissage Statistique :
Apprentissage Statistique Apprentissage Statistique : modélisation, prévision et data mining PHILIPPE BESSE & BÉATRICE LAURENT 5ème année GMM - MMS Équipe de Statistique et Probabilités Institut de Mathématiques
Plus en détailTempérature corporelle d un castor (une petite introduction aux séries temporelles)
Température corporelle d un castor (une petite introduction aux séries temporelles) GMMA 106 GMMA 106 2014 2015 1 / 32 Cas d étude Temperature (C) 37.0 37.5 38.0 0 20 40 60 80 100 Figure 1: Temperature
Plus en détailLogiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS
Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence
Plus en détailQu est-ce qu une probabilité?
Chapitre 1 Qu est-ce qu une probabilité? 1 Modéliser une expérience dont on ne peut prédire le résultat 1.1 Ensemble fondamental d une expérience aléatoire Une expérience aléatoire est une expérience dont
Plus en détailTransmission d informations sur le réseau électrique
Transmission d informations sur le réseau électrique Introduction Remarques Toutes les questions en italique devront être préparées par écrit avant la séance du TP. Les préparations seront ramassées en
Plus en détailCAPTEURS - CHAINES DE MESURES
CAPTEURS - CHAINES DE MESURES Pierre BONNET Pierre Bonnet Master GSI - Capteurs Chaînes de Mesures 1 Plan du Cours Propriétés générales des capteurs Notion de mesure Notion de capteur: principes, classes,
Plus en détailAgrégation des portefeuilles de contrats d assurance vie
Agrégation des portefeuilles de contrats d assurance vie Est-il optimal de regrouper les contrats en fonction de l âge, du genre, et de l ancienneté des assurés? Pierre-O. Goffard Université d été de l
Plus en détailSimulation d'un examen anthropomorphique en imagerie TEMP à l iode 131 par simulation Monte Carlo GATE
Simulation d'un examen anthropomorphique en imagerie TEMP à l iode 131 par simulation Monte Carlo GATE LAURENT Rémy laurent@clermont.in2p3.fr http://clrpcsv.in2p3.fr Journées des LARD Septembre 2007 M2R
Plus en détailAlgorithmes d'apprentissage
Algorithmes d'apprentissage 1 Agents qui apprennent à partir d'exemples La problématique : prise de décision automatisée à partir d'un ensemble d'exemples Diagnostic médical Réponse à une demande de prêt
Plus en détailUne méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données
Une méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données Marc Boullé Orange Labs 2 avenue Pierre Marzin 22300 Lannion marc.boulle@orange-ftgroup.com,
Plus en détailPierre OLIVIER - Médecine Nucléaire
Diplôme Universitaire Corrélations anatomo-physio-pathologiques en imagerie thoracique 25 mai 2011 Imagerie TEP et pathologie tumorale bronchique Pierre OLIVIER - Médecine Nucléaire Détection en coincidence
Plus en détailTests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE
Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.
Plus en détailStructure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données
Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques
Plus en détailLe risque Idiosyncrasique
Le risque Idiosyncrasique -Pierre CADESTIN -Magali DRIGHES -Raphael MINATO -Mathieu SELLES 1 Introduction Risque idiosyncrasique : risque non pris en compte dans le risque de marché (indépendant des phénomènes
Plus en détailT de Student Khi-deux Corrélation
Les tests d inférence statistiques permettent d estimer le risque d inférer un résultat d un échantillon à une population et de décider si on «prend le risque» (si 0.05 ou 5 %) Une différence de moyennes
Plus en détailPROGRAMME (Susceptible de modifications)
Page 1 sur 8 PROGRAMME (Susceptible de modifications) Partie 1 : Méthodes des revues systématiques Mercredi 29 mai 2013 Introduction, présentation du cours et des participants Rappel des principes et des
Plus en détailStéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 04/04/2008 Stéphane Tufféry - Data Mining - http://data.mining.free.fr
Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE 1 Plan du cours Qu est-ce que le data mining? A quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data
Plus en détailFoscolo (1), J Felblinger (2), S Bracard (1) CHU Hôpital central, service de neuroradiologie, Nancy (1) CHU BRABOIS, Centre d investigation clinique
S A l (1) G H (2) S S Aptel (1), G Hossu (2), S Foscolo (1), J Felblinger (2), S Bracard (1) CHU Hôpital central, service de neuroradiologie, Nancy (1) CHU BRABOIS, Centre d investigation clinique innovation
Plus en détailLa problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites
La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur
Plus en détailNON-LINEARITE ET RESEAUX NEURONAUX
NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail
Plus en détailACP Voitures 1- Méthode
acp=princomp(voit,cor=t) ACP Voitures 1- Méthode Call: princomp(x = voit, cor = T) Standard deviations: Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 2.1577815 0.9566721 0.4903373 0.3204833 0.2542759 0.1447788
Plus en détailBiostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke
www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3
Plus en détailPREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE
PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE Jean-Paul Valois, Claude Mouret & Nicolas Pariset Total, 64018 Pau Cédex MOTS CLEFS : Analyse spatiale, ACP, Lissage, Loess PROBLEMATIQUE En analyse multivariée,
Plus en détailCHAPITRE 3 LA SYNTHESE DES PROTEINES
CHAITRE 3 LA SYNTHESE DES ROTEINES On sait qu un gène détient dans sa séquence nucléotidique, l information permettant la synthèse d un polypeptide. Ce dernier caractérisé par sa séquence d acides aminés
Plus en détailCours 9 : Plans à plusieurs facteurs
Cours 9 : Plans à plusieurs facteurs Table des matières Section 1. Diviser pour regner, rassembler pour saisir... 3 Section 2. Définitions et notations... 3 2.1. Définitions... 3 2.2. Notations... 4 Section
Plus en détailSujet 1 : Diagnostique du Syndrome de l apnée du sommeil par des techniques d analyse discriminante.
Sujet 1 : Diagnostique du Syndrome de l apnée du sommeil par des techniques d analyse discriminante. Objectifs et formulation du sujet Le syndrome de l apnée du sommeil (SAS) est un problème de santé publique
Plus en détailBaccalauréat ES Pondichéry 7 avril 2014 Corrigé
Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient
Plus en détailTests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»
Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences
Plus en détail