Analyse de spectres d absorbance pour la prédiction des taux de moisissure, de matières grasses et de protéines d échantillons de viande
|
|
- Claudine Mathieu
- il y a 8 ans
- Total affichages :
Transcription
1 Université de Nantes M2 Ingénierie Mathématiques Rapport de chimiométrie Analyse de spectres d absorbance pour la prédiction des taux de moisissure, de matières grasses et de protéines d échantillons de viande Satish MOSELLE & Emmanuel VERRON 21 mars
2 Introduction Nous disposons de données, recueillies au sein de «Tecator Infratec Food and Feed Analyzer, nous donnant des longueurs d ondes en proche infra-rouge (NIR) situé entre 850 nm et 1050 nm par le principe de la transmission par proche infra-rouge (NIT) ainsi que le taux de moisissure (variable water), de la matière grasse (variable fat) et des protéines (variable protein) recueillies sur des échantillons de viande. Nos données sont réparties en deux parties : absorp qui contient 100 spectres d absorbances pour 215 échantillons (dont les 129 premiers ont été utilisés comme échantillon d apprentissage. endpoints qui contients les pourcentages en eau, matière grasse et de protéines de chaque échantillon. Su chaque échantillon de viande les compositions en moisissure, matières grasses et en protéines ont été déterminées par mesure chimique. Rappelons que la courbe d absorbance mesurée pour le ne échantinnon est donnée par Xn (t) = log10 ( II0 ) où t est la longuer d onde de la lumière, I0 l intensité de la lumière mesuré incidente et I l intensité de la lumière transmise après le passage à travers l échantillon de viande. Le problème est que l analyse des taux de moisissure,de matière grasse et de protéines sont longues et coûteuse. Nous souhaitons donc créer un modèle de prévision qui nous permettent de prédire ces taux. Figure 1 Représentation de l absorbance en fonction des différentes longueurs d onde en proche infra-rouge En centrant et en réduisant chaque individu nous obtenons le spectre d absorbance suivant : Figure 2 Représentation de l absorbance en fonction des différentes longueurs d onde en proche infra-rouge Nous travaillerons ainsi par la suite avec les données centrées réduites. 2
3 1 Comparaison de différents modèles d étalonnage Dans cette partie nous allons comparer les performances de différents modèles d étalonnage : PCR, PLS1 et PLS2. Nous diviserons notre jeu de données en deux parties : l une pour l apprentissage contenant les 129 premières observations et l autre pour la validation externe du modèle. Pour le choix du nombre de composantes principales, nous regardons l évolution de la racine carrée de l erreur quadratrique moyenne (Root Mean Squared Error of Prediction), le coefficient de détermination et la la racine carrée de l erreur quadratique moyenne obtenue par validation croisée (Root Mean Square Error of Cross- Validation) en fonction du nombre de composantes principales. Le RMSECV est défini par : n i= (y i ŷ i LOO ) 2 n où ŷ est le vecteur contenant les valeurs de la variable y qui sont estimées par la méthode de validation croisée Leave on out (la valeur de ŷ i est estimée en utilisant le modèle construit sans la i e observation), y contient les valeurs observées et n est le nombre d échantillons utilisés. n Le RMSEP est défini par : où ŷ est le vecteur contenant les valeurs prédites, y les valeurs observées et n est le nombre d échantillons utilisés. i= (y i ŷ i ) 2 n 1.1 Principal Component Regression (PCR) Cette méthode utilise la matrice des covariances des absorbances centrées, A A. Le principe est de choisir une nouvelle base de variables indépendantes. La matrice de changement de base (qui va rendre la matrice de covariance diagonale), est donc construite à partir des vecteurs propres de A A. Les valeurs propres représentent alors la variance des scores, et donc leur contribution à la modélisation : Pour effectuer la réduction de données, il suffit alors de ne conserver que les h scores correspondant aux plus fortes valeurs propres. Nous effectuons une régression sur composantes principales sur les variables de moisissure, de gras et de proteines en prenant 20 composantes principales et en utilisant la méthode de validation croisée : Leave one out RMSECV Figure 3 Evolution du RMSECV en fonction du nombre de variables latentes D après les résultats graphiques, on choisit de retenir 4 composantes principales pour la variable water 5 pour fat et 13 pour protein. 3
4 Nb var latentes (Intercept) RMSECV-water RMSECV-fat RMSECV-protein Table 1 Evolution du RMSECV en fonction du nombre de variables latentes Figure 4 Inertie expliquée par les variables Nombre de variables latentes Variance expliquée (en %) X Variance expliquée (en %) water Variance expliquée (en %) fat Variance expliquée (en %) protein Table 2 Evolution de la variance expliquée en fonction du nombre de variables latentes Notre choix de nombre de composantes pour chaques variables permet à chaque fois d expliquer plus de 95% de la variance du tableau initial. 4
5 Figure 5 Représentation valeurs observées vs valeurs prédites On observe peu de dispersion autour de la droite identité. Les valeurs prédites semblent correctes pour chaque modèle. Figure 6 Représentation des vecteurs des loadings 5
6 1.1.2 Validation interne Pour la phase de validation interne, nous regardons l évolution du coefficient de détermination (R2) en fonction du nombre de composantes principales. Figure 7 Evolution du R 2 en fonction du nombre de variables latentes Nb var latentes R2-water R2-fat R2-protein Table 3 Evolution du R 2 en fonction du nombre de variables latentes Le R 2 mesure l ajustement du modèle à nos données de départ. Nous obtenons un R 2 très proche de 1 pour nos trois modèles, on conclut à l excellente qualité d ajustement de nos modèles Validation externe Pour la phase de validation externe, nous utilisons l échantillon test pour prédire les valeurs de nos variables. Figure 8 Représentation valeurs observées vs valeurs prédites 6
7 Les valeurs prédites sur l échantillon test semblent proches de leur vraies valeurs. On souhaite quantifier cette observation en calculant la moyenne des erreurs au carré (RMSEP) RMSEP Figure 9 Evolution du RMSEP en fonction du nombre de variables latentes Nb var latentes RMSEP-water RMSEP-fat RMSEP-protein Table 4 Evolution du RMSEP en fonction du nombre de variables latentes Variables Nb de variables latentes RMSECV R 2 RMSEP Tableau récapulatif : water fat protein
8 1.2 Partial Least Square Regression 1 (PLS1) On cherche à prévoir chacune des variables en fonction des valeurs d absorbance. Comme pour la régression sur composantes principales, le principe est de rechercher un modèle de régression linéaire sur un ensemble de composantes orthogonales (ou variables latentes) construites à partir de combinaisons linéaires des valeurs d absorbance centrées dont les pondérations contituent les vecteurs des loadings. Dans le cas de la PLS, la construction des composantes est optimisée pour que celles-ci soient les plus liées à la variable Y à prédire au sens de la covariance empirique, alors que les composantes principales ne visent qu à extraire une part de variance maximale sans tenir compte d une variable cible. Nous effectuons une régression des moindres carrés partiels (Partial Least Square) sur chacune des variables de moisissure, de gras et de proteines en prenant 20 composantes principales en utilisant la méthode de validation croisée Leave one out RMSECV Figure 10 Evolution du RMSECV en fonction du nombre de variables latentes D après les résultats graphiques, on choisit de retenir 9 composantes principales pour la variable water 5 pour fat et 12 pour protein. Nb variables latentes (Intercept) RMSECV-water RMSECV-fat RMSECV-protein
9 Figure 11 Inertie expliquée par les variables Comme pour la régression PCR, notre choix de nombre de composantes permet à chaque fois de restituer plus de 95% d inertie. Figure 12 Représentation valeurs observées vs valeurs prédites On observe peu de dispersion autour de la droite identité. Les valeurs prédites semblent à première vue être satisfaisantes. 9
10 Figure 13 Représentation des vecteurs des loadings Validation interne Pour la phase de validation interne, nous regardons l évolution du coefficient de détermination (R2) en fonction du nombre de composantes principales. Figure 14 Evolution du R 2 en fonction du nombre de variables latentes Nb variables latentes R2-water R2-fat R2-protein
11 1.2.3 Validation externe Pour la phase de validation externe, nous utilisons l échantillon test pour prédire les valeurs de nos variables. Figure 15 Représentation valeurs observées vs valeurs prédites Les variables prédites ont l air de plutôt bien correspondre à leur vraies valeurs. On va calculer l erreur de prédiction RMSEP Figure 16 Evolution du RMSEP en fonction du nombre de variables latentes Nb variables latentes RMSEP-water RMSEP-fat RMSEP-protein
12 Variables Nb de variables latentes RMSECV R 2 RMSEP Tableau récapulatif water fat protein
13 1.3 Partial Least Square Regression 2 (PLS2) La PLS est une généralisation multidimensionnelle de la PLS1. Dans ce cas, on étallonne toutes les variables en fonction des valeurs d absorbance. Nous effectuons une régression des moindres carrés partiels (Partial Least Square) sur la matrice constituée des variables de moisissure, de gras et de proteines, en prenant en compte 20 composantes principales et en utilisant la méthode de validation croisée Leave one out RMSECV Figure 17 Evolution du RMSECV en fonction du nombre de variables latentes D après les résultats graphiques, on choisit de retenir 5 composantes principales pour les variables water, fat et protein. Nb variables latentes (Intercept) RMSECV-water RMSECV-fat RMSECV-protein Figure 18 Evolution de la somme des RMSECV et de l inertie expliquée en fonction du nombre de variables latentes Le graphique confirme que ce choix de 5 composantes semble être un bon compromis. De plus, le pourcentage d inertie restituée est de plus de 95%. 13
14 Figure 19 Représentation valeurs observées vs valeurs prédites Figure 20 Représentation des vecteurs des loadings Comme pour nos deux autres types de régression, il apparaît des prédictions satisfaisantes. On cherche maintenant à vérifier nos observations en calculant le coefficient de détermination puis en utilisant nos données test. 14
15 1.3.2 Validation interne Pour la phase de validation interne, nous regardons l évolution du coefficient de détermination (R2) en fonction du nombre de composantes principales. 7 Figure 21 Evolution du R 2 en fonction du nombre de variables latentes Nb variables latentes R2-water R2-fat R2-protein L ajustement de notre modèle à nos données est une fois de plus bon. Il faut noter cependant l apparition d une valeur inférieure à 0.95 pour la variable protéine. 15
16 1.3.3 Validation externe Pour la phase de validation externe, nous utilisons l échantillon test pour prédire les valeurs de nos variables. Figure 22 Représentation valeurs observées vs valeurs prédites RMSEP Figure 23 Evolution du RMSEP en fonction du nombre de variables latentes Nb variables latentes RMSEP-water RMSEP-fat RMSEP-protein
17 Variables Nb de variables latentes RMSECV R 2 RMSEP Tableau récapulatif water fat protein Comparaison des modèles de régression Nous avons donc mis en place 7 modèles de prédiction (3 par PCR, 3 par PLS1 et 1 PLS2). Pour les modèles de régression sur composantes principales (PCR) et moindres carrés partiels (PLS1), la variable protein est à chaque fois la variable pour laquelle on obtient les plus faibles RMSECV et RMSEP. Pour les autres modèles et pour les autres variables, les erreurs de validation croisée et de prédiction sont du même ordre de grandeur ( 2). Cependant on préfèrera sans doute une méthode PLS2. En effet, pour obtenir une prédiction sur les trois variables water, fat et protein, on a un seul modèle avec PLS2 alors que PCR et PLS1 nécessitent de calculer de nouvelles composantes et de nouveaux coefficients pour chaque variable régressée. Avec un seul modèle de régression pour les 3 variables et des erreurs de prédiction satisfaisantes, la méthode PLS2 est la méthode choisie dans une optique de prévision de la compositions en moisissure, matières grasses et en protéines de viandes. 17
18 2 Influence des groupes d individus Dans cette partie, nous allons d abord créer trois groupes d individus avec des effectifs relativement proches. Ces trois groupes sont obtenus de manière aléatoire. Leur caractère artificiel doit nous aider à étudier l influence de tels groupes sur la prédiction d appartenance à une classe à partir des données spectrales. Nous générons trois groupes à l aide d une méthode de nuées dynamiques : la méthode des k-means. Notés 1, 2 et 3, ces groupes d individus sont d effectifs 86, 92 et 37 respectivement. On construit un tableau à 3 colonnes, donnant pour chaque individu l indicatrice d appartence à son groupe. On l appelle tableau disjonctif complet. 2.1 ACP des données et visualisations des groupes Figure 24 ACP du tableau avec indication d appartenance On représente la cartographie des individus sur les deux premières composantes d une ACP sur les données spectrales. On voit très bien que la discrimination des groupes est faite sur le premier axe factoriel qui explique 98% de la variance du tableau original. 18
19 2.2 Méthode PLS2 pour prédiction d appartenance à un groupe On souhaite mettre en place un modèle de prédiction d appertenance à l un des trois groupes. Pour cela, on réalise une régression PLS2 des données spectrales sur le tableau disjonctif complet. On en tire ainsi 10 composantes, qu on utilisera dans une analyse factorielle discriminante pour classer les individus. Comme dans la partie précédente, on utilise les 129 premiers individus pour apprentissage et les 86 derniers pour test. La première étape consiste donc en la réalisation d une PLS2 sur nos données d apprentissage. Figure 25 Evolution de l inertie expliquée en fonction du nombre de variables latentes et 10 premiers vecteurs des loadings Le choix de ne considérer que seulement 10 composantes pour la suite est légitimé par le pourcentage d inertie expliquée, très proche de 100 à partir de 5 composantes AFD des composantes PLS2 Nous mettons en place maintenant une analyse factorielle discriminante sur les composants PLS2. Cette méthode consiste en la recherche de variables latentes qui discriminent le mieux les groupes. Ces variables sont des combinaisons linéaires des 10 composantes PLS2 sélectionnées. Comme il y a trois groupes à classer, le nombre de variables latentes obtenues par AFD est 2, on les note LD1 et LD2. Figure 26 Représentation des individus d apprentissage dans le plan formé par les deux variables discriminantes La première variable discriminante (LD1) sépare plutôt bien les groupes 1 et 3. Le deuxième groupe a plus de mal à être bien discriminé bien que l axe LD2 semble le séparer des deux autres groupes. 19
20 Poids des composantes dans LD1 et LD2 LD1 LD2 Comp Comp Comp Comp Comp Comp Comp Comp Comp Comp On utilise maintenant une règle d affectation afin de classer nos 129 individus dans un groupe. On compare le groupe prédit avec le vrai groupe à l aide d une matrice de confusion. groupe prediction La méthode de classement nous donne un taux de bonnes prédictions d environ 74%. On remarque que seulement la moitié des individus du groupe 3 sont bien classés et que 14 individus du groupe 2 ont été classé dans le premier groupe Application à l échantillon de validation Nous devons vérifier la qualité d un telle règle de classement en s appuyant sur nos données test. On récupère la matrice des dix vecteurs des loadings de la PLS2 et on fait le produit matriciel avec les données spectrales de l échantillon test. On obtient alors une matrice avec les 10 composantes de la PLS2 calculées sur le deuxième échantillon. Comme LD1 et LD2 sont connues, on peut calculer les projections des individus de validations sur ces variables discriminantes. Figure 27 Représentation des individus de validation dans le plan formé par les deux variables discriminantes Graphiquement, la discrimination des 3 groupes semble peu évidente. On réutilise notre règle de classement pour prédire le groupe de chacune des individus de l échantillon test : 20
21 groupe prediction Les prédictions obtenues sont très mauvaises. La méthode de classement n a pas réussi à classer un seul individu des groupes 1 et 2 dans son bon groupe. Tout le groupe 3 est bien classé, mais la méthode a fait plus de 80% d erreur de prédictions. Un modèle de classement basé sur un calcul de composantes PLS2 ne semble pas être adapté à la prévision. Le taux d erreur de prédiction (26%) obtenu par Analyse Factorielle Discriminante sur les données d apprentissage semble correct mais le passage à l échantillon de validation ne donne pas les résultats escomptés (plus de 80% d individus mal classés). 21
Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Plus en détailExtraction d informations stratégiques par Analyse en Composantes Principales
Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailIntroduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailL ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Plus en détailAnalyse en Composantes Principales
Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées
Plus en détailACP Voitures 1- Méthode
acp=princomp(voit,cor=t) ACP Voitures 1- Méthode Call: princomp(x = voit, cor = T) Standard deviations: Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 2.1577815 0.9566721 0.4903373 0.3204833 0.2542759 0.1447788
Plus en détailStatistique Descriptive Multidimensionnelle. (pour les nuls)
Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Multidimensionnelle (pour les nuls) (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219
Plus en détail1 Complément sur la projection du nuage des individus
TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent
Plus en détailLe Data Mining au service du Scoring ou notation statistique des emprunteurs!
France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative
Plus en détailL'analyse des données à l usage des non mathématiciens
Montpellier L'analyse des données à l usage des non mathématiciens 2 ème Partie: L'analyse en composantes principales AGRO.M - INRA - Formation Permanente Janvier 2006 André Bouchier Analyses multivariés.
Plus en détailAnalyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin
Analyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin Sandro Petrillo Université de Neuchâtel - Diplôme Postgrade en Statistique Projet
Plus en détailESIEA PARIS 2011-2012
ESIEA PARIS 2011-2012 Examen MAT 5201 DATA MINING Mardi 08 Novembre 2011 Première Partie : 15 minutes (7 points) Enseignant responsable : Frédéric Bertrand Remarque importante : les questions de ce questionnaire
Plus en détailINTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES
INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine
Plus en détailChapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Plus en détailProjet SINF2275 «Data mining and decision making» Projet classification et credit scoring
Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems
Plus en détailTransmission d informations sur le réseau électrique
Transmission d informations sur le réseau électrique Introduction Remarques Toutes les questions en italique devront être préparées par écrit avant la séance du TP. Les préparations seront ramassées en
Plus en détailExercice : la frontière des portefeuilles optimaux sans actif certain
Exercice : la frontière des portefeuilles optimaux sans actif certain Philippe Bernard Ingénierie Economique & Financière Université Paris-Dauphine Février 0 On considère un univers de titres constitué
Plus en détailINF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
Plus en détailEtude d un cas industriel : Optimisation de la modélisation de paramètre de production
Revue des Sciences et de la Technologie RST- Volume 4 N 1 /janvier 2013 Etude d un cas industriel : Optimisation de la modélisation de paramètre de production A.F. Bernate Lara 1, F. Entzmann 2, F. Yalaoui
Plus en détailPerrothon Sandrine UV Visible. Spectrophotométrie d'absorption moléculaire Étude et dosage de la vitamine B 6
Spectrophotométrie d'absorption moléculaire Étude et dosage de la vitamine B 6 1 1.But et théorie: Le but de cette expérience est de comprendre l'intérêt de la spectrophotométrie d'absorption moléculaire
Plus en détailÉvaluation de la régression bornée
Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement
Plus en détailFICHE 1 Fiche à destination des enseignants
FICHE 1 Fiche à destination des enseignants 1S 8 (b) Un entretien d embauche autour de l eau de Dakin Type d'activité Activité expérimentale avec démarche d investigation Dans cette version, l élève est
Plus en détailLogiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS
Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence
Plus en détailTravaux pratiques avec RapidMiner
Travaux pratiques avec RapidMiner Master Informatique de Paris 6 Spécialité IAD Parcours EDOW Module Algorithmes pour la Fouille de Données Janvier 2012 Prise en main Généralités RapidMiner est un logiciel
Plus en détailChapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens
Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques
Plus en détailSUIVI CINETIQUE PAR SPECTROPHOTOMETRIE (CORRECTION)
Terminale S CHIMIE TP n 2b (correction) 1 SUIVI CINETIQUE PAR SPECTROPHOTOMETRIE (CORRECTION) Objectifs : Déterminer l évolution de la vitesse de réaction par une méthode physique. Relier l absorbance
Plus en détailAide-mémoire de statistique appliquée à la biologie
Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela
Plus en détailSéries Statistiques Simples
1. Collecte et Représentation de l Information 1.1 Définitions 1.2 Tableaux statistiques 1.3 Graphiques 2. Séries statistiques simples 2.1 Moyenne arithmétique 2.2 Mode & Classe modale 2.3 Effectifs &
Plus en détailCours 9 : Plans à plusieurs facteurs
Cours 9 : Plans à plusieurs facteurs Table des matières Section 1. Diviser pour regner, rassembler pour saisir... 3 Section 2. Définitions et notations... 3 2.1. Définitions... 3 2.2. Notations... 4 Section
Plus en détailChapitre 02. La lumière des étoiles. Exercices :
Chapitre 02 La lumière des étoiles. I- Lumière monochromatique et lumière polychromatique. )- Expérience de Newton (642 727). 2)- Expérience avec la lumière émise par un Laser. 3)- Radiation et longueur
Plus en détailSystèmes de transmission
Systèmes de transmission Conception d une transmission série FABRE Maxime 2012 Introduction La transmission de données désigne le transport de quelque sorte d'information que ce soit, d'un endroit à un
Plus en détailTABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie
PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats Pierre Dagnelie TABLE DES MATIÈRES 2012 Presses agronomiques de Gembloux pressesagro.gembloux@ulg.ac.be www.pressesagro.be
Plus en détailModule HVAC - fonctionnalités
Module HVAC - fonctionnalités Modèle de radiation : DO = Discrete Ordinates On peut considérer l échauffement de solides semi transparents causé par le rayonnement absorbé par le solide. On peut également
Plus en détailMODELE A CORRECTION D ERREUR ET APPLICATIONS
MODELE A CORRECTION D ERREUR ET APPLICATIONS Hélène HAMISULTANE Bibliographie : Bourbonnais R. (2000), Econométrie, DUNOD. Lardic S. et Mignon V. (2002), Econométrie des Séries Temporelles Macroéconomiques
Plus en détailESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring
ESSEC Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring Les méthodes d évaluation du risque de crédit pour les PME et les ménages Caractéristiques Comme les montants des crédits et des
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane
Plus en détailTABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.
STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,
Plus en détailK. Ammar, F. Bachoc, JM. Martinez. Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau
Apport des modèles de krigeage à la simulation numérique K Ammar, F Bachoc, JM Martinez CEA-Saclay, DEN, DM2S, F-91191 Gif-sur-Yvette, France Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau Apport des
Plus en détailExemples d application
AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif
Plus en détailTable des matières. I Mise à niveau 11. Préface
Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3
Plus en détailEXERCICE 2 : SUIVI CINETIQUE D UNE TRANSFORMATION PAR SPECTROPHOTOMETRIE (6 points)
BAC S 2011 LIBAN http://labolycee.org EXERCICE 2 : SUIVI CINETIQUE D UNE TRANSFORMATION PAR SPECTROPHOTOMETRIE (6 points) Les parties A et B sont indépendantes. A : Étude du fonctionnement d un spectrophotomètre
Plus en détailOptimisation, traitement d image et éclipse de Soleil
Kléber, PCSI1&3 014-015 I. Introduction 1/8 Optimisation, traitement d image et éclipse de Soleil Partie I Introduction Le 0 mars 015 a eu lieu en France une éclipse partielle de Soleil qu il était particulièrement
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme
Plus en détailDétection en environnement non-gaussien Cas du fouillis de mer et extension aux milieux
Détection en environnement non-gaussien Cas du fouillis de mer et extension aux milieux hétérogènes Laurent Déjean Thales Airborne Systems/ENST-Bretagne Le 20 novembre 2006 Laurent Déjean Détection en
Plus en détailThéorie des sondages : cours 5
Théorie des sondages : cours 5 Camelia Goga IMB, Université de Bourgogne e-mail : camelia.goga@u-bourgogne.fr Master Besançon-2010 Chapitre 5 : Techniques de redressement 1. poststratification 2. l estimateur
Plus en détailA chaque couleur dans l'air correspond une longueur d'onde.
CC4 LA SPECTROPHOTOMÉTRIE I) POURQUOI UNE SUBSTANCE EST -ELLE COLORÉE? 1 ) La lumière blanche 2 ) Solutions colorées II)LE SPECTROPHOTOMÈTRE 1 ) Le spectrophotomètre 2 ) Facteurs dont dépend l'absorbance
Plus en détailAnalyses multivariées avec R Commander (via le package FactoMineR) Qu est ce que R? Introduction à R Qu est ce que R?
Analyses multivariées avec R Commander Analyses multivariées avec R Commander (via le package FactoMineR) Plate-forme de Support en Méthodologie et Calcul Statistique (SMCS) - UCL 1 Introduction à R 2
Plus en détailExemple PLS avec SAS
Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that
Plus en détailInitiation à l analyse en composantes principales
Fiche TD avec le logiciel : tdr601 Initiation à l analyse en composantes principales A.B. Dufour & J.R. Lobry Une première approche très intuitive et interactive de l ACP. Centrage et réduction des données.
Plus en détailComment suivre l évolution d une transformation chimique? + S 2 O 8 = I 2 + 2 SO 4
Afin d optimiser leurs procédés, les industries chimiques doivent contrôler le bon déroulement de la réaction de synthèse menant aux espèces voulues. Comment suivre l évolution d une transformation chimique?
Plus en détailBureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr
Dominique Muller Laboratoire Inter-universitaire de Psychologie Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr Supports de cours : webcom.upmf-grenoble.fr/lip/perso/dmuller/m2r/acm/
Plus en détailLES CARACTERISTIQUES DES SUPPORTS DE TRANSMISSION
LES CARACTERISTIQUES DES SUPPORTS DE TRANSMISSION LES CARACTERISTIQUES DES SUPPORTS DE TRANSMISSION ) Caractéristiques techniques des supports. L infrastructure d un réseau, la qualité de service offerte,
Plus en détailSpectrophotomètre double faisceau modèle 6800
Spectrophotomètre double faisceau modèle 6800 Spectrophotomètre double faisceau modèle 6800 Double faisceau avec optiques parfaitement stables. Bande passante 1,5 nm. Logiciel de navigation Jenway Flight
Plus en détailSpécificités, Applications et Outils
Spécificités, Applications et Outils Ricco Rakotomalala Université Lumière Lyon 2 Laboratoire ERIC Laboratoire ERIC 1 Ricco Rakotomalala ricco.rakotomalala@univ-lyon2.fr http://chirouble.univ-lyon2.fr/~ricco/data-mining
Plus en détailIntroduction. Préambule. Le contexte
Préambule... INTRODUCTION... BREF HISTORIQUE DE L ACP... 4 DOMAINE D'APPLICATION... 5 INTERPRETATIONS GEOMETRIQUES... 6 a - Pour les n individus... 6 b - Pour les p variables... 7 c - Notion d éléments
Plus en détailEnjeux mathématiques et Statistiques du Big Data
Enjeux mathématiques et Statistiques du Big Data Mathilde Mougeot LPMA/Université Paris Diderot, mathilde.mougeot@univ-paris-diderot.fr Mathématique en Mouvements, Paris, IHP, 6 Juin 2015 M. Mougeot (Paris
Plus en détailPRISE EN MAIN DU SPECTROPHOTOMETRE UV-VISIBLE SHIMADZU U.V. 240
I.N.S.. DE ROUEN Laboratoire de Chimie nalytique U.V. N PRISE EN MIN DU SPECTROPHOTOMETRE UV-VISIBLE SHIMDZU U.V. 240. OBJECTIFS - Choix des paramètres nécessaires pour un tracé de spectre. - Utilisation
Plus en détailMise en pratique : Etude de spectres
Mise en pratique : Etude de spectres Introduction La nouvelle génération de spectromètre à détecteur CCD permet de réaliser n importe quel spectre en temps réel sur toute la gamme de longueur d onde. La
Plus en détailIntroduction aux Statistiques et à l utilisation du logiciel R
Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil
Plus en détailIntroduction au datamining
Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des
Plus en détailLa segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM
La segmentation à l aide de EG-SAS A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM Définition de la segmentation - Au lieu de considérer une population dans son ensemble,
Plus en détailPREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE
PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE Jean-Paul Valois, Claude Mouret & Nicolas Pariset Total, 64018 Pau Cédex MOTS CLEFS : Analyse spatiale, ACP, Lissage, Loess PROBLEMATIQUE En analyse multivariée,
Plus en détailModèles pour données répétées
Résumé Les données répétées, ou données longitudinales, constituent un domaine à la fois important et assez particulier de la statistique. On entend par données répétées des données telles que, pour chaque
Plus en détailANALYSE SPECTRALE. monochromateur
ht ANALYSE SPECTRALE Une espèce chimique est susceptible d interagir avec un rayonnement électromagnétique. L étude de l intensité du rayonnement (absorbé ou réémis) en fonction des longueurs d ode s appelle
Plus en détailLa structure de la base de données et l utilisation de PAST. Musée Royal de l Afrique Centrale (MRAC Tervuren)
La structure de la base de données et l utilisation de PAST La structure de la base de données données originales SPÉCIMENS Code des spécimens: Identification des spécimens individuels. Dépend du but de
Plus en détailPartie Observer : Ondes et matière CHAP 04-ACT/DOC Analyse spectrale : Spectroscopies IR et RMN
Partie Observer : Ondes et matière CHAP 04-ACT/DOC Analyse spectrale : Spectroscopies IR et RMN Objectifs : Exploiter un spectre infrarouge pour déterminer des groupes caractéristiques Relier un spectre
Plus en détailNON-LINEARITE ET RESEAUX NEURONAUX
NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail
Plus en détailSpectrophotométrie - Dilution 1 Dilution et facteur de dilution. 1.1 Mode opératoire :
Spectrophotométrie - Dilution 1 Dilution et facteur de dilution. 1.1 Mode opératoire : 1. Prélever ml de la solution mère à la pipette jaugée. Est-ce que je sais : Mettre une propipette sur une pipette
Plus en détailFORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)
87 FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) Dans le cadre de la réforme pédagogique et de l intérêt que porte le Ministère de l Éducation
Plus en détailAnalyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent
Plus en détailFORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
Plus en détailDécouverte du logiciel ordinateur TI-n spire / TI-n spire CAS
Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS Mémento Ouvrir TI-Nspire CAS. Voici la barre d outils : L insertion d une page, d une activité, d une page où l application est choisie, pourra
Plus en détailIndividus et informations supplémentaires
ADE-4 Individus et informations supplémentaires Résumé La fiche décrit l usage des individus supplémentaires dans des circonstances variées. En particulier, cette pratique est étendue aux analyses inter
Plus en détail23. Interprétation clinique des mesures de l effet traitement
23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d
Plus en détailProjet Matlab : un logiciel de cryptage
Projet Matlab : un logiciel de cryptage La stéganographie (du grec steganos : couvert et graphein : écriture) consiste à dissimuler une information au sein d'une autre à caractère anodin, de sorte que
Plus en détailUviLight XTW Spectrophotomètre UV-Vis
Enseignement Agro-alimentaire Sciences Chimie Recherche Laboratoires de référence UviLight XTW Spectrophotomètre UV-Vis Accédez aux meilleures performances grâce à des spécificités optiques supérieures
Plus en détailExo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2.
Eo7 Calculs de déterminants Fiche corrigée par Arnaud Bodin Eercice Calculer les déterminants des matrices suivantes : Correction Vidéo ( ) 0 6 7 3 4 5 8 4 5 6 0 3 4 5 5 6 7 0 3 5 4 3 0 3 0 0 3 0 0 0 3
Plus en détailValidation probabiliste d un Système de Prévision d Ensemble
Validation probabiliste d un Système de Prévision d Ensemble Guillem Candille, janvier 2006 Système de Prévision d Ensemble (EPS) (ECMWF Newsletter 90, 2001) Plan 1 Critères de validation probabiliste
Plus en détailTESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION
TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun
Plus en détailNOTE SUR LA MODELISATION DU RISQUE D INFLATION
NOTE SUR LA MODELISATION DU RISQUE D INFLATION 1/ RESUME DE L ANALYSE Cette étude a pour objectif de modéliser l écart entre deux indices d inflation afin d appréhender le risque à très long terme qui
Plus en détailApprentissage Automatique
Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Plus en détailCHAPITRE I. Modélisation de processus et estimation des paramètres d un modèle
CHAPITRE I Modélisation de processus et estimation des paramètres d un modèle I. INTRODUCTION. Dans la première partie de ce chapitre, nous rappelons les notions de processus et de modèle, ainsi que divers
Plus en détailSTATISTIQUES. UE Modélisation pour la biologie
STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres
Plus en détailGestion obligataire passive
Finance 1 Université d Evry Séance 7 Gestion obligataire passive Philippe Priaulet L efficience des marchés Stratégies passives Qu est-ce qu un bon benchmark? Réplication simple Réplication par échantillonnage
Plus en détailCours de méthodes de scoring
UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-
Plus en détailRDP : Voir ou conduire
1S Thème : Observer RDP : Voir ou conduire DESCRIPTIF DE SUJET DESTINE AU PROFESSEUR Objectif Compétences exigibles du B.O. Initier les élèves de première S à la démarche de résolution de problème telle
Plus en détailISFA 2 année 2002-2003. Les questions sont en grande partie indépendantes. Merci d utiliser l espace imparti pour vos réponses.
On considère la matrice de données : ISFA 2 année 22-23 Les questions sont en grande partie indépendantes Merci d utiliser l espace imparti pour vos réponses > ele JCVGE FM1 GM JCRB FM2 JMLP Paris 61 29
Plus en détailPHYSIQUE-CHIMIE. Partie I - Spectrophotomètre à réseau
PHYSIQUE-CHIMIE L absorption des radiations lumineuses par la matière dans le domaine s étendant du proche ultraviolet au très proche infrarouge a beaucoup d applications en analyse chimique quantitative
Plus en détailSéance 0 : Linux + Octave : le compromis idéal
Séance 0 : Linux + Octave : le compromis idéal Introduction Linux est un système d'exploitation multi-tâches et multi-utilisateurs, basé sur la gratuité et développé par une communauté de passionnés. C'est
Plus en détailpka D UN INDICATEUR COLORE
TP SPETROPHOTOMETRIE Lycée F.BUISSON PTSI pka D UN INDIATEUR OLORE ) Principes de la spectrophotométrie La spectrophotométrie est une technique d analyse qualitative et quantitative, de substances absorbant
Plus en détailStatistique Descriptive Élémentaire
Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier
Plus en détailDonnées longitudinales et modèles de survie
ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan
Plus en détailUne réponse (très) partielle à la deuxième question : Calcul des exposants critiques en champ moyen
Une réponse (très) partielle à la deuxième question : Calcul des exposants critiques en champ moyen Manière heuristique d'introduire l'approximation de champ moyen : on néglige les termes de fluctuations
Plus en détailMaster IAD Module PS. Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique. Gaël RICHARD Février 2008
Master IAD Module PS Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique Gaël RICHARD Février 2008 1 Reconnaissance de la parole Introduction Approches pour la reconnaissance
Plus en détailTP 2: LES SPECTRES, MESSAGES DE LA LUMIERE
TP 2: LES SPECTRES, MESSAGES DE LA LUMIERE OBJECTIFS : - Distinguer un spectre d émission d un spectre d absorption. - Reconnaître et interpréter un spectre d émission d origine thermique - Savoir qu un
Plus en détailProjet Matlab/Octave : segmentation d'un ballon de couleur dans une image couleur et insertion d'un logo
Projet Matlab/Octave : segmentation d'un ballon de couleur dans une image couleur et insertion d'un logo Dans ce projet, nous allons réaliser le code qui permet d'insérer sur une image, un logo sur un
Plus en détailNiveau 2 nde THEME : L UNIVERS. Programme : BO spécial n 4 du 29/04/10 L UNIVERS
Document du professeur 1/7 Niveau 2 nde THEME : L UNIVERS Physique Chimie SPECTRES D ÉMISSION ET D ABSORPTION Programme : BO spécial n 4 du 29/04/10 L UNIVERS Les étoiles : l analyse de la lumière provenant
Plus en détail