Analyse de spectres d absorbance pour la prédiction des taux de moisissure, de matières grasses et de protéines d échantillons de viande

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimension: px
Commencer à balayer dès la page:

Download "Analyse de spectres d absorbance pour la prédiction des taux de moisissure, de matières grasses et de protéines d échantillons de viande"

Transcription

1 Université de Nantes M2 Ingénierie Mathématiques Rapport de chimiométrie Analyse de spectres d absorbance pour la prédiction des taux de moisissure, de matières grasses et de protéines d échantillons de viande Satish MOSELLE & Emmanuel VERRON 21 mars

2 Introduction Nous disposons de données, recueillies au sein de «Tecator Infratec Food and Feed Analyzer, nous donnant des longueurs d ondes en proche infra-rouge (NIR) situé entre 850 nm et 1050 nm par le principe de la transmission par proche infra-rouge (NIT) ainsi que le taux de moisissure (variable water), de la matière grasse (variable fat) et des protéines (variable protein) recueillies sur des échantillons de viande. Nos données sont réparties en deux parties : absorp qui contient 100 spectres d absorbances pour 215 échantillons (dont les 129 premiers ont été utilisés comme échantillon d apprentissage. endpoints qui contients les pourcentages en eau, matière grasse et de protéines de chaque échantillon. Su chaque échantillon de viande les compositions en moisissure, matières grasses et en protéines ont été déterminées par mesure chimique. Rappelons que la courbe d absorbance mesurée pour le ne échantinnon est donnée par Xn (t) = log10 ( II0 ) où t est la longuer d onde de la lumière, I0 l intensité de la lumière mesuré incidente et I l intensité de la lumière transmise après le passage à travers l échantillon de viande. Le problème est que l analyse des taux de moisissure,de matière grasse et de protéines sont longues et coûteuse. Nous souhaitons donc créer un modèle de prévision qui nous permettent de prédire ces taux. Figure 1 Représentation de l absorbance en fonction des différentes longueurs d onde en proche infra-rouge En centrant et en réduisant chaque individu nous obtenons le spectre d absorbance suivant : Figure 2 Représentation de l absorbance en fonction des différentes longueurs d onde en proche infra-rouge Nous travaillerons ainsi par la suite avec les données centrées réduites. 2

3 1 Comparaison de différents modèles d étalonnage Dans cette partie nous allons comparer les performances de différents modèles d étalonnage : PCR, PLS1 et PLS2. Nous diviserons notre jeu de données en deux parties : l une pour l apprentissage contenant les 129 premières observations et l autre pour la validation externe du modèle. Pour le choix du nombre de composantes principales, nous regardons l évolution de la racine carrée de l erreur quadratrique moyenne (Root Mean Squared Error of Prediction), le coefficient de détermination et la la racine carrée de l erreur quadratique moyenne obtenue par validation croisée (Root Mean Square Error of Cross- Validation) en fonction du nombre de composantes principales. Le RMSECV est défini par : n i= (y i ŷ i LOO ) 2 n où ŷ est le vecteur contenant les valeurs de la variable y qui sont estimées par la méthode de validation croisée Leave on out (la valeur de ŷ i est estimée en utilisant le modèle construit sans la i e observation), y contient les valeurs observées et n est le nombre d échantillons utilisés. n Le RMSEP est défini par : où ŷ est le vecteur contenant les valeurs prédites, y les valeurs observées et n est le nombre d échantillons utilisés. i= (y i ŷ i ) 2 n 1.1 Principal Component Regression (PCR) Cette méthode utilise la matrice des covariances des absorbances centrées, A A. Le principe est de choisir une nouvelle base de variables indépendantes. La matrice de changement de base (qui va rendre la matrice de covariance diagonale), est donc construite à partir des vecteurs propres de A A. Les valeurs propres représentent alors la variance des scores, et donc leur contribution à la modélisation : Pour effectuer la réduction de données, il suffit alors de ne conserver que les h scores correspondant aux plus fortes valeurs propres. Nous effectuons une régression sur composantes principales sur les variables de moisissure, de gras et de proteines en prenant 20 composantes principales et en utilisant la méthode de validation croisée : Leave one out RMSECV Figure 3 Evolution du RMSECV en fonction du nombre de variables latentes D après les résultats graphiques, on choisit de retenir 4 composantes principales pour la variable water 5 pour fat et 13 pour protein. 3

4 Nb var latentes (Intercept) RMSECV-water RMSECV-fat RMSECV-protein Table 1 Evolution du RMSECV en fonction du nombre de variables latentes Figure 4 Inertie expliquée par les variables Nombre de variables latentes Variance expliquée (en %) X Variance expliquée (en %) water Variance expliquée (en %) fat Variance expliquée (en %) protein Table 2 Evolution de la variance expliquée en fonction du nombre de variables latentes Notre choix de nombre de composantes pour chaques variables permet à chaque fois d expliquer plus de 95% de la variance du tableau initial. 4

5 Figure 5 Représentation valeurs observées vs valeurs prédites On observe peu de dispersion autour de la droite identité. Les valeurs prédites semblent correctes pour chaque modèle. Figure 6 Représentation des vecteurs des loadings 5

6 1.1.2 Validation interne Pour la phase de validation interne, nous regardons l évolution du coefficient de détermination (R2) en fonction du nombre de composantes principales. Figure 7 Evolution du R 2 en fonction du nombre de variables latentes Nb var latentes R2-water R2-fat R2-protein Table 3 Evolution du R 2 en fonction du nombre de variables latentes Le R 2 mesure l ajustement du modèle à nos données de départ. Nous obtenons un R 2 très proche de 1 pour nos trois modèles, on conclut à l excellente qualité d ajustement de nos modèles Validation externe Pour la phase de validation externe, nous utilisons l échantillon test pour prédire les valeurs de nos variables. Figure 8 Représentation valeurs observées vs valeurs prédites 6

7 Les valeurs prédites sur l échantillon test semblent proches de leur vraies valeurs. On souhaite quantifier cette observation en calculant la moyenne des erreurs au carré (RMSEP) RMSEP Figure 9 Evolution du RMSEP en fonction du nombre de variables latentes Nb var latentes RMSEP-water RMSEP-fat RMSEP-protein Table 4 Evolution du RMSEP en fonction du nombre de variables latentes Variables Nb de variables latentes RMSECV R 2 RMSEP Tableau récapulatif : water fat protein

8 1.2 Partial Least Square Regression 1 (PLS1) On cherche à prévoir chacune des variables en fonction des valeurs d absorbance. Comme pour la régression sur composantes principales, le principe est de rechercher un modèle de régression linéaire sur un ensemble de composantes orthogonales (ou variables latentes) construites à partir de combinaisons linéaires des valeurs d absorbance centrées dont les pondérations contituent les vecteurs des loadings. Dans le cas de la PLS, la construction des composantes est optimisée pour que celles-ci soient les plus liées à la variable Y à prédire au sens de la covariance empirique, alors que les composantes principales ne visent qu à extraire une part de variance maximale sans tenir compte d une variable cible. Nous effectuons une régression des moindres carrés partiels (Partial Least Square) sur chacune des variables de moisissure, de gras et de proteines en prenant 20 composantes principales en utilisant la méthode de validation croisée Leave one out RMSECV Figure 10 Evolution du RMSECV en fonction du nombre de variables latentes D après les résultats graphiques, on choisit de retenir 9 composantes principales pour la variable water 5 pour fat et 12 pour protein. Nb variables latentes (Intercept) RMSECV-water RMSECV-fat RMSECV-protein

9 Figure 11 Inertie expliquée par les variables Comme pour la régression PCR, notre choix de nombre de composantes permet à chaque fois de restituer plus de 95% d inertie. Figure 12 Représentation valeurs observées vs valeurs prédites On observe peu de dispersion autour de la droite identité. Les valeurs prédites semblent à première vue être satisfaisantes. 9

10 Figure 13 Représentation des vecteurs des loadings Validation interne Pour la phase de validation interne, nous regardons l évolution du coefficient de détermination (R2) en fonction du nombre de composantes principales. Figure 14 Evolution du R 2 en fonction du nombre de variables latentes Nb variables latentes R2-water R2-fat R2-protein

11 1.2.3 Validation externe Pour la phase de validation externe, nous utilisons l échantillon test pour prédire les valeurs de nos variables. Figure 15 Représentation valeurs observées vs valeurs prédites Les variables prédites ont l air de plutôt bien correspondre à leur vraies valeurs. On va calculer l erreur de prédiction RMSEP Figure 16 Evolution du RMSEP en fonction du nombre de variables latentes Nb variables latentes RMSEP-water RMSEP-fat RMSEP-protein

12 Variables Nb de variables latentes RMSECV R 2 RMSEP Tableau récapulatif water fat protein

13 1.3 Partial Least Square Regression 2 (PLS2) La PLS est une généralisation multidimensionnelle de la PLS1. Dans ce cas, on étallonne toutes les variables en fonction des valeurs d absorbance. Nous effectuons une régression des moindres carrés partiels (Partial Least Square) sur la matrice constituée des variables de moisissure, de gras et de proteines, en prenant en compte 20 composantes principales et en utilisant la méthode de validation croisée Leave one out RMSECV Figure 17 Evolution du RMSECV en fonction du nombre de variables latentes D après les résultats graphiques, on choisit de retenir 5 composantes principales pour les variables water, fat et protein. Nb variables latentes (Intercept) RMSECV-water RMSECV-fat RMSECV-protein Figure 18 Evolution de la somme des RMSECV et de l inertie expliquée en fonction du nombre de variables latentes Le graphique confirme que ce choix de 5 composantes semble être un bon compromis. De plus, le pourcentage d inertie restituée est de plus de 95%. 13

14 Figure 19 Représentation valeurs observées vs valeurs prédites Figure 20 Représentation des vecteurs des loadings Comme pour nos deux autres types de régression, il apparaît des prédictions satisfaisantes. On cherche maintenant à vérifier nos observations en calculant le coefficient de détermination puis en utilisant nos données test. 14

15 1.3.2 Validation interne Pour la phase de validation interne, nous regardons l évolution du coefficient de détermination (R2) en fonction du nombre de composantes principales. 7 Figure 21 Evolution du R 2 en fonction du nombre de variables latentes Nb variables latentes R2-water R2-fat R2-protein L ajustement de notre modèle à nos données est une fois de plus bon. Il faut noter cependant l apparition d une valeur inférieure à 0.95 pour la variable protéine. 15

16 1.3.3 Validation externe Pour la phase de validation externe, nous utilisons l échantillon test pour prédire les valeurs de nos variables. Figure 22 Représentation valeurs observées vs valeurs prédites RMSEP Figure 23 Evolution du RMSEP en fonction du nombre de variables latentes Nb variables latentes RMSEP-water RMSEP-fat RMSEP-protein

17 Variables Nb de variables latentes RMSECV R 2 RMSEP Tableau récapulatif water fat protein Comparaison des modèles de régression Nous avons donc mis en place 7 modèles de prédiction (3 par PCR, 3 par PLS1 et 1 PLS2). Pour les modèles de régression sur composantes principales (PCR) et moindres carrés partiels (PLS1), la variable protein est à chaque fois la variable pour laquelle on obtient les plus faibles RMSECV et RMSEP. Pour les autres modèles et pour les autres variables, les erreurs de validation croisée et de prédiction sont du même ordre de grandeur ( 2). Cependant on préfèrera sans doute une méthode PLS2. En effet, pour obtenir une prédiction sur les trois variables water, fat et protein, on a un seul modèle avec PLS2 alors que PCR et PLS1 nécessitent de calculer de nouvelles composantes et de nouveaux coefficients pour chaque variable régressée. Avec un seul modèle de régression pour les 3 variables et des erreurs de prédiction satisfaisantes, la méthode PLS2 est la méthode choisie dans une optique de prévision de la compositions en moisissure, matières grasses et en protéines de viandes. 17

18 2 Influence des groupes d individus Dans cette partie, nous allons d abord créer trois groupes d individus avec des effectifs relativement proches. Ces trois groupes sont obtenus de manière aléatoire. Leur caractère artificiel doit nous aider à étudier l influence de tels groupes sur la prédiction d appartenance à une classe à partir des données spectrales. Nous générons trois groupes à l aide d une méthode de nuées dynamiques : la méthode des k-means. Notés 1, 2 et 3, ces groupes d individus sont d effectifs 86, 92 et 37 respectivement. On construit un tableau à 3 colonnes, donnant pour chaque individu l indicatrice d appartence à son groupe. On l appelle tableau disjonctif complet. 2.1 ACP des données et visualisations des groupes Figure 24 ACP du tableau avec indication d appartenance On représente la cartographie des individus sur les deux premières composantes d une ACP sur les données spectrales. On voit très bien que la discrimination des groupes est faite sur le premier axe factoriel qui explique 98% de la variance du tableau original. 18

19 2.2 Méthode PLS2 pour prédiction d appartenance à un groupe On souhaite mettre en place un modèle de prédiction d appertenance à l un des trois groupes. Pour cela, on réalise une régression PLS2 des données spectrales sur le tableau disjonctif complet. On en tire ainsi 10 composantes, qu on utilisera dans une analyse factorielle discriminante pour classer les individus. Comme dans la partie précédente, on utilise les 129 premiers individus pour apprentissage et les 86 derniers pour test. La première étape consiste donc en la réalisation d une PLS2 sur nos données d apprentissage. Figure 25 Evolution de l inertie expliquée en fonction du nombre de variables latentes et 10 premiers vecteurs des loadings Le choix de ne considérer que seulement 10 composantes pour la suite est légitimé par le pourcentage d inertie expliquée, très proche de 100 à partir de 5 composantes AFD des composantes PLS2 Nous mettons en place maintenant une analyse factorielle discriminante sur les composants PLS2. Cette méthode consiste en la recherche de variables latentes qui discriminent le mieux les groupes. Ces variables sont des combinaisons linéaires des 10 composantes PLS2 sélectionnées. Comme il y a trois groupes à classer, le nombre de variables latentes obtenues par AFD est 2, on les note LD1 et LD2. Figure 26 Représentation des individus d apprentissage dans le plan formé par les deux variables discriminantes La première variable discriminante (LD1) sépare plutôt bien les groupes 1 et 3. Le deuxième groupe a plus de mal à être bien discriminé bien que l axe LD2 semble le séparer des deux autres groupes. 19

20 Poids des composantes dans LD1 et LD2 LD1 LD2 Comp Comp Comp Comp Comp Comp Comp Comp Comp Comp On utilise maintenant une règle d affectation afin de classer nos 129 individus dans un groupe. On compare le groupe prédit avec le vrai groupe à l aide d une matrice de confusion. groupe prediction La méthode de classement nous donne un taux de bonnes prédictions d environ 74%. On remarque que seulement la moitié des individus du groupe 3 sont bien classés et que 14 individus du groupe 2 ont été classé dans le premier groupe Application à l échantillon de validation Nous devons vérifier la qualité d un telle règle de classement en s appuyant sur nos données test. On récupère la matrice des dix vecteurs des loadings de la PLS2 et on fait le produit matriciel avec les données spectrales de l échantillon test. On obtient alors une matrice avec les 10 composantes de la PLS2 calculées sur le deuxième échantillon. Comme LD1 et LD2 sont connues, on peut calculer les projections des individus de validations sur ces variables discriminantes. Figure 27 Représentation des individus de validation dans le plan formé par les deux variables discriminantes Graphiquement, la discrimination des 3 groupes semble peu évidente. On réutilise notre règle de classement pour prédire le groupe de chacune des individus de l échantillon test : 20

21 groupe prediction Les prédictions obtenues sont très mauvaises. La méthode de classement n a pas réussi à classer un seul individu des groupes 1 et 2 dans son bon groupe. Tout le groupe 3 est bien classé, mais la méthode a fait plus de 80% d erreur de prédictions. Un modèle de classement basé sur un calcul de composantes PLS2 ne semble pas être adapté à la prévision. Le taux d erreur de prédiction (26%) obtenu par Analyse Factorielle Discriminante sur les données d apprentissage semble correct mais le passage à l échantillon de validation ne donne pas les résultats escomptés (plus de 80% d individus mal classés). 21

HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES

HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES 105 HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES 1. Introduction En statistiques il arrive fréquemment que les individus soient décrits par un grand nombre de caractères. : voitures décrites par leur

Plus en détail

Distance et classification. Cours 4: Traitement du signal et reconnaissance de forme

Distance et classification. Cours 4: Traitement du signal et reconnaissance de forme Distance et classification Cours 4: Traitement du signal et reconnaissance de forme Plan Introduction Pré-traitement Segmentation d images Morphologie mathématique Extraction de caractéristiques Classification

Plus en détail

COURS DE DATA MINING 6 : MODELISATION NON-SUPERVISEE LES ANALYSES FACTORIELLES

COURS DE DATA MINING 6 : MODELISATION NON-SUPERVISEE LES ANALYSES FACTORIELLES COURS DE DATA MINING 6 : MODELISATION NON-SUPERVISEE LES ANALYSES FACTORIELLES EPF 4/ 5 ème année - Option Ingénierie d Affaires et de Projets - Finance Bertrand LIAUDET 6 : Modélisation non-supervisée

Plus en détail

Analyse des données et Data Mining

Analyse des données et Data Mining Analyse des données et Data Mining Analyse en composantes principales utc sy09 1 Objectif des méthodes factorielles Visualiser, traiter des données multidimensionnelles Problème difficile Information apportée

Plus en détail

PCA appliqué à la 2D et 3D Dernière mise à jour : avril 2011

PCA appliqué à la 2D et 3D Dernière mise à jour : avril 2011 Projet 2009 2010 Biométrie 3D PCA appliqué à la 2D et 3D Dernière mise à jour : avril 2011 Département : TIC Mots clés : Biométrie, Analyse d images, Vision, Caméra thermique, Caméra temps de vol, Détection

Plus en détail

Méthodes de projection

Méthodes de projection Chapitre 11 Méthodes de projection Contenu 11.1 Analyse en composantes principales........ 138 11.1.1 L Analyse en Composantes Principales........ 139 11.1.2 La (grande) famille des ACP............. 151

Plus en détail

Statistiques de groupe

Statistiques de groupe Système Méthodologique d Aide à la Réalisation de Tests Statistiques de groupe et analyse des questions de votre épreuve Une unité de soutien de l IFRES Université de Liège L analyse des statistiques de

Plus en détail

Analyse en composantes principales

Analyse en composantes principales Analyse en composantes principales Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire LITIS Analyse en composantes principales p. 1/18 Introduction Objectifs Soit {x i } i=1,,l

Plus en détail

Séance 2: Modèle Euclidien

Séance 2: Modèle Euclidien Généralités Métrique sur les INDIVIDUS Métrique sur les VARIABLES Inertie Analyse des individus Laboratoire de Statistique et Probabilités UMR 5583 CNRS-UPS www.lsp.ups-tlse.fr/gadat Généralités Métrique

Plus en détail

Les Réseaux de Neurones avec

Les Réseaux de Neurones avec Les Réseaux de Neurones avec Au cours des deux dernières décennies, l intérêt pour les réseaux de neurones s est accentué. Cela a commencé par les succès rencontrés par cette puissante technique dans beaucoup

Plus en détail

Une revue des méthodes de discrimination pour la spectrométrie PIR (centrée sur les méthodes linéaires) JM Roger. jean-michel.roger@cemagref.

Une revue des méthodes de discrimination pour la spectrométrie PIR (centrée sur les méthodes linéaires) JM Roger. jean-michel.roger@cemagref. Une revue des méthodes de discrimination pour la spectrométrie PIR (centrée sur les méthodes linéaires) JM Roger jean-michel.roger@cemagref.fr Plan Qu'est ce que la discrimination? Le modèle de l'analyse

Plus en détail

L analyse en composantes principales en pratique

L analyse en composantes principales en pratique L analyse en composantes principales en pratique Après avoir vu sa formalisation mathématique dans le module précédent, on s intéresse ici à l utilisation pratique de l ACP. 1 Objectifs L objectif de l

Plus en détail

Analyse en composantes principales Christine Decaestecker & Marco Saerens ULB & UCL

Analyse en composantes principales Christine Decaestecker & Marco Saerens ULB & UCL Analyse en composantes principales Christine Decaestecker & Marco Saerens ULB & UCL LINF 2275 Stat. explor. multidim. 1 A.C.P.: Analyse en Composantes Principales Analyse de la structure de la matrice

Plus en détail

1 FAITES CONNAISSANCE AVEC LA MÉTHODE DES PLANS D EXPÉRIENCES

1 FAITES CONNAISSANCE AVEC LA MÉTHODE DES PLANS D EXPÉRIENCES 1 FAITES CONNAISSANCE AVEC LA MÉTHODE DES PLANS D EXPÉRIENCES Si vous lisez ce livre c est que, probablement, vous faites des expériences et que vous cherchez à mieux les organiser. Vous cherchez surtout

Plus en détail

Chapitre 8: Inférence, échantillonnage et estimation

Chapitre 8: Inférence, échantillonnage et estimation Chapitre 8: Inférence, échantillonnage et estimation 1. Echantillonnage aléatoire simple 2. Inférence statistique 3. Estimation 4. Evaluation graphique de l adéquation d un modèle de distribution 1 L inférence

Plus en détail

Laboratoire 2 Extraction des caractéristiques

Laboratoire 2 Extraction des caractéristiques Laboratoire 2 Extraction des caractéristiques L objectif de l extraction et de la sélection de caractéristiques est d identifier les caractéristiques importantes pour la discrimination entre classes. Après

Plus en détail

1. Explorer, organiser et démontrer des propriétés géométriques en termes de longueurs et d angles. Découvrir et étudier des nombres irrationnels.

1. Explorer, organiser et démontrer des propriétés géométriques en termes de longueurs et d angles. Découvrir et étudier des nombres irrationnels. Compétences : math, 2 ème degré (pages 1 à 3) math, 3 ème degré (pages 4 à 8) 3 grands thèmes du cours à 4h sem (pages 9 à 11) 3 grands thèmes du cours à 2h sem (pages 12 à 14) (Seules les définitions

Plus en détail

Installation de la librairie VISP et création du projet

Installation de la librairie VISP et création du projet ESIR3-IN Travaux Pratiques VO 2012-2013 PREAMBULE Copier les données des TPs 1. créez un répertoire VO dans votre homedir cd ~/ mkdir VO cd VO 2. copier le dossier contenant toutes les données pour les

Plus en détail

Économétrie. Francesco Quatraro M1 EFM 2010/2011

Économétrie. Francesco Quatraro M1 EFM 2010/2011 Francesco Quatraro M1 EFM 2010/2011 1 La violation des hypothèses Le modèle des MCO considère que les hypothèses suivantes sont toutes respectées: H1: le modèle est linéaire en x i,t H2: les valeurs x

Plus en détail

I. LA VARIABILITE AU SEIN DES POPULATIONS

I. LA VARIABILITE AU SEIN DES POPULATIONS I. LA VARIABILITE AU SEIN DES POPULATIONS La notion de population recouvre un concept difficilement réductible à une définition unique. Au sens de la génétique, une population représente une entité de

Plus en détail

Statistiques Appliquées Rôle des femmes dans la société

Statistiques Appliquées Rôle des femmes dans la société Statistiques Appliquées Rôle des femmes dans la société Denis Schelling Semestre d automne 2012 Résumé A partir de données concernant le rôle des femmes dans la société, nous avons effectué une analyse

Plus en détail

GOUTTE. Analyse Statistique des Données Cours 4. Master 2 EID. LUISS, Libera Università Internazionale degli Studi Sociali

GOUTTE. Analyse Statistique des Données Cours 4. Master 2 EID. LUISS, Libera Università Internazionale degli Studi Sociali LUISS, Libera Università Internazionale degli Studi Sociali Université Paris 13 Laboratoire Analyse, Géométrie et Applications UMR 7539 GOUTTE Analyse Statistique des Données Cours 4 Master 2 EID goutte@math.univ-paris13.fr

Plus en détail

Boîte à outils mathématiques de base pour l infographie et l animation par ordinateur. Yves Chiricota, professeur DIM, UQAC Cours 8TRD147

Boîte à outils mathématiques de base pour l infographie et l animation par ordinateur. Yves Chiricota, professeur DIM, UQAC Cours 8TRD147 Boîte à outils mathématiques de base pour l infographie et l animation par ordinateur Yves Chiricota, professeur DIM, UQAC Cours 8TRD147 14 Janvier 2015 2 Il est impossible d envisager l étude des méthodes

Plus en détail

Choix de modèle en régression linéaire

Choix de modèle en régression linéaire Master pro Fouille de données Philippe Besse 1 Objectif Choix de modèle en régression linéaire La construction d un score d appétence sur les données bancaires correspond au choix et à l estimation d un

Plus en détail

L analyse Factorielle des correspondances. 1/ Préambule descriptif de l AFC

L analyse Factorielle des correspondances. 1/ Préambule descriptif de l AFC L analyse Factorielle des correspondances...2 1/ Préambule descriptif de l AFC...2 Exemples de types de données que l AFC peut aborder:...2 Quelques types de tableaux traités par l AFC...3 2/ Exercice

Plus en détail

Analyse des données - Logiciel R

Analyse des données - Logiciel R Université de Strasbourg Analyse des données Master de Sciences, Spécialité Statistique 2012/13 Master Actuariat Emmanuel Périnel Analyse des données - Logiciel R TP n 2. L Analyse en Composantes Principales

Plus en détail

TABLE DES MATIÈRES CHAPITRE 1 LA CONSTRUCTION D UN INSTRUMENT DE MESURE... 9. Avant-propos... 5 Sommaire... 7

TABLE DES MATIÈRES CHAPITRE 1 LA CONSTRUCTION D UN INSTRUMENT DE MESURE... 9. Avant-propos... 5 Sommaire... 7 TABLE DES MATIÈRES Avant-propos... 5 Sommaire... 7 CHAPITRE 1 LA CONSTRUCTION D UN INSTRUMENT DE MESURE... 9 1. Le processus de construction d un test... 9 2. La construction d un test d acquis scolaires...

Plus en détail

Méthodes de placement multidimensionnelles. Fabrice Rossi Télécom ParisTech

Méthodes de placement multidimensionnelles. Fabrice Rossi Télécom ParisTech Méthodes de placement multidimensionnelles Fabrice Rossi Télécom ParisTech Plan Introduction Analyse en composantes principales Modèle Qualité et interprétation Autres méthodes 2 / 27 F. Rossi Plan Introduction

Plus en détail

Analyse multivariée approfondie

Analyse multivariée approfondie Analyse multivariée approfondie Enseignants: NIANG N. et RUSSOLILLIO G. Maître de conférences Statistique Appliquée Laboratoire CEDRIC CNAM http://www.cnam.fr et d autres intervenants extérieurs au Cnam

Plus en détail

CH.2 CODES CORRECTEURS

CH.2 CODES CORRECTEURS CH.2 CODES CORRECTEURS 2.1 Le canal bruité 2.2 La distance de Hamming 2.3 Les codes linéaires 2.4 Les codes de Reed-Muller 2.5 Les codes circulaires 2.6 Le câblage des codes circulaires 2.7 Les performances

Plus en détail

Introduction à l analyse des données. Olivier Godechot

Introduction à l analyse des données. Olivier Godechot Introduction à l analyse des données Olivier Godechot Introduction. Les données statistiques : de très nombreuses variables. Aucune n est parfaite La perception d un phénomène appréhendée comme la combinaison

Plus en détail

Ch2 : Analyse en Composantes Principales (ACP)

Ch2 : Analyse en Composantes Principales (ACP) Ch2 : Analyse en Composantes Principales (ACP) A- Objectifs B- construction d un espace factoriel C- Les étapes d une ACP D- Interprétation E- Limites A- Objectifs On dispose d un tableau de données X.

Plus en détail

Chapitre 4 : RÉGRESSION

Chapitre 4 : RÉGRESSION Chapitre 4 : RÉGRESSION 4.3 Régression linéaire multiple 4.3.1 Equation et Estimation 4.3.2 Inférence 4.3.3 Coefficients de détermination 4.3.4 Spécifications Régression linéaire multiple 1 / 50 Chapitre

Plus en détail

1. Description du cours

1. Description du cours 1. Description du cours Ce cours porte sur la généralisation de notions mathématiques par le biais d expériences, d applications et du développement de structures formelles et abstraites. Au moyen de la

Plus en détail

SY09 Rapport TP4 : Analyse discriminante, régression logistique

SY09 Rapport TP4 : Analyse discriminante, régression logistique UNIVERSITÉ DE TECHNOLOGIE DE COMPIÈGNE SY09 Rapport TP4 : Analyse discriminante, régression logistique CUNI Frédéric 15 juin 2015 Objectifs du TP : Le but de ce TP est l application de l analyse discriminante

Plus en détail

Statistiques I: Séance informatique - Corrections

Statistiques I: Séance informatique - Corrections Haute Ecole de Gestion Automne 2010 Geneva School of Business Administration Mercredi 8h15-10h00 A. Caboussat, STAT I Statistiques I: Séance informatique - Corrections Part I Exercices sur Excel Problème

Plus en détail

Introduction sur l analyse en composantes principales (ACP)

Introduction sur l analyse en composantes principales (ACP) Introduction sur l analyse en composantes principales (CP) ) Introduction sur un exemple à 2 dimensions On veut représenter graphiquement les profils d élèves qui ont été notés sur 2 matières (Français

Plus en détail

Chapitre 1 GRAPHIQUES

Chapitre 1 GRAPHIQUES Statistique appliquée à la gestion et au marketing http://foucart.thierry.free.fr/statpc Chapitre 1 GRAPHIQUES On entend souvent qu un schéma vaut mieux qu un long discours. Effectivement, lorsque l on

Plus en détail

Ce TD se déroule sur 3 heures : vous devez donc consacrer environ 1 heure pour chacune des phases.

Ce TD se déroule sur 3 heures : vous devez donc consacrer environ 1 heure pour chacune des phases. TD Analyse de données pour l évaluation de l exposition Octobre 2014 1 Contexte et objectif du TD Pour réaliser une évaluation de l exposition d une population à un contaminant chimique, plusieurs sources

Plus en détail

Statistiques descriptives Variance et écart type

Statistiques descriptives Variance et écart type Statistiques descriptives Variance et écart type I) Rappel : la moyenne (caractéristique de position ) Définition Soit la série statistique définie dans le tableau suivant : Valeur... Effectif... Fréquences

Plus en détail

Les théorèmes de Gerschgorin et de Hadamard

Les théorèmes de Gerschgorin et de Hadamard Localisation des valeurs propres : Quelques propriétés sur les disques de Gerschgorin. Jean-Baptiste Campesato 22 septembre 29 Gerschgorin est parfois retranscrit en Gershgorin, Geršgorin, Hershhornou

Plus en détail

Rapport de TP Phytochimie : Spectrométrie d Absorption Atomique (SAA)

Rapport de TP Phytochimie : Spectrométrie d Absorption Atomique (SAA) Rapport de TP Phytochimie : Spectrométrie d Absorption Atomique (SAA) Di Pascoli Thomas Mouton Julia (M1 S2 VRV) I) Introduction L eau minérale Contrex est connue pour être riche en minéraux, notamment

Plus en détail

Extraction d informations stratégiques par Analyse en Composantes Principales

Extraction d informations stratégiques par Analyse en Composantes Principales Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction

Plus en détail

Didacticiel - Études de cas. Utiliser la validation croisée pour l évaluation des arbres de décision avec R, Knime et RapidMiner.

Didacticiel - Études de cas. Utiliser la validation croisée pour l évaluation des arbres de décision avec R, Knime et RapidMiner. 1 Objectif Utiliser la validation croisée pour l évaluation des arbres de décision avec R, Knime et RapidMiner. Ce didacticiel reprend un de nos anciens articles consacrés à la mise en œuvre de la validation

Plus en détail

Initiation Access 2003

Initiation Access 2003 Initiation Access 2003 Sommaire Introduction...3 1. Création d une base...3 1.1. Modélisation...3 1.2. Création de la base...4 2. Les tables...5 2.1. Création d'une table en mode Création...5 2.2. Les

Plus en détail

Méthode des moindres carrés

Méthode des moindres carrés Chapitre 5 Méthode des moindres carrés Une situation courante en sciences biologiques est d avoir à sa disposition deux ensembles de données de taille n, {y 1,y 2,...,y n } et {x 1,x 2,...,x n }, obtenus

Plus en détail

Analyse en Composantes Principales avec XLSTAT

Analyse en Composantes Principales avec XLSTAT Analyse en Composantes Principales avec XLSTAT Une feuille Excel contenant à la fois les données et les résultats peut-être téléchargée en cliquant ici. Les données proviennent du US Census Bureau (le

Plus en détail

Cours de Statistiques

Cours de Statistiques Cours de Statistiques Romain Raveaux 1 1 Laboratoire L3I Université de La Rochelle romain.raveaux01 at univ-lr.fr Octobre 24-11, 2008 1 / 35 Sommaire 1 Quelques Rappels 2 numériques Relations entre deux

Plus en détail

Comment calculer la précision des estimateurs composites d Esane

Comment calculer la précision des estimateurs composites d Esane Comment calculer la précision des estimateurs composites d Esane Thomas Deroyon Insee - 18 Bd Adolphe Pinard Paris, thomas.deroyon@insee.fr Résumé. Les statistiques structurelles d entreprise permettent

Plus en détail

Le Saux Loïc Tanguy Brewal. Enquête d opinion sur la dégradation de la qualité de la télévision française dans le temps

Le Saux Loïc Tanguy Brewal. Enquête d opinion sur la dégradation de la qualité de la télévision française dans le temps Le Saux Loïc Tanguy Brewal Enquête d opinion sur la dégradation de la qualité de la télévision française dans le temps Traitement des enquêtes M1 ISC 2007/2008 Sommaire Introduction... 3 I ANALYSE DESCRIPTIVE

Plus en détail

Session 1 Introduction

Session 1 Introduction (bio) Session 1 Septembre 8 2014 1/26 Sommaire (bio) 1 (bio) 2 3 4 2/26 (bio) Comme la population qui nous intéresse est habituellement trop grande pour être étudiée directement, seulement un petit nombre

Plus en détail

LE TOURISME EN MILIEU EDUCATIF, VECTEUR DE MODIFICATION DES REPRESENTATIONS SPATIALES DES ENFANTS.

LE TOURISME EN MILIEU EDUCATIF, VECTEUR DE MODIFICATION DES REPRESENTATIONS SPATIALES DES ENFANTS. CO-276 LE TOURISME EN MILIEU EDUCATIF, VECTEUR DE MODIFICATION DES REPRESENTATIONS SPATIALES DES ENFANTS. BOGACZ K. Université Lyon 2, LYON, FRANCE INTRODUCTION Dans cette recherche nous questionnons les

Plus en détail

Fiche PanaMaths Introduction au tracé de courbes avec Scilab

Fiche PanaMaths Introduction au tracé de courbes avec Scilab Fiche PanaMaths Introduction au tracé de courbes avec Scilab Introduction Ce document présuppose un certain niveau de connaissance du logiciel Scilab de la part du lecteur (de la lectrice) : calcul matriciel,

Plus en détail

STAGE. «Offre modulaire - Recueillir et analyser les besoins et attentes des usagers - Module 4 - L'analyse experte des données statistiques»

STAGE. «Offre modulaire - Recueillir et analyser les besoins et attentes des usagers - Module 4 - L'analyse experte des données statistiques» STAGE «Offre modulaire - Recueillir et analyser les besoins et attentes des usagers - Module 4 - L'analyse experte des données statistiques» PROGRAMME DETAILLE Intervenant : PARIS nicolas Cabinet : OPTIMA

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

DIU Infirmières de Santé au Travail - IDF. Service Central de Santé au Travail de l AP-HP PLAN DE COURS

DIU Infirmières de Santé au Travail - IDF. Service Central de Santé au Travail de l AP-HP PLAN DE COURS DIU Infirmières de Santé au Travail - IDF Faculté de Médecine Paris VII - Denis Diderot Mardi 7 juin 2016 STATISTIQUES EN SANTE AU TRAVAIL : NOTIONS ESSENTIELLES Service Central de Santé au Travail de

Plus en détail

CHAPITRE 1 La nature de l économétrie et la structure des données économiques... 25

CHAPITRE 1 La nature de l économétrie et la structure des données économiques... 25 TABLE DES MATIÈRES Sommaire... 5 Avant- propos... 9 Remerciements... 19 À propos de l auteur... 23 CHAPITRE 1 La nature de l économétrie et la structure des données économiques... 25 1.1 Qu est- ce que

Plus en détail

MATHÉMATIQUES ET SCIENCES HUMAINES

MATHÉMATIQUES ET SCIENCES HUMAINES MATHÉMATIQUES ET SCIENCES HUMAINES M. C. WEISS Variations pédagogiques sur le thème des échantillons systématiques Mathématiques et sciences humaines, tome 102 (1988), p. 39-45.

Plus en détail

Erik PERNOD Calcul Scientifique 3 ème Année RESEAUX DE NEURONES

Erik PERNOD Calcul Scientifique 3 ème Année RESEAUX DE NEURONES Erik PERNOD Calcul Scientifique 3 ème Année RESEAUX DE NEURONES 1 TABLE DES MATIERES TABLE DES MATIERES... 2 I PERCEPTRON SIMPLE... 3 I.1 Introduction... 3 I.2 Algorithme... 3 I.3 Résultats... 4 1er exemple

Plus en détail

Chapitre 3 Dénombrement et représentation d un caractère continu. Lætitia Perrier Bruslé Cours de statistique descriptive sous Excel

Chapitre 3 Dénombrement et représentation d un caractère continu. Lætitia Perrier Bruslé Cours de statistique descriptive sous Excel Chapitre 3 Dénombrement et représentation d un caractère continu Lætitia Perrier Bruslé Cours de statistique descriptive sous Excel Introduction Un caractère quantitatif est continu si ses modalités possibles

Plus en détail

Analyse discriminante

Analyse discriminante Analyse discriminante Christine Decaestecker & Marco Saerens ULB & UCL LINF2275 1 Analyse Discriminante Particularités: 2 formes/utilisations complémentaires: méthode factorielle: description "géométrique"

Plus en détail

par Jean-François Deslandes

par Jean-François Deslandes GUIDE EXCEL POUR LA STATISTIQUE par Jean-François Deslandes Automne 2000 2 Table des matières RAPPORT DE TABLEAU CROISÉ DYNAMIQUE 4 CONSTRUCTION D'UN TABLEAU DE FRÉQUENCE POUR UNE VARIABLE UNIQUE 4 DISTRIBUTION

Plus en détail

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. Solution des exercices d algèbre linéaire

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. Solution des exercices d algèbre linéaire UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 3 4 Master d économie Cours de M. Desgraupes MATHS/STATS Document : Solution des exercices d algèbre linéaire Table des matières

Plus en détail

Analyse coût-effacité : Aide au dimensionnement d un service lit-porte ou d un pool d infirmières

Analyse coût-effacité : Aide au dimensionnement d un service lit-porte ou d un pool d infirmières efficience Analyse coût-effacité : Aide au dimensionnement d un service lit-porte ou d un pool d infirmières L activité hospitalière présente la particularité d être à la fois non stockable et de répondre

Plus en détail

Algorithmes de descente par blocs pour l apprentissage creux

Algorithmes de descente par blocs pour l apprentissage creux Algorithmes de descente par blocs pour l apprentissage creux Mehdi Meghzifene 11//211 1 Table des matières 1 Introduction 3 1.1 Principe......................................... 3 2 Résolution 4 2.1 Minimisation

Plus en détail

LES TRACES ECRITES ORGANISATION ET GESTION DE DONNEES. CYCLE 3 ET CYCLE D'ADAPTATION (6 ème )

LES TRACES ECRITES ORGANISATION ET GESTION DE DONNEES. CYCLE 3 ET CYCLE D'ADAPTATION (6 ème ) LES TRACES ECRITES ORGANISATION ET GESTION DE DONNEES CYCLE 3 ET CYCLE D'ADAPTATION (6 ème ) IA 58 - Groupe départemental science Traces écrites «Organisation et gestion de données» cycle 3 et cycle d

Plus en détail

Liste complète des sujets d oral (SESSION 2004) servant pour 2004-2005. Leçons d Algèbre et de Géométrie

Liste complète des sujets d oral (SESSION 2004) servant pour 2004-2005. Leçons d Algèbre et de Géométrie http://perso.wanadoo.fr/gilles.costantini/agreg.htm Liste complète des sujets d oral (SESSION 2004) servant pour 2004-2005 Légende : En italique : leçons dont le libellé a changé ou évolué par rapport

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Lycée Fénelon Sainte-Marie Préparation Science-Po/Prépa HEC

Lycée Fénelon Sainte-Marie Préparation Science-Po/Prépa HEC Lycée Fénelon Sainte-Marie Préparation Science-Po/Prépa HEC Dénombrement et probabilités Version du juillet 05 Enoncés Exercice - YouTube Sur YouTube, les vidéos sont identifiées à l aide d une chaîne

Plus en détail

Analyse de deux séquences d apprentissage 1

Analyse de deux séquences d apprentissage 1 hs.c om Ce fichier, corrigé du fichier D22, aborde le vaste domaine du traitement de l information, de la gestion de données et des représentations couramment utilisées. Nous vous proposons deux séquences

Plus en détail

Pour utiliser les menus statistiques fournis par excel

Pour utiliser les menus statistiques fournis par excel Pour utiliser les menus statistiques fournis par excel Préalable: Dans Outils/Macro complémentaires, cocher si ce n'est pas déjà fait "utilitaires d'analyse": Partie 1 Analyse de variance A] Plan S n

Plus en détail

GUIDE DU DATA MINER. Classification - Typologies. Data Management, Data Mining, Text Mining

GUIDE DU DATA MINER. Classification - Typologies. Data Management, Data Mining, Text Mining GUIDE DU DATA MINER Classification - Typologies Data Management, Data Mining, Text Mining 1 Guide du Data Miner Classification - Typologies Le logiciel décrit dans le manuel est diffusé dans le cadre d

Plus en détail

Ministère de la Jeunesse et des Sports Institut Royal de Formation des Cadres Département des Sciences de la Vie. A. Arfaoui

Ministère de la Jeunesse et des Sports Institut Royal de Formation des Cadres Département des Sciences de la Vie. A. Arfaoui Ministère de la Jeunesse et des Sports Institut Royal de Formation des Cadres Département des Sciences de la Vie A. Arfaoui PLA Définitions Paramètres marginaux Covariance Coefficient de Corrélation Coefficient

Plus en détail

Quelques éléments d algèbre pour l analyse de

Quelques éléments d algèbre pour l analyse de Fiche TD avec le logiciel : tdr80 Quelques éléments d algèbre pour l analyse de données A.B. Dufour, D. Chessel et M. Royer L algèbre matricielle est fondamentale dans la compréhension de la théorie liée

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Plan du cours Analyse en Composantes Principales Introduction Les données Leurs représentations La méthode Modèle Interprétation statistique Espace principal Composantes Principales Représentations Graphiques

Plus en détail

Bases du Modèle Linéaire

Bases du Modèle Linéaire AgroParisTech Bases du Modèle Linéaire J.J. Daudin, E. Lebarbier, C. Vuillet Table des matières 1 Introduction 3 2 Estimation des paramètres 5 2.1 Estimation des paramètres de l espérance......................

Plus en détail

Éléments de correction du TD

Éléments de correction du TD Septembre 011 Éléments de correction du TD Stéphane Blin Introduction Je donne ici les éléments de correction de la question - de la marche de potentiel, ainsi que les éléments de corrections pour les

Plus en détail

T.P. 8 - Exercice 1 Khi-Carré d ajustement (Corrigé)

T.P. 8 - Exercice 1 Khi-Carré d ajustement (Corrigé) T.P. 8 - Exercice 1 Khi-Carré d ajustement (Corrigé) Connaissances préalables : Buts spécifiques : Outils nécessaires : Consignes générales : Distribution de fréquences, proportions. Test d ajustement.

Plus en détail

Didacticiel Études de cas

Didacticiel Études de cas 1 Objectif Déploiement des modèles prédictifs avec R. L industrialisation est l étape ultime du data mining. Dans le cadre prédictif, l objectif est de classer un individu à partir de sa description. Pour

Plus en détail

L ESTIMATION DES ÉCARTS SALARIAUX

L ESTIMATION DES ÉCARTS SALARIAUX Novembre 2005 L ESTIMATION DES ÉCARTS SALARIAUX (articles 60 à 68) La Loi sur l équité salariale vise à corriger les écarts salariaux dus à la discrimination systémique fondée sur le sexe à l égard des

Plus en détail

Analyse de données. [Tapez le sous-titre du document] ANALYSE DE DONNEES 2011 2012. ANALYSE DE DONNEES Page 1 LICENCE 3 SCIENCES ECONOMIQUES

Analyse de données. [Tapez le sous-titre du document] ANALYSE DE DONNEES 2011 2012. ANALYSE DE DONNEES Page 1 LICENCE 3 SCIENCES ECONOMIQUES 2011 2012 ANALYSE DE DONNEES 2011 2012 LICENCE 3 SCIENCES ECONOMIQUES COURS DE M. THIERRY BLAYAC Analyse de données [Tapez le sous-titre du document] ANALYSE DE DONNEES Page 1 H34VEN Cours pour Licence

Plus en détail

Mini-Projet de Prolog : Solver de Sudoku

Mini-Projet de Prolog : Solver de Sudoku UNIVERSITE François Rabelais TOURS Polytech Tours-Département Informatique 64, Avenue Jean Portalis 37200 TOURS Mini-Projet de Prolog : Solver de Sudoku Encadré par : Présenté par : M. J-L Bouquard Florent

Plus en détail

Résolution de systèmes linéaires : Méthodes directes. Polytech Paris-UPMC. - p. 1/51

Résolution de systèmes linéaires : Méthodes directes. Polytech Paris-UPMC. - p. 1/51 Résolution de systèmes linéaires : Méthodes directes Polytech Paris-UPMC - p. /5 Rappels mathématiques s Propriétés - p. 2/5 Rappels mathématiques Soit à résoudre le système linéaire Ax = b. Rappels mathématiques

Plus en détail

L analyse des données statistiques

L analyse des données statistiques L analyse des données statistiques Public : Les cadres devant analyser des données quantitatives et qualitatives Objectif : Apprendre, en utilisant principalement Excel : - à traiter des données provenant

Plus en détail

Etude expérimentale sur les interférences lumineuses

Etude expérimentale sur les interférences lumineuses Etude expérimentale sur les interférences lumineuses La lumière est une onde électromagnétique. Deux ondes sont à même d interagir en se sommant. Dans certains cas particuliers, notamment pour deux rayons

Plus en détail

Chapitre 2. Caractéristiques des distributions à une variable quantitative

Chapitre 2. Caractéristiques des distributions à une variable quantitative Chapitre 2. Caractéristiques des distributions à une variable quantitative Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University

Plus en détail

Angle de champ. Définition et méthodes de calcul

Angle de champ. Définition et méthodes de calcul Angle de champ Définition et méthodes de calcul Angle de champ Les techniques de photographie panoramique et haute définition consistent à assembler un grand nombre de photos afin de couvrir une plus grande

Plus en détail

Classe de 3ème. Effectif partiel n Effectif total N

Classe de 3ème. Effectif partiel n Effectif total N Classe de 3ème Chapitre 2 Statistiques. 1. Quelques rappels. Une série statistique est composée de valeurs. Le nombre de fois où une valeur est répétée s'appelle l'effectif partiel de cette valeur. La

Plus en détail

CODES CORRECTEURS D'ERREURS

CODES CORRECTEURS D'ERREURS CODES CORRECTEURS D'ERREURS Marc URO TABLE DES MATIÈRES DÉTECTION ET CORRECTION D'ERREURS... 6 CAS D'UN CANAL SANS SYMBOLE D'EFFACEMENT...6 CAS D'UN CANAL AVEC SYMBOLE D'EFFACEMENT...7 GÉNÉRATION ET DÉTECTION

Plus en détail

TIMES SERIES DATA MINING: NOUVELLES PERSPECTIVES

TIMES SERIES DATA MINING: NOUVELLES PERSPECTIVES TIMES SERIES DATA MINING: NOUVELLES PERSPECTIVES La version 12.1 de SAS Enterprise Miner voit l arrivée en production de la famille des nœuds de Time Series Data Mining (TSDM). Il s agit d une réelle innovation

Plus en détail

FICHE N 13 : SUIVRE ET COMPARER DES CARRIÈRES PROFESSIONNELLES

FICHE N 13 : SUIVRE ET COMPARER DES CARRIÈRES PROFESSIONNELLES FICHE N 13 : SUIVRE ET COMPARER DES CARRIÈRES PROFESSIONNELLES De quoi s agit-il? La mesure des risques discriminatoires dans les carrières professionnelles au sein d une organisation présente des difficultés.

Plus en détail

Reconnaissance des formes

Reconnaissance des formes Reconnaissance des formes Discrimination A. Belaïd LORIA - Nancy Discrimination linéaire Notion d hyperplan Discrimination linéaire Principe Une forme x R d (vecteur forme) Rôle de la Trouver D : R d x

Plus en détail

Séries chronologiques

Séries chronologiques 31-1-2005 Séries chronologiques Nino Silverio Support de cours provisoire pour l unité de valeur Mathématiques et statistiques destiné aux classes du BTS Comptabilité-Gestion de l ECG. Introduction DÉFINITION

Plus en détail

T.S.A T E S T S E N I O R A T T I T U D E S. Un test de personnalité spécifiquement conçu pour le recrutement et le bilan professionnel des seniors

T.S.A T E S T S E N I O R A T T I T U D E S. Un test de personnalité spécifiquement conçu pour le recrutement et le bilan professionnel des seniors T.S.A T E S T S E N I O R A T T I T U D E S Un test de personnalité spécifiquement conçu pour le recrutement et le bilan professionnel des seniors Une analyse fonctionnelle de l image de soi et des compétences

Plus en détail

Introduction aux sondages

Introduction aux sondages Service Universitaire d Enseignement à Distance Licence AES - Troisième année Introduction aux sondages Université Rennes 2 Place du Recteur H. le Moal CS 24307-35043 Rennes Tel : 02 99 14 18 21 Mel :

Plus en détail

L estimation du modèle a priori Décompter les ddl

L estimation du modèle a priori Décompter les ddl L estimation du modèle a priori Décompter les ddl ------------ François Cheptou Juin 004 Dans le programme de mathématiques BTS Chimiste, trois modèles a priori sont étudiés. ) = µ (modèle simple) ) =

Plus en détail

Développement de systèmes plus intelligents : Etude technique de systèmes d aide à des programmes écologiques basés sur la modélisation.

Développement de systèmes plus intelligents : Etude technique de systèmes d aide à des programmes écologiques basés sur la modélisation. Développement axé sur la modélisation Livre blanc Juin 2009 Développement de systèmes plus intelligents : Etude technique de systèmes d aide à des programmes écologiques basés sur la modélisation. Dr.

Plus en détail

SEMIN. Analyses factorielles avec R. Elisabeth MORAND INED

SEMIN. Analyses factorielles avec R. Elisabeth MORAND INED SEMIN Analyses factorielles avec R Elisabeth MORAND INED SEMIN R du MNHN 10 Décembre 2009 E. Morand 10 Décembre 2009 INED 1 / 42 Part I Analyse en Composantes Principales : ACP 2 / 42 Sommaire 1 Introduction

Plus en détail

Statistiques descriptives (1/2)

Statistiques descriptives (1/2) Statistiques descriptives (1/2) Anita Burgun 2011-2012 http://www.med.univ-rennes1.fr Introduction! Statistique: méthode scientifique qui consiste à réunir des données chiffrées sur des ensembles d individus

Plus en détail