Méthodes De Couplage De Deux K-Tableaux Et Collections De Graphiques

Documents pareils
Mémo d utilisation de ADE-4

Initiation à l analyse en composantes principales

Individus et informations supplémentaires

Extraction d information des bases de séquences biologiques avec R

«Poursuivre au-delà de BEEST : une approche fonctionnelle basée sur les traits de vie des espèces en relation avec l habitat».

Traits biologiques : variables ou K-tableaux?

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge!

Optimiser ses graphiques avec R

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge!

Création de fonds de cartes statiques et dynamiques avec R et Google Maps

ISFA 2 année Les questions sont en grande partie indépendantes. Merci d utiliser l espace imparti pour vos réponses.

Gestion des données avec R

Avant-après, amont-aval : les couples de tableaux totalement appariés

Aide-mémoire de statistique appliquée à la biologie

Analyse des correspondances avec colonne de référence

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

Modélisation multi-agents - Agents réactifs

Analyses multivariées avec R Commander (via le package FactoMineR) Qu est ce que R? Introduction à R Qu est ce que R?

Lire ; Compter ; Tester... avec R

Analyse en Composantes Principales

La classification automatique de données quantitatives

Logiciel XLSTAT version rue Damrémont PARIS

UNIVERSITE D ANTANANARIVO FACULTE DES SCIENCES DEPARTEMENT DE BIOLOGIE ET ECOLOGIE VEGETALES

Objectif. Cette formation doit permettre au client d être autonome dans la création de ses rapports avancés en utilisant la fonctionnalité Excel +.

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

La place de SAS dans l'informatique décisionnelle

STAGE IREM 0- Premiers pas en Python

SAS de base : gestion des données et procédures élémentaires

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

Journée SITG, Genève 15 octobre Nicolas Lachance-Bernard M.ATDR Doctorant, Laboratoire de systèmes d information géographique

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Ingénierie Dirigée par les Modèles. Editeurs de modèles. (Eclipse Modeling Tools) Jean-Philippe Babau

Exemples d Analyses de Variance avec R

Statistique Descriptive Multidimensionnelle. (pour les nuls)

Plan du cours Cours théoriques. 29 septembre 2014

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

Exercice 6 Associer chaque expression de gauche à sa forme réduite (à droite) :

MOHAMAD Rihab 4 rue de la Bergeonnerie Joué-Lès-Tours, FRANCE 33 (0) dib305@hotmail.com

ESIEA PARIS

MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE UNIVERSITE ABDELHAMID IBN BADIS MOSTAGANEM TUNISIE MAROC ALGERIE

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année

La corrélation entre deux matrices de distances euclidiennes

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications

1 Complément sur la projection du nuage des individus

ALGORITHME GENETIQUE ET MODELE DE SIMULATION POUR L'ORDONNANCEMENT D'UN ATELIER DISCONTINU DE CHIMIE

Analyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin

TerrOïko : JEU en collaboration avec la SEEM

Distribution Uniforme Probabilité de Laplace Dénombrements Les Paris. Chapitre 2 Le calcul des probabilités

Jean-Nicolas Piotrowski, Dirigeant Fondateur d ITrust

Croissance et vieillissement cellulaires Docteur COSSON Pierre Nb réponses = 81 sur 87. Résultats des questions prédéfinies

Analyse des durées de vie avec le logiciel R

Introduction aux Statistiques et à l utilisation du logiciel R

MANIPULATION ET VISUALISATION DE GROSSES BASES DE DONNÉES AVEC R

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Exo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2.

Cours d Analyse. Fonctions de plusieurs variables

Vérification audiovisuelle de l identité

ATELIER IMAGEJ. Différentes applications vous sont proposées pour apprendre à utiliser quelques fonctions d ImageJ :

Imputation du salaire d ego dans TeO

Cours 1. I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs

ACP Voitures 1- Méthode

Séquence 6. Mais ces espèces pour autant ne sont pas identiques et parfois d ailleurs ne se ressemblent pas vraiment.

1 Importer et modifier des données avec R Commander

Fonctions de deux variables. Mai 2011

Extraction d informations stratégiques par Analyse en Composantes Principales

Etude des propriétés empiriques du lasso par simulations

Fondation GoodPlanet Programme Action Carbone. Présentation des projets de compensation carbone

Introduction au datamining

Big data et sciences du Vivant L'exemple du séquençage haut débit

Langage Perl. Introduction & Retour d'expérience. Journée du 30/11/ S. Gallina - GEPV - 1/42

Architecture de réseau de senseurs : monitoring environnemental et écosystèmes forestiers

5. Matériaux en contact avec l eau

:SPECIMEN SPECIMEN SUPPLÉMENT AU DIPLÔME (ANNEXE DESCRIPTIVE AU DIPLÔME)

NOS SAVOIRS FAIRE. Bureau d étude Décoration, informatique et électronique. Production Atelier bois/métal/peinture, informatique, vidéo et infographie

Liste des notes techniques... xxi Liste des encadrés... xxiii Préface à l édition internationale... xxv Préface à l édition francophone...

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

CHAPITRE VI : HYBRIDATION GEOMETRIE DES MOLECULES

CM2B Ste Marthe NOMBRES CROISES

Cycle de formation certifiante Sphinx

Introduction à l'analyse multivariée (factorielle) sous R. Stéphane CHAMPELY

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Microsoft Excel : tables de données

Protocoles pour le suivi des pontes de tortues marines dans le cadre de Protomac. Professeur Marc Girondot

Cours de Master Recherche

Introduction à R. Florence Yerly. Dept. de mathématiques, Université de Fribourg (CH) SP 2011

Représentation d un entier en base b

Localisation des fonctions

TRAVAUX DE RECHERCHE DANS LE

Mesures Agro-Environnementales

Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires

R, Bonnes pratiques. Christophe Genolini

L export de SAS vers Excel expliqué à ma fille

Exercices Corrigés Premières notions sur les espaces vectoriels

Déroulement. Evaluation. Préambule. Définition. Définition. Algorithmes et structures de données 28/09/2009

Polynômes à plusieurs variables. Résultant


Fiche TD avec le logiciel. Courbes de niveau. D. Chessel

FONDEMENTS MATHÉMATIQUES 12 E ANNÉE. Mathématiques financières

Transcription:

Méthodes De Couplage De Deux K-Tableaux Et Collections De Graphiques J. Thioulouse, A. Siberchicot, A. Julien-Laferrière, A.B. Dufour, S. Dray jean.thioulouse@univ-lyon1.fr Biométrie & Biologie Evolutive - CNRS - Université Lyon 1 June 26, 2013 J. Thioulouse, A. Siberchicot,A. Julien-Laferrière, A.B. Couplage Dufour, De S. Deux Dray K-Tableaux (jean.thioulouse@univ-lyon1.frbiométrie June 26, 2013 & Biologie1 Evoluti / 19

Table of Contents 1 Introduction - Analyse de données écologiques avec ade4 2 Sorties des analyses - Coordonnées factorielles 3 Représentations graphiques - Utilisation d adegraphics 4 Conclusion J. Thioulouse, A. Siberchicot,A. Julien-Laferrière, A.B. Couplage Dufour, De S. Deux Dray K-Tableaux (jean.thioulouse@univ-lyon1.frbiométrie June 26, 2013 & Biologie2 Evoluti / 19

Introduction Méthodes de couplage de deux K-tableaux Collections de graphiques avec le package adegraphics Rappels sur les méthodes d analyse de données écologiques avec ade4 Les méthodes d analyse d un tableau Les méthodes d analyse d un couple de tableaux Les méthodes d analyse de K-tableaux Les méthodes d analyse de K couples de tableaux (deux K-tableaux) J. Thioulouse, A. Siberchicot,A. Julien-Laferrière, A.B. Couplage Dufour, De S. Deux Dray K-Tableaux (jean.thioulouse@univ-lyon1.frbiométrie June 26, 2013 & Biologie3 Evoluti / 19

Introduction Les méthodes d analyse d un tableau ACP, AFC, ACM: une dizaine dans ade4 (dudi.xxx) En écologie: tableaux de dénombrements d espèces Abondances, % recouvrement, présence/absence, traits spécifiques Données génétiques: micro-satellites, puces ADN, séquençage Variables environnementales (milieu), données satellites (land cover) Objectifs: description de structures Typologie d individus (lignes = sites) Corrélations entre variables (colonnes = espèces / variables) J. Thioulouse, A. Siberchicot,A. Julien-Laferrière, A.B. Couplage Dufour, De S. Deux Dray K-Tableaux (jean.thioulouse@univ-lyon1.frbiométrie June 26, 2013 & Biologie4 Evoluti / 19

Introduction Les méthodes d analyse d un couple de tableaux ACC, RDA, COIA, RLQ, pcaiv, etc. huit fonctions dans ade4 Un tableau de données d espèces Un tableau de données de variables du milieu (mêmes sites) Plusieurs familles de méthodes: Direct / indirect gradient analysis Analyses sous contraintes (combinaisons linéaires des var. milieu) Analyse de coinertie (covariances croisées) Objectifs: description des relations entre les deux tableaux Prédiction d un tableau par l autre Analyse de co-structures (typologies) Test statistique (permutations) J. Thioulouse, A. Siberchicot,A. Julien-Laferrière, A.B. Couplage Dufour, De S. Deux Dray K-Tableaux (jean.thioulouse@univ-lyon1.frbiométrie June 26, 2013 & Biologie5 Evoluti / 19

Introduction Les méthodes d analyse de K-tableaux STATIS, ATP, AFC Foucart Une série de tableaux de données En écologie: un tableau espèces x sites répété au cours du temps Trois étapes: Interstructure / Compromis / Intrastructure Interstructure: importance de chaque tableau, coeff. CL compromis Compromis: analyse d un tableau moyen pondéré Intrastructure: projection des lignes et des colonnes de tous les tableaux initiaux dans l analyse du compromis Objectifs: analyse de la stabilité des structures Typologie des tableaux (interstructure) Structures stables: tableau moyen (compromis) Description des modifications de structures (intrastructure) J. Thioulouse, A. Siberchicot,A. Julien-Laferrière, A.B. Couplage Dufour, De S. Deux Dray K-Tableaux (jean.thioulouse@univ-lyon1.frbiométrie June 26, 2013 & Biologie6 Evoluti / 19

Introduction Les méthodes d analyse de K couples de tableaux BGCOIA (coinertie inter-classes) STATICO, COSTATIS (ATP / coinertie) DO-ACT (double STATIS, Vivien & Sabatier 2004) Une série de tableaux de données d espèces Une série de tableaux de données du milieu Stabilité des relations espèces/milieu Objectifs: analyse de la stabilité des co-structures espèces/milieu Typologie de co-structures (typologie de typologies) Co-structures stables Description des modifications de co-structures J. Thioulouse, A. Siberchicot,A. Julien-Laferrière, A.B. Couplage Dufour, De S. Deux Dray K-Tableaux (jean.thioulouse@univ-lyon1.frbiométrie June 26, 2013 & Biologie7 Evoluti / 19

Coordonnées factorielles Sorties des analyses (ade4): dataframes de coordonnées factorielles Les méthodes d analyse d un tableau Tableau (n, p), f axes conservés pour le calcul coordonnées Coordonnées des individus (lignes): xxx$li (n, f ) Coordonnées des variables (colonnes): xxx$co (p, f ) Les méthodes d analyse d un couple de tableaux Analyse de coinertie: Tableau espèces (n, p 1 ) Tableau milieu (n, p 2 ) Tableau croisé (p 1, p 2 ) Coordonnées des colonnes du tableau espèces: $li (p 1, f ) Coordonnées des colonnes du tableau milieu: $co (p 2, f ) Coordonnées des lignes du tableau espèces: $lx (n, f ) Coordonnées des lignes du tableau milieu: $ly (n, f ) J. Thioulouse, A. Siberchicot,A. Julien-Laferrière, A.B. Couplage Dufour, De S. Deux Dray K-Tableaux (jean.thioulouse@univ-lyon1.frbiométrie June 26, 2013 & Biologie8 Evoluti / 19

Coordonnées factorielles Les méthodes d analyse de K-tableaux Analyse Triadique Partielle (ATP): t tableaux, (n, p) Interstructure: $RV.coo (t, f ) Compromis (individus) : $li (n, f ) Compromis (variables) : $co (p, f ) Intrastructure (proj. lignes des tableaux initiaux): $Tli (t n, f ) Intrastructure (proj. colonnes des tableaux initiaux): $Tco (t p, f ) J. Thioulouse, A. Siberchicot,A. Julien-Laferrière, A.B. Couplage Dufour, De S. Deux Dray K-Tableaux (jean.thioulouse@univ-lyon1.frbiométrie June 26, 2013 & Biologie9 Evoluti / 19

Coordonnées factorielles Les méthodes d analyse de K couples de tableaux Analyse STATICO (ATP des tableaux croisés espèces x milieu): t tableaux espèces (n, p 1 ), t tableaux milieu (n, p 2 ) Interstructure: $RV.coo (t, f ) Compromis (espèces) : $li (p 1, f ) Compromis (milieu) : $co (p 2, f ) Intrastructure (proj. des col. tableaux d espèces): $Tli (t p 1, f ) Intrastructure (proj. des col. tableaux de milieu): $Tco (t p 2, f ) Intrastructure (proj. des lig. tableaux d espèces): $supix (t n, f ) Intrastructure (proj. des lig. tableaux de milieu): $supiy (t n, f ) J. Thioulouse, A. Siberchicot,A. Julien-Laferrière, A.B. Couplage Dufour, De S. Deux Dray K-Tableaux (jean.thioulouse@univ-lyon1.frbiométrie June 26, 2013 & Biologie 10 Evoluti / 19

Représentations graphiques Tableaux de coordonnées factorielles représentations graphiques Exemple: jeu de données réel de petites dimensions Méaudret: 4 couples de tableaux espèces x milieu (un par saison) Méthode STATICO (couplage de deux K-tableaux) Anciennes fonctions graphiques d ade4 vs. adegraphics J. Thioulouse, A. Siberchicot,A. Julien-Laferrière, A.B. Couplage Dufour, De S. Deux Dray K-Tableaux (jean.thioulouse@univ-lyon1.frbiométrie June 26, 2013 & Biologie 11 Evoluti / 19

Graphiques: exemple Exemple: données du Méaudret (Autrans), package ade4 6 stations réparties le long d un cours d eau, échantillonnées 4 fois un K-tableau milieu: 10 variables physico-chimiques un K-tableau 13 espèces éphémeroptères. Winter Autumn Summer Spring Sites (6) Environmental variables (10) Winter Autumn Summer Spring Sites (6) Ephemeroptera species (13) Jeu de données du Méaudret, package ade4. J. Thioulouse, A. Siberchicot,A. Julien-Laferrière, A.B. Couplage Dufour, De S. Deux Dray K-Tableaux (jean.thioulouse@univ-lyon1.frbiométrie June 26, 2013 & Biologie 12 Evoluti / 19

Graphiques: méthode STATICO Méthode STATICO, package ade4 k p q n 2 k-tables Means by table k COIA 2 PTA p q k q p q k 2 tables of group means p k cross-covariance tables n 2 compromises COIA q PTA q COIA q p p p Cross-covariance table Cross-covariance compromise Cross-covariance table BGCOIA STATICO COSTATIS J. Thioulouse, A. Siberchicot,A. Julien-Laferrière, A.B. Couplage Dufour, De S. Deux Dray K-Tableaux (jean.thioulouse@univ-lyon1.frbiométrie June 26, 2013 & Biologie 13 Evoluti / 19

Graphiques: méthode STATICO Méthode STATICO (couplage de deux K-tableaux) Intrastructure, Trajectoire des individus Collection de graphiques obtenue par juxtaposition des projections des lignes (stations) de tous les tableaux des deux séries dans l analyse du compromis. Calculs: data(meau) wit1 <- withinpca(meau$env, meau$design$season, scal = "total") spepca <- dudi.pca(meau$spe, scale = FALSE) wit2 <- wca(spepca, meau$design$season) kta1 <- ktab.within(wit1) # premier k-tableau kta2 <- ktab.within(wit2) # second k-tableau kcoi <- ktab.match2ktabs(kta1, kta2) # K-tableau croisés statico1 <- pta(kcoi) # Analyse triadique partielle J. Thioulouse, A. Siberchicot,A. Julien-Laferrière, A.B. Couplage Dufour, De S. Deux Dray K-Tableaux (jean.thioulouse@univ-lyon1.frbiométrie June 26, 2013 & Biologie 14 Evoluti / 19

Graphiques avec ade4 Graphiques des trajectoires: anciennes fonctions d ade4 par(mfrow=c(2,2)) for (i in levels(reorder(meau$design$season, rep(c(1, 2, 3, 4), each = 6)))) { s.traject(statico1$supix[meau$design$season == i, ], label = i,, xlim = c(-3.5, 2), ylim = c(-2, 3)) s.label(statico1$supix[meau$design$season == i, ], label = sites,, xlim = c(-3.5, 2), ylim = c(-2, 3), add.plot = T) } for (i in levels(reorder(meau$design$season, rep(c(1, 2, 3, 4), each = 6)))) { s.traject(statico1$supiy[meau$design$season == i, ], label = i,, xlim = c(-3.5, 2), ylim = c(-2, 3)) s.label(statico1$supiy[meau$design$season == i, ], label = sites,, xlim = c(-3.5, 2), ylim = c(-2, 3), add.plot = T) } J. Thioulouse, A. Siberchicot,A. Julien-Laferrière, A.B. Couplage Dufour, De S. Deux Dray K-Tableaux (jean.thioulouse@univ-lyon1.frbiométrie June 26, 2013 & Biologie 15 Evoluti / 19

Graphiques avec ade4 d = 1 d = 1 d = 1 d = 1 1 spring 2 summer 1 1 1 2 3 6 4 3 6 2 autumn 3 5 6 4 winter 2 5 3 6 4 5 4 5 d = 1 d = 1 1 d = 1 d = 1 1 1 summer autumn 1 2 4 3 5 spring 6 2 3 4 5 6 2 3 4 5 6 3 winter 2 4 5 6 Intrastructure des stations pour les variables du milieu (en haut) et pour les espèces (en bas), package ade4. J. Thioulouse, A. Siberchicot,A. Julien-Laferrière, A.B. Couplage Dufour, De S. Deux Dray K-Tableaux (jean.thioulouse@univ-lyon1.frbiométrie June 26, 2013 & Biologie 16 Evoluti / 19

Graphiques avec adegraphics Nouvelles fonctions du package adegraphics st1 <- s.traject(statico1$supix, facets = statico1$supti[,1], plabels.cex = 0, psub.cex = 0, plot = FALSE) sla1 <- s.label(statico1$supix, facets = statico1$supti[,1], psub.cex = 1.5, plabel.col = "red", plot = FALSE) st2 <- s.traject(statico1$supiy, facets = statico1$supti[,1], plabels.cex = 0, psub.cex = 0, plot = FALSE) sla2 <- s.label(statico1$supiy, facets = statico1$supti[,1], psub.cex = 1.5, plabel.col = "blue", plot = FALSE) pos1 <- rbind(c(0,0,.25,1),c(.25,0,.5,1),c(.5,0,.75,1),c(.75,0,1,1)) st1@positions <- st2@positions <- pos1 sla1@positions <- sla2@positions <- pos1 s1 <- superpose(st1, sla1) s2 <- superpose(st2, sla2) ADEgS(list(s1, s2), layout = c(2, 1)) J. Thioulouse, A. Siberchicot,A. Julien-Laferrière, A.B. Couplage Dufour, De S. Deux Dray K-Tableaux (jean.thioulouse@univ-lyon1.frbiométrie June 26, 2013 & Biologie 17 Evoluti / 19

Graphiques avec adegraphics d= 1 d= 1 d= 1 d= 1 S1 S2.1 S1.1 S1.2 S1.3 spring S2 S3 S6 S4 S5 d= 1 summer S3.1 S4.1 S6.1 S5.1 d= 1 S2.2 autumn S5.2 S3.2 S6.2 S4.2 S1.2 d= 1 winter S2.3 S5.3 S3.3 S4.3 S6.3 d= 1 S1.1 S1 S1.3 spring S2 S4 S3 S5 S6 S2.1 summer S3.1 S5.1 S4.1 S6.1 S2.2 autumn S3.2 S4.2 S5.2 S6.2 S3.3 winter S2.3 S4.3 Intrastructure des stations pour les variables du milieu (en haut) et pour les espèces (en bas), package adegraphics. S5.3 S6.3 J. Thioulouse, A. Siberchicot,A. Julien-Laferrière, A.B. Couplage Dufour, De S. Deux Dray K-Tableaux (jean.thioulouse@univ-lyon1.frbiométrie June 26, 2013 & Biologie 18 Evoluti / 19

Conclusion Package adegraphics: Collections de graphiques Lattice Classes S4 Beaucoup d autres avantages (objets graphiques modifiables) Facilité d utilisation et de programmation Méthodes d analyse de données: couplage de 2 K-tableaux Stages de formation ade4: Novembre/Décembre 2013 Ouvrage en cours de rédaction: Collection Use R! Springer J. Thioulouse, A. Siberchicot,A. Julien-Laferrière, A.B. Couplage Dufour, De S. Deux Dray K-Tableaux (jean.thioulouse@univ-lyon1.frbiométrie June 26, 2013 & Biologie 19 Evoluti / 19