Analyses des correspondances et K-tableaux

Documents pareils
Analyse des correspondances avec colonne de référence

Individus et informations supplémentaires

Avant-après, amont-aval : les couples de tableaux totalement appariés

Traits biologiques : variables ou K-tableaux?

La corrélation entre deux matrices de distances euclidiennes

Mémo d utilisation de ADE-4

Data issues in species monitoring: where are the traps?

Initiation à l analyse en composantes principales

Exemple PLS avec SAS

I. Programmation I. 1 Ecrire un programme en Scilab traduisant l organigramme montré ci-après (on pourra utiliser les annexes):

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

Statistique Descriptive Multidimensionnelle. (pour les nuls)

Improving the breakdown of the Central Credit Register data by category of enterprises

«Poursuivre au-delà de BEEST : une approche fonctionnelle basée sur les traits de vie des espèces en relation avec l habitat».

Exercices sur SQL server 2000

Modèles et simulations informatiques des problèmes de coopération entre agents

Editing and managing Systems engineering processes at Snecma

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

Analyse en Composantes Principales

Continuité et dérivabilité d une fonction

La classification automatique de données quantitatives

L ESPACE À TRAVERS LE REGARD DES FEMMES. European Economic and Social Committee Comité économique et social européen

Face Recognition Performance: Man vs. Machine

The new consumables catalogue from Medisoft is now updated. Please discover this full overview of all our consumables available to you.

UNIVERSITE D ANTANANARIVO FACULTE DES SCIENCES DEPARTEMENT DE BIOLOGIE ET ECOLOGIE VEGETALES

PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

DOCUMENTATION MODULE BLOCKCATEGORIESCUSTOM Module crée par Prestacrea - Version : 2.0

UNE REPRESENTATION GRAPHIQUE DE LA LIAISON STATISTIQUE ENTRE DEUX VARIABLES ORDONNEES. Éric TÉROUANNE 1

INF6304 Interfaces Intelligentes

INSTITUT MARITIME DE PREVENTION. For improvement in health and security at work. Created in 1992 Under the aegis of State and the ENIM

Introduction aux outils BI de SQL Server Fouille de données avec SQL Server Analysis Services (SSAS)

IFT3902 : (Gestion de projet pour le) développement, (et la) maintenance des logiciels

CLIQUEZ ET MODIFIEZ LE TITRE

: Machines Production a créé dès 1995, le site internet

Programmation linéaire

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.

Post-processing of multimodel hydrological forecasts for the Baskatong catchment

Systèmes sylvopastoraux. Pour un environnement, une agriculture et une économie durables

Exercice du cours Gestion Financière à Court Terme : «Analyse d un reverse convertible»

Vérification audiovisuelle de l identité

Special Operating Agencies Designation Regulation, amendment. Règlement modifiant le Règlement sur la désignation des organismes de service spécial

Once the installation is complete, you can delete the temporary Zip files..

OpenPaaS Le réseau social d'entreprise

Note méthodologique. Les principales différences avec les TES sont mentionnées dans l encadré 1.

Public and European Business Law - Droit public et européen des affaires. Master I Law Level

INDIVIDUALS AND LEGAL ENTITIES: If the dividends have not been paid yet, you may be eligible for the simplified procedure.

Un outil open source de gestion de bibliographies

TP11 - Administration/Tuning

ISFA 2 année Les questions sont en grande partie indépendantes. Merci d utiliser l espace imparti pour vos réponses.

EC TYPE EXAMINATION CERTIFICATE

Laboratory accredited by the French Home Office (official gazette date February 5 th, 1959, modified) Valid five years from August 27 th, 2013

Logiciel XLSTAT version rue Damrémont PARIS

IPSAS 32 «Service concession arrangements» (SCA) Marie-Pierre Cordier Baudouin Griton, IPSAS Board

I. Cas de l équiprobabilité

L industrie pharmaceutique et la grippe aviaire

Embases pour raccordement G1/8 - G1/4

Analyses multivariées avec R Commander (via le package FactoMineR) Qu est ce que R? Introduction à R Qu est ce que R?

Introduction à l approche bootstrap

MapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril / 15

Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA

Recherche dans un tableau

COPYRIGHT Danish Standards. NOT FOR COMMERCIAL USE OR REPRODUCTION. DS/EN 61303:1997

Évaluation de la régression bornée

SNMP for cloud Jean Parpaillon. SNMP4cloud - 1

Protocoles pour le suivi des pontes de tortues marines dans le cadre de Protomac. Professeur Marc Girondot

Chapitre 6. Fonction réelle d une variable réelle

RAPID Prenez le contrôle sur vos données

INFO-F-425 Modèles mathématiques et algorithmes pour l ordonnancement. Bernard Fortz

Fiche produit ifinance v4

Fabricant. 2 terminals

: seul le dossier dossier sera cherché, tous les sousdomaines

îundesdruokerei Berlin

DOCUMENTATION - FRANCAIS... 2

De l Etudiant à SBA à l Enseignant Chercheur à l ENSMA

Calcul différentiel sur R n Première partie

Classification Automatique de messages : une approche hybride

Thomas Loubrieu (Ifremer) Small to Big Data Novembre 2013, Ifremer, Brest

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Instructions Mozilla Thunderbird Page 1

Encryptions, compression et partitionnement des données

Introduction : pour une refonte générale de notre système de retraite

L'analyse des données à l usage des non mathématiciens

TSTI 2D CH X : Exemples de lois à densité 1

Bourses d excellence pour les masters orientés vers la recherche

GASKET FOR TONER COLLECTION BOTTLE

Stratégie IT : au cœur des enjeux de l entreprise

Feuille d exercices 2 : Espaces probabilisés

Olivier Mondet

affichage en français Nom de l'employeur *: Lions Village of Greater Edmonton Society

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

UNIVERSITY OF MALTA FACULTY OF ARTS. French as Main Area in an ordinary Bachelor s Degree

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

Marie Curie Individual Fellowships. Jean Provost Marie Curie Postdoctoral Fellow, Institut Langevin, ESCPI, INSERM, France

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Rapport standard analyse des risques/stratégie d audit. Sommaire

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

APPENDIX 6 BONUS RING FORMAT

Comptes des changements de la biodiversité des systèmes et des espèces

Plan du cours Cours théoriques. 29 septembre 2014

Transcription:

ADE-4 Analyses des correspondances et K-tableaux Résumé La fiche propose une introduction de la logique de l analyse des correspondances dans l usage des analyses à K-tableaux (STATIS et AFMULT). On présente un jeu de données (6 campagnes de chalutage dans le golfe du Lion) qui demande une approche analyses des correspondances des structures spatio-faunistiques. La simple utilisation de l option CoaKTab dans KTabUtil permet l usage de KTA, STATIS et AFMULT dans cette logique AFC. Des logiques internes très différentes conduisent à des résultats très proches. Plan 1 Pattern multispécifique pluriannuel... 2 1.1 6 campagnes d échantillonnage... 3 1.2 Le cortège faunistique n est pas stable... 4 1.3 Le K-tableaux... 6 2 Les analyses séparées... 8 3 La version AFC de STATIS... 9 4 La version AFC de l AFMULT... 15 Références... 20 D. Chessel & J.C. Gaertner ADE-4 / Fiche thématique 5.9 / 97-07 / page 1

1 Pattern multispécifique pluriannuel La description d un pattern multispécifique par l analyse des correspondances est une technique standard utilisée dans ADE comme routine. Reprenons un exemple formé de 55 chalutages dans le golfe du Lion : 44 55 36 41 42 43 35 37 22 23 38 24 26 31 39 30 32 27 34 25 21 9 18 19 20 33 40 29 8 1 28 4 17 5 2 3 16 10 7 15 11 6 12 13 14 52 53 51 45 46 54 49 50 48 47 Chaque espèce capturée donne une carte d abondance : ARNL ARNT ASPC BLEN BOOP BUGL CEPO CONG ELED EUTR GALU LEPC LEPD LOLI LOPB MERL MICU MULB MULS On obtient une ou plusieurs cartes de synthèse à l aide des coordonnées factorielles de l AFC. ADE-4 / Fiche thématique 5.9 / 97-07 / page 2

-3.3-1.6 0.14 Facteur 1 Facteur 2 1.7 3.6 Figure 1 : Cartographie des coordonnées d une analyse des correspondances. Un modèle général du mode de distribution multispécifique est souvent obtenu en utilisant toutes les ressources de l analyse des correspondances. Le premier exemple d une telle pratique est proposé dans 1 et discuté dans 2. Les illustrations de cette technique sont fort nombreuses. On choisit l AFC, pour un tel objectif, afin de profiter du double averaging (les espèces à la moyenne des relevés et les relevés à la moyenne des espèces) parfaitement adapté aux modèles des gradients introduits par 3. L association entre AFC et théorie des gradients écologiques a été d abord identifiée par 4, renforcée par 5 et étendue aux notions de diversité et d amplitude dans 6. Le choix de l AFC impose de voir chaque espèce comme un profil de répartition de son abondance entre les stations et une station comme un profil de répartition entre les espèces. Cette symétrie est constitutive de la méthode. On élimine ainsi les effets d abondance variable tant entre espèces qu entre stations. L AFC est une méthode à double centrage 7. On élimine ainsi la structure spatiale uniquement liée à l abondance totale des captures (ci-dessous le poids des stations dans l AFC) : 0 0.0086 0.016 0.025 0.035 Si on opte pour l analyse des correspondances dans la description des structures spatiales multispécifiques, l enregistrement de cette structure en plusieurs occasions pose un nouveau problème d analyse des données. 1.1 6 campagnes d échantillonnage La question est clairement posée dans la figure constituant l annexe. Au cours des années 1983, 1985, 1986, 1987, 1988 et 1992 une campagne de pêche a prospecté le Golfe du Lion. Les abondances de chaque espèce en chaque point sont cartographiée à chaque date. Le méthode d échantillonnage n autorise pas la reproduction des chalutages au même endroit et les cinq ensembles couvrent la même zone sans pouvoir se superposer (figure 2). ADE-4 / Fiche thématique 5.9 / 97-07 / page 3

1983 1985 1986 1987 1988 1992 Figure 2 : les 6 campagnes de prélèvements. 1.2 Le cortège faunistique n est pas stable Les abondances, après transformation en logarithme, forme un tableau LN_ALL avec 45 colonnes (espèces) et 399 lignes (chalutages) répartis en 6 groupes d effectif respectif 55, 69, 72, 73, 61 et 69. L AFC du tableau (COA : COrrespondence Analysis) : laisse entrevoir des structures fortes. La partition en blocs (dates) donne une variable qualitative qui permet d initier la discrimination entre dates (Discrimin : Initialize/LinkPrep) : L AFC inter-classes est testée par Discrimin : Between analysis/test : ADE-4 / Fiche thématique 5.9 / 97-07 / page 4

: Les 6 % d inertie inter-classe sont extrêmement significatifs et l analyse est justifiée On pourrait étudier 4 facteurs (sur 5 possibles) mais on se contentera d observer le premier plan des relevés qui isole les deux dernières années : 1992 0.85-1.7 2-2.4 1988 Figure 3 : Carte des lignes de l analyse des correspondances inter-dates. La carte des espèces (figure 4) permet de faire la liste des taxons dont l abondance est instable : ADE-4 / Fiche thématique 5.9 / 97-07 / page 5

ARNL PAGY CITH ASPCLEPD LEPC SERC SCON SERH TRIP CEPO MULB ARNT ASPO PAGA SQUA PHYI LOPP ZEUS TRIY SCOL TORP CONG RAJA MERL ARGE MICU SOLE GALU LOLI BUGL URAN 1-1 1-1 MACO Figure 4 : Carte des colonnes de l analyse des correspondances inter-dates. On identifie facilement sur l annexe les faits marquants mis en évidence par la figure 4. Nous n insistons pas sur ces approches élémentaires. Une seule question nous concerne ici : peut-on identifier clairement la part stable du pattern multispécifique (si elle existe), la présence éventuelle à certaines dates de faits de structure non reproductibles? Peut-on quantifier la présence, la permanence et la reproductibilité des structures spatiales multispécifiques, en dépit des variations d abondance de certains taxons? Peut-on le faire en conservant la logique de l analyse des correspondances à une date donnée, c est-à-dire avec double centrage et élimination des variations de densité tant entre espèces que entre relevés? Ces objectifs excluent les approches traditionnelles de STATIS et de l AFMULT qui fonctionnent essentiellement sur des variantes ACP. La fiche propose une solution simple pour répondre à ces questions. 1.3 Le K-tableaux Les effectifs des lignes par blocs sont consignés dans le fichier LN_ALL_bloc (5-1). Initier les analyses par KTabUtil : InitKTab : Pour plus de commodités, dans le fichier Z!TCc.123, changer les étiquettes 1a, 1b,... par les dates et les étiquettes 2a, 2b,... par le code des espèces. Centrer le tableau par KTabUtil : COAKtab : ADE-4 / Fiche thématique 5.9 / 97-07 / page 6

L option a effectué les calculs simples suivants. On note I le nombre total de lignes du tableau traité et J le nombre de colonnes. Soit K le nombre de sous-tableaux, I k le nombre de lignes du sous-tableau k. On note, pour 1 i I, b( i) = k le fait que la ligne i appartient au sous-tableau k. X = x ij que des valeurs positives ou nulles. On calcule d abord les poids des colonnes avec : [ ] 1 i I,1 j J est le tableau initial ne comportant x.j = x ij x.. = x.j p.j = x.j D 1 i I 1 j J x J = Diag p.1,...,p.j.. ( ) Cette pondération (somme unité) sera commune aux triplets statistiques associés à chacun des sous-tableaux. Pour le sous-tableau k, on calcule ensuite les distributions conditionnelles par colonnes : k x.j = xij p i/j = x ij b b( i)= k x ( i).j On moyenne ces distributions conditionnelles pour obtenir la distribution marginale du sous-tableau k : p i. = p.j p i/j 1 j J D Ik = Diag( b( p i. ) D I = Diag( p 1.,...,p i.,...,p I. ) i)=k La somme des poids des lignes d un sous-tableau vaut 1 et la somme des poids de toutes les lignes du tableau vaut K. Le tableau est alors soumis au centrage de type AFC (Cf. 8 ) par : y ij = p i/j p i. Le sous-tableau d ordre k, formé des lignes du bloc associé, est défini par : Y k = y ij [ ] b i 1 ( )= k,1 j J Il fournit le triplet ( Y k,d J,D Ik ), qui est un triplet d AFC. La distance du Khi2 classique, entre distributions conditionnelles par colonnes, est retrouvée dans chacune des analyses séparées. Ces analyses séparées ne sont pas celles des analyses de départ mais celle des AFC pondérées (équivalent pour les colonnes de l option COA : Row weighted COA ou de l option MCA : Fuzzy Correspondence Analysis 9, utilisée jusqu à présent pour les lignes) par la distribution globale. Le K-tableau ainsi constitué par l option KTabUtil : COAKtab permet d utiliser tous les modules K-tableaux avec des propriétés très particulières. Rappelons que l utilisation de la logique AFC tend progressivement à l emporter sur la logique de l ACP dès qu on pense que les courbes de réponses des taxons sur les gradients écologiques sous-jacents sont des courbes en cloche et non des fonctions monotones (ce qui reste vrai pour les facteurs limitants comme la pollution) et s impose totalement dès ADE-4 / Fiche thématique 5.9 / 97-07 / page 7

que la standardisation du relevé n est pas assurée comme en ornithologie (facteurs météorologiques 10 ). 2 Les analyses séparées On utilise l option KTA : Separate analyses : Row bloc: 1 - Col bloc: 1 - Total inertia: 2.38231 Num. Eigenval. R.Iner. R.Sum Num. Eigenval. R.Iner. R.Sum 01 +4.8456E-01 +0.2034 +0.2034 02 +3.7803E-01 +0.1587 +0.3621 03 +3.2839E-01 +0.1378 +0.4999 04 +1.6958E-01 +0.0712 +0.5711 ------------------------------------------------------------------- Row bloc: 2 - Col bloc: 1 - Total inertia: 1.90915 Num. Eigenval. R.Iner. R.Sum Num. Eigenval. R.Iner. R.Sum 01 +3.3008E-01 +0.1729 +0.1729 02 +3.0630E-01 +0.1604 +0.3333 03 +1.9230E-01 +0.1007 +0.4341 04 +1.3401E-01 +0.0702 +0.5042 ------------------------------------------------------------------- Row bloc: 3 - Col bloc: 1 - Total inertia: 2.00772 Num. Eigenval. R.Iner. R.Sum Num. Eigenval. R.Iner. R.Sum 01 +3.5760E-01 +0.1781 +0.1781 02 +2.7542E-01 +0.1372 +0.3153 03 +2.4211E-01 +0.1206 +0.4359 04 +1.7972E-01 +0.0895 +0.5254 ------------------------------------------------------------------- Row bloc: 4 - Col bloc: 1 - Total inertia: 1.88129 Num. Eigenval. R.Iner. R.Sum Num. Eigenval. R.Iner. R.Sum 01 +3.4861E-01 +0.1853 +0.1853 02 +2.7907E-01 +0.1483 +0.3336 03 +1.6657E-01 +0.0885 +0.4222 04 +1.2374E-01 +0.0658 +0.4880 ------------------------------------------------------------------- Row bloc: 5 - Col bloc: 1 - Total inertia: 1.88456 Num. Eigenval. R.Iner. R.Sum Num. Eigenval. R.Iner. R.Sum 01 +4.1757E-01 +0.2216 +0.2216 02 +2.7422E-01 +0.1455 +0.3671 03 +1.7993E-01 +0.0955 +0.4626 04 +1.3763E-01 +0.0730 +0.5356 ------------------------------------------------------------------- Row bloc: 6 - Col bloc: 1 - Total inertia: 2.5713 Num. Eigenval. R.Iner. R.Sum Num. Eigenval. R.Iner. R.Sum 01 +4.2770E-01 +0.1663 +0.1663 02 +3.6960E-01 +0.1437 +0.3101 03 +2.9411E-01 +0.1144 +0.4245 04 +2.2883E-01 +0.0890 +0.5135 ------------------------------------------------------------------- Eigenvalues are stored by column into file A.savp Row : 45 - Col (tables): 6 File A.saTLli contains row scores in separate analyses It has 399 rows and 4 columns It is to be used with --TLl.label and --TLl.cat files File A.saTCco contains column scores in separate analyses It has 270 rows and 4 columns It is to be used with --TCc.label and --TCc.cat files File A.sapa contains total inertia and rank for each separate analyses It has 6 rows and 2 columns On reconnaît immédiatement une forte cohérence des paramètres (inerties totales et valeurs propres des analyses séparées. La figure 5 donne les 20 premières valeurs propres, comprises entre 0 et 1. Entre 2 et 5 facteurs seraient légitimement examinés suivant les cas, ce qui permet de penser à une certaine variation de la structure entre tableaux. La figure 6 donne les coordonnées de rang 1 par leur carte, ce qui permet de ADE-4 / Fiche thématique 5.9 / 97-07 / page 8

reconnaître des similitudes (aux inversions de signes habituelles près) et noter des nuances. La coordination de ces 6 analyses des correspondances par une méthode multitableau est donc utile. 1 2 3 4 5 6 0.49 0 21 0 Figure 5 : valeurs propres des analyses séparées. 1983 1985 1986 1987 1988 1992 Figure 6: Coordonnées de rang 1 des analyses séparées. 3 La version AFC de STATIS On utilise l option STATIS : Operator averaging : [ 1] 1000 [ 2] 603 1000 [ 3] 642 741 1000 [ 4] 611 768 818 1000 [ 5] 692 630 640 602 1000 [ 6] 567 561 573 559 656 1000 ADE-4 / Fiche thématique 5.9 / 97-07 / page 9

On observe une bonne homogénéité des RV calculés ici sur des AFC. File A.oa+RV contains cosinus between operators It has 6 rows and 6 columns Compromise with cosinus between operators Num. Eigenval. R.Iner. R.Sum Num. Eigenval. R.Iner. R.Sum 01 +4.2287E+00 +0.7048 +0.7048 02 +6.1094E-01 +0.1018 +0.8066 03 +4.3017E-01 +0.0717 +0.8783 04 +2.9541E-01 +0.0492 +0.9275 05 +2.5994E-01 +0.0433 +0.9709 06 +1.7483E-01 +0.0291 +1.0000 File A.oa+EV contains the eigenvalues of interstructure analysis It has 6 rows and 1 columns File A.oa+IS contains the table scores of the interstructure analysis It has 6 rows and 6 columns 1987 1985 1986 1983 1988 1992 On peut supposer l existence d un compromis légitime. Num. Eigenval. R.Iner. R.Sum Num. Eigenval. R.Iner. R.Sum 01 +8.1469E-01 +0.1589 +0.1589 02 +6.1088E-01 +0.1191 +0.2780 03 +3.6038E-01 +0.0703 +0.3483 04 +3.3301E-01 +0.0649 +0.4133 05 +2.7384E-01 +0.0534 +0.4667 06 +2.6459E-01 +0.0516 +0.5183 File A.oa+vp contains the eigenvalues of compromise analysis It has 45 rows and 1 columns On opte franchement pour un compromis à deux dimensions et on garde deux facteurs. Typological value indices Rows = row number of each table ADE-4 / Fiche thématique 5.9 / 97-07 / page 10

Weights = Weights of operators in the compromise NS norm2 = Squared norm (Hilbert-Schmidt) of operators Cos2 = Squared cosinus betweem operator and approximed compromise ---------- ---------- ---------- ---------- ---------- Number Rows Weights NS norm2 Cos2 ---------- ---------- ---------- ---------- ---------- 1 55 3.962e-01 5.857e-01 0.417 2 69 4.176e-01 3.095e-01 0.482 3 72 4.289e-01 3.491e-01 0.490 4 73 4.235e-01 2.917e-01 0.481 5 61 4.065e-01 3.482e-01 0.503 6 69 3.742e-01 5.598e-01 0.306 ---------- ---------- ---------- ---------- ---------- Les poids des opérateurs, les normes et les cosinus carrés indiquent une adéquation relativement constante des différents tableaux à la construction du compromis et à son adéquation. Manifestement chaque tableau contient autre chose que la structure compromis (les cosinus carrés sont compris entre 0.4 et 0.5) mais aucun des tableaux ne l a emporté sur les autres. On doit retrouver dans chaque tableau une structure commune. File A.oaT4a contains scores of axes of separate analysis It has 24 rows and 2 columns It is to be used with --T4a.label and --T4a.cat files 1-2 1-1 2-2 2-1 3-2 1-3 3-1 4-2 5-2 6-3 4-1 5-1 6-2 6-1 On confirme que chaque analyse ne donne pas toujours directement le plan 1-2 du compromis comme plan 1-2 de l analyse séparée mais qu une bonne cohésion est rencontrée dans 4 des 6 cas : 1-15-1 1-2 2-1 6-2 4-1 6-1 4-2 5-2 2-2 3-2 3-1 File A.oaTLl contains standard column scores with lambda norm ADE-4 / Fiche thématique 5.9 / 97-07 / page 11

It has 399 rows and 2 columns It is to be used with --TLl.label and --TLl.cat files File :A.oaTLl Col. Mini Maxi 1-3.771e+00 2.446e+00 2-3.812e+00 5.526e-01 1983 1985 1986 1987 1988 1992 1-4 3-4 Les coordonnées des lignes des sous-tableaux, projections sur un même plan de R 45 défini par les deux premiers axes du compromis, reproduisent avec régularité une structure à trois éléments, un bloc de stations centrales et deux branches. Ces coordonnées sont cartographiables (ci-dessous, la première coordonnée) : 1983 1985 1986 1987 1988 1992 Figure 7 : Cartographie de la première coordonnée du compromis de STATIS. ADE-4 / Fiche thématique 5.9 / 97-07 / page 12

1983 1985 1986 1987 1988 1992 Figure 8: Cartographie de la seconde coordonnée du compromis de STATIS. En première lecture, on admettra que les différences entre tableaux ne proviennent que des variations du plan d échantillonnage. Il est complètement légitime de regrouper les 6 cartes pour n en faire qu une seule. Facteur 1 Facteur 2 Facteur 1 Facteur 2 Les trois éléments de la carte factorielle ont des définitions spatiales précises et seront interprétés sans difficulté. Cette structure spatiale des communautés, de grande stabilité est un véritable compromis, chaque campagne apparaissant ici comme un échantillon d une structure dans la logique propre des méthodes STATIS. La correspondance avec les espèces s établit par : ADE-4 / Fiche thématique 5.9 / 97-07 / page 13

File A.oa+co contains column scores (analysis of the compromise) It has 45 rows and 2 columns File :A.oa+co Col. Mini Maxi 1-5.254e+00 3.274e+00 2-4.929e+00 9.053e-01 SOLE CEPO TRAH PAGY ARNT ASPO CITH SERH CEPO SERC CITH ZEUS MICU LEPC MERL TRIS ELED SCYO SCOL URAN SCON EUTR CONG BLEN LOPB BOOP TRIP TORP LOPP ARNL LOLI PAGA ASPC MULB LEPM SEPO RAJA ARGE SQUA LEPD CAPO TRIY PHYI SERH 2-6 4-6 MULS MACO BUGL GALU On a ici toute la logique de l analyse des correspondances avec les averagings sousjacents et la définition réciproque des positions des relevés et des positions des espèces. Aux bornes des branches on place les indicatrices strictes et au centre les taxons à la distribution la plus large. STATIS a bien exécutée une analyse des correspondances moyenne alors qui serait ici très voisine d une analyse des correspondances intraclasses. Enfin, dans ce mode de centrage, la notion de trajectoires reprend toute sa signification : File A.oaTCtra contains columns scores issued from each table by Modified Statis trajectories It has 270 rows and 2 columns It is to be used with --TCc.label and --TCc.cat files File :A.oaTCtra Col. Mini Maxi 1-4.178e+00 2.497e+00 2-3.933e+00 6.804e-01 ADE-4 / Fiche thématique 5.9 / 97-07 / page 14

BUGL ASPO ARNT MULS MACO BUGL 1-5 3-5 GALU GALU MULS En effet, le compromis positionne les espèces, puis les relevés par averaging (par sous-tableau), puis les espèces par averaging par sous-tableau, donc permet d étudier la stabilité de la position des taxons. La figure donne une indication globale de stabilité de la position des taxons qui correspond à la stabilité de la structure spatiale. MULS apparaît, par exemple, comme une espèce dont la position est globalement mixte. L analyse a extrait du multi-tableau une structure spatiale et faunistique stable, simple, régulièrement exprimée et parfois sensiblement brouillée par les particularités des campagnes qu on observera en dépouillant chaque analyse séparée. 4 La version AFC de l AFMULT On utilise l option MFA : Variable groups qui porte ici un nom inadapté : ADE-4 / Fiche thématique 5.9 / 97-07 / page 15

En effet, ADE-4 contient une version standard de l AFMULT qui reproduit strictement les résultats obtenu par les auteurs quand on l utilise sur un K-tableau formé par les mêmes individus coordonnant plusieurs groupes de variables. Mais comme tout module d ADE-4, le calcul est possible pour tout K-tableau coordonnant K schémas de dualité quelconques compatibles entre eux. On peut continuer à appeler AFMULT les calculs qui suivent en précisant que l usage qui en est fait ici est une extension de la théorie initiale. Multiple factor analysis Escofier & Pages 1984 Input file A Row number: 399, Column number: 45, Block number: 6 Selected weighting option -> First eigenvalue from separate analysis DiagoRC: General program for two diagonal inner product analysis Input file: A.++ta --- Number of rows: 399, columns: 45 ----------------------- Total inertia: 32.2363 ----------------------- Num. Eigenval. R.Iner. R.Sum Num. Eigenval. R.Iner. R.Sum 01 +5.1080E+00 +0.1585 +0.1585 02 +3.8499E+00 +0.1194 +0.2779 03 +2.3147E+00 +0.0718 +0.3497 04 +1.9967E+00 +0.0619 +0.4116 05 +1.7199E+00 +0.0534 +0.4650 06 +1.6147E+00 +0.0501 +0.5151 File A.++vp contains the eigenvalues and relative inertia for each axis --- It has 45 rows and 2 columns On obtient une répartition de l inertie de l analyse du tableau sensiblement différente de celle de l AFC simple (5 facteurs p. 4) et très proche des propositions de STATIS. On s en tiendra au dépouillement du plan 1-2. File A.++co contains the column scores --- It has 45 rows and 2 columns File :A.++co Col. Mini Maxi 1-1.325e+01 8.298e+00 2-1.255e+01 2.268e+00 L analyse donne une carte des taxons, qui ne nous surprendra pas (figure 9). Les statistiques d inertie, d une logique totalement différentes de celle de STATIS, confirme une bonne répartition entre tableaux et une grande homogénéité des résultats. Projected inertia of variable groups ---------- ---------- ---------- fac 1 fac 2 ---------- ---------- ---------- ADE-4 / Fiche thématique 5.9 / 97-07 / page 16

Tab 1 8.031e-01 5.957e-01 Tab 2 9.084e-01 7.687e-01 Tab 3 9.098e-01 7.258e-01 Tab 4 8.660e-01 6.640e-01 Tab 5 8.406e-01 5.266e-01 Tab 6 7.800e-01 5.691e-01 ---------- ---------- ---------- Total 5.108e+00 3.850e+00 ---------- ---------- ---------- These values are stored in the file A.++iner It has 6 rows and 2 columns SOLE PAGY LOLI PAGALOPP TRAH ARNL ASPC MULB ASPO ARNT MULS SQUA CAPOLEPD TRIY PHYI MACO BUGL 5-15 10-15 GALU Figure 9 : Carte du plan 1-2 des espèces dans l AFMULT. 4-2 5-2 2-2 3-2 1-15-1 4-1 6-1 2-1 1-2 6-2 3-1 6-3 4-3 5-3 2-3 3-3 3-4 4-4 2-4 1-4 6-4 5-4 1-3 Figure 10 : Projection des axes des analyses séparées dans l AFMULT. ADE-4 / Fiche thématique 5.9 / 97-07 / page 17

File A.++T4a contains scores of axes of separate analysis It has 24 rows and 2 columns It is to be used with --T4a.label and --T4a.cat files File :A.++T4a Col. Mini Maxi 1-7.355e-01 9.387e-01 2-8.031e-01 8.749e-01 Les projections des axes des analyses séparées (figure 10) confirme que le plan 1-2 du compromis de STATIS est extrêmement proche de celui de l AFMULT. File A.++li contains the row scores --- It has 399 rows and 2 columns File :A.++li Col. Mini Maxi 1-3.810e+00 2.458e+00 2-3.820e+00 5.563e-01 2.5-4 2.5-4 STATIS AFMULT La proximité est telle que les coordonnées factorielles des deux systèmes sont pratiquement confondues (ci-dessus la première coordonnée). Tout ce qui a été observée précédemmment aurait été mis en évidence par cette analyse. Nous n y reviendrons pas. L AFMULT positionne les espèces une première fois globalement puis une seconde fois par tableau. Les statistiques éditées ne laisse aucun doute sur la stabilité de la structure faunistique vis-à-vis de la structure spatiale globale : R corrélation coefficients between general scores and one table scores ---------- ---------- ---------- fac 1 fac 2 ADE-4 / Fiche thématique 5.9 / 97-07 / page 18

---------- ---------- ---------- Tab 1 9.457e-01 9.160e-01 Tab 2 9.598e-01 9.220e-01 Tab 3 9.718e-01 9.528e-01 Tab 4 9.499e-01 9.327e-01 Tab 5 9.398e-01 8.930e-01 Tab 6 9.345e-01 9.235e-01 ---------- ---------- ---------- On sait enfin que l AFMULT est une inter-classe permettant la représentation simultanée des taxons positionnés par chaque tableau (Cf. fascicule 6, fiche 4, p.17). File A.++TCO contains columns scores issued from each table It has 270 rows and 2 columns It is to be used with --TCc.label and --TCc.cat files File :A.++TCO Col. Mini Maxi 1-6.193e+00 3.927e+00 2-5.394e+00 9.212e-01 File A.++C1 contains general scores It has 45 rows and 2 columns File :A.++C1 Col. Mini Maxi 1-4.992e+00 3.126e+00 2-4.102e+00 7.418e-01 1.5-6.5 4.5-6.5 ASPO MULS MACO BUGL GALU File A.++TCrep contains column scores Duplication of general scores It has 270 rows and 2 columns It is to be used with --TCc.label and --TCc.cat files ADE-4 / Fiche thématique 5.9 / 97-07 / page 19

File :A.++TCrep Col. Mini Maxi 1-4.992e+00 3.126e+00 2-4.102e+00 7.418e-01 On retrouve encore les résultats déjà observés (p. 15) dans une logique très différente. L identité des deux séries de résultats montre d une part que la logique AFC du centrage du K-tableau joue un grand rôle et que d autre part chacune des deux analyses donneraient l essentiel de l information recherchée. Le centrage de type AFC des K-tableaux semble donc prometteur. Références 1 Hatheway, W.H. (1971) Contingency table analysis of rain forest vegetation. In : Statistical Ecology. III Many species populations ecosystems and systems analysis. Patil, G.P., Pielou, E.C. & Waters, W.E. (Eds.) Pennsylvania State University Press. 271-314. 2 Esteve, J. (1978) Les méthodes d'ordination : éléments pour une discussion. In : Biométrie et Ecologie. Legay, J.M. & Tomassone, R. (Eds.) Société Française de Biométrie, Paris. 223-250. 3 Whittaker, R.H. (1967) Gradient analysis of vegetation. Biological Reviews : 42, 207-264. 4 Hill, M.O. (1973) Reciprocal averaging : an eigenvector method of ordination. Journal of Ecology : 61, 237-249. Hill, M.O. (1974) Correspondence analysis : A neglected multivariate method. Journal of the Royal Statistical Society, C : 23, 340-354. 5 Ter Braak, C.J.F. (1985) Correspondence analysis of incidence and abundance data : properties in terms of a unimodal reponse model. Biometrics : 41, 859-873. 6 Thioulouse, J. & Chessel, D. (1992) A method for reciprocal scaling of species tolerance and sample diversity. Ecology : 73, 670-680. 7 Noy-Meir, I. (1973) Data transformations in ecological ordination. I. Some advantages of non-centering. Journal of Ecology : 61,329-341. 8 Escoufier, Y. (1982) L'analyse des tableaux de contingence simples et multiples. Metron : 40, 53-77. Escoufier, Y. (1985) L'analyse des correspondances : ses propriétés et ses extensions. In : Proceedings 45th session. Institut International de la Statistique. Amsterdam. 28.2.1-28.2.16. 9 Chevenet, F., Dolédec, S. & Chessel, D. (1994) A fuzzy coding approach for the analysis of long-term ecological data. Freshwater Biology : 31, 295-309. 10 Lebreton, J.D. & Yoccoz, N. (1987) Multivariate analysis of bird count data. Acta Œcologica, Œcologia Generalis : 8, 2, 125-144. ADE-4 / Fiche thématique 5.9 / 97-07 / page 20

Annexe 1 ADE-4 / Fiche thématique 5.9 / 97-07 / page 21

Annexe 2 ADE-4 / Fiche thématique 5.9 / 97-07 / page 22

Annexe 3 ADE-4 / Fiche thématique 5.9 / 97-07 / page 23

Annexe 4 ADE-4 / Fiche thématique 5.9 / 97-07 / page 24