EXEMPLE D UTILISATION DE LA PROCEDURE CATMOD ALIMENTATION DES ALLIGATORS

Documents pareils
Exemple PLS avec SAS

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

Étude de cas Assurance (d après une étude de Philippe Périé, CISIA)

Modèles pour données répétées

Imputation du salaire d ego dans TeO

Lire ; Compter ; Tester... avec R

Un exemple de régression logistique sous

Données longitudinales et modèles de survie

Demande d autorisation de faire une tournée pour des cirques itinérants détenant des animaux sauvages

Exemples d application

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

1 Modélisation d être mauvais payeur

MODELE A CORRECTION D ERREUR ET APPLICATIONS

Exercices M1 SES Ana Fermin ( fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Algebra & Trigonometry High School Level Glossary English / French

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9

FOAD COURS D ECONOMETRIE 1 CHAPITRE 2 : Hétéroscédasicité des erreurs. 23 mars 2012.

Introduction aux Statistiques et à l utilisation du logiciel R

Keywords: Probability of catastrophic events, Bivariate extreme value theory, Heavy tailed distributions, ALS methods.

Gestion de Portefeuille. Mesures de Performance Ajustées du Risque

SEMINAIRE SAS VISUAL ANALYTICS LAUSANNE, MARCH 18 : JÉRÔME BERTHIER VALERIE AMEEL

Exercices sur SQL server 2000

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

SAS de base : gestion des données et procédures élémentaires

TP: Représentation des signaux binaires. 1 Simulation d un message binaire - Codage en ligne

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH

Le chi carré. Le sommaire. Approche quantitative

T de Student Khi-deux Corrélation

Didacticiel - Études de cas. Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat.

Post-processing of multimodel hydrological forecasts for the Baskatong catchment

Chapitre 3. Les distributions à deux variables

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

TABLE DES MATIERES. C Exercices complémentaires 42

Génération de code binaire pour application multimedia : une approche au vol

Évaluation de la régression bornée

Surveillance de Scripts LUA et de réception d EVENT. avec LoriotPro Extended & Broadcast Edition

INITIATION AU LOGICIEL SAS

Business Process Management

INSTITUT MARITIME DE PREVENTION. For improvement in health and security at work. Created in 1992 Under the aegis of State and the ENIM

Institut français des sciences et technologies des transports, de l aménagement

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

Utilisation du Logiciel de statistique SPSS 8.0

I. Programmation I. 1 Ecrire un programme en Scilab traduisant l organigramme montré ci-après (on pourra utiliser les annexes):

SAS ENTERPRISE MINER POUR L'ACTUAIRE

Faut-il pondérer? ...Ou l'éternelle question de l'économètre confronté à un problème de sondage. Laurent Davezies et Xavier D'Haultf uille.

De la mesure à l analyse des risques

Demande d autorisation de faire du commerce d animaux

SparkInData. Place de Marché des applications Spatiales

Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1)

Surveillance et maintenance prédictive : évaluation de la latence de fautes. Zineb SIMEU-ABAZI Univ. Joseph Fourier, LAG)

Exercice : la frontière des portefeuilles optimaux sans actif certain

Examen de Logiciels Statistiques

BIG Data et R: opportunités et perspectives

Courses available for exchange students 4 th year

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Introduction à la statistique non paramétrique

Étude des flux d individus et des modalités de recrutement chez Formica rufa

Ects. Utilitaire d Économétrie Version 2. Russell Davidson

Solvabilité II et rentabilité ajustée au risque des produits en assurance-vie

Densité de population et ingestion de nourriture chez un insecte vecteur de la maladie de Chagas

Introduction à SPSS. Guy Mélard, U.L.B. Mars 2006 Guy Mélard, ULB 1. Introduction à SPSS. Objectif de la leçon.

Théorie des sondages : cours 5

SOCIAL INTELLIGENCE BUSINESS RESULTS

Analyse de la variance Comparaison de plusieurs moyennes

Efficience des marchés et finance comportementale

Commande Prédictive des. Convertisseurs Statiques

Wealth Effect on Labor Market Transitions

Comment consolider des données

L Elasticité Concept et Applications Chapitre 4

Analyse des correspondances avec colonne de référence

Validation probabiliste d un Système de Prévision d Ensemble

Project 1 Experimenting with Simple Network Management Tools. ping, traceout, and Wireshark (formerly Ethereal)

1 Imputation par la moyenne

L'intelligence d'affaires: la statistique dans nos vies de consommateurs

NON-LINEARITE ET RESEAUX NEURONAUX

Archived Content. Contenu archivé

Application des courbes ROC à l analyse des facteurs pronostiques binaires

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

CONFIGURATION DU SERVEUR DE MAILS EXIM. par. G.Haberer, A.Peuch, P.Saade

INTRODUCTION AU DATA MINING

PAR_ _09543_EUR DATE: 17/12/2014. Suite à l'avis PAR_ _08654_EUR

Détection de têtes dans un nuage de points 3D à l aide d un modèle de mélange sphérique

BIRT (Business Intelligence and Reporting Tools)

Exploiter les statistiques d utilisation de SQL Server 2008 R2 Reporting Services

Comprendre l impact de l utilisation des réseaux sociaux en entreprise SYNTHESE DES RESULTATS : EUROPE ET FRANCE

Le signal GPS. Les horloges atomiques à bord des satellites GPS produisent une fréquence fondamentale f o = Mhz

BUSINESS FORECASTING SYSTEM

Aerodrome chart ALT AD : 309 (11 hpa)

CORRIGES Plan de la séance

Table des matières PRESENTATION DU LANGAGE DS2 ET DE SES APPLICATIONS. Introduction

Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved.

Modélisation du risque opérationnel Approche Bâle avancée

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année

Langage propre à Oracle basé sur ADA. Offre une extension procédurale à SQL

Modèle GARCH Application à la prévision de la volatilité

CLASSIFICATION REPORT OF REACTION TO FIRE PERFORMANCE IN ACCORDANCE WITH EN : 2007

MegaStore Manager ... Simulation de gestion d un hypermarché. Manuel du Participant

La Recherche du Point Optimum de Fonctionnement d un Générateur Photovoltaïque en Utilisant les Réseaux NEURO-FLOUS

ESIEA PARIS

Transcription:

EXEMPLE D UTILISATION DE LA PROCEDURE CATMOD ALIMENTATION DES ALLIGATORS Le tableau provient d une étude concernant les facteurs influençant le choix de la nourriture principale d alligators. L échantillon est formé de 9 alligators capturés dans quatre lacs de Floride. La variable à modéliser est la nourriture principale, en volume, trouvée dans l estomac des alligators. Cette variable (Choix) a cinq catégories : poissons, invertébrés, autres, oiseaux, reptiles. Les variables explicatives, outre le lac, sont le sexe des alligators ( Genre) : male ou femelle, et leur taille codée en deux catégories : taille (,3 mètres) taille ( >,3 mètres ). On trouve dans les cinq colonnes de droite le nombre d alligators qui se sont nourris principalement de poissons, d invertébrés, d oiseaux, de reptiles ou d autres nourritures. Lac Genre Taille Poissons Invertébrés Autres Oiseaux ( Birds) Hancock Male 7 5 4 Femelle 6 3 3 3 3 Oklawaha Male Trafford George Femelle Male Femelle Male Femelle 3 3 3 8 3 9 3 8 7 9 7 6 4 9 5 4 3 Reptiles 6 6 TABLEAU Cas Alimentation Alligators Procédure CATMOD SAS

) L objectif de l étude est de construire un modèle explicatif de la variable choix à l aide des variables lac, genre, taille. Dans ce but on utilise la procédure CATMOD. Indiquer les cinq options disponibles pour les fonctions de réponse. Lesquelles sont utilisables pour ce type de données? ) Comment doit on présenter les données pour le programme CATMOD? On indiquera en particulier le nombre de lignes. 3) Indiquer ce que l on entend par fonction de réponse logit généralisé. En utilisant les notations du cours, on écrira précisément les différents termes. On démontrera comment on en déduit les probabilités associées aux différentes modalités de la variable à expliquer Y. 4) Les résultats obtenus avec l option par défaut de CATMOD pour le modèle avec uniquement les effets principaux : lac, genre, taille sont fournis dans le tableau. Que pensez vous de ce modèle? Tester l apport de chaque variable. 5) Les résultats concernant le modèle simplifié ( effets lac et taille ) sont présentés dans le tableau 3. Quelle est l utilité dans la procédure CATMOD de l instruction : «population lac genre taille;». Pourquoi n était-elle pas nécessaire dans le modèle avec les trois effets principaux lac genre taille? (tableau ) 6) Commenter les résultats du tableau 3. 7) A partir du modèle simplifié, calculer pour les males de taille du lac Hancock, les probabilités estimées des choix de nourriture poissons, invertébrés. Indiquer aussi les probabilités estimées des choix de nourriture poissons, invertébrés pour les femelles de taille du lac Hancock. ( compléter le tableau 4 ). 8) Le tableau 5 présente les sorties d une modélisation à l aide de la fonction identité. Un message d erreur apparaît. Comment peut-on l expliquer? Comment peut-on éviter ce type de problème dans SAS? 9) Le tableau 6 présente les résultats du modèle utilisant la fonction identité, prenant en compte les effets principaux lac genre taille. Que pensez-vous de ce modèle? Que peut-on proposer? Cas Alimentation Alligators Procédure CATMOD SAS

ANNEXE : ALIMENTATION DES ALLIGATORS TABLEAU : Procédure CATMOD ; Modèle avec les effets principaux lac, genre, taille. proc catmod data=alligat order=data; weight freq; model choix= lac genre taille; run; Data Summary Response choix Response Levels 5 Weight Variable freq Populations 6 Data Set ALLIGAT Total Frequency 9 Frequency Missing Observations 56 Population Profiles Sample lac genre taille Sample Size H M 3 H M 7 3 H F 6 4 H F 9 5 O M 5 6 O M 6 7 O F 5 8 O F 9 T M T M 8 T F T F 3 G M 7 4 G M 5 G F 4 6 G F Response Profiles Response choix P I 3 A 4 B 5 R Cas Alimentation Alligators Procédure CATMOD SAS 3

Maximum Likelihood Analysis of Variance Source DF Chi-Square Pr > ChiSq Intercept 4 6.4 <. lac 36.3.3 genre 4.8.78 taille 4 5.89.3 Likelihood Ratio 4 5.6.8 Analysis of Maximum Likelihood Estimates Standard Chi- Effect Parameter Estimate Error Square Pr > ChiSq Intercept.77.344 6.5 <..6.378 9..7 3.6564.3863.89.893 4 -.836.476.35.555 lac 5.557.5777.9.345 6 -.39.6768 3.7.544 7.797.67.35.445 8.85.744.9.76 9 -.85.4735 3..76 -.9.496..9855 -.46.689 5.4.48 -.759.8988 3.64.56 3 -.389.4843 8.3.44 4 -.97.4953.36.5485 5 -.47.594.6.4379 6 -.4593.6645.48.4894 genre 7.338.346.84.3598 8.83.35.5.846 9.875.3777.5.696.6.4544..985 taille.785.333.74.389.9466.3386 7.8.5 3.438.3573.4.356 4 -.866.477.4.8396 Cas Alimentation Alligators Procédure CATMOD SAS 4

TABLEAU 3 : MODELE SIMPLIFIE, EFFETS LAC ET TAILLE proc catmod data=alligat order=data; weight freq; population lac genre taille; model choix= lac taille / freq prob predict ; run; Maximum Likelihood Analysis of Variance Source DF Chi-Square Pr > ChiSq Intercept 4 7.39 <. lac 35.49.4 taille 4 8.76.9 Likelihood Ratio 44 5.48.784 Analysis of Maximum Likelihood Estimates Standard Chi- Effect Parameter Estimate Error Square Pr > ChiSq Intercept.839.3398 9.3 <...368 9..5 3.6795.388 3.7.75 4 -.95.4738.39.5334 lac 5.464.5589.56.456 6 -.34.664 4.8.433 7.6556.67.7.8 8.89.74.35.455 9 -.7996.47.88.896.374.496..94 -.38.679 4.84.78 -.7353.8953 3.76.56 3 -.76.4677 7.44.64 4 -.543.48.8.597 5 -.3467.53.46.499 6 -.477.64.54.46 taille 7.756.9.37.5448 8.947.34 9..7 9.344.357..945 -.397.43..789 Cas Alimentation Alligators Procédure CATMOD SAS 5

TABLEAU 4 : EXTRAIT DU TABLEAU DES PREVISIONS MODELE SIMPLIFIE. Maximum Likelihood Predicted Values for Probabilities ------Observed------ ------Predicted----- Standard Standard lac genre taille choix Probability Error Probability Error Residual H M P.5385.383???.7??? I.769.739???.443??? A.3846.349.537.637.39 B.74.356 -.7 R.475.85 -.47 H M P.574.87.57.9. I.3.4 -.3 A.857.77.94.79.97 B.49.33.49.76. R.78.46 -.7 H F P.654.954???.7??? I.54.67???.443.3 A.54.67.537.637 -.38 B.769.53.74.356.65 R.769.53.475.85.95 H F P.3333.57.57.9 -.37 I.3.4 -.3 A.3333.57.94.79.393 B..386.49.76.83 R..48.78.46.393 Cas Alimentation Alligators Procédure CATMOD SAS 6

TABLEAU 5 : MODELE FONCTION IDENTITE proc catmod data=alligat order=data; weight freq; response marginals; model choix= lac genre taille; run; The CATMOD Procedure Data Summary Response choix Response Levels 5 Weight Variable freq Populations 6 Data Set ALLIGAT Total Frequency 9 Frequency Missing Observations 56 Population Profiles Sample lac genre taille Sample Size H M 3 H M 7 3 H F 6 4 H F 9 5 O M 5 6 O M 6 7 O F 5 8 O F 9 T M T M 8 T F T F 3 G M 7 4 G M 5 G F 4 6 G F Response choix P I 3 A 4 B 5 R ERROR: The response functions are linearly dependent since the number of functions per population, 4, is greater than or equal to the number of response levels,, in population. Cas Alimentation Alligators Procédure CATMOD SAS 7

TABLEAU 6 : MODELE FONCTION IDENTITE effectifs modifiés. proc catmod data=alligat order=data; weight freq; response marginals; population lac genre taille; model choix= lac genre taille/ addcell =. ; run; Analysis of Variance Source DF Chi-Square Pr > ChiSq Intercept 4 33.6 <. lac 4.89 <. genre 4.9.8 taille 4 4.33 <. Residual 4 63.4.5 Analysis of Weighted Least Squares Estimates Standard Chi- Effect Parameter Estimate Error Square Pr > ChiSq Intercept.463.7 89.5 <..88.49 33.89 <. 3.4.6 46.7 <. 4.36. 8.5.43 lac 5.676.489.75.6 6 -.47.97 47.66 <. 7.67.437.93.649 8.69.9.79.3747 9 -.68.49 5.65.75.349.476 4.36 <. -.8.36 4.84. -.53.37 3.39.656 3 -.98.47 3.9 <. 4.89.469 3.6.579 5.56.39.8.794 6.79.97.83.369 genre 7.884.6.58.7 8 -.35.85 3.6.576 9 -.33.4..555 -.5..87.354 taille -.58.7 4.6.36.958.98 3.48 <. 3 -.68.3.56.453 4 -.3.6.56. Cas Alimentation Alligators Procédure CATMOD SAS 8