GOUTTE. Analyse Statistique des Données Cours 5. Master 2 EID. LUISS, Libera Università Internazionale degli Studi Sociali
|
|
- Alexis Desjardins
- il y a 6 ans
- Total affichages :
Transcription
1 LUISS, Libera Università Internazionale degli Studi Sociali Université Paris 13 Laboratoire Analyse, Géométrie et Applications UMR 7539 GOUTTE Analyse Statistique des Données Cours 5 Master 2 EID goutte@math.univ-paris13.fr Master 2 EID 07/08 1
2 1 Introduction 1.1 Les modèles de régression Nous allons donc étudier les diérents types de regression. Tout d'abord quel est l'objectif d'une régression: Expliquer une grandeur y par un ensemble de grandeurs x où y est la variable à expliquer, ou encore réponse et l'ensemble x sont les variables explicatives, ou encore régresseurs. Exemple: Économétrie : expliquer la quantité de production (y) en fonction du capital, du travail, de l'énergie, x = (x 1,..., x p ) Banque/Finance => le crédit scoring : attribution d?un crédit en fonction de variables quantitatives : revenu, âge, dépôt,... variables qualitatives : sexe, CSP, Les modèles de régression Il existe diérents types de modèle de régression. Régression linéaire simple ou multiple: Expliquer une variable quantitative y par une ou plusieurs variables quantitatives x La relation recherchée entre y et x est linéaire, de type ane y = ax + b avec a, b R Régression non linéaire paramétrique / non paramétrique Expliquer une variable quantitative y par un ensemble de variables quantitatives x La relation recherchée entre y et x est une fonction non linéaire de type polynomiale par exemple y = p i=1 a ix i + b avec a i, b R. Modèle d'analyse de la variance Expliquer une variable quantitative y par un ensemble de variables qualitatives x. C'est ce que nous avons vu au chapitre 3 avec les procédures ANOVA et GLM. Régression logistique Expliquer une variable qualitative y par un ensemble x de variables quantitatives et qualitatives goutte@math.univ-paris13.fr Master 2 EID 07/08 2
3 2 Explications des modèles 2.1 Régression linéaire simple Nous cherchons donc à expliquer une variable quantitative y en fonction d'une variable explicative x, elle aussi quantitative. La représentation graphique (nuage de points) nous permet de spécier un modèle linéaire de type: Graphe: y = a x + b + ɛ Où a R est un paramètre constant à estimer. b R est lui aussi un paramètre associé à la variable x, à estimer. ɛ est le terme d'erreur, qui regroupe tous les phénomènes non expliqués par le modèle. Autrement dit le paramètre ɛ de notre modèle vaut 0 alors notre modèle est parfait. goutte@math.univ-paris13.fr Master 2 EID 07/08 3
4 Prédiction: 2.2 Régression linéaire multiple Dans le cas d'une régression multiple, nous cherchons à expliquer une variable quantitative y en fonction de plusieurs variables explicatives x 1, x 2, x 3,..., x k, où k est le nombres de variables. Le modèle linéaire multiple s'écrit donc ainsi: y = a 1 x 1 + a 2 x a k x k + b + ɛ Hypothèses: Le modèle utilisé implique plusieurs hypothèses: H1: Le modèle est linéaire. H2: la variable explicative est observée ( non aléatoire). H3: la moyenne des erreurs est nulle. H4: la variance des erreurs est constante. H5: Les erreurs ne sont pas corrélés entre elles. goutte@math.univ-paris13.fr Master 2 EID 07/08 4
5 H6: l'erreur est indépendante de la variable explicative. L'analyse des erreurs est importante, puisqu'elle permet de diagnostiquer un modèle non approprié (non linéaire, colinéaire, etc). Nous cherchons donc à estimer les paramètres a 1,..., a k et b de notre modèle. L'objectif étant d'estimer ces paramètres de façon à minimiser le terme ɛ. Autrement dit de minimiser la distance (au carré) entre chaque individu et la droite de régression. C'est ce qu'on appele une minimisation au sens des moindres carrés ordinaires (MCO). Nous trouvons ainsi des paramètres â 1,..., â k et ˆb. Graphe: Une fois estimé ces paramètres nous pouvons entamer la phase de prédiction de la variable réponse ŷ. ŷ = â 1 x 1 + â 2 x â k x k + ˆb Par déduction nous obtenons l'erreur du modèle : ERR = y ŷ goutte@math.univ-paris13.fr Master 2 EID 07/08 5
6 2.3 Tests statistiques sur les coecients du modèle Nous avons besoins de savoir si les coecients estimés sont signicativement diérents de zéro, c'est à dire si il y a un eet de la variable. Nous posons le test suivant: H0: le coecient est nul: a k = 0. La variable explicative x k n?inue donc pas sur la variable réponse y. H1: le coecient est diérent de 0. La variable x k explique la variable y. La statistique de test est la suivante: ST D obs = a k σ(a k ). y. Si ST D obs > ST D k 1 alors on rejette l'hypothèse H0, la variable x k explique la variable 2.4 Indicateur de qualité du modèle Un bon indicateur de la qualité de notre modèle est le coecient de détermination ou coecient empirique de corrélation : R 2. En eet, la variable à expliquer y possèdent une variance (variance totale), qui représente l'ensemble de l'information à modéliser. L'équation du modèle explique, elle, une partie de cette variance (variance due au modèle), le terme d'erreur ɛ explique une autre partie de la variance (variance résiduelle). Le coecient R 2 est le rapport entre la variance due au modèle et la variance totale. Il est compris entre 0 et 1. Le R 2 est donc un indicateur de la qualité du modèle fonctionnant ainsi: R 2 = 0.7 : 70% de la réponse est expliquée par les régresseurs. R 2 = 0 : modèle inadapté. R 2 = 1 : modèle parfait. goutte@math.univ-paris13.fr Master 2 EID 07/08 6
7 2.5 Exemples de modèles mal ajustés Voici quatres exemples de modèles ayant tous un coecent R 2 = Cependant les résultats des interprétations varient: Graphes: 1. Modèle adapté. 2. Modèle inadapté: l'équation du modèle devrait être une courbe (relation non linéaire). 3. Graphiquement, aucun modèle ne s'impose. 4. Le modèle est acceptable, mais graphiquement, il est moins correct que le cas (1) (les valeurs élevées de y sont mal prédites). goutte@math.univ-paris13.fr Master 2 EID 07/08 7
8 2.6 Analyse des résidus Les résidus studentisés (rapportés à l'ecart-type des erreurs) : t : Ce sont des estimations des erreurs du modèle. Ils permettent de vérier l'hypothèse de relation linéaire entre la réponse y et les régresseurs x. L'analyse se fait en analysant le graphique qui représente les résidus studentisés t en fonction des estimations ŷ de la variable à expliquer. Graphes: 1. Ajustement satisfaisant. 2. La courbure indique une non linéarité. 3. La dispersion indique une variance non constante. goutte@math.univ-paris13.fr Master 2 EID 07/08 8
9 2.7 Individus aberrants A cause d'une seule observation inuente, un modèle peut être mal estimé, il faut alors détecter cette observation et l'éliminer Graphes: Plusieurs statistiques permettent de déceler des valeurs aberrantes ou inuentes: La valeur du terme d'erreur. Les résidus studentisés. La distance de Cook. Ces statistiques prennent une valeur pour chaque observation. De manière générale, lorsque pour ces statistiques une observation possède une valeur élevée, cette valeur est inuente. goutte@math.univ-paris13.fr Master 2 EID 07/08 9
10 2.8 Selection des variables du modèles Colinéarité Une dénition de la colinéarité dans le cas des régressions peut être la suivante: deux variables sont colinéaires si elles apportent la même information. On peut détecter la colinéarité entre deux variables à l?aide de deux résultats précédemment étudiés: Un coecient de corrélation très élevé (PROC CORR). La relation géométrique est linéaire (PROC PLOT). Evidement la colinéarité a beaucoup d'inuence sur le modèle : un modèle qui contient deux variables colinéaires peut être moins bon que le modèle qui ne contient qu'une d'entre elles (la meilleure...). Une autre méthodes, vus au cours 4, nous permet aussi d'isoler ces variables coliéaires: L'analyse en composantes principales (ACP). Les variables qui se retrouvent sur un même axe peuvent être colinéaires Méthodes de selection Les régresseurs n'expliquent pas tous la réponse de manière égale: certains régresseurs sont meilleurs que d'autres. Notamment, un modèle peut être meilleur si on enlève une variable du modèle.pour ce faire, des méthodes de sélection de variables peuvent être utilisées. Il existe 3 méthodes: Ascendante pas à pas (forward): les variables sont ajoutées au modèle les unes après les autres, la première variable étant la meilleure. Descendante pas à pas (backward) : toutes les variables sont ajoutés, puis elles sont enlevées une par une en fonction de celle qui est la moins pertinentes. Ascendante avec remise en cause (stepwise) : méthode forward où une variable ajoutée peut être ultérieurement enlevée. 2.9 Conclusion Analyser les variables quantitatives explicatives: Recherche des variables colinéaires. Sélectionner les variables qui vont entrer dans le modèle. Rechercher le modèle: Pour trouver les régresseurs les plus explicatifs: méthode de sélection pas à pas des variables. Pour le cas des variables colinéaires : comparer les modèles. Analyse de la qualité du modèle. goutte@math.univ-paris13.fr Master 2 EID 07/08 10
11 Analyse des observations inuentes. Valider le modèle. 3 Regressions sous SAS 3.1 Syntaxe PROC REG <options>; <label:> MODEL <variable réponse>=<régresseurs> / <options> ; BY <variable>; FREQ <variable>; ID <variable>; WEIGHT <variable>; OUTPUT <OUT=table> <mot-clé>=<nom>; RUN; QUIT; Algorithme 1: Procédure REG Les options de la procèdure REG: CORR: édite la matrice des corrélations entre les variables. DATA=table : table en entrée. NOPRINT : supprime toute édition. OUTEST=table : crée une table qui contient l'équation du modèle. Les options de l'instruction MODEL: <label:> MODEL réponse=<régresseurs> / <options> ; Label: : Libellé du modèle. Réponse : variable à expliquer. Régresseurs : variables explicatives. goutte@math.univ-paris13.fr Master 2 EID 07/08 11
12 Les options : NOINT : supprime la constante dans l'équation du modèle. R : édite les statistiques pour les observations (Valeurs prédites, Résidus studentisés, Distance de Cook,...). SELECTION=forward/backward/stepwise : sélection des variables pas à pas. Les options classiques: BY: eectue un modèle par modalité de la variable. FREQ: pondération des observations (si pour une observation FREQ=3, l'observation est prise en compte comme si elle apparaissait 3 fois. ID : Identiant des observations. WEIGHT : pondération des observations pour eectuer une régression pondérée. OUTPUT <OUT=table> mot-clé=nom : OUT=table : crée une table en sortie, qui contient les stats du modèle. Au moins un mot-clé doit être spécié Mot-clé=nom : ajoute le mot-clé dans la table OUT et le renomme en nom. Exemple de mot clé : p pour les valeurs prédites. goutte@math.univ-paris13.fr Master 2 EID 07/08 12
La place de SAS dans l'informatique décisionnelle
La place de SAS dans l'informatique décisionnelle Olivier Decourt ABS Technologies - Educasoft Formations La place de SAS dans l'informatique décisionnelle! L'historique de SAS! La mécanique! La carrosserie
Plus en détailExemples d application
AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détailSTATISTIQUES. UE Modélisation pour la biologie
STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres
Plus en détail1 Imputation par la moyenne
Introduction au data mining L3 MIS - STA 1616-2010 V. Monbet Données manquantes L'objectif de ce TD est de manipuler et de comparer plusieurs méthodes d'imputation de données manquantes. La première partie
Plus en détailChapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Plus en détailINITIATION AU LOGICIEL SAS
INITIATION AU LOGICIEL SAS (version 9.1.3 sous Windows) Hélène HAMISULTANE Bibliographie : Initiation au logiciel SAS(9) pour Windows, Coqué N. (juin 2006). www.agroparistech.fr/img/pdf/polysas.pdf SAS
Plus en détailRégression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr
Régression linéaire Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr 2005 Plan Régression linéaire simple Régression multiple Compréhension de la sortie de la régression Coefficient de détermination R
Plus en détailCrédit Scoring. Master 2 SRO. Année scolaire 2009/2010. Professeur : RICHARD EMILION. Réalisé par : MAHAMAT OUMAR ALHABO et OULD EL HADDAD CHEIKH
Master 2 SRO Année scolaire 2009/2010 Crédit Scoring Professeur : RICHARD EMILION Réalisé par : MAHAMAT OUMAR ALHABO et OULD EL HADDAD CHEIKH Master_2_SRO_Data-Mining 1 Table des matières PARTIE 1 1. Résumé
Plus en détailEconométrie La régression linéaire simple et multiple
Ricco Rakotomalala Econométrie La régression linéaire simple et multiple Version 1.1 Université Lumière Lyon 2 Page: 1 job: Econometrie_Regression macro: svmono.cls date/time: 26-May-2015/18:13 Page: 2
Plus en détailSouad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/
Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation
Plus en détailTRACER LE GRAPHE D'UNE FONCTION
TRACER LE GRAPHE D'UNE FONCTION Sommaire 1. Méthodologie : comment tracer le graphe d'une fonction... 1 En combinant les concepts de dérivée première et seconde, il est maintenant possible de tracer le
Plus en détailL ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Plus en détailIntroduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Plus en détailLogiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS
Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence
Plus en détailIBM SPSS Regression 21
IBM SPSS Regression 21 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p. 46. Cette version s applique à IBM SPSS Statistics
Plus en détailNON-LINEARITE ET RESEAUX NEURONAUX
NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail
Plus en détailTESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION
TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun
Plus en détailRésolution d équations non linéaires
Analyse Numérique Résolution d équations non linéaires Said EL HAJJI et Touria GHEMIRES Université Mohammed V - Agdal. Faculté des Sciences Département de Mathématiques. Laboratoire de Mathématiques, Informatique
Plus en détailSAS ENTERPRISE MINER POUR L'ACTUAIRE
SAS ENTERPRISE MINER POUR L'ACTUAIRE Conférence de l Association des Actuaires I.A.R.D. 07 JUIN 2013 Sylvain Tremblay Spécialiste en formation statistique SAS Canada AGENDA Survol d Enterprise Miner de
Plus en détail1 Modélisation d être mauvais payeur
1 Modélisation d être mauvais payeur 1.1 Description Cet exercice est très largement inspiré d un document que M. Grégoire de Lassence de la société SAS m a transmis. Il est intitulé Guide de démarrage
Plus en détailLeçon N 4 : Statistiques à deux variables
Leçon N 4 : Statistiques à deux variables En premier lieu, il te faut relire les cours de première sur les statistiques à une variable, il y a tout un langage à se remémorer : étude d un échantillon d
Plus en détailSAS de base : gestion des données et procédures élémentaires
1 SAS de base : gestion des données et procédures élémentaires SAS de base : gestion des données et procédures élémentaires Résumé Description des commandes (module SAS de base) les plus utiles de l étape
Plus en détail«Cours Statistique et logiciel R»
«Cours Statistique et logiciel R» Rémy Drouilhet (1), Adeline Leclercq-Samson (1), Frédérique Letué (1), Laurence Viry (2) (1) Laboratoire Jean Kuntzmann, Dép. Probabilites et Statistique, (2) Laboratoire
Plus en détailIntroduction à la Statistique Inférentielle
UNIVERSITE MOHAMMED V-AGDAL SCIENCES FACULTE DES DEPARTEMENT DE MATHEMATIQUES SMI semestre 4 : Probabilités - Statistique Introduction à la Statistique Inférentielle Prinemps 2013 0 INTRODUCTION La statistique
Plus en détailConception d'un réseau de transport d'électricité
La Fédération Française des Jeux Mathématiques et la Société de Calcul Mathématique SA avec l'appui de Réseau de Transport d'electricité Conception d'un réseau de transport d'électricité Auteurs : Florian
Plus en détailInitiation au logiciel SAS(9) pour Windows
AgroParisTech Initiation au logiciel SAS(9) pour Windows N. Coqué UFR de Mathématiques, Département MMIP Table des matières Introduction 3 1 Présentation 3 1.1 Les tables SAS.....................................
Plus en détailDéroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Plus en détailPhysique: 1 er Bachelier en Medecine. 1er juin 2012. Duree de l'examen: 3 h. Partie 1: /56. Partie 2 : /20. Nom: N ō carte d étudiant:
Nom: Prénom: A N ō carte d étudiant: Physique: 1 er Bachelier en Medecine 1er juin 2012. Duree de l'examen: 3 h Avant de commencer a repondre aux questions, identiez-vous en haut de cette 1ere page, et
Plus en détailCoup de Projecteur sur les Réseaux de Neurones
Coup de Projecteur sur les Réseaux de Neurones Les réseaux de neurones peuvent être utilisés pour des problèmes de prévision ou de classification. La représentation la plus populaire est le réseau multicouche
Plus en détailOPTIMISATION À UNE VARIABLE
OPTIMISATION À UNE VARIABLE Sommaire 1. Optimum locaux d'une fonction... 1 1.1. Maximum local... 1 1.2. Minimum local... 1 1.3. Points stationnaires et points critiques... 2 1.4. Recherche d'un optimum
Plus en détailELASTICITE DE LA DEMANDE Calcul de l'elasticite & Applications Plan du cours I. L'elasticite de la demande & ses determinants II. Calcul de l'elasticite & pente de la courbe de demande III. Applications
Plus en détailRapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/2011. 1.1 Présentation. 1.2 Ressources
Master Maths Finances 2010/2011 Data Mining janvier 2011 RapidMiner 1 Introduction 1.1 Présentation RapidMiner est un logiciel open source et gratuit dédié au data mining. Il contient de nombreux outils
Plus en détailYAO : Un logiciel pour les modèles
YAO : Un logiciel pour les modèles numériques et l'assimilation de données Sylvie Thiria, Fouad Badran, Charles Sorror Rapport de recherche (22 juin 2006) 1 Table des matières 1 Introduction 3 2 Principes
Plus en détailL exclusion mutuelle distribuée
L exclusion mutuelle distribuée L algorithme de L Amport L algorithme est basé sur 2 concepts : L estampillage des messages La distribution d une file d attente sur l ensemble des sites du système distribué
Plus en détail$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU
$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU Fabien FIGUERES fabien.figueres@mpsa.com 0RWVFOpV : Krigeage, plans d expériences space-filling, points de validations, calibration moteur. 5pVXPp Dans le
Plus en détailScénario: Score d appétence de la carte visa premier
Scénario: Score d appétence de la carte visa premier Résumé Cette aventure reprend rapidement l exploration des données bancaires avant d aborder systématiquement la construction de modèles de prévision
Plus en détailTP3 : Creation de tables 1 seance
Universite de Versailles IUT de Velizy - Algorithmique 2005/2006 TP3 : Creation de tables 1 seance Objectif : Creation et modication de tables dans une base de donnees. Avant de commencer ce TP, terminer
Plus en détailSéance 0 : Linux + Octave : le compromis idéal
Séance 0 : Linux + Octave : le compromis idéal Introduction Linux est un système d'exploitation multi-tâches et multi-utilisateurs, basé sur la gratuité et développé par une communauté de passionnés. C'est
Plus en détailFaut-il pondérer? ...Ou l'éternelle question de l'économètre confronté à un problème de sondage. Laurent Davezies et Xavier D'Haultf uille.
Faut-il pondérer?...ou l'éternelle question de l'économètre confronté à un problème de sondage Laurent Davezies et Xavier D'Haultf uille Juin 2009 Résumé Ce papier précise dans quels cas les estimations
Plus en détailRenforcement des trois compétences : compréhension orale, expression orale et expression écrite à partir de documents et vidéos.
Master Mathématiques et Applications Spécialité : Ingénierie mathématique et modélisation Parcours : Mathématique et Informatique : Statistique, Signal, Santé (MI3S) 2015-2016 RÉSUMÉ DES COURS : (dernière
Plus en détailThéorie des sondages : cours 5
Théorie des sondages : cours 5 Camelia Goga IMB, Université de Bourgogne e-mail : camelia.goga@u-bourgogne.fr Master Besançon-2010 Chapitre 5 : Techniques de redressement 1. poststratification 2. l estimateur
Plus en détailÉvaluation de la régression bornée
Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement
Plus en détailAPPORT DES RESEAUX BAYESIENS DANS LA PREVENTION DE LA DELINQUANCE
SûretéGlobale.Org La Guitonnière 49770 La Meignanne Téléphone : +33 241 777 886 Télécopie : +33 241 200 987 Portable : +33 6 83 01 01 80 Adresse de messagerie : c.courtois@sureteglobale.org APPORT DES
Plus en détaila) La technique de l analyse discriminante linéaire : une brève présentation. 3 étapes de la méthode doivent être distinguées :
a) La technique de l analyse discriminante linéaire : une brève présentation. Nous nous limiterons ici à l'analyse discriminante linéaire et à deux groupes : - linéaire, la variante utilisée par ALTMAN
Plus en détailFOAD COURS D ECONOMETRIE 1 CHAPITRE 2 : Hétéroscédasicité des erreurs. 23 mars 2012.
FOAD COURS D ECONOMETRIE CHAPITRE 2 : Hétéroscédasicité des erreurs. 23 mars 202. Christine Maurel Maître de conférences en Sciences Economiques Université de Toulouse - Capitole Toulouse School of Economics-ARQADE
Plus en détailCours de méthodes de scoring
UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-
Plus en détailAnalyse de la variance Comparaison de plusieurs moyennes
Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction
Plus en détailUn exemple de régression logistique sous
Fiche TD avec le logiciel : tdr341 Un exemple de régression logistique sous A.B. Dufour & A. Viallefont Etude de l apparition ou non d une maladie cardiaque des coronaires 1 Présentation des données Les
Plus en détailANALYSE DE RISQUE AVEC LA MÉTHODE MEHARI Eric Papet e.papet@dev1-0.com Co-Fondateur SSII DEV1.0 Architecte Logiciel & Sécurité Lead Auditor ISO 27001
ANALYSE DE RISQUE AVEC LA MÉTHODE MEHARI Eric Papet e.papet@dev1-0.com Co-Fondateur SSII DEV1.0 Architecte Logiciel & Sécurité Lead Auditor ISO 27001 PLAN Introduction Générale Introduction MEHARI L'analyse
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailIntroduction à l économétrie : Spécifications, formes fonctionnelles, hétéroscédasticité et variables instrumentales
Introduction à l économétrie : Spécifications, formes fonctionnelles, hétéroscédasticité et variables instrumentales Pierre Thomas Léger IEA, HEC Montréal 2013 Table des matières 1 Introduction 2 2 Spécifications
Plus en détailCours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES
LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,
Plus en détailANTISELECTION ET CHOIX D'ASSURANCE : LE CAS DU VOL EN HABITATION UNE APPROCHE DE LA MESURE DU PHENOMENE
ANTISELECTION ET CHOIX D'ASSURANCE : LE CAS DU VOL EN HABITATION UNE APPROCHE DE LA MESURE DU PHENOMENE Yannick MACÉ Statisticien-Economiste Responsable du Secteur Analyses Techniques, Groupama (C.C.A.M.A.)
Plus en détailEquations cartésiennes d une droite
Equations cartésiennes d une droite I) Vecteur directeur d une droite : 1) Définition Soit (d) une droite du plan. Un vecteur directeur d une droite (d) est un vecteur non nul la même direction que la
Plus en détailChristophe CANDILLIER Cours de DataMining mars 2004 Page 1
Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe
Plus en détailFORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)
87 FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) Dans le cadre de la réforme pédagogique et de l intérêt que porte le Ministère de l Éducation
Plus en détailAnnexe A de la norme 110
Annexe A de la norme 110 RAPPORTS D ÉVALUATION PRÉPARÉS AUX FINS DES TEXTES LÉGAUX OU RÉGLEMENTAIRES OU DES INSTRUCTIONS GÉNÉRALES CONCERNANT LES VALEURS MOBILIÈRES Introduction 1. L'annexe A a pour objet
Plus en détailL'analyse de données. Polycopié de cours ENSIETA - Réf. : 1463. Arnaud MARTIN
L'analyse de données Polycopié de cours ENSIETA - Réf : 1463 Arnaud MARTIN Septembre 2004 Table des matières 1 Introduction 1 11 Domaines d'application 2 12 Les données 2 13 Les objectifs 3 14 Les méthodes
Plus en détailChap 4: Analyse syntaxique. Prof. M.D. RAHMANI Compilation SMI- S5 2013/14 1
Chap 4: Analyse syntaxique 1 III- L'analyse syntaxique: 1- Le rôle d'un analyseur syntaxique 2- Grammaires non contextuelles 3- Ecriture d'une grammaire 4- Les méthodes d'analyse 5- L'analyse LL(1) 6-
Plus en détailL ALGORITHMIQUE. Algorithme
L ALGORITHMIQUE Inspirée par l informatique, cette démarche permet de résoudre beaucoup de problèmes. Quelques algorithmes ont été vus en 3 ième et cette année, au cours de leçons, nous verrons quelques
Plus en détail1.5 0.5 -0.5 -1.5 0 20 40 60 80 100 120. (VM(t i ),Q(t i+j ),VM(t i+j ))
La logique oue dans les PME/PMI Application au dosage de l'eau dans les bétons P.Y. Glorennec INSA de Rennes/IRISA glorenne@irisa.fr C. Hérault Hydrostop christophe@hydrostop.fr V. Hulin Hydrostop vincent@hydrostop.fr
Plus en détailTable des matières. Avant-propos. Chapitre 2 L actualisation... 21. Chapitre 1 L intérêt... 1. Chapitre 3 Les annuités... 33 III. Entraînement...
III Table des matières Avant-propos Remerciements................................. Les auteurs..................................... Chapitre 1 L intérêt............................. 1 1. Mise en situation...........................
Plus en détailÉtude de cas Assurance (d après une étude de Philippe Périé, CISIA)
Étude de cas Assurance (d après une étude de Philippe Périé, CISIA) I.1.Les données L échantillon est constitué de 1106 assurés Belges observés en 1992 et répartis en 2 groupes. - les assurés qui n ont
Plus en détailFiltrage stochastique non linéaire par la théorie de représentation des martingales
Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de
Plus en détailExercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015
Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par
Plus en détailFonctions de plusieurs variables : dérivés partielles, diérentielle. Fonctions composées. Fonctions de classe C 1. Exemples
45 Fonctions de plusieurs variables : dérivés partielles, diérentielle. Fonctions composées. Fonctions de classe C 1. Exemples Les espaces vectoriels considérés sont réels, non réduits au vecteur nul et
Plus en détailProgrammation linéaire
1 Programmation linéaire 1. Le problème, un exemple. 2. Le cas b = 0 3. Théorème de dualité 4. L algorithme du simplexe 5. Problèmes équivalents 6. Complexité de l Algorithme 2 Position du problème Soit
Plus en détailNOTATIONS PRÉLIMINAIRES
Pour le Jeudi 14 Octobre 2010 NOTATIONS Soit V un espace vectoriel réel ; l'espace vectoriel des endomorphismes de l'espace vectoriel V est désigné par L(V ). Soit f un endomorphisme de l'espace vectoriel
Plus en détailBaccalauréat ES Pondichéry 7 avril 2014 Corrigé
Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient
Plus en détailCopropriété: 31, rue des Abondances 92100 Boulogne-Billancourt
Eléments utilisés: Copropriété: 31, rue des Abondances 92100 Boulogne-Billancourt Notice explicative sur la ventilation de la facture EDF annuelle entre les différents postes de consommation à répartir
Plus en détailEquilibrage de charge multi-critère pour les serveurs DNS(SEC)
Equilibrage de charge multi-critère pour les serveurs DNS(SEC) Stanislas Francfort, Stéphane Sénécal, Qinghui Xu, Daniel Migault 6 décembre 2010 Résumé Cet article présente le problème de répartition de
Plus en détail2010 Minitab, Inc. Tous droits réservés. Version 16.1.0 Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des
2010 Minitab, Inc. Tous droits réservés. Version 16.1.0 Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des marques déposées de Minitab, Inc. aux Etats-Unis et
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailScénario: Données bancaires et segmentation de clientèle
Résumé Scénario: Données bancaires et segmentation de clientèle Exploration de données bancaires par des méthodes uni, bi et multidimensionnelles : ACP, AFCM k-means, CAH. 1 Présentation Le travail proposé
Plus en détailData Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.
des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le
Plus en détailAnnexe commune aux séries ES, L et S : boîtes et quantiles
Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans
Plus en détailAlgèbre 40 Analyse 26 14 Stat. 1 - IES : Probabilités discrètes et calcul intégral 29,5 6 Stat. 2 - IES : Probabilités générales 54 8 UE1-02 M-E-IS
1er semestre UE1-01 E Algèbre 40 Analyse 26 14 Stat. 1 - IES : Probabilités discrètes et calcul intégral 29,5 6 Stat. 2 - IES : Probabilités générales 54 8 UE1-02 M-E-IS Introduction au système SAS 25,5
Plus en détailFonctions de deux variables. Mai 2011
Fonctions de deux variables Dédou Mai 2011 D une à deux variables Les fonctions modèlisent de l information dépendant d un paramètre. On a aussi besoin de modéliser de l information dépendant de plusieurs
Plus en détailFormations EViews FORMATIONS GENERALES INTRODUCTIVES INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS
Formations EViews FORMATIONS GENERALES INTRODUCTIVES DEB : DECOUVERTE DU LOGICIEL EVIEWS INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS FORMATIONS METHODES ECONOMETRIQUES VAR : MODELES
Plus en détailOpenFLUID Software Environment for Modelling Fluxes in Landscapes
OpenFLUID Software Environment for Modelling Fluxes in Landscapes TP MHYDAS : Mise en uvre, analyses de sensibilité et de scénarii du modèle hydrologique distribué MHYDAS - Application au bassin versant
Plus en détailCours 9. Régimes du transistor MOS
Cours 9. Régimes du transistor MOS Par Dimitri galayko Unité d enseignement Élec-info pour master ACSI à l UPMC Octobre-décembre 005 Dans ce document le transistor MOS est traité comme un composant électronique.
Plus en détailModélisation intégrée des écoulements pour la gestion en temps réel d'un bassin versant anthropisé
1 TGR Modélisation intégrée des écoulements pour la gestion en temps réel d'un bassin versant anthropisé Simon Munier Institut des Sciences et Industries du Vivant et de l'environnement (AgroParisTech)
Plus en détailt 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :
Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant
Plus en détailStratégie optimale de stockage de déchets à vie longue
Stratégie optimale de stockage de déchets à vie longue Bertrand Villeneuve Université Paris-Dauphine bertrand.villeneuve@dauphine.fr 3 octobre 211 Ce texte présente des calculs théoriques et indications
Plus en détailAnnée : Team-War Jaafar AMRANI-MESBAHI Fabien GARCIA Abdelali NAIT BELKACEM Rahma NAKARA Philippe NGUYEN
Projet de Fin d'étude Rapport de gestion de projet Recherche de méthode d'estimation de volume de production à risque Équipe 5e me Année : Team-War Jaafar AMRANI-MESBAHI Fabien GARCIA Abdelali NAIT BELKACEM
Plus en détailProjet SINF2275 «Data mining and decision making» Projet classification et credit scoring
Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems
Plus en détailOrdonnancement. N: nains de jardin. X: peinture extérieure. E: électricité T: toit. M: murs. F: fondations CHAPTER 1
CHAPTER 1 Ordonnancement 1.1. Étude de cas Ordonnancement de tâches avec contraintes de précédences 1.1.1. Exemple : construction d'une maison. Exercice. On veut construire une maison, ce qui consiste
Plus en détailFONCTION DE DEMANDE : REVENU ET PRIX
FONCTION DE DEMANDE : REVENU ET PRIX 1. L effet d une variation du revenu. Les lois d Engel a. Conditions du raisonnement : prix et goûts inchangés, variation du revenu (statique comparative) b. Partie
Plus en détailChapitre 2 Le problème de l unicité des solutions
Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)
Plus en détailBaccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé
Baccalauréat S ntilles-guyane 11 septembre 14 Corrigé EXERCICE 1 6 points Commun à tous les candidats Une entreprise de jouets en peluche souhaite commercialiser un nouveau produit et à cette fin, effectue
Plus en détailAnalyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1)
Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1) Modèles de régression logistique à réaliser Une explicative catégorielle
Plus en détailNOTIONS DE PROBABILITÉS
NOTIONS DE PROBABILITÉS Sommaire 1. Expérience aléatoire... 1 2. Espace échantillonnal... 2 3. Événement... 2 4. Calcul des probabilités... 3 4.1. Ensemble fondamental... 3 4.2. Calcul de la probabilité...
Plus en détailChapitre 2/ La fonction de consommation et la fonction d épargne
hapitre 2/ La fonction de consommation et la fonction d épargne I : La fonction de consommation keynésienne II : Validations et limites de la fonction de consommation keynésienne III : Le choix de consommation
Plus en détailProgrammation Linéaire - Cours 1
Programmation Linéaire - Cours 1 P. Pesneau pierre.pesneau@math.u-bordeaux1.fr Université Bordeaux 1 Bât A33 - Bur 265 Ouvrages de référence V. Chvátal - Linear Programming, W.H.Freeman, New York, 1983.
Plus en détailTechniques du Data Mining pour la prédiction de faillite des entreprises et la gestion du risque de crédit
Techniques du Data Mining pour la prédiction de faillite des entreprises et la gestion du risque de crédit Adil Belhouari HEC - Montréal - Journées de l Optimisation 2005-09 Mai 2005 PLAN DE LA PRÉSENTATION
Plus en détailSOMMAIRE OPÉRATIONS COURANTES OPÉRATIONS D INVENTAIRE
SOMMAIRE OPÉRATIONS COURANTES OPÉRATIONS D INVENTAIRE 1 Factures de doit p. 9 Processus 1 2 Réductions sur factures de doit p. 11 Processus 1 3 Frais accessoires sur factures p. 13 Processus 1 4 Comptabilisation
Plus en détailLA GESTION DU RISQUE DE CHANGE. Finance internationale, 9 ème édition Y. Simon et D. Lautier
LA GESTION DU RISQUE DE CHANGE 2 Section 1. Problématique de la gestion du risque de change Section 2. La réduction de l exposition de l entreprise au risque de change Section 3. La gestion du risque de
Plus en détailProcessus de Développement Logiciel
Processus de Développement Logiciel Cours M14 Pierre Gérard Université de Paris 13 IUT Villetaneuse Formation Continue Licence Pro SIL - 2007/2008 Table des matières 1 Des besoins au code avec UML 1 2
Plus en détail