Introduction à la modélisation statistique

Dimension: px
Commencer à balayer dès la page:

Download "Introduction à la modélisation statistique"

Transcription

1 Introduction à la modélisation statistique Illustrée avec XLSTAT Jean Paul Maalouf 29 novembre

2 PLAN XLSTAT : qui sommes-nous? Statistiques : categories Rappel : tests statistiques Modélisation statistique : principes Régression linéaire simple / ANOVA Principes Démonstration XLSTAT et interprétation des sorties : coefficients, p-values, R² Hypothèses sur les résidus et diagnostic graphique Régression linéaire multiple Principe, mises en garde : sur-ajustement et multicollinéarité Démonstration XLSTAT et interprétation des sorties Quelle méthode de modélisation choisir? Annexe : résidus-outils de diagnostic alternatifs Annexe : outils de modélisation alternatifs Toutes les données de cette formation ont été inventées sauf mention contraire 2

3 Logiciel XLSTAT XLSTAT est un logiciel d analyse de données convivial qui s intègre à Excel 3

4 XLSTAT, Historique Un logiciel en pleine croissance, une équipe grandissante Première vente sur internet Nouvelle version, Interface : VBA, Calculs : C++ 7 langues Nouveaux produits Nouveau site Equipe grandissante Thierry Fahmy développe une alternative userfriendly pour l analyse de données : Naissance d XLSTAT 1996 Création de la société Addinsoft 2006 Nouvelles offres modulaires 2015 XLSTAT 365 Version Cloud pour Excel 365 XLSTAT-Free Version gratuite 4

5 XLSTAT en quelques chiffres 200+ fonctionnalités statistiques Réparties dans des solutions généralistes ou orientées-métier 50k utilisateurs A travers le monde. Secteurs privé, éducation, recherche 16 salariés A l écoute des utilisateurs 130k visites/mois sur le site web Tutoriels didactiques en 5 langues 7 langues 400 téléchargements/jour 5

6 Statistiques : 4 catégories 6

7 Statistiques : 4 catégories Enregistrement Enregistrement Enregistrement Description Exploration Tests Modélisation Je veux résumer Je veux plonger Je veux accepter / Je cherche à des données (1-3 facilement dans un rejeter une hypothèse comprendre comment variables) grâce à gros jeu de données bien précise en évolue un phénomène des calculs ou des sans forcément avoir assumant des risques en fonction d un graphiques simples une question précise d erreur (test t, ANOVA, ensemble de (moyenne, écart derrière la tête (ACP, khi², corrélation...) paramètres (régression, type, box plot ) CAH...) ANCOVA, ANOVA) 7

8 Tests statistiques : rappel 8

9 Tests statistiques : rappel? Question La moyenne A est-elle significativement différente de la moyenne B? Le test renvoie une p-value. 0 < p-value < 1 H0 Ha Hypothèse nulle En général absence de différence ou de relation. H0 : moyenne A = moyenne B Hypothèse alternative En général existence de différence ou de relation Ha : moyenne A moyenne B Décision : Si p-value < alpha, on rejette H0 et on accepte Ha en prenant un risque p-value de se tromper 9

10 Modélisation statistique - principes Je cherche à comprendre la manière dont évolue un phénomène en fonction d un ensemble de variables 10

11 Modélisation statistique : principes Définition Un modèle statistique est une représentation simplifiée et chiffrée d un phénomène. Il nous permet de mieux comprendre la réalité voire de faire des prédictions. 11

12 Modélisation statistique : exemple caricatural On vous demande : quelle-est la taille des français? Première manière de répondre Vous récitez l intégralité du tableau, ligne par ligne Deuxième manière de répondre Vous calculez la moyenne et l écart type de vos données et vous contentez de fournir ces deux chiffres Vous disposez de ce tableau contenant l info taille d un échantillon représentatif de 200 Français Français Taille Janine 169 Françoise 158 Roger 159 Albert 168 Isabelle 171 Jean-Luc 187 Nicolas 171 Benoît Représenter la taille des Français par une moyenne et un écart type est une manière de modéliser cette taille 12

13 Modélisation statistique : principes Définition Un modèle statistique est une représentation simplifiée et chiffrée d un phénomène. Il nous permet de mieux comprendre la réalité voire de faire des prédictions. Techniquement, comment ça marche? Un modèle permet d expliquer une variable (à expliquer, dépendante) par des variables (explicatives, indépendantes) via des équations mathématiques impliquant des paramètres. Le modèle caricatural de la moyenne n implique pas de variables explicatives 13

14 Régression linéaire simple Principes, démonstration XLSTAT, interprétation des sorties 14

15 Individus Tableau de données : plateforme de vente de chaussures en ligne Variables Question : comment le montant de la facture varie-t-il en fonction du temps passé sur le site? 15

16 Exemple : modélisation du montant facture en fonction du temps passé sur le site 16

17 Exemple : modélisation du montant facture en fonction du temps passé sur le site On peut partir sur une Régression linéaire simple (y = a*x + b) Notre manière de simplifier la réalité : un modèle «droite» paramètres Ce qu on n a pas réussi à capturer avec notre modèle Montant facture = a*temps passé sur le site + b + résidus Variable dépendante ( = à expliquer) Variable explicative Erreurs (Résidus) PS : on a choisi une modélisation linéaire, mais rien ne nous y obligeait. La question nous donne le droit de choisir un modèle plus courbe, si les données et l interprétation le justifient. 17

18 Salaire moyen L ANOVA peut être elle aussi perçue comme un modèle statistique (variables explicatives qualitatives) modèle Modèle un paramètre Salaire moyen = moyenne(modalité de référence) + écart(modalité du point considéré) + résidus deux paramètres Modalité de référence Terre Pluton Mars Origine Erreurs (Résidus) ANOVA, régression linéaire & ANCOVA font partie de la famille du modèle linéaire 18

19 Modélisation - Comment estimer les paramètres? Cas de la régression linéaire simple Pour un modèle donné, les meilleures valeurs de paramètres sont celles qui minimisent la somme des carrés des résidus : n S a, b = i=1 y i ax i + b 2 y observés (données) y prédits par le modèle Erreurs (Résidus) C est ce qu on appelle l estimation par les moindres carrés 19

20 Exemple : modélisation du montant facture en fonction du temps passé sur le site - XLSTAT 20

21 Modélisation linéaire du montant facture en fonction du temps passé sur le site Régression linéaire simple, sorties XLSTAT Estimation des paramètres (moindres carrés) Intervalles de confiance autour de l estimation b a P-values associées à: H0 : paramètre = 0 Ha : paramètre 0 Equation peut être utilisée pour prédire le montant de la facture en fonction de nouvelles valeurs de temps passé sur le site 21

22 Modélisation linéaire du montant facture en fonction du temps passé sur le site Régression linéaire simple, sorties XLSTAT Le R² reflète la bonne adéquation du modèle aux données. 0<R²<1 Intervalle de confiance du modèle ( = lié à l estimation des paramètres) Intervalle de confiance de prédiction = 95% des nouvelles prédictions tomberont dans cette enveloppe 22

23 modèle linéaire hypothèses sur les résidus Un modèle linéaire n est fiable que sous certaines hypothèses relatives aux résidus associés 23

24 Modèle linéaire : hypothèses sur les résidus Indépendance Pas d autocorrélation. Une mesure par individu. Normalité Résidus suivent une distribution normale Pas trop de valeurs hors-normes En général, pas plus de 5% de résidus hors-normes Homoscedasticité Homogénéité de la variance des résidus 24

25 Modèle linéaire : hypothèses sur les résidus, diagnostic graphique Graphique des résidus en fonction des var. explicatives : Répartition homogène des points autour de la droite y = 0 modèle valide 25

26 Examen des résidus, cas courants de violation des hypothèses Violation de l indépendance ( résidus autocorrélés) Violation de l homoscedasticité ( hétérogénéité de la variance) Rencontrée surtout dans séries temporelles avec périodicité Cas où la variance est fonction de la moyenne par exemple 26

27 Solutions aux violations des hypothèses sur les résidus Réfléchir aux valeurs hors normes (les éliminer?) Transformer les données y ou x (log, racine carrée, Box-Cox ) Opter pour un modèle plus adapté (non-linéaire, de Poisson ) Autocorrélation : modèle de Cochrane-Orcutt (XLSTAT-Forecast) 27

28 Régression linéaire multiple y = a*x1 + b*x

29 Régression linéaire multiple - principes Etudier l influence linéaire de plusieurs variables explicatives sur la variable à expliquer, augmenter la qualité prédictive 29

30 Régression linéaire multiple mises en garde outre les hypothèses sur les résidus : sur-ajustement et multicollinéarité 30

31 Ajouter des variables explicatives Régression linéaire multiple (y = a*x1 + b*x2 +...) mises en garde Ajouter des variables explicatives augmente le R² Et par conséquent la qualité prédictive du modèle. Attention : ne pas en inclure beaucoup trop Pour éviter d avoir des modèles trop ajustés sur nos données particulières, et par conséquent peu généralisables. L indice de qualité de modèle AIC. Compromis entre : bon ajustement aux données faible nombre de paramètres. L AIC est un indice de qualité relative donc à utiliser uniquement pour comparer des modèles entre eux. Le modèle à l AIC le plus faible est le meilleur. Attention aux variables redondantes Certaines variables très corrélées peuvent se masquer les unes les autres dans l évaluation de leurs effets. On parle de multicollinéarité (indice VIF > 5). Exemples : température du jour et température de la nuit ; poids et taille 31

32 Modélisation linéaire du montant facture en fonction d une série de variables Régression linéaire multiple Question : quelles variables (colonnes D-G) ont la meilleure influence linéaire sur le montant de la facture? Peut-on prédire le montant de la facture de deux nouveaux clients? 32

33 Modélisation linéaire du montant facture en fonction d une série de variables Régression linéaire multiple 33

34 Modélisation linéaire du montant facture en fonction d une série de variables Régression linéaire multiple : examen de la multicollinéarité VIF très élevé Variables redondantes Solution : relancer le modèle en excluant une des deux variables 34

35 Modélisation linéaire du montant facture en fonction d une série de variables Régression linéaire multiple : coefficients lorsqu on exclut la taille Interprétation : Effet positif significatif du poids sur le montant de la facture 35

36 Modélisation linéaire du montant facture en fonction d une série de variables Prédiction 36

37 Selon le type de variable(s) à expliquer et explicatives, plusieurs solutions possibles : Quelle méthode de modélisation choisir? Lien : choisir un modèle statistique approprié en fonction de votre situation 37

38 Conclusion : Revenons à cette question sur la taille... Différents modèles pour répondre à la même question On vous demande : quelle-est la taille des Français? Taille des Français : variable à expliquer 4 Elle dépend linéairement de l âge et de l origine ANCOVA Leur taille a telle moyenne plus ou 1 moins tel écart type 5 Distribution normale (moyenne et écart type) Elle dépend linéairement de l âge et de la taille du père Régression linéaire multiple Elle dépend de l origine géographique 2 6 ANOVA à un facteur Elle dépend de l origine géographique et du sexe ANOVA à 2 facteurs Elle dépend linéairement de l âge 3 7 Régression linéaire simple Etc. etc. Var. explicatives quantitatives Var. explicatives qualitatives 38

39 En somme 39

40 Introduction à la modélisation statistique - résumé La modélisation statistique permet D examiner le comportement de variables dites à expliquer en fonction de variables dites explicatives via une equation mathématique impliquant des paramètres. De faire des prédictions grâce à cette équation. Les modèles linéaires classiques sont valables uniquement sous certaines hypothèses portant sur les résidus : normalité, homoscedasticité, absence d autorrélation. Attention aux problèmes liés à l introduction d un trop grand nombre de variables explicatives : sur-ajustement et multicollinéarité. Selon les types de variables et la question, différents modèles existent. 40

41 Merci pour votre attention! Tous les outils vus sont disponibles dans toutes les solutions XLSTAT (sauf la Free) Survey time 41

42 Disponibilité des webinars en ligne Jusqu au 16 décembre

43 Alternatives au diagnostic graphique pour verifier les Hypothèses sur les résidus Indépendance Test de Durbin-Watson exécuté sur les résidus std. (XLSTAT-Forecast) Normalité Tests de normalité exécuté sur les résidus std. Pas trop de valeurs hors-normes Vérifier que 5% des résidus std. ne dépassent pas 1.96 Homoscedasticité Tests de l hétéroscedasticité (Breusch- Pagan ou White) exécuté sur les résidus std. 43

44 Alternatives à la modélisation statistique classique Tableaux avec un grand nombre de var. explicatives ( > nombre d observations) présentant une multicollinéarité potentielle importante : régression PLS Machine learning supervisé : KNN, Naïve Bayes, SVM (surtout pour la prédiction) ; arbres de décision 44

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

NOTE SUR LA MODELISATION DU RISQUE D INFLATION NOTE SUR LA MODELISATION DU RISQUE D INFLATION 1/ RESUME DE L ANALYSE Cette étude a pour objectif de modéliser l écart entre deux indices d inflation afin d appréhender le risque à très long terme qui

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

Leçon N 4 : Statistiques à deux variables

Leçon N 4 : Statistiques à deux variables Leçon N 4 : Statistiques à deux variables En premier lieu, il te faut relire les cours de première sur les statistiques à une variable, il y a tout un langage à se remémorer : étude d un échantillon d

Plus en détail

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) 87 FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) Dans le cadre de la réforme pédagogique et de l intérêt que porte le Ministère de l Éducation

Plus en détail

Peut-on imiter le hasard?

Peut-on imiter le hasard? 168 Nicole Vogel Depuis que statistiques et probabilités ont pris une large place dans les programmes de mathématiques, on nous propose souvent de petites expériences pour tester notre perception du hasard

Plus en détail

Calculer avec Sage. Revision : 417 du 1 er juillet 2010

Calculer avec Sage. Revision : 417 du 1 er juillet 2010 Calculer avec Sage Alexandre Casamayou Guillaume Connan Thierry Dumont Laurent Fousse François Maltey Matthias Meulien Marc Mezzarobba Clément Pernet Nicolas Thiéry Paul Zimmermann Revision : 417 du 1

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

L'intelligence d'affaires: la statistique dans nos vies de consommateurs

L'intelligence d'affaires: la statistique dans nos vies de consommateurs L'intelligence d'affaires: la statistique dans nos vies de consommateurs Jean-François Plante, HEC Montréal Marc Fredette, HEC Montréal Congrès de l ACFAS, Université Laval, 6 mai 2013 Intelligence d affaires

Plus en détail

Résumé non technique

Résumé non technique Résumé non technique Constats : selon le FMI, l indexation et l ajustement biennal du salaire social minimum sont des facteurs déterminants à la fois du différentiel d inflation et de l inflation au Luxembourg

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

FORMULAIRE DE STATISTIQUES

FORMULAIRE DE STATISTIQUES FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

Faire un semi variograme et une carte krigée avec surfer

Faire un semi variograme et une carte krigée avec surfer Faire un semi variograme et une carte krigée avec surfer Jérôme Mathieu http://www.jerome.mathieu.freesurf.fr avril 2004 Fichier de données Faire un fichier excel avec les données organisée en colonnes:

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015 Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par

Plus en détail

Best Styles ou comment capturer au mieux les primes de risque sur les marchés d actions

Best Styles ou comment capturer au mieux les primes de risque sur les marchés d actions Stratégie Best Styles ou comment capturer au mieux les primes de risque sur les marchés d actions La recherche des primes de risque constitue une stratégie relativement courante sur les marchés obligataires

Plus en détail

Formations EViews FORMATIONS GENERALES INTRODUCTIVES INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS

Formations EViews FORMATIONS GENERALES INTRODUCTIVES INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS Formations EViews FORMATIONS GENERALES INTRODUCTIVES DEB : DECOUVERTE DU LOGICIEL EVIEWS INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS FORMATIONS METHODES ECONOMETRIQUES VAR : MODELES

Plus en détail

SOMMAIRE OPÉRATIONS COURANTES OPÉRATIONS D INVENTAIRE

SOMMAIRE OPÉRATIONS COURANTES OPÉRATIONS D INVENTAIRE SOMMAIRE OPÉRATIONS COURANTES OPÉRATIONS D INVENTAIRE 1 Factures de doit p. 9 Processus 1 2 Réductions sur factures de doit p. 11 Processus 1 3 Frais accessoires sur factures p. 13 Processus 1 4 Comptabilisation

Plus en détail

Données longitudinales et modèles de survie

Données longitudinales et modèles de survie ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Ecran principal à l ouverture du logiciel

Ecran principal à l ouverture du logiciel MANUEL D UTILISATION PLATEFORME SMS Félicitations pour avoir choisi notre plateforme d envoi de SMS. Le logiciel est très simple d utilisation et intuitif. Avec ce logiciel vous êtes libre de créer vos

Plus en détail

La place de SAS dans l'informatique décisionnelle

La place de SAS dans l'informatique décisionnelle La place de SAS dans l'informatique décisionnelle Olivier Decourt ABS Technologies - Educasoft Formations La place de SAS dans l'informatique décisionnelle! L'historique de SAS! La mécanique! La carrosserie

Plus en détail

Londres 1854 Des problèmes (re)connus Faire plus avec moins Tendances et défis «BYOD» WIN INTUNE «Nouveaux paradigmes» «Big Data» «Cloud» Windows Server Gestion Sys. Center Identité & Virt CLOUD OS Microsoft

Plus en détail

Transformation IT de l entreprise ANALYTIQUE: L ÈRE WATSON

Transformation IT de l entreprise ANALYTIQUE: L ÈRE WATSON Transformation IT de l entreprise ANALYTIQUE: L ÈRE WATSON L analytique joue un rôle désormais primordial dans la réussite d une entreprise. Les pouvoirs qu elle délivre sont incontestables, cependant

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

STATISTIQUES. UE Modélisation pour la biologie

STATISTIQUES. UE Modélisation pour la biologie STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane

Plus en détail

Statistique Descriptive Élémentaire

Statistique Descriptive Élémentaire Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier

Plus en détail

Programmation Linéaire - Cours 1

Programmation Linéaire - Cours 1 Programmation Linéaire - Cours 1 P. Pesneau pierre.pesneau@math.u-bordeaux1.fr Université Bordeaux 1 Bât A33 - Bur 265 Ouvrages de référence V. Chvátal - Linear Programming, W.H.Freeman, New York, 1983.

Plus en détail

PRIME D UNE OPTION D ACHAT OU DE VENTE

PRIME D UNE OPTION D ACHAT OU DE VENTE Université Paris VII - Agrégation de Mathématiques François Delarue) PRIME D UNE OPTION D ACHAT OU DE VENTE Ce texte vise à modéliser de façon simple l évolution d un actif financier à risque, et à introduire,

Plus en détail

Exemples d application

Exemples d application AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif

Plus en détail

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme? Exercices Alternatifs Quelqu un aurait-il vu passer un polynôme? c 2004 Frédéric Le Roux, François Béguin (copyleft LDL : Licence pour Documents Libres). Sources et figures: polynome-lagrange/. Version

Plus en détail

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme? Exercices Alternatifs Quelqu un aurait-il vu passer un polynôme? c 2004 Frédéric Le Roux, François Béguin (copyleft LDL : Licence pour Documents Libres). Sources et figures: polynome-lagrange/. Version

Plus en détail

MODELE A CORRECTION D ERREUR ET APPLICATIONS

MODELE A CORRECTION D ERREUR ET APPLICATIONS MODELE A CORRECTION D ERREUR ET APPLICATIONS Hélène HAMISULTANE Bibliographie : Bourbonnais R. (2000), Econométrie, DUNOD. Lardic S. et Mignon V. (2002), Econométrie des Séries Temporelles Macroéconomiques

Plus en détail

MABioVis. Bio-informatique et la

MABioVis. Bio-informatique et la MABioVis Modèles et Algorithmes pour la Bio-informatique et la Visualisation Visite ENS Cachan 5 janvier 2011 MABioVis G GUY MELANÇON (PR UFR Maths Info / EPI GRAVITE) (là, maintenant) - MABioVis DAVID

Plus en détail

Londres 1854 Des problèmes (re)connus Faire plus avec moins Tendances et défis «BYOD» WIN INTUNE «Nouveaux paradigmes» «Big Data» «Cloud» Windows Server Gestion Sys. Center Identité & Virt CLOUD OS Microsoft

Plus en détail

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient

Plus en détail

PLAN DE COURS. Reconnaître le rôle des mathématiques ou de l informatique dans la société contemporaine (0011)

PLAN DE COURS. Reconnaître le rôle des mathématiques ou de l informatique dans la société contemporaine (0011) PLAN DE COURS Titre du cours : Logiciels appliqués en sciences Numéro du cours : 360-ESZ-03 Programme : Sciences de la Nature 200B0 Pondération : 1-2-3 Session : Hiver 2010 Enseignant : Éric Gaul François

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

Capital économique en assurance vie : utilisation des «replicating portfolios»

Capital économique en assurance vie : utilisation des «replicating portfolios» Capital économique en assurance vie : utilisation des «replicating portfolios» Anne LARPIN, CFO SL France Stéphane CAMON, CRO SL France 1 Executive summary Le bouleversement de la réglementation financière

Plus en détail

Spécifications, Développement et Promotion. Ricco RAKOTOMALALA Université Lumière Lyon 2 Laboratoire ERIC

Spécifications, Développement et Promotion. Ricco RAKOTOMALALA Université Lumière Lyon 2 Laboratoire ERIC Spécifications, Développement et Promotion Ricco RAKOTOMALALA Université Lumière Lyon 2 Laboratoire ERIC Ricco? Enseignant chercheur (CNU.27) En poste à l Université Lyon 2 Faculté de Sciences Eco. Recherche

Plus en détail

Mortalité observée et mortalité attendue au cours de la vague de chaleur de juillet 2006 en France métropolitaine

Mortalité observée et mortalité attendue au cours de la vague de chaleur de juillet 2006 en France métropolitaine Mortalité observée et mortalité attendue au cours de la vague de chaleur de uillet en France métropolitaine FOUILLET A 1, REY G 1, JOUGLA E, HÉMON D 1 1 Inserm, U75, Villeuif, France. Inserm CépiDc, IFR9,

Plus en détail

1 Modélisation d être mauvais payeur

1 Modélisation d être mauvais payeur 1 Modélisation d être mauvais payeur 1.1 Description Cet exercice est très largement inspiré d un document que M. Grégoire de Lassence de la société SAS m a transmis. Il est intitulé Guide de démarrage

Plus en détail

Solution logicielle pour le pilotage et l ERM. Journées d études IARD 26 mars 2010 2 mars 2010

Solution logicielle pour le pilotage et l ERM. Journées d études IARD 26 mars 2010 2 mars 2010 Présentation d ERMS Solution logicielle pour le pilotage et l ERM Journées d études IARD 26 mars 2010 2 mars 2010 Sommaire 1 Présentation d ACTUARIS 2 Les problématiques rencontrées 3 Présentation d ERMS

Plus en détail

M2 IAD UE MODE Notes de cours (3)

M2 IAD UE MODE Notes de cours (3) M2 IAD UE MODE Notes de cours (3) Jean-Yves Jaffray Patrice Perny 16 mars 2006 ATTITUDE PAR RAPPORT AU RISQUE 1 Attitude par rapport au risque Nousn avons pas encore fait d hypothèse sur la structure de

Plus en détail

Les Eléments clés du projet

Les Eléments clés du projet THE GLOBAL LEADER IN CLOUD BI & CPM Les Eléments clés du projet 1 THE GLOBAL LEADER IN CLOUD BI & CPM Les Eléments clés du projet Périmètre fonctionnel 2 Le Core Model Le point central de constitution

Plus en détail

Mémoire d actuariat - promotion 2010. complexité et limites du modèle actuariel, le rôle majeur des comportements humains.

Mémoire d actuariat - promotion 2010. complexité et limites du modèle actuariel, le rôle majeur des comportements humains. Mémoire d actuariat - promotion 2010 La modélisation des avantages au personnel: complexité et limites du modèle actuariel, le rôle majeur des comportements humains. 14 décembre 2010 Stéphane MARQUETTY

Plus en détail

Régression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr

Régression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr Régression linéaire Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr 2005 Plan Régression linéaire simple Régression multiple Compréhension de la sortie de la régression Coefficient de détermination R

Plus en détail

FctsAffines.nb 1. Mathématiques, 1-ère année Edition 2007-2008. Fonctions affines

FctsAffines.nb 1. Mathématiques, 1-ère année Edition 2007-2008. Fonctions affines FctsAffines.nb 1 Mathématiques, 1-ère année Edition 2007-2008 Fonctions affines Supports de cours de mathématiques de degré secondaire II, lien hpertete vers la page mère http://www.deleze.name/marcel/sec2/inde.html

Plus en détail

1 Importer et modifier des données avec R Commander

1 Importer et modifier des données avec R Commander Université de Nantes 2015/2016 UFR des Sciences et Techniques Département de Mathématiques TP1 STATISTIQUE DESCRIPTIVE Frédéric Lavancier Avant propos Ouvrir l application R Saisir dans la console library(rcmdr)

Plus en détail

La pratique du coaching en France. Baromètre 2010

La pratique du coaching en France. Baromètre 2010 SFCoach : crée du lien entre le monde du travail et les professionnels de l accompagnement La pratique du coaching en France Baromètre 2010 Fondée en 1996 22, Bd Sébastopol 75004 Paris Association 1901

Plus en détail

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures) Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures) Eercice 1 (5 points) pour les candidats n ayant pas choisi la spécialité MATH Le tableau suivant donne l évolution du chiffre

Plus en détail

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques

Plus en détail

Chapitre 2/ La fonction de consommation et la fonction d épargne

Chapitre 2/ La fonction de consommation et la fonction d épargne hapitre 2/ La fonction de consommation et la fonction d épargne I : La fonction de consommation keynésienne II : Validations et limites de la fonction de consommation keynésienne III : Le choix de consommation

Plus en détail

Rappel sur les bases de données

Rappel sur les bases de données Rappel sur les bases de données 1) Généralités 1.1 Base de données et système de gestion de base de donnés: définitions Une base de données est un ensemble de données stockées de manière structurée permettant

Plus en détail

Gestion Comptable Sage 100

Gestion Comptable Sage 100 Gestion Comptable La réponse à tous les besoins comptables et financiers de l entreprise avec la richesse d une offre unique sur le marché. 1 SOMMAIRE 1.1. Le pôle comptable et Financier...3 1.2. Une couverture

Plus en détail

4.14 Influence de la température sur les résistances

4.14 Influence de la température sur les résistances nfluence de la température sur la résistance 4.14 nfluence de la température sur les résistances ne résistance R, parcourue par un courant pendant un certain temps t, dissipe une énergie calorifique (W

Plus en détail

enquête pour les fautes sur le fond, ce qui est graves pour une encyclopédie.

enquête pour les fautes sur le fond, ce qui est graves pour une encyclopédie. 4.0 Contrôles /4 4 e enquête pour les fautes sur le fond, ce qui est graves pour une encyclopédie. RPPEL de 0. Wikipédia 2/2 Dans le chapitre : XX e siècle : ( 4.0 mythe paroxysme ) sous la photo d un

Plus en détail

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences

Plus en détail

L assurance de la qualité à votre service

L assurance de la qualité à votre service Atelier L assurance de la qualité à votre service Présentation de Jean-Marie Richard 24 et 25 novembre Sujets Qu est-ce que l assurance de la qualité? Initiation aux concepts de l assurance de la qualité.

Plus en détail

PRÉSENTATION DE L OFFRE

PRÉSENTATION DE L OFFRE PRÉSENTATION DE L OFFRE CMS 5.x CONTRÔLE DE LA MASSE SALARIALE Les informations contenues dans ce document font partie intégrante de la solution CMS et sont protégées en France par le code de la propriété

Plus en détail

Le risque Idiosyncrasique

Le risque Idiosyncrasique Le risque Idiosyncrasique -Pierre CADESTIN -Magali DRIGHES -Raphael MINATO -Mathieu SELLES 1 Introduction Risque idiosyncrasique : risque non pris en compte dans le risque de marché (indépendant des phénomènes

Plus en détail

Liste des notes techniques... xxi Liste des encadrés... xxiii Préface à l édition internationale... xxv Préface à l édition francophone...

Liste des notes techniques... xxi Liste des encadrés... xxiii Préface à l édition internationale... xxv Préface à l édition francophone... Liste des notes techniques.................... xxi Liste des encadrés....................... xxiii Préface à l édition internationale.................. xxv Préface à l édition francophone..................

Plus en détail

Les coûts de la production. Microéconomie, chapitre 7

Les coûts de la production. Microéconomie, chapitre 7 Les coûts de la production Microéconomie, chapitre 7 1 Sujets à aborder Quels coûts faut-il considérer? Coûts à court terme Coûts à long terme Courbes de coûts de court et de long terme Rendements d échelle

Plus en détail

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun

Plus en détail

Pourquoi l apprentissage?

Pourquoi l apprentissage? Pourquoi l apprentissage? Les SE sont basés sur la possibilité d extraire la connaissance d un expert sous forme de règles. Dépend fortement de la capacité à extraire et formaliser ces connaissances. Apprentissage

Plus en détail

Température corporelle d un castor (une petite introduction aux séries temporelles)

Température corporelle d un castor (une petite introduction aux séries temporelles) Température corporelle d un castor (une petite introduction aux séries temporelles) GMMA 106 GMMA 106 2014 2015 1 / 32 Cas d étude Temperature (C) 37.0 37.5 38.0 0 20 40 60 80 100 Figure 1: Temperature

Plus en détail

Les outils de simulation. Myriam HUMBERT CETE Ouest

Les outils de simulation. Myriam HUMBERT CETE Ouest Les outils de simulation Myriam HUMBERT CETE Ouest Outils de simulation pour la GPE Objectif Ø Recommandations pour la mise en œuvre des calculs dans le cadre d une GPE ü Analyse qualitative des outils

Plus en détail

PROJET DE GESTION PORTEFEUILLE. Evaluation d une Stratégie de Trading

PROJET DE GESTION PORTEFEUILLE. Evaluation d une Stratégie de Trading PROJET DE GESTION PORTEFEUILLE Evaluation d une Stratégie de Trading Encadré par M. Philippe Bernard Master 1 Economie Appliquée-Ingénierie Economique et Financière Taylan Kunal 2011-2012 Sommaire 1) Introduction

Plus en détail

4 Statistiques. Les notions abordées dans ce chapitre CHAPITRE

4 Statistiques. Les notions abordées dans ce chapitre CHAPITRE CHAPITRE Statistiques Population (en milliers) 63 6 6 6 Évolution de la population en France 9 998 999 3 Année Le graphique ci-contre indique l évolution de la population française de 998 à. On constate

Plus en détail

Le logiciel M4R (Monitoring for Results)

Le logiciel M4R (Monitoring for Results) L innovation appliquée au service de la nouvelle gouvernance Le logiciel M4R (Monitoring for Results) de IDEA-Solutions Un réseau international opérant en trois langues une formation combinée à l action

Plus en détail

LE BUDGET DES VENTES

LE BUDGET DES VENTES LE BUDGET DES VENTES Objectif(s) : o Pré requis : o Modalités : o o o Elaboration du budget des ventes. Connaissances du processus "ventes". Principes, Synthèse, Application. TABLE DES MATIERES Chapitre

Plus en détail

Est-il possible de réduire les coûts des logiciels pour mainframe en limitant les risques?

Est-il possible de réduire les coûts des logiciels pour mainframe en limitant les risques? DOSSIER SOLUTION Programme de rationalisation des logiciels pour mainframe (MSRP) Est-il possible de réduire les coûts des logiciels pour mainframe en limitant les risques? agility made possible Le programme

Plus en détail

Création de maquette web

Création de maquette web Création de maquette web avec Fireworks Il faut travailler en 72dpi et en pixels, en RVB Fireworks étant un logiciel dédié à la création de maquettes pour le web il ne propose que les pixels pour le texte

Plus en détail

CA Mainframe Chorus for Security and Compliance Management version 2.0

CA Mainframe Chorus for Security and Compliance Management version 2.0 FICHE PRODUIT CA Mainframe Chorus for Security and Compliance CA Mainframe Chorus for Security and Compliance Management version 2.0 Simplifiez et rationalisez vos tâches de gestion de la sécurité et la

Plus en détail

www.styleanalytics.com

www.styleanalytics.com www.styleanalytics.com Style Analytics EuroPerformance a le plaisir de vous présenter Style Analytics, outil de mesure des risques et de la performance des fonds d investissement. Style Analytics offre

Plus en détail

Plate-forme Cloud CA AppLogic pour les applications d entreprise

Plate-forme Cloud CA AppLogic pour les applications d entreprise FICHE PRODUIT : CA AppLogic Plate-forme Cloud CA AppLogic pour les applications d entreprise agility made possible CA AppLogic est une plate-forme Cloud Computing clés en main permettant aux clients de

Plus en détail

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

Une introduction. Lionel RIOU FRANÇA. Septembre 2008 Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

avec des nombres entiers

avec des nombres entiers Calculer avec des nombres entiers Effectuez les calculs suivants.. + 9 + 9. Calculez. 9 9 Calculez le quotient et le rest. : : : : 0 :. : : 9 : : 9 0 : 0. 9 9 0 9. Calculez. 9 0 9. : : 0 : 9 : :. : : 0

Plus en détail

MAITRISER LE BLENDED LEARNING EN 4 ÉTAPES

MAITRISER LE BLENDED LEARNING EN 4 ÉTAPES MAITRISER LE BLENDED LEARNING EN 4 ÉTAPES Comprendre l essor du Blended....3 Un exemple de dispositif Blended.......4 7 7 conseils pour vendre une prestation Blended.......... 9 6 questions / réponses

Plus en détail

Travail de projet sur VBA

Travail de projet sur VBA Travail de projet sur VBA Calcul du Ratio de Sharpe Page 1 sur 25 Table des matières : 1. Introduction 3 2. Démarche générale 3 2.1 Récolte de données 3 2.2 Calculs de rendements 4 2.3 Calculs de volatilités

Plus en détail

Une étude de différentes analyses réalisées par le BIT

Une étude de différentes analyses réalisées par le BIT Association internationale de la sécurité sociale Quinzième Conférence internationale des actuaires et statisticiens de la sécurité sociale Helsinki, Finlande, 23-25 mai 2007 Comparaison des hypothèses

Plus en détail

Note de service À : De :

Note de service À : De : Note de service À : De : Tous les Fellows, affiliés, associés et correspondants de l Institut canadien des actuaires et autres parties intéressées Jim Christie, président Conseil des normes actuarielles

Plus en détail

Les audits de l infrastructure des SI

Les audits de l infrastructure des SI Les audits de l infrastructure des SI Réunion responsables de Catis 23 avril 2009 Vers un nouveau modèle pour l infrastructure (CDSI Avril et Juin 2008) En dix ans, les évolutions des SI ont eu un fort

Plus en détail

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

Avis sur la 1 ère révision du schéma d'aménagement et de gestion des eaux «Nappes profondes de Gironde»

Avis sur la 1 ère révision du schéma d'aménagement et de gestion des eaux «Nappes profondes de Gironde» Commission Planification Séance du 24 mai 2012 Délibération n DL/CB/12-XX Avis sur la 1 ère révision du schéma d'aménagement et de gestion des eaux «Nappes profondes de Gironde» Le comité de bassin délibérant

Plus en détail

GENIE DES SYSTEMES INDUSTRIELS

GENIE DES SYSTEMES INDUSTRIELS MASTER SCIENCES, TECHNOLOGIES, SANTE/STAPS GENIE DES SYSTEMES INDUSTRIELS Spécialité Risques Industriels et Maintenance www.univ-littoral.fr OBJECTIFS DE LA FORMATION L objectif du master régional GSI

Plus en détail

IBM SPSS Regression 21

IBM SPSS Regression 21 IBM SPSS Regression 21 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p. 46. Cette version s applique à IBM SPSS Statistics

Plus en détail

Efficace et ciblée : La surveillance des signaux de télévision numérique (2)

Efficace et ciblée : La surveillance des signaux de télévision numérique (2) Efficace et ciblée : La surveillance des signaux de télévision numérique (2) La première partie de cet article publié dans le numéro 192 décrit la méthode utilisée pour déterminer les points de surveillance

Plus en détail

LE TABLEAU DE BORD DE SUIVI DE L ACTIVITE

LE TABLEAU DE BORD DE SUIVI DE L ACTIVITE TABLEAU DE BORD LE TABLEAU DE BORD DE SUIVI DE L ACTIVITE DEFINITION Le tableau de bord est un support (papier ou informatique) qui sert à collecter de manière régulière des informations permettant de

Plus en détail

Banque nationale suisse

Banque nationale suisse IFFP Institut fédéral des hautes études en formation professionnelle Combinaison des politiques budgétaires et monétaires 22.01.2010, Lausanne 8h45 12h 12h45 16h David Maradan, chargé de cours UNIGE et

Plus en détail