Statistiques Appliquées Rôle des femmes dans la société
|
|
- Marie-Josèphe Paré
- il y a 8 ans
- Total affichages :
Transcription
1 Statistiques Appliquées Rôle des femmes dans la société Denis Schelling Semestre d automne 2012 Résumé A partir de données concernant le rôle des femmes dans la société, nous avons effectué une analyse afin de déterminer quelles étaient les facteurs influançant la réponse des individus à l affirmation : «Les femmes devraient se concentrer sur les tâches ménagères et laisser les hommes travailler.» Après une analyse exploratoire ainsi que l ajustement de différents modèles de régression logistique et leurs comparaisons, nous avons obtenu le modèle le plus adéquat pour nos données. De ce modèle, nous déduisons que le nombre d années d éducation des individus ainsi que le sexe ont tous les deux une influence dans la réponse données par l individu. 1 Introduction A partir de la fin du 18 e siècle et au cours du siècle précédent, le rôle des femmes au sein de la société occidentale s est considérablement amélioré. Les femmes ont ainsi obtenu davantage de droits les ammenant progressivement à égalité avec les hommes. Ces changements ont néanmoins nécessité du temps si bien que les mentalités sur le rôle des femmes différaient souvent d un individu à l autre qu il soit masculin ou féminin et ce encore jusqu au début des années 90. Les données que nous allons analyser sont issues d une enquête effectuée dans les années 70 où il existait encore des pays, comme la Suisse, où certaines régions n accordaient toujours pas le droit de vote aux femmes par exemple. A cette époque, les femmes subissaient davantage d inégalités dans le monde du travail qu aujourd hui, les incitant à rester au foyer s occuper des tâches ménagères. Mais surtout le rôle de la femme au sein de la société du travail particulièrement était encore en pleine évolution. Nos données vont nous permettre d analyser l opinion public sur le rôle de la femme dans la société à cette époque là. denis.schelling@epfl.ch 1
2 2 Données Les données sont issues d une enquête menée par le National Opinion Research Center de l université de Chicago aux Etats-Unis entre 1974 et Les individus se voyaient poser l affirmation suivante : «Les femmes devraient se concentrer sur les tâches ménagères et laisser les hommes travailler et diriger le pays.» Les individus avaient la posibilité de répondre qu ils étaient d accord ou non avec l affirmation. Chaque individu s est vu également demander le nombre d années d éducation qu il avait effectuées. Ces données sont visibles sur la table 1 pour les 2871 individus. Nombre d années d éducation D accord Pas d accord D accord Pas d accord Table 1: Tableau des données. Il y a au total 1305 hommes et 1566 femmes. La figure 1 indique le nombre de participants en fonction du nombre d années d éducation. 2
3 Nombre de participants Nombre de participants Figure 1: Nombre de participants en fonction du nombre d années d éducation pour les hommes et les femmes. Sur la figure 1, on remarque qu une grande proportion des personnes intérrogées se situe aux alentours de 12 années d éducations et ce indépendamment du sexe. A la vu de ces données, il est légitime de se poser la question suivante : Le sexe et/ou l éducation ont-ils une influence sur la réponse donnée par un individu à l affirmation? Nous allons tout d abord tenter de répondre à cette question en analysant les données de façon exploratoire dans la section suivante puis nous allons ajuster des modèles adéquats à nos données afin de pouvoir tirer des conclusions plus certaines. 3 Analyse exploratoire des données Un premier essai pour identifier l influence du nombre d années d éducation est de considérer les probabilités empiriques d être d accord avec l affirmation en fonction du nombre d années d éducation et ce pour les hommes et les femmes confondus. Pour un nombre d années d éducation j donné, on définit la probabilité empirique p j d être d accord avec l affirmation comme étant le nombre de personnes étant d accord et ayant reçu j années d éducation divisé par le nombre de personnes interrogées ayant j années d éducation. Les résultats obtenus sont indiqués sur le graphe de gauche de la figure 2. 3
4 Tous les individus confondus et séparés Probabilité empirique d'être d'accord Tous les individus Probabilité empirique d'être d'accord Figure 2: Probabilités empiriques d être d accord en fonction du nombre d années d éducation à gauche sans distinction du sexe, à droite avec la distinction. On remarque sur le graphe de gauche que les probabilités empiriques d être d accord ont tendance à baisser si le nombre d années d éducation augmente passant en dessous de 0.5 à partir de 9 années d éducations. Ainsi le graphe de gauche sur la figure 2 nous montre que le nombre d années d éducation semble avoir une véritable influence sur la réponse donnée par l individu et ce indépendamment du sexe. Les individus ayant reçu davantage d éducation serait ainsi plus enclins à ne pas être d accord avec l affirmation. Afin de maintenant essayer d identifier une eventuelle influence du sexe sur la réponse, nous allons considérer les probabilités empiriques p j,h, p j,f d être d accord avec l affirmation pour les hommes et les femmes respectivement ayant reçu j années d éducation. Ces probabilités empiriques sont visibles sur le graphe de droite de la figure 2. Bien que les valeurs obtenues pour les hommes et les femmes soient parfois différentes, nous ne pouvons clairement pas décider si le sexe a une incidence sur ces probabilités empiriques. Pour essayer tout de même d identifier l influence du sexe nous allons encore considérer les réponses moyennes obtenues µ H, µ F auprès des hommes et des femmes respectivement. Ces réponses moyennes sont obtenues en considérant le nombre d hommes (ou de femmes) ayant été d accord avec l affirmation divisé par le nombre total d hommes (ou de femmes) interrogés. On note encore σ 2 H et σ2 F les variances empiriques calculées pour µ H et µ F. Les résultats obtenus sont donnés sur la table 2. Homme Femme µ σ Table 2: Réponses moyennes d être d accord pour les hommes et les femmes. Le tableau 2 nous indique que les moyennes µ H et µ F sont proches. Néanmoins, les variances pour chacune de ces moyennes étant spécialement élevées, nous nous avisons de conclure quoi que ce soit sur l influence du sexe sur la réponse obtenue. Nous déduisons de notre analyse exploratoire que le nombre d années d éducation semble 4
5 jouer un rôle important dans la réponse donnée à la question alors que le rôle du sexe demeure plus difficle à cerner. Toutefois ces deux éléments doivent être appronfondis plus en détails afin de donner une réponse adéquate et précise. 4 Méthodes En vue d apporter des réponses plus exactes à notre question posée en fin de section 2, nous allons construire un modèle adéquat pour nos données. Tout d abord, nous considérons que chaque individu répond par "Oui" ou "Non" à l affirmation s il est respectivement d accord ou non avec celle-ci. Nous appelons y i la variable réponse de l individu i pour i = 1,..., n, où n = 2871 est le nombre total d individus. La variable y i est codée comme suit, { 1 si "Oui" y i =, pour i = 1,..., n. 0 si "Non" Ainsi les données dont nous disposons pour chaque individu sont sa réponse de type binaire ainsi que deux variables explicatives, son nombre d années d éducation education ainsi que son sexe, de type binaire également, codé de la forme 1 Homme, où 1 Homme,i = { 1 si l individu i est un homme 0 si l individu i est une femme, pour i = 1,..., n. Nous pouvons désormais attribuer à un individu i, pour i = 1,..., n une probabilité de succès p i de répondre "Oui", c est à dire la probabilité que y i = 1. Ceci nous conduit à supposer que la réponse de l individu i peut être vu comme une variable de Bernoulli avec probabilité de succès égale à p i. De plus, nous considérons que chaque individu répond indépendamment des iid autres ce qui nous conduit finalement à supposer que y i B(1, p i ) pour i = 1,..., n. Nous savons de Collett (1991) qu un modèle adéquat pour modéliser les données de type binomiale est la régression logistique linéaire qui dans le cas de k variables explicatives s exprime de la façon suivante : ( ) pi logit(p i ) = log = β 0 + β 1 x 1i + + β k x ki, pour i = 1,..., n, (4.1) 1 p i où x 1i,..., x ki sont les valeurs des k variables explicatives et β 0,..., β k sont les paramètres pour ces variables explicatives. Remarquons que de l équation (4.1) nous pouvons obtenir l expression suivante, p i = exp(β 0 + β 1 x 1i + + β k x ki ), pour i = 1,..., n. (4.2) 1 + exp(β 0 + β 1 x 1i + + β k x ki ) Une manière de vérifier si le modèle (4.1) est adéquat pour nos données est de considérer la figure 3 et de vérifier s il peut y avoir des relations linéaires entre les logit des probabilités empiriques, p j,h pour les hommes, p j,f pour les femmes, définies dans la section précédente, et le nombre d années d éducation. 5
6 Logit des probabilités empiriques Figure 3: Logit des probabilités empiriques en fonction du nombre d années d éducation. La figure 3 nous permet de voir qu il semble y avoir une certaine linéarité entre le logit des probabilités empiriques et le nombre d années d éducation. Il est donc raisonnable de considérer le modèle (4.1) que nous allons ajuster aux données. L ajustement du modèle s effectue en maximisant la vraisemblance par rapport au paramètre β = (β 0,..., β k ) T. Pour nos données, la vraisemblance s exprime comme L(β) = n i=1 p y i i (1 p i) 1 y i, (4.3) où p i = p i (β) par l expression (4.2). Ainsi notre fonction objectif à maximiser sera 5 Analyse n l(β) = log {L(β)} = {log(p i ) y i + log(1 p i ) (1 y i )}. (4.4) i=1 Nous allons effectuer différentes régressions logistiques sur nos données et essayer de trouver le modèle le plus adéquat pour celles-ci. Modèle A : Education et sexe comme variables explicatives Le premier modèle que nous allons ajuster et que nous appelerons le modèle A, s ajuste sur l ensembles des individus et prend comme variables explicatives le nombre d années d éducation ainsi que le sexe. Son expression s écrit comme logit(p i ) = β 0 + β 1 education i + β 2 1 Homme,i, pour i = 1,..., n. En ajustant le modèle, on obtient les résultats indiqués sur la table 3. 6
7 Paramètre Estimation Ecart-type Pr(> z ) β 0 (intercepte) <2e-16 β 1 (éducation) <2e-16 β 2 (sexe) Table 3: Résultats des estimations pour le modèle A Nous remarquons que la variables de l éducation est très significative. En revanche il semblerait que la variable indicatrice du sexe masculin ne soit pas si significative. Cela nous conduit à considérer un modèle sans la variable indicatrice du sexe masculin. Modèle B : Education comme variable explicative Le deuxième modèle que nous pouvons ainsi considérer est celui ne prenant pas en compte le sexe, c est-à-dire le modèle ne contenant que le nombre d années d éducation comme variable explicative, logit(p i ) = β 0 + β 1 education i, pour i = 1,..., n. On obtient ainsi les estimations suivantes, indiquées sur la table 4. Paramètre Estimation Ecart-type Pr(> z ) β 0 (intercepte) <2e-16 β 1 (éducation) <2e-16 Table 4: Résultats des estimations pour le modèle B Ce modèle n a que des variables significatives contrairement au modèle A. On remarque encore que le modèle B est imbriqué dans le modèle A. Ainsi, nous pouvons effectuer un test de rapport de vraisemblance afin de déterminer si la variable additionnelle du modèle A concernant le sexe est significative ou non. Nous calculons alors la statistique du test W AB = 2 ( l A l B ), où l A, l B sont les log-vraisemblances maximisées pour les modèles A et B respectivement. Sous l hypothèse nulle H 0 : β 2 = 0, on a W AB χ 2 q, où q est la différence des dimensions entre les paramètres du modèle le plus grand et le plus petit. On a q = 1 dans notre cas. Par le calcul, on obtient W AB et la p-valeur du test qui est p = P r(χ 2 1 > W AB). Ceux-ci sont donnés sur la table 5. W AB p-valeur Table 5: Résultat du test H 0 : β 2 = 0. Avec cette p-valeur il est clair que nous ne rejettons pas H 0 et donc nous ne pouvons pas tirer de conclusions concernant l influence du sexe. La figure 4 nous permet de visualiser les valeurs de la probabilité de répondre "Oui" en fonction du nombre d années d éducation pour notre modèle. Ces valeurs sont obtenues avec les paramètres ajustés du modèle à l aide de l équation (4.2). Les intervalles de confiance pour les probabilités ont été obtenus à l aide de la méthode delta. Les probabilités empiriques pour les hommes et les femmes ont également été incluses. 7
8 Probabilité d'être d'accord Tous individus Figure 4: Probabilité de répondre "Oui" obtenue à l aide des paramètres ajustés du modèle B avec les intervalles de confiances en traitillés. On peut dire de la figure 4 que ce modèle semble relativement bien convenir aux groupes des hommes et de femmes. Cependant, nous voulons vérifier s il y a une influence du sexe dans la réponse des individus mais ce modèle ne nous permet pas de répondre à cette question. Modèle C : Interaction entre le sexe et l éducation Le défaut de nos modèles précédents est que si l on considère la figure 3 alors considérer nos modèles A et B revient à assigner la même pente de droite de la régression logistique pour les hommes ainsi que pour les femmes. Ainsi nos modèles précédents ne prennent pas en compte un éventuel changement de pente entre ces deux groupes. Ce changement de pente s exprime comme l interaction entre les variables explicatives education et 1 Homme. Nous allons donc palier ce défaut en considérant désormais cette interaction. Notre nouveau modèle s exprime de la forme, logit(p i ) = β 0 + β 1 education i + β 2 1 Homme,i + β 3 1 Homme,i education i, pour i = 1,..., n. En ajustant ce modèle on obtient les resultats de la table 6. Paramètre Estimation Ecart-type Pr(> z ) β 0 (intercepte) <2e-16 β 1 (éducation) <2e-16 β 2 (sexe) β 3 (sexe éducation) Table 6: Résultats des estimations pour le modèle C On remarque sur la table 6 que toutes les variables du modèle C semblent être significatives. Etant donné que ce modèle C inclut le modèle A comme sous-modèle, nous pouvons encore effectuer un test de rapport de vraisemblance pour voir s il est juste d exclure l interaction entre 8
9 le sexe et l éducation qui se résume dans l hypothèse nulle H 0 : β 3 = 0. Si l on nomme l C la logvraisemblance maximisée pour le modèle C, alors nous avons que sous H 0, W AC = 2 ( l C l A ) est distribué selon une loi χ 2 q où q = 1. La valeur de W AC et la p-valeure sont données sur la table 7. W AC p-valeur Table 7: Résultat du test H 0 : β 3 = 0. Ainsi, avec la p-valeur obtenue nous rejettons l hypothèse nulle est nous en déduisons que l interaction entre le sexe et l éducation est d une importance significative. Ainsi l influence de la variable du sexe intervient à ce niveau là puisque la différence de pentes des droites de régression logistique est significative. A l aide de notre estimation β de β nous pouvons exprimer les formules des droites de régression logistique pour les hommes ainsi que pour les femmes. Ces droites ont pour équations, et sont données sur la figure 5. : logit(p) = education , (5.1) : logit(p) = education , (5.2) Logit des probabilités empiriques Figure 5: Droites de régression logistique pour les hommes ainsi que pour les femmes. Remarquons que le modèle C revient à attribuer à chaque groupe une droite de régression logistique différente. Une manière différente d obtenir également deux droites différentes est de considérer deux modèles indépendants, l un pour les hommes et l autre pour les femme. Ainsi, nos régressions logistiques ne s effectueraient que sur un seul groupe parmis les individus. Si l on suppose que les indices i sont ordonnées de telles sorte que pour i = 1,..., N H, l individu i est un homme et N H est le nombre total d homme, et pour i = N H + 1,..., n, l individu i soit une femme, avec N F = n N H le nombre total de femmes, alors les modèles s expriment dans ce cas 9
10 de la façon suivante, : logit(p i ) = β 0,H +β 1,H education i, pour i = 1,..., N H, (5.3) : logit(p i ) = β 0,F +β 1,F education i, pour i = N H + 1,..., n. (5.4) En ajustant chacune de ces régressions logistiques individuellement, nous obtenons les estimations indiquées sur la table 8. Paramètre Estimation Ecart-type Estimation Ecart-type β β Table 8: Estimations pour les modèles individuels. On remarque que si l on considère les droites de régressions logistiques issues de ces deux modèles alors nous obtenons des droites pratiquement identiques à celle obtenues avec le modèle C, données par les équations (5.3) et (5.4). Une façon d interpréter ces résultats est de se dire que le modèle C tente d ajuster une droite de régressions logistiques pour chacun des groupes. Cependant, lorsque notre échantillon est de grande taille, cela revient approximativement à effectuer une régression logistique sur chaque groupe indépendamment. Finalement, la figure 6 nous indique les valeurs des probabilités d être d accord avec l affirmation obtenues à l aide des coefficients estimés du modèle C pour les hommes et le femmes ainsi que les valeurs empiriques de ces probabilités en fonction du nombre d années d éducation. Probabilité d'être d'accord Figure 6: Probabilité de répondre "Oui" obtenue à l aide des paramètres ajustés du modèle C avec les intervalles de confiances en traitillés. La figure nous indique que ce modèle semble plus adéquat pour expliquer les valeurs obtenues pour les hommes et le femmes séparément. En effet, pour les valeurs obtenues pour les hommes et 10
11 les femmes sont sensiblement différentes surtout pour un nombre d années d éducation inférieur à 5 ans ou supérieur à 15 ans. On peut donc tirer des conclusions de notre analyse qui seront présentées dans la section suivante. 6 Conclusion En conclusion, afin d évaluer les potentielles influences du sexe ou du nombre d années d éducation dans les réponses données par les individus, nous avons tout d abord effectué une analyse exploratoire. A la fin de cette dernière il nous semblait juste de penser que le nombre d années d éducation avait très certainement une influence dans les réponses obtenues. L ajustement des différents modèles de régressions logistiques et leurs comparaison à l aide de test de rapport de vraisemblance nous a conduit au modèle C qui est le plus plausible pour l ensemble de toutes nos données. Ce modèle prenait en compte le nombre d année d éducation, le sexe mais également l interaction entre le sexe et le nombre d années d éducation. Les paramètres de ce modèle étant tous significatifs, nous pouvons déduire que la variable du sexe, par son action seule et son interaction avec le nombre d années d éducation a une importance pour l explication des données. Ainsi, nous concluons de notre analyse que non seulement l éducation mais également le sexe ont une importance pour la réponse obtenue à l affirmation. Références Collett, D. (1991) Modelling binary data. London : Chapman & Hall. 11
«Cours Statistique et logiciel R»
«Cours Statistique et logiciel R» Rémy Drouilhet (1), Adeline Leclercq-Samson (1), Frédérique Letué (1), Laurence Viry (2) (1) Laboratoire Jean Kuntzmann, Dép. Probabilites et Statistique, (2) Laboratoire
Plus en détailUFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES
Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,
Plus en détailLa survie nette actuelle à long terme Qualités de sept méthodes d estimation
La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg
Plus en détailEstimation et tests statistiques, TD 5. Solutions
ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études
Plus en détailNOTE SUR LA MODELISATION DU RISQUE D INFLATION
NOTE SUR LA MODELISATION DU RISQUE D INFLATION 1/ RESUME DE L ANALYSE Cette étude a pour objectif de modéliser l écart entre deux indices d inflation afin d appréhender le risque à très long terme qui
Plus en détailDonnées longitudinales et modèles de survie
ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan
Plus en détailFeuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.
Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences
Plus en détailLE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE.
LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE. Synthèse des travaux réalisés 1. Problématique La question D7 du plan d exécution du Programme National de Recherches
Plus en détailLoi binomiale Lois normales
Loi binomiale Lois normales Christophe ROSSIGNOL Année scolaire 204/205 Table des matières Rappels sur la loi binomiale 2. Loi de Bernoulli............................................ 2.2 Schéma de Bernoulli
Plus en détailUne nouvelle norme mondiale sur la comptabilisation des produits
Une nouvelle norme mondiale sur la comptabilisation des produits Les répercussions pour le secteur des logiciels et des services infonuagiques Novembre 2014 L International Accounting Standards Board (IASB)
Plus en détailPrincipe d un test statistique
Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre
Plus en détailExercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015
Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par
Plus en détailIntroduction à l étude des Corps Finis
Introduction à l étude des Corps Finis Robert Rolland (Résumé) 1 Introduction La structure de corps fini intervient dans divers domaines des mathématiques, en particulier dans la théorie de Galois sur
Plus en détailDéfinition 0,752 = 0,7 + 0,05 + 0,002 SYSTÈMES DE NUMÉRATION POSITIONNELS = 7 10 1 + 5 10 2 + 2 10 3
8 Systèmes de numération INTRODUCTION SYSTÈMES DE NUMÉRATION POSITIONNELS Dans un système positionnel, le nombre de symboles est fixe On représente par un symbole chaque chiffre inférieur à la base, incluant
Plus en détailChapitre 3 : INFERENCE
Chapitre 3 : INFERENCE 3.1 L ÉCHANTILLONNAGE 3.1.1 Introduction 3.1.2 L échantillonnage aléatoire 3.1.3 Estimation ponctuelle 3.1.4 Distributions d échantillonnage 3.1.5 Intervalles de probabilité L échantillonnage
Plus en détailTABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Plus en détailCours de Tests paramétriques
Cours de Tests paramétriques F. Muri-Majoube et P. Cénac 2006-2007 Licence Ce document est sous licence ALC TYPE 2. Le texte de cette licence est également consultable en ligne à l adresse http://www.librecours.org/cgi-bin/main?callback=licencetype2.
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailNON-LINEARITE ET RESEAUX NEURONAUX
NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail
Plus en détailIFT3245. Simulation et modèles
IFT 3245 Simulation et modèles DIRO Université de Montréal Automne 2012 Tests statistiques L étude des propriétés théoriques d un générateur ne suffit; il estindispensable de recourir à des tests statistiques
Plus en détailL allocataire dans un couple : l homme ou la femme?
L allocataire dans un couple : l homme ou la femme? par Alain Jacquot CNAF-Bureau des Prévisions Les CAF versent une trentaine de prestations (prestations familiales stricto sensu, aides au logement, et
Plus en détailAnnexe commune aux séries ES, L et S : boîtes et quantiles
Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans
Plus en détailCONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Plus en détailLe Data Mining au service du Scoring ou notation statistique des emprunteurs!
France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative
Plus en détailBaccalauréat ES/L Amérique du Sud 21 novembre 2013
Baccalauréat ES/L Amérique du Sud 21 novembre 2013 A. P. M. E. P. EXERCICE 1 Commun à tous les candidats 5 points Une entreprise informatique produit et vend des clés USB. La vente de ces clés est réalisée
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailFONCTION DE DEMANDE : REVENU ET PRIX
FONCTION DE DEMANDE : REVENU ET PRIX 1. L effet d une variation du revenu. Les lois d Engel a. Conditions du raisonnement : prix et goûts inchangés, variation du revenu (statique comparative) b. Partie
Plus en détailMéthodes de simulation des décès. appliquées au régime de retraite de la. fonction publique d État
Méthodes de simulation des décès appliquées au régime de retraite de la fonction publique d État Hady Senghor et Benoît Buisson Service des retraites de l État Septembre 2014 1 2 Sommaire Résumé... 4 I
Plus en détailP1 : Corrigés des exercices
P1 : Corrigés des exercices I Exercices du I I.2.a. Poker : Ω est ( l ensemble ) des parties à 5 éléments de l ensemble E des 52 cartes. Cardinal : 5 I.2.b. Bridge : Ω est ( l ensemble ) des parties à
Plus en détailChapitre 6 Test de comparaison de pourcentages χ². José LABARERE
UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables
Plus en détailLes conducteurs automobiles évaluent-ils correctement leur risque de commettre un accident?
Les conducteurs automobiles évaluent-ils correctement leur risque de commettre un accident? Nathalie LEPINE GREMAQ, Université de Toulouse1, 31042 Toulouse, France GRAPE, Université Montesquieu-Bordeaux
Plus en détailPartie 5 : La consommation et l investissement
Partie 5 : La consommation et l investissement Enseignant A. Direr Licence 2, 1er semestre 2008-9 Université Pierre Mendès France Cours de macroéconomie suite La troisième partie a exposé les théories
Plus en détailIntroduction des. comptes d épargne libre d impôt
Introduction des comptes d épargne libre d impôt Comptes d épargne libre d impôt Une nouvelle façon d épargner Les comptes d épargne libre d impôt ont été introduits par le gouvernement fédéral dans le
Plus en détailFOTO - L OMNIBUS MENSUEL DE CROP LE NOUVEAU CROP-EXPRESS
FOTO - L OMNIBUS MENSUEL DE CROP LE NOUVEAU CROP-EXPRESS 550, RUE SHERBROOKE OUEST MONTRÉAL (QUÉBEC) H3A 1B9 BUREAU 900 TOUR EST T 514 849-8086, POSTE 3064 Réflexions méthodologiques Depuis des années,
Plus en détail2.4 Représentation graphique, tableau de Karnaugh
2 Fonctions binaires 45 2.4 Représentation graphique, tableau de Karnaugh On peut définir complètement une fonction binaire en dressant son tableau de Karnaugh, table de vérité à 2 n cases pour n variables
Plus en détailInvestissement dans la construction de nouveaux bâtiments résidentiels (travaux mis en place) Méthodologie
Investissement dans la construction de nouveaux bâtiments résidentiels (travaux mis en place) Méthodologie Division de l investissement et du stock de capital Méthodologie L'investissement dans la construction
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détailBTS Groupement A. Mathématiques Session 2011. Spécialités CIRA, IRIS, Systèmes électroniques, TPIL
BTS Groupement A Mathématiques Session 11 Exercice 1 : 1 points Spécialités CIRA, IRIS, Systèmes électroniques, TPIL On considère un circuit composé d une résistance et d un condensateur représenté par
Plus en détailApprentissage par renforcement (1a/3)
Apprentissage par renforcement (1a/3) Bruno Bouzy 23 septembre 2014 Ce document est le chapitre «Apprentissage par renforcement» du cours d apprentissage automatique donné aux étudiants de Master MI, parcours
Plus en détailChapitre 1 : Évolution COURS
Chapitre 1 : Évolution COURS OBJECTIFS DU CHAPITRE Savoir déterminer le taux d évolution, le coefficient multiplicateur et l indice en base d une évolution. Connaître les liens entre ces notions et savoir
Plus en détailLa problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites
La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur
Plus en détailChapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Plus en détailINTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES
INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine
Plus en détailDéveloppement itératif, évolutif et agile
Document Développement itératif, évolutif et agile Auteur Nicoleta SERGI Version 1.0 Date de sortie 23/11/2007 1. Processus Unifié Développement itératif, évolutif et agile Contrairement au cycle de vie
Plus en détailNombre dérivé et tangente
Nombre dérivé et tangente I) Interprétation graphique 1) Taux de variation d une fonction en un point. Soit une fonction définie sur un intervalle I contenant le nombre réel a, soit (C) sa courbe représentative
Plus en détailAvis légal. I 2 FISCALLIANCE 2011 L Incorporation des Courtiers Immobiliers du Québec
Avis légal L incorporation des courtiers est un sujet très complexe, lequel ne saurait évidemment être traité en profondeur dans le présent document. Ce fascicule vise à sensibiliser les courtiers quant
Plus en détailModule 16 : Les fonctions de recherche et de référence
Module 16 : Les fonctions de recherche et de référence 16.0 Introduction L une des fonctions les plus importantes d Excel, c est la possibilité de chercher une valeur spécifique dans un grand nombre de
Plus en détailL ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Plus en détailArithmétique binaire. Chapitre. 5.1 Notions. 5.1.1 Bit. 5.1.2 Mot
Chapitre 5 Arithmétique binaire L es codes sont manipulés au quotidien sans qu on s en rende compte, et leur compréhension est quasi instinctive. Le seul fait de lire fait appel au codage alphabétique,
Plus en détailMémoire d Actuariat Tarification de la branche d assurance des accidents du travail Aymeric Souleau aymeric.souleau@axa.com 3 Septembre 2010 Plan 1 Introduction Les accidents du travail L assurance des
Plus en détailPratique de l analyse de données SPSS appliqué à l enquête «Identités et Capital social en Wallonie»
Centre de recherche en démographie et sociétés UCL/IACCHOS/DEMO Pratique de l analyse de données SPSS appliqué à l enquête «Identités et Capital social en Wallonie» 1 2 3+ analyses univariées Type de variables
Plus en détailFeuille TD n 1 Exercices d algorithmique éléments de correction
Master Sciences, Technologies, Santé Mention Mathématiques, spécialité Enseignement des mathématiques Algorithmique et graphes, thèmes du second degré Feuille TD n 1 Exercices d algorithmique éléments
Plus en détailIntroduction à la Statistique Inférentielle
UNIVERSITE MOHAMMED V-AGDAL SCIENCES FACULTE DES DEPARTEMENT DE MATHEMATIQUES SMI semestre 4 : Probabilités - Statistique Introduction à la Statistique Inférentielle Prinemps 2013 0 INTRODUCTION La statistique
Plus en détail23. Interprétation clinique des mesures de l effet traitement
23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d
Plus en détailCHAPITRE 5. Stratégies Mixtes
CHAPITRE 5 Stratégies Mixtes Un des problèmes inhérents au concept d équilibre de Nash en stratégies pures est que pour certains jeux, de tels équilibres n existent pas. P.ex.le jeu de Pierre, Papier,
Plus en détailArbres binaires de décision
1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression
Plus en détailNiveau de scolarité et emploi : le Canada dans un contexte international
N o 81-599-X au catalogue Issue n o 008 ISSN : 1709-8661 ISBN : 978-1-100-98615-9 Feuillet d information Indicateurs de l éducation au Niveau de scolarité et emploi : le dans un contexte international
Plus en détailLeçon N 4 : Statistiques à deux variables
Leçon N 4 : Statistiques à deux variables En premier lieu, il te faut relire les cours de première sur les statistiques à une variable, il y a tout un langage à se remémorer : étude d un échantillon d
Plus en détailProbabilités Loi binomiale Exercices corrigés
Probabilités Loi binomiale Exercices corrigés Sont abordés dans cette fiche : (cliquez sur l exercice pour un accès direct) Exercice 1 : épreuve de Bernoulli Exercice 2 : loi de Bernoulli de paramètre
Plus en détailCOMMISSION DE L ÉQUITÉ SALARIALE
COMMISSION DE L ÉQUITÉ SALARIALE Dossier n o : 36455 FRA Québec, le : 17 février 2015 Membre : Sophie Raymond, commissaire Commission de l équité salariale et 9061 1674 Québec inc. (connue sous le nom
Plus en détailIntroduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Plus en détailRapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/2011. 1.1 Présentation. 1.2 Ressources
Master Maths Finances 2010/2011 Data Mining janvier 2011 RapidMiner 1 Introduction 1.1 Présentation RapidMiner est un logiciel open source et gratuit dédié au data mining. Il contient de nombreux outils
Plus en détailLois de probabilité. Anita Burgun
Lois de probabilité Anita Burgun Problème posé Le problème posé en statistique: On s intéresse à une population On extrait un échantillon On se demande quelle sera la composition de l échantillon (pourcentage
Plus en détailInstitut économique de Montréal. Rapport d un sondage omnibus. Juin 2005
Institut économique de Montréal Rapport d un sondage omnibus Juin 2005 Opinion des Québécois à l égard du jugement de la Cour suprême du Canada relatif à l interdiction aux citoyens de payer pour des soins
Plus en détailTempérature corporelle d un castor (une petite introduction aux séries temporelles)
Température corporelle d un castor (une petite introduction aux séries temporelles) GMMA 106 GMMA 106 2014 2015 1 / 32 Cas d étude Temperature (C) 37.0 37.5 38.0 0 20 40 60 80 100 Figure 1: Temperature
Plus en détailTraitement des données avec Microsoft EXCEL 2010
Traitement des données avec Microsoft EXCEL 2010 Vincent Jalby Septembre 2012 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation
Plus en détailOPTIMISATION À UNE VARIABLE
OPTIMISATION À UNE VARIABLE Sommaire 1. Optimum locaux d'une fonction... 1 1.1. Maximum local... 1 1.2. Minimum local... 1 1.3. Points stationnaires et points critiques... 2 1.4. Recherche d'un optimum
Plus en détailStatistiques Descriptives à une dimension
I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des
Plus en détailExercices Alternatifs. Une fonction continue mais dérivable nulle part
Eercices Alternatifs Une fonction continue mais dérivable nulle part c 22 Frédéric Le Rou (copyleft LDL : Licence pour Documents Libres). Sources et figures: applications-continues-non-derivables/. Version
Plus en détailTSTI 2D CH X : Exemples de lois à densité 1
TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun
Plus en détailActuariat I ACT2121. septième séance. Arthur Charpentier. Automne 2012. charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.
Actuariat I ACT2121 septième séance Arthur Charpentier charpentier.arthur@uqam.ca http ://freakonometrics.blog.free.fr/ Automne 2012 1 Exercice 1 En analysant le temps d attente X avant un certain événement
Plus en détail1 Complément sur la projection du nuage des individus
TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent
Plus en détailMémoire d actuariat - promotion 2010. complexité et limites du modèle actuariel, le rôle majeur des comportements humains.
Mémoire d actuariat - promotion 2010 La modélisation des avantages au personnel: complexité et limites du modèle actuariel, le rôle majeur des comportements humains. 14 décembre 2010 Stéphane MARQUETTY
Plus en détailt 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :
Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant
Plus en détailProbabilités sur un univers fini
[http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur
Plus en détailSéries Statistiques Simples
1. Collecte et Représentation de l Information 1.1 Définitions 1.2 Tableaux statistiques 1.3 Graphiques 2. Séries statistiques simples 2.1 Moyenne arithmétique 2.2 Mode & Classe modale 2.3 Effectifs &
Plus en détailLe montant des garanties constituées aux fins du STPGV est-il excessif?
Le montant des garanties constituées aux fins du STPGV est-il excessif? Kim McPhail et Anastasia Vakos* L e système canadien de transfert des paiements de grande valeur (STPGV) sert à effectuer les paiements
Plus en détailClassification non supervisée
AgroParisTech Classification non supervisée E. Lebarbier, T. Mary-Huard Table des matières 1 Introduction 4 2 Méthodes de partitionnement 5 2.1 Mesures de similarité et de dissimilarité, distances.................
Plus en détailPROBABILITES ET STATISTIQUE I&II
PROBABILITES ET STATISTIQUE I&II TABLE DES MATIERES CHAPITRE I - COMBINATOIRE ELEMENTAIRE I.1. Rappel des notations de la théorie des ensemble I.1.a. Ensembles et sous-ensembles I.1.b. Diagrammes (dits
Plus en détailProbabilités sur un univers fini
[http://mp.cpgedupuydelome.fr] édité le 10 août 2015 Enoncés 1 Proailités sur un univers fini Evènements et langage ensemliste A quelle condition sur (a,, c, d) ]0, 1[ 4 existe-t-il une proailité P sur
Plus en détailProjet SINF2275 «Data mining and decision making» Projet classification et credit scoring
Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems
Plus en détailComment va la vie en France?
Comment va la vie en France? L Initiative du vivre mieux, lancée en 2011, se concentre sur les aspects de la vie qui importent aux gens et qui ont un impact sur leur qualité de vie. L Initiative comprend
Plus en détailRapport sur. La situation financière de l ensemble des retraités Québécois et des secteurs public et parapublic du Québec
Rapport sur La situation financière de l ensemble des retraités Québécois et des secteurs public et parapublic du Québec François Vaillancourt CIRANO et Université de Montréal et Viorela Diaconu Université
Plus en détailQuestion 1: Analyse et évaluation des obligations / Gestion de portefeuille
Question 1: Analyse et évaluation des obligations / Gestion de portefeuille (33 points) Monsieur X est un gérant de fonds obligataire qui a repris la responsabilité de gestion du portefeuille obligataire
Plus en détailProbabilités III Introduction à l évaluation d options
Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un
Plus en détailLa fonction exponentielle
DERNIÈRE IMPRESSION LE 2 novembre 204 à :07 La fonction exponentielle Table des matières La fonction exponentielle 2. Définition et théorèmes.......................... 2.2 Approche graphique de la fonction
Plus en détailSeconde Généralités sur les fonctions Exercices. Notion de fonction.
Seconde Généralités sur les fonctions Exercices Notion de fonction. Exercice. Une fonction définie par une formule. On considère la fonction f définie sur R par = x + x. a) Calculer les images de, 0 et
Plus en détailLogiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS
Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence
Plus en détailTests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE
Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.
Plus en détailCours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES
LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,
Plus en détailDOCM 2013 http://docm.math.ca/ Solutions officielles. 1 2 10 + 1 2 9 + 1 2 8 = n 2 10.
A1 Trouvez l entier positif n qui satisfait l équation suivante: Solution 1 2 10 + 1 2 9 + 1 2 8 = n 2 10. En additionnant les termes du côté gauche de l équation en les mettant sur le même dénominateur
Plus en détailFORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
Plus en détailCollecter des informations statistiques
Collecter des informations statistiques FICHE MÉTHODE A I Les caractéristiques essentielles d un tableau statistique La statistique a un vocabulaire spécifique. L objet du tableau (la variable) s appelle
Plus en détailQUATRE-VINGT-DIXIÈME SESSION
Original: anglais 20 octobre 2005 QUATRE-VINGT-DIXIÈME SESSION RÉGIME DE SÉCURITÉ SOCIALE DE L OIM Amendement au Statut du personnel pour les fonctionnaires et les employés Page 1 RÉGIME DE SÉCURITÉ SOCIALE
Plus en détailAnalyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin
Analyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin Sandro Petrillo Université de Neuchâtel - Diplôme Postgrade en Statistique Projet
Plus en détailThéorie des sondages : cours 5
Théorie des sondages : cours 5 Camelia Goga IMB, Université de Bourgogne e-mail : camelia.goga@u-bourgogne.fr Master Besançon-2010 Chapitre 5 : Techniques de redressement 1. poststratification 2. l estimateur
Plus en détailAnalyse de la variance Comparaison de plusieurs moyennes
Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction
Plus en détailTP de risque management Risque Forex
TP de risque management Risque Forex Exercice 1 Partie 1. Le but de cette exercice est voir quel sont les options qui permettent de gérer le risque du au taux de change. En effet, dans notre cas, une société
Plus en détailLes modèles de choix binaire
Chapitre 4 Les modèles de choix binaire Les modèles de régression linéaire développés ci-dessus concernent une variable dépendante continue (comme par exemple le salaire ou le taux de chômage). Ce chapitre
Plus en détail