Analyse de donne es Exercices Table des matières Séquence 1 : Détermination des types d enquêtes, choix d échantillons... 3 Application n 1 : Construire un sondage par quotas... 3 Application n 2 : Construire un échantillonnage aléatoire simple... 3 Application n 3 : Construire un échantillonnage aléatoire stratifié... 3 Application n 4 : Choisir un type d enquête... 4 Application n 5 : Calculer un intervalle de confiance et une taille d échantillon... 4 Séquence 2 : Réalisation des enquêtes... 5 Application n 1 :... 5 Application n 2... 5 Application n 3... 5 Application n 4... 6 Application n 5... 6 LP Bancassurance - Analyse de données - Séquence 1 : Détermination des types d enquêtes, choix d échantillons 1/17
Séquence 3 : Analyse de résultats... 7 Application n 1 :... 7 Application n 2 :... 7 Application n 3 :... 7 Application n 4 :... 8 Séquence 4 : Méthodes d analyse... 12 Application n 1 : Khi² - Ajustement à une loi... 12 Application n 2: Khi² - Ajustement à une loi... 12 Application n 3 : Khi² - Test d indépendance... 13 Application n 4 : Khi² - Test d indépendance... 13 Application n 5 : ANOVA 1 facteur... 14 Application n 6 : ANOVA 1 facteur... 14 Application n 7 : ANOVA 2 facteurs... 15 Application n 8 : ANOVA 2 facteurs... 15 Application n 9 : régression simple... 15 Application n 10 : régression simple... 16 Application n 11 : régression multiple... 16 Application n 12 : régression multiple... 17 LP Bancassurance - Analyse de données - Séquence 1 : Détermination des types d enquêtes, choix d échantillons 2/17
Séquence 1 : Détermination des types d enquêtes, choix d échantillons Application n 1 : Construire un sondage par quotas A partir des données suivantes, recueillies sur un échantillon de 150 personnes, construisez le tableau des personnes à interroger, et une feuille de quotas (nombre d enquêteurs : 10) Age Sexe Individuelle -30 ans 20% Hommes 48% Individuelle <150 m² 20% 30-45 ans 15% Femmes 52% Individuelle > 150m² 10% 45-50 ans 15% Collective <10 logements 30% +60 ans 50% Collective>10 logements 40% Application n 2 : Construire un échantillonnage aléatoire simple Périodique Aléatoire Restreint aux entreprises du Var Construire un échantillon aléatoire simple des entreprises (échantillonnage périodique) Construire un échantillon aléatoire simple des entreprises (échantillonnage aléatoire) Application n 3 : Construire un échantillonnage aléatoire stratifié Construire un échantillon aléatoire simple des entreprises du Var (échantillonnage aléatoire) Construire un échantillon aléatoire stratifié proportionnel des entreprises (Var / hors Var) LP Bancassurance - Analyse de données - Séquence 1 : Détermination des types d enquêtes, choix d échantillons 3/17
Construire un échantillon aléatoire stratifié des entreprises (Var / hors Var) Application n 4 : Choisir un type d enquête Choisissez les modes d enquête et les modes d administration que vous choisiriez pour les populations et les thèmes suivants : Population Commerçants du centre-ville de Toulon Clients d une mutuelle Internautes Population française Fournisseurs d une GSS Thème de l enquête Animations de Noël Remboursements de dépenses de santé Fréquentation d un site Réaction face à un événement d actualité Délais d approvisionnement Application n 5 : Calculer un intervalle de confiance et une taille d échantillon a) Vous devez réaliser une enquête de satisfaction auprès des usagers d une agence bancaire. Une pré- enquête a montré que 82% des usagers étaient satisfaits. 1) A combien peut-on estimer le pourcentage de clients insatisfaits des services de l agence? 2) Faudrait-il interroger plus ou moins de personnes si le taux de satisfaction était de 54%? Justifiez (sans calcul) 3) On cherche à évaluer le nombre de personnes à interroger pour avoir une bonne idée de ce pourcentage global. A combien peut-on évaluer ce nombre de personnes? b) Une formation veut évaluer la notoriété d un de ses diplômes Une pré-enquête menée sur 62 personnes a montré que 46 personnes connaissaient le diplôme. 1) Calculez le nombre de personnes à interroger pour disposer d une évaluation plus précise de cette notoriété, avec une erreur de ± 6% 2) Combien de personnes faudrait-il interroger avec une erreur de ± 2%? 3) Si la notoriété était de 55%, faudrait-il interroger plus ou moins de personnes? Justifiez sans calcul 4) On a interrogé 125 diplômés. Le taux de satisfaction moyen des diplômés est de 13/20, avec un écart-type de 3. A combien peut-on évaluer le taux moyen de satisfaction des diplômés? LP Bancassurance - Analyse de données - Séquence 1 : Détermination des types d enquêtes, choix d échantillons 4/17
Séquence 2 : Réalisation des enquêtes Application n 1 : Etablissez le modèle d enquête pour une boutique ayant perdu une part significative de son CA Application n 2 Remplissez le tableau suivant Mode d administration Avantages Inconvénients Solutions pour limiter les inconvénients Face à face Courrier Enquête postale Internet Application n 3 Soient les questions suivantes. On vous demande de préciser les erreurs commises, de corriger les questions qui ne vous semblent pas satisfaisantes (vous pouvez les compléter, les réécrire, voire rajouter des questions) ; et de redéfinir éventuellement les échelles de mesure, si ces dernières ne vous semblent pas convenir. Question Que pensez-vous de l'affirmation selon laquelle le P.E.R.P. est un bon type de placement? Quel est votre métier? Combien de km parcourez-vous dans votre véhicule? Regardez-vous les programmes culturels à la télévision et avec quelle fréquence? Quel est votre opérateur de téléphone fixe, et quel est votre type d abonnement? Réponses proposées C'est vrai / c'est souvent vrai / c'est parfois vrai / ce n'est jamais vrai (Réponse ouverte texte) (question ouverte) - d une fois / mois, 1 fois/mois, 2 fois/mois, plus de 2 fois par mois Cegetel / France Telecom / Neuf Telecom LP Bancassurance - Analyse de données - Séquence 2 : Réalisation des enquêtes 5/17
Question Réponses proposées Quel est votre diplôme le plus élevé? Bac / Bac+2 / L3 / Master 2 Consommez-vous du café? Oui / Parfois / Non Application n 4 Qualifiez les questions du document CREDOC_CultureFinanciere.pdf Application n 5 Effectuez les opérations suivantes dans Sphinx Création des premières questions par type Disposez-vous d un téléphone fixe? Donnez 3 adjectifs pour décrire votre téléphone mobile? Etes-vous satisfait de votre téléphone mobile? Quel est le montant de votre dernière facture? Quel est votre code postal? Création des intertitres Téléphone fixe Téléphone mobile Identification Modifications Ordre des questions Ordre des titres Suppression de questions Renvois Définition d un renvoi : Disposez-vous d un téléphone fixe : oui/non Suppression d un renvoi Restriction Définition d une restriction : Ne répondre à la question «Êtes-vous satisfait des services de cet opérateur?» Seulement si abonné au fixe et abonné au portable. LP Bancassurance - Analyse de données - Séquence 2 : Réalisation des enquêtes 6/17
Séquence 3 : Analyse de résultats Application n 1 : En utilisant le tableau disponible dans ADLPRO-GRAPH.xlsx, construisez les graphiques permettant de mettre en avant les données présentées. Application n 2 : En utilisant le tableau disponible dans ADLPRO-TCD.xlsx, construisez les TCD permettant c extraire les données suivantes - Nombre de formations par type d emplois repères - Nombre de formations par type de formation et par organisation - Coût pédagogique par domaines (principal et secondaire) - Coût par sexe et par établissement - Durée de formation par type d emplois repères - Coût par lieu de formation - Coût par domaine et par lieu de formation - Pourcentage du coût de chaque domaine secondaire dans le coût par domaine principal - Pourcentage de formation par sexe par établissement - Ecart par rapport à la répartition totale par sexe de l entreprise Application n 3 : Commentez les résultats présentés dans CREDOC_CultureFinanciere_resultats.pdf LP Bancassurance - Analyse de données - Séquence 3 : Analyse de résultats 7/17
Application n 4 : Commentez les résultats suivants ; établissez une brève synthèse de l enquête LP Bancassurance - Analyse de données - Séquence 3 : Analyse de résultats 8/17
LP Bancassurance - Analyse de données - Séquence 3 : Analyse de résultats 9/17
LP Bancassurance - Analyse de données - Séquence 3 : Analyse de résultats 10/17
LP Bancassurance - Analyse de données - Séquence 3 : Analyse de résultats 11/17
Séquence 4 : Méthodes d analyse Application n 1 : Khi² - Ajustement à une loi Pour étudier l éventuelle influence de la couleur de l emballage d un nouveau savon, SAVOLIVE SA a procédé à une étude sur un échantillon de 200 ménages. On a remis à chacun d entre eux 4 savons de composition identique mais emballés dans des boîtes de couleur différentes (rouge, blanc, bleu, vert) en leur affirmant qu il s agit de savons de formules différentes (ce qui est faux). On leur a indiqué en même temps qu il leur sera demandé, un mois plus tard, vers lequel va leur préférence. SAVOLIVE leur offrira alors une caisse de 24 savons de leur choix. A la fin de l expérience, les choix observés ont été les suivants : Couleur Rouge Blanc Bleu Vert Ensemble Effectif 51 74 30 45 200 1) Résolvez ce problème sous Excel : a. construisez le tableau en utilisant le fichier ADLPRO-KHI2.xls b. résolvez l exercice 2) Résolvez ce problème sous Sphinx Application n 2: Khi² - Ajustement à une loi On étudie le nombre de clients en fonction du segment auquel ils appartiennent. Les segments sont-ils équivalents? Vivier Bonne gamme Patrimoniaux 53 60 40 3) Résolvez ce problème sous Excel : a. construisez le tableau en utilisant le fichier ADLPRO-KHI2.xls b. résolvez l exercice 4) Résolvez ce problème sous Sphinx LP Bancassurance - Analyse de données - Séquence 4 : Méthodes d analyse 12/17
Application n 3 : Khi² - Test d indépendance On étudie le nombre de produits bancaires possédés par les clients en fonction du segment auquel ils appartiennent et de leur âge. Le segment dépendil de l âge? Gamme Age Vivier Bonne gamme Patrimoniaux 18-25 11 4 0 26-40 15 8 2 41-60 15 13 8 +60 12 35 30 5) Résolvez ce problème sous Excel : a. construisez le tableau en construisant un tableau croisé dynamique à partir du fichier ADLPRO-KHI2.xls b. résolvez l exercice 6) Résolvez ce problème sous Sphinx Application n 4 : Khi² - Test d indépendance On étudie le nombre de produits bancaires possédés par les clients en fonction du segment auquel ils appartiennent et de leur âge. Le segment dépendil de l âge? Romans BD Livres d art Essais Enfants Histoire -20 8 10 4 3 5 10 20-40 10 2 12 15 2 5 +40 20 0 10 20 2 8 7) Résolvez ce problème sous Excel : a. construisez le tableau en construisant un tableau croisé dynamique à partir du fichier ADLPRO-KHI2.xls LP Bancassurance - Analyse de données - Séquence 4 : Méthodes d analyse 13/17
b. résolvez l exercice 8) Résolvez ce problème sous Sphinx Application n 5 : ANOVA 1 facteur On désire savoir si la longueur du linéaire consacré à un produit influence significativement le volume des ventes de ce produit avec un niveau de risque de 5%. Le tableau suivant résume les statistiques recueillies auprès de 18 magasins choisis aléatoirement pour faire cette expérience. Six magasins ont été affectés aléatoirement à chacun des trois traitements (demi-linéaire, linéaire simple, double linéaire). Demi-linéaire Linéaire simple Double linéaire 10 12 13 12 13 15 9 11 13 14 17 20 10 11 12 11 12 12 Application n 6 : ANOVA 1 facteur Dans une université américaine, on a prélevé des échantillons indépendants de professeurs masculins et féminins. On a obtenu les salaires annuels suivants (en milliers de $ arrondis). Qu en pensez-vous? Hommes Femmes 12 9 11 12 19 8 16 10 22 16 LP Bancassurance - Analyse de données - Séquence 4 : Méthodes d analyse 14/17
Application n 7 : ANOVA 2 facteurs Trois hommes font un travail similaire d empaquetage. Le nombre de boîtes empaquetées par chacun, au cours de trois heures déterminées, est donné dans le tableau suivant. De quoi dépend le nombre de boîtes empaquetées? Hommes A B C heures 11-12 120 55 175 13-14 30 25 55 16-17 250 40 290 Application n 8 : ANOVA 2 facteurs Trois méthodes d estimation de valeurs d inventaire ont été employées à la fin de chaque mois, sur une période de 6 mois, fournissant ainsi les 18 estimations suivantes. Qu en pensez-vous? Mois Janvier Février Mars Avril Mai Juin Méthode Méthode 1 14 12 16 15 10 11 Méthode 2 18 13 17 19 13 13 Méthode 3 16 14 17 14 12 9 Application n 9 : régression simple Une entreprise souhaiterait fournir à ses clients une indication stable de ses délais de livraison. Elle a collecté un certain nombre d informations, représentées ci-dessous. Qu en pensez-vous? Envoi 1 2 3 4 5 6 7 8 9 10 Distance (en km) 825 215 1070 550 480 920 1350 325 670 1215 Nb. jours avant livraison 3,5 1 4 2 1 3 4.5 1.5 3 5 LP Bancassurance - Analyse de données - Séquence 4 : Méthodes d analyse 15/17
9) Résolvez ce problème sous Excel 10) Résolvez ce problème sous Sphinx Application n 10 : régression simple On cherche à évaluer la marge que génère un linéaire en fonction de la taille des produits qui y sont présentés. On obtient les données suivantes Taille(m) 2,5 2,8 4,8 5,4 6,23 6,45 3,2 6,22 4,15 Marge ( /unité) 4,15 5,9 1,1 6,12 2,11 3,48 2,11 5,01 6,68 1) Résolvez ce problème sous Excel 2) Résolvez ce problème sous Sphinx Application n 11 : régression multiple On cherche à estimer la croissance de plusieurs grands pays industriels en fonction d un certain nombre de variables. Les données sont les suivantes. Proposez une estimation satisfaisante. Variable/pays USA Japon Allemagne France Italie Royaume Canada Uni Croissance 2 1,4 1,4 1,5 0,7 2,1 1,5 PIB 6955 5114 2412 1538 1087 1102 560 Chômage 5,5 3,1 8,2 11,6 12,2 8,7 9,5 Inflation 2,8-0,1 1,8 0,7 5,4 3,4 2,2 Dette 63,4 80,6 62,2 60,7 124,7 60 100,5 Taux d intérêt 6,6 3,4 6,9 7,7 11,9 8,2 8,4 LP Bancassurance - Analyse de données - Séquence 4 : Méthodes d analyse 16/17
1) Résolvez ce problème sous Excel 2) Résolvez ce problème sous Sphinx Application n 12 : régression multiple On cherche à estimer les ventes d en entreprise en fonction d un certain nombre de variables. Qu en pensez-vous? Ventes / 2005 2004 2003 2002 2001 Années Ventes 5245 5100 4912 4811 4305 Ventes N-1 5100 4912 4811 4305 4198 Budget pub. 350 340 280 280 280 Zones de 6 6 5 5 4 Vente Croissance 2,7 2,5 2 1,8 1,5 1) Résolvez ce problème sous Excel 2) Résolvez ce problème sous Sphinx LP Bancassurance - Analyse de données - Séquence 4 : Méthodes d analyse 17/17