Heidi WECHTLER. Octobre 2005



Documents pareils
UNIVERSITÉ DE MONTRÉAL DÉPARTEMENT DE SOCIOLOGIE ************* Cours de niveau gradué en méthodes quantitatives *************

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Cycle de formation certifiante Sphinx

MASTER 2 SCIENCES HUMAINES ET SOCIALES Mention Psychologie. Spécialité : Recherches en psychologie

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Master Marketing et Pratiques Commerciales parcours Management de la marque et communication Apprentissage Master 2

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

TABLE DES MATIERES. C Exercices complémentaires 42

données en connaissance et en actions?

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

MRK A : Méthodes d Analyse de Données en Marketing Automne 2010

ARIANE. Terrains, techniques et compétences méthodologiques en sciences sociales. Mars 2014

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

INTRODUCTION AU DATA MINING

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Estimation et tests statistiques, TD 5. Solutions

Modèle de demande d'habilitation d'un Mastère LMD

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Qu est-ce qu une problématique?

T de Student Khi-deux Corrélation

Programme de la formation. Écrit : 72hdepréparation aux épreuves d admissibilité au CRPE

INFORMATIQUE : LOGICIELS TABLEUR ET GESTIONNAIRE DE BASES DE DONNEES

Table des matières. I Mise à niveau 11. Préface

Examen de Logiciels Statistiques

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Item 169 : Évaluation thérapeutique et niveau de preuve

Coup de Projecteur sur les Réseaux de Neurones

CMI ECONOMIE, FINANCE QUANTITATIVE ET STATISTIQUES - PARCOURS FORMATION EN APPRENTISSAGE

Bases de données documentaires et distribuées Cours NFE04

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Pascal Weber - Expert en organisation

Santé des TPE face à la crise

Traitement des données avec Microsoft EXCEL 2010

Leçon N 4 : Statistiques à deux variables

Consolidation de fondamentaux

IBM SPSS Statistics Base 20

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Débouchés professionnels

Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte

Construire un tableau de bord par Marc Maisonneuve

SERVICE D ACCOMPAGNEMENT PEDAGOGIQUE DE L UNIVERSITE SORBONNE PARIS CITE

Principes de mathématiques 12 SÉRIE DE PROBLÈMES. Septembre Student Assessment and Program Evaluation Branch

Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Demande d admission au Centre pédagogique Lucien-Guilbault Secteur primaire

Solutions Décisionnelles SPAD. La maîtrise des données, l'art de la décision

Logiciel XLSTAT version rue Damrémont PARIS

Mineure Architectures Orientées Services SOA Business Process Modeling (BPM) Mineure SOA. Business Process Modeling (BPM)

Attachée Temporaire d Enseignement et de Recherche Institut d Administration des Entreprises Université de Toulouse 1 Capitole.

Le Sphinx Millenium Modes opératoires Préparer, administrer, Dépouiller les enquêtes

Présentation du logiciel

Évaluations aléatoires : Comment tirer au sort?

N SIMON Anne-Catherine

Licence Professionnelle en Statistique et Informatique Décisionnelle (S.I.D.)

Mises en relief. Information supplémentaire relative au sujet traité. Souligne un point important à ne pas négliger.

TD d économétrie appliquée : Introduction à STATA

Principe d un test statistique

IBM SPSS Regression 21

Les nouveaux tableaux de bord des managers

1 Imputation par la moyenne

«Étude sur l appropriation et les usages au sein d un ENT en IUFM»

Arbres binaires de décision

Spécificités, Applications et Outils

,,ÉTUDES ET RECHERCHES SUR LA DISTRIBUTION, LA PROMOTION ET LA VALORISATION DES PRODUITS DE BOULANGERIE DANS LE MUNICIPE DE CONSTANŢA

IBM SPSS Direct Marketing 21

Sondage auprès des employés du réseau de la santé et des services sociaux du Québec - Rapport sommaire -

Master Marketing et Pratiques Commerciales Apprentissage Master 2

Entretien portant sur la location (exemple)

Cet exposé s intègre dans les travaux développés par une Equipe en Projet INRP-IUFM,

Formations EViews FORMATIONS GENERALES INTRODUCTIVES INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS

Améliorer les performances du site par l'utilisation de techniques de Web Mining

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

Plates-formes de téléformation et modèles pédagogiques

Ressources nécessaires (avec budget)

TD1 Signaux, énergie et puissance, signaux aléatoires

Introduction au Data-Mining

Industrie 4.0 L usine connectée

Les conducteurs automobiles évaluent-ils correctement leur risque de commettre un accident?

Outils pour les réseaux de neurones et contenu du CD-Rom

sommaire L organisation et la gestion des archives d entreprise...7

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

Why Software Projects Escalate: The Importance of Project Management Constructs

MASTER ECONOMIE APPLIQUEE

BUSINESS FORECASTING SYSTEM

Développement d'applications pour le référencement d'un site web et pour la gestion de campagnes de mails

HIVER 2004 MÉTHODOLOGIE DE LA RECHERCHE EN MARKETING MRK

Relation entre deux variables : estimation de la corrélation linéaire

TUTORIEL Qualit Eval. Introduction :

L évaluation du transfert des apprentissages suite à un programme de perfectionnement

1 er Avril 2015 Data Science & Big Data Etat de l art Donner plus d intelligence aux données

SAS ENTERPRISE MINER POUR L'ACTUAIRE

ETUDE DE PERCEPTION PRODUIT

Lire ; Compter ; Tester... avec R

Utilisation du Logiciel de statistique SPSS 8.0

ISBN-13 : Dépôt légal : Bibliothèque et Archives nationales du Québec, 2009

Algèbre 40 Analyse Stat. 1 - IES : Probabilités discrètes et calcul intégral 29,5 6 Stat. 2 - IES : Probabilités générales 54 8 UE1-02 M-E-IS

Transcription:

Heidi WECHTLER Le support aux analyses de données Séminaire GREGOR Octobre 2005

Support aux analyse de données du GREGOR Le poste Chargée d étude statistiques au GREGOR, bureau B126 (wechtler.iae@univ-paris1.fr) Les missions Support aux analyses de données pour les doctorants et enseignants du GREGOR, pour la partie empirique des thèses ou des articles. Conseils d initiation aux logiciels statistiques, Conseils pour le choix des méthodes, Conseils pour la mise en œuvre, Conseils pour l interprétation.

Support aux analyse de données : A quelle étape? Avant Possibilité d initiation aux logiciels Statistiques disponibles au GREGOR : SPAD : spécialisé pour les analyses de données approfondies (analyses factorielles, classification ) et pour l analyse textuelle SPSS : spécialisé pour les tests, facile d accès pour les analyses factorielles et régression SAS : fait tout, pratique pour la gestion et transformation de données, les statistiques en général et l automatisation de tâches. Garde trace des manipulations de données et options choisies. Il est plus facile de collecter des données adéquates lorsqu on connaît les différentes possibilités des logiciels Exemples : Attention au format des variables (continues, échelles, nominales ) Pour l analyse textuelle, penser à des variables nominales pertinentes pour comparer les discours

Support aux analyse de données : A quelle étape? Avant Se poser les bonnes questions : A propos des données : le format des variables A propos des méthodes : la nature des données et la taille de l échantillon déterminent les d analyses Exemples : Ma variable est-elle vraiment une échelle? On ne peut pas faire de régression simple sur une variable dépendante qualitative On ne peut pas utiliser de méthodes paramétriques sur de très petits échantillons Comment mélanger les variables quali et quanti? Difficile de caractériser des profils de réponses avec des questionnaires à étapes (si vous avez répondu «bien» ou «assez bien» passez à la question 11 sinon passez à la question 19 etc.)

Support aux analyse de données : A quelle étape? Pendant Conseils pour : Les différentes méthodes possibles en fonction des données Vérifier si les hypothèses statistiques sont respectées pour utiliser une méthode en particulier La mise en œuvre des méthodes choisies Exemples : Est-ce que l échantillon est assez conséquent pour faire tel test, telle méthode? Méthodes paramétriques ou non paramétriques? Est-ce que mes variables sont bien indépendantes (corrélation faible) dans ma régression?

Support aux analyse de données : A quelle étape? Après Pour les analyses déjà bien avancées, aide à l interprétation et tri des output Exemples : Pour arriver au résultat final, est-il nécessaire de présenter toutes les étapes, tous les essais, faut-il garder plusieurs méthodes qui montrent le même résultat? Dans une régression simple, faut-il présenter dans la sorties les variables non significatives? Est-ce que mon test est bien significatif, qu en conclure?

Support aux analyse de données : FAQ Les besoins les plus souvent formulés Principe de l analyse textuelle et apprentissage du logiciel SPADT Apprentissage du logiciel SPAD pour l analyse des correspondances multiples Aide à l interprétation des analyses factorielles (les différences entre SPSS et SPAD) Aide pour mettre en œuvre et interpréter facilement les classifications (l avantage de SPAD) Aide à l interprétation des tests non paramétriques (sous SPSS) Relecture de la partie statistique pour vérifier le déroulement des étapes statistiques et l interprétation générale Aide pour la mise en œuvre et interprétation de modèles de régression dont la variable dépendante est nominale (logit) Points méthodologiques et définitions de méthodes statistiques

Quelques astuces Bon à savoir, il est très courant d utiliser plusieurs logiciels en statistiques (on utilise la spécialité de chacun pour le maximum de lisibilité) Exemple : SAS pour mettre en forme les données SPSS pour faire les différents tests SPAD pour les analyses factorielles et classification SPSS pour les régressions Ne pas hésiter à tester plusieurs méthodes, plusieurs découpages de variables Exemple : Tester avec la variable sous forme continue Tester la variable transformer en quartile Tester la variable avec un découpage à seuils théoriques Tester la variable sous forme binaire (médiane)

Support aux analyse de données du GREGOR Propositions : Possibilité de prendre rendez-vous TD d initiation aux logiciels Stat en petits groupes ou individuellement TD de statistiques sur un point précis (paramétrique/non paramétrique ; analyse factorielle ; régression linéaire ; modèle logit) Projets : Des licences SPAD 6 sur tous les postes de la salle B129 + DEA avec possibilités d avoir des licences étudiants (environ 20 ) Avoir des licences étudiants SPSS (environ 20 )