Une approche statistique des corpus de SMS : outils et défis

Dimension: px
Commencer à balayer dès la page:

Download "Une approche statistique des corpus de SMS : outils et défis"

Transcription

1 Une approche statistique des corpus de SMS : outils et défis Thomas François 1, 2 (1) Aspirant F.N.R.S. (2) CENTAL, IL&C (Université Catholique de Louvain) Séminaire sud4science 29 Septembre /43

2 Plan 1 Introduction 2 L approche quantitative 3 Exemples de résultats 4 Conclusion 2/43

3 Plan 1 Introduction 2 L approche quantitative La démarche quantitative La étrisation Le choix des outils statistiques Les problèmes d échantillonnage 3 Exemples de résultats La question de l abréviation 4 Conclusion 3/43

4 Introduction L envoi de SMS constitue aujourd hui une activité sociale largement répandue dans nos sociétés. D après le rapport 2010 : U.S Digital, Year in review, malgré l arrivée massive des smartphones, l activité principale des utilisateurs sur leur téléphone mobile reste l envoi de SMS (68%), suvi par la prise de photo (52,4%). 4/43

5 Introduction L esms [Cougnon and Ledegen, 2010] présente une caractéristique intéressante : Avec les autres formes de DEM [Panckhurst, 2009], il représente un discours écrit qui peut échapper aux contraintes institutionnelles pesant sur la plupart des autres écrits traditionnels. Par conséquent, on peut penser que la notion de variation s y exprime davantage... [Cougnon and François, 2010] concluent d ailleurs : «Au travers de cette analyse, se dessine plutôt l existence de sous-groupes présentant chacun leurs particularismes». [Panckhurst, 2009, 45] y voit «une absence quasi totale de normes et une créativité lexicale extrêment riche». 5/43

6 Introduction Il existe plusieurs types de variations [Moreau, 1997, 284] : Variation diachronique : les études sur les corpus de SMS sont assez récentes (milieu des années 90) et il n y a pas encore d étude diachronique basée sur des données conséquentes ; Variation diatopique : représentée grâce aux différents corpus récoltés (belgicisme, québécisme, etc.), mais aussi au sein d un même corpus (parler de Liège, de Bruxelles, etc.) ; Variation diastratique : axe moins aisé à explorer, car il requiert la constitution de profils d informateurs (profession, niveau d étude, etc.). D autres aspects socio-démographique du scripteur peuvent encore influencer son emploi de la langue : âge, sexe, ethnie, religion, langue maternelle, etc. Variation diaphasique : pour un même usager, observer les différences en fonction du type de destinataire (n est généralement pas connu, mais peut parfois se deviner). 6/43

7 Introduction Dans ce contexte, l emploi de méthodes quantitatives d analyse des données peut aider le chercheur à décrire la variation. En effet, l exploration systématique de corpus permet : de relever des phénomènes qui auraient échappé à une approche qualitative ; surtout, à estimer plus précisément leur importance, laquelle pourrait être mal évaluée sur la base de quelques exemples seulement. Cette présentation discute les techniques à disposition du chercheur pour ce faire et souligne quelques problèmes, au travers d exemples issus du corpus de sms4science. 7/43

8 Plan 1 Introduction 2 L approche quantitative La démarche quantitative La étrisation Le choix des outils statistiques Les problèmes d échantillonnage 3 Exemples de résultats La question de l abréviation 4 Conclusion 8/43

9 Quant Plan 1 Introduction 2 L approche quantitative La démarche quantitative La étrisation Le choix des outils statistiques Les problèmes d échantillonnage 3 Exemples de résultats La question de l abréviation 4 Conclusion 9/43

10 Quant La démarche quantitative Comme pour la démarche qualitative, le chercheur part généralement d une hypothèse de recherche : Exemple Est-ce que les femmes sont plus bavardes dans les SMS que les hommes? Trois étapes subséquentes : 1 Transformer le phénomène en une variable et le mesurer sur les données collectées (étriser) ; 2 Adapter l hypothèse afin qu elle puisse être validée au moyen d un test statistique ; 3 Analyser plus finement les résultats du test, à l aide d autre outils statistiques ou d une démarche qualitative. 10/43

11 Quant La démarche quantitative : exemple Aspect loquace peut être mesuré : à l aide du nombre de caractères moyen par message ; [Cougnon and François, 2010] constatent sur le corpus belge : 109 caractères/mess. pour les messages écrits par des femmes contre 99 pour ceux écrits par des hommes. à l aide du nombre moyen de mots par message. [Ling, 2005] montrait déjà que le nombre moyen de mots par message est de 5,54 pour les informateurs masculins (X 1 ) et de 6,95 pour les femmes (X 2 ). Ces constats doivent rester au niveau des données! 11/43

12 Quant La démarche quantitative : exemple Question suivante : peut-on généraliser les résultats à l ensemble de la population? (inférence) Transformation de l hypothèse de recherche sous la forme d une hypothèse statistique H0 : X 1 = X 2 H1 : X 1 X 2 Divers tests statistiques permettent d évaluer cette hypothèse, en fonction de la nature des données : [Ling, 2005] effectue une ANOVA : p = 0, 0001 ; Les messages écrits par les femmes norvégiennes seraient donc bien plus longs en moyenne que ceux des hommes. 12/43

13 Quant Les différents problèmes Vu comme cela, l approche quantitative semble simple, mais de nombreux problèmes se posent en réalité... La étrisation est notamment confrontée au manque de systématisation dans l annotation des corpus ; Le choix du test statistique à employer doit être bien réfléchi ; L inférence statistique est menacée par l existence de biais dans les corpus. Nous allons détailler ces trois aspects au travers d exemples : La question du taux d abréviation dans les SMS ; La présence d emprunts ; Les types de salutations employées. 13/43

14 Plan 1 Introduction 2 L approche quantitative La démarche quantitative La étrisation Le choix des outils statistiques Les problèmes d échantillonnage 3 Exemples de résultats La question de l abréviation 4 Conclusion 14/43

15 La étrisation : introduction La étrisation : Elle consiste à définir une variable d intérêt, qualitative ou quantitative, comportant un certain nombre de valeurs au sein desquelles sont classées les différentes formes du phénomène analysé. Par ex. : elo, hello, helo, lo, heyo, hlo, l.o, llo, hilo, l=o, hell0, yello, ll, hèlo sont regroupés sous la forme hello. Dans le contexte de corpus de SMS, elle présente plusieurs difficultés : Problèmes liées à la représentation et la manipulation des données ; Incohérences dans les annotations ou les transcriptions des corpus ; Difficultées liées au traitement automatisée des SMS (de Neef et Véronis, 2004) ; Niveau d analyse. 15/43

16 Représentations des données Données de sms4science sont stockées dans des bases de données MySQL : il convient de les exporter dans un format plus manipulable par le linguiste. Tentation : utiliser Excel Pratique pour visualiser et manipuler les données... MAIS... limite des 255 caractères par case entraîne des pertes de données!! Notre approche Les données sont exportées sous format.csv et manipulées à l aide de scripts python. pas de perte de données et plus souple qu Excel, mais moins accessible. 16/43

17 Problème de cohérence La préparation des corpus (anonymisation, transcription, etc.) requiert des interventions manuelles, qui manquent parfois de systématisme. Balises d anonymisation : exemples tirés du corpus de La Réunion : {NOM} ou {nom} ou {{NOM} ou {NOM1} ; {n } ou {tél} ou {TEL} ; {NOM.com} ou {site}, etc. Le problème se retrouve entre les différents corpus : Belgique : ADR ; Réunion : adresse. Une normalisation des balises a été entreprise au CENTAL. 17/43

18 Incohérence dans les transcriptions En calculant le taux d abbréviation (Réunion), nous avons obtenus des valeurs aberrantes, qui s expliquent : exemple Manque 1 sms ; 129 messages n avaient pas de transcription! ratio trop large! 5 SMS ont été dédoublés ; Quelques rares traductions sont erronées : Salut oui sava et toi?? Ben pour samedi jpe pas comme je révise pour le brevet. Bon ben sera à une prochaine ptete Traduit : Salut, oui prends bien soin de toi. Ces données ont été supprimées pour le traitement statistique. On voit l intérêt d une approche systématique! 18/43

19 Difficulté du traitement automatique Plusieurs problèmes se posent pour le TAL des SMS : Segmentation des unités linguistiques : mots, phrases, alors que les espaces peuvent manquer, les mots avoir été concaténés (ex. Kcé kompliké l amour!... Jcompren plu rien!) ou la ponctuation, manquer ; Régionalismes ou emprunts, qui ne sont pas repris dans les resources et ne sont pas reconnus : oufti que tout à est compliqué... ; De manière générale, la créativité linguistique, très présente dans l esms est difficile à traiter par le TAL. Nous avons opté pour une approche semi-automatique. 19/43

20 Niveau des observations Un dernier problème se pose : quelle population choisir? Dans les exemples précédents, nous nous sommes intéressés à la population des scripteurs ; «Est-ce que les femmes écrivent des messages plus longs que les hommes?» Toutefois, [Ling, 2005] et [Cougnon and François, 2010] travaillent au niveau des messages : «Est-ce les messages écrits par des femmes sont plus longs que ceux écrits par des hommes?» Un troisième niveau est possible : celui de la forme linguistique : «Est-ce que les régionalismes sont plus utilisés par des femmes que des hommes? Travailler au niveau des scripteurs demande de fusionner les sms en une seule observation et nie le fait que certains utilisateurs sont nettement plus actifs que d autres. 20/43

21 Plan 1 Introduction 2 L approche quantitative La démarche quantitative La étrisation Le choix des outils statistiques Les problèmes d échantillonnage 3 Exemples de résultats La question de l abréviation 4 Conclusion 21/43

22 Choix des tests statistiques Le choix du bon test statistique peut être un problème pour le néophyte, mais répond à des critères précis. Variable qualitative : Test du Chi-carré. Variable continue étrique (test de Shapiro-Wilk) : Comparaison de deux échantillons : Test T de student ; Plus de deux échantillons : ANOVA Variable continue non étrique : Comparaison de deux échantillons : Test de Mann-Whitney ; Plus de deux échantillons : Test de Kruskal-Wallis ; 22/43

23 Plan 1 Introduction 2 L approche quantitative La démarche quantitative La étrisation Le choix des outils statistiques Les problèmes d échantillonnage 3 Exemples de résultats La question de l abréviation 4 Conclusion 23/43

24 Notion d inférence : rappel L inférence Il s agit d un processus par lequel on induit les caractéristiques inconnues d une population à partir de celles d un échantillon issu de cette population, avec une certaine marge d erreur. C est ce que [Ling, 2005] fait lorsqu il affirme, sur la base d un échantillon de SMS : Les messages écrits par des femmes norvégiennes sont plus longs que ceux des hommes Pour que la procédure d inférence soit valide, il faut que l échantillon soit représentatif. 24/43

25 Représentativité des corpus sms4science Parmi les différentes techniques d échantillonnage, seules certaines sont probabilistes et engendrent un échantillon i.i.d : échantillonnage aléatoire simple : on dresse une liste des individus et on les sélectionne au hasard ; échantillonnage systématique : on sélectionne les individus à intervalles fixes ; échantillonnage stratifié : respect de la proportion des sous-groupes. Sont théoriquement optimales, mais difficiles à mettre en place (voir [Ling, 2005]). 25/43

26 Représentativité des corpus sms4science Corpus sms4science sont obtenus via échantillonnage par volontaires (publicité via les médias et stimulation via des lots) représentativité discutable! Échantillon i.i.d. = identiquement distribués : p(x 1 ) = p(x 2 ) =... = p(x n) Dans ce cas, les lots risquent d attirer davantage certains types de personnes. indépendants : p(x 1 x 2... x n) = n i=1 p(x i) La publicité se fait par proximité (amis, médias, etc.). Problème On peut se demander dans quelle mesure les corpus sms4science sont bien représentatifs. 26/43

27 Représentativité des corpus sms4science Étude de [Cougnon and François, 2010] sur la question : population ciblée : utilisateurs de SMS belges francophones (approximée via la pop. belge francophone) ; Test de représentativité : chi-carré d ajustement pour chaque dimension (âge, sexe, etc.). Résultats : Sexe : 57,2% de femmes contre 42,7% d hommes ne correspond pas au 51,6% contre 48,4% au niveau de la population (χ 2 (1) = 21, 2 ; p <.0001) Âge : même constat. 27/43

28 Représentativité des corpus sms4science Données pour l âge : Classes -15 ans ans prop. corpus 10,9 29,8 32,5 15,4 6,2 5,1 prop. pop. 18,2 6,10 6,3 13,9 14,9 40,5 La différence entre les deux distributions est très largement significative : χ 2 (1) = 3941, 5 ; p < /43

29 Interprétation de ces résultats Normalement, de tels résultats doivent être interprétés comme la preuve d un biais : l échantillon ne serait pas représentatif de la population... MAIS... dans ce cas, il est possible aussi que la population des utilisateurs de SMS soit nettement différente de celle de la Belgique francophone. [Ling, 2006, 4] : 70% des sujets de 16 à 19 ans utilisent quotidiennement les SMS ; 60% des ans et seulement 10 % des plus de 67 ans. [Chabert, 2010, 8] : 97% des ans utilisent «au moins de temps en temps», contre 93% des ans et 59% des 40 et plus. Il est donc probable que le corpus sms4science belge ne soit pas si biaisé que cela. 29/43

30 Plan 1 Introduction 2 L approche quantitative La démarche quantitative La étrisation Le choix des outils statistiques Les problèmes d échantillonnage 3 Exemples de résultats La question de l abréviation 4 Conclusion 30/43

31 Quelques études sur les corpus sms4science Nous allons présenter quelques résultats de nos études précédentes sur les pratiques d abréviations dans la francophonie ; Le même genre d étude a été appliquée à : Salutations (ouverture du canal) ; Présence d emprunts ou de code-switching. Détails dans [Cougnon and François, 2010, Cougnon and François, 2011] 31/43

32 Plan 1 Introduction 2 L approche quantitative La démarche quantitative La étrisation Le choix des outils statistiques Les problèmes d échantillonnage 3 Exemples de résultats La question de l abréviation 4 Conclusion 32/43

33 Pourquoi abrévier? Une question importante : pourquoi le contexte de l esms est-il un lieu privilégié de l abréviation? Qui abrévie et pour quelles raisons? [Panckhurst, 2009] a proposé une classification des néographies rencontrées dans les sms, parmi lesquelles : On trouve des abréviations (ordi ; lut ; mdr ; pr ou ele) ; Mais aussi des allongements : suuuupppeeerrr!!!!!! Notre question : Est-ce que certains types de scripteurs recourrent davantage à l abréviation que d autres? [Ling, 2005, 6] : 6% des messages comportaient des abréviations, qui sont le plus utilisées par les adolescents et les jeunes gens. 33/43

34 L abréviation dans le corpus belge Variable (nombre de caractères dans la transcription nombre de caractères dans le SMS) nombre de caractères dans la transcription Taux de réduction moyen : 9,4%. Loin de messages tels que : Maman kèsk L sé kèsk L sépa? Eseydepa c àlamésonce WE.PAPA (45%) 19% des messages : «pas d abréviation» ; 2,4% plus longs que la transcription (allongements). 34/43

35 L abréviation dans le corpus belge Les tests statistiques révèlent que : Les messages écrits par des femmes sont davantages abréviés que ceux des hommes (U = 6, 55; p < 0, 0001) : 10% de réduction contre 8,4%. L âge, le niveau d éducation et le nombre de sms envoyés par semaine influencent la pratique de l abréviation, MAIS... Attention à l excès de données! le nb. de sms par semaine a un effet significatif sur le taux d abréviation (KW : χ 2 (5) = 210; p < 0, 0001) ; la corrélation entre les deux variables est très basse (r s = 0, 006; p = 0, 31) ; Privilégier les mesures de la taille de l effet aux tests de significativité : avec le nombre, tout devient significatif [Kilgarriff, 2005]. 35/43

36 L abréviation dans le corpus belge Au-delà des facteurs démographiques, la principale motivation à l abréviation ne serait-elle pas la limite des 160 caractères? Dans le corpus belge, 6221 messages comportent entre 151 et 160 caractères soucis d optimisation. On peut donc penser que ces messages seront plus abréviés. 36/43

37 L abréviation dans le corpus belge Plus les messages sont longs, plus ils sont abréviés (r = 0, 17; p < 0, 001) ; On observe aussi un effet des seuils (160 et 320) sur le taux d abréviation ; Messages de 151 à 160 carac. sont significativement plus abréviés (13,3% contre 9% pour le reste) t = 29, 32; p < 0, /43

38 Autres corpus Ce constat n est pas extensible à l ensemble des régions du projet sms4science. Dans le corpus du Québec, abréviation plus importante (14,6% contre 9,5%) ; Les messages les plus courts sont les plus abréviés (r = 0, 28; p < 0, 001) ; Les messages de 151 à 160 carac. sont moins abréviés que les autres (9% contre 15,6%) t = 6, 21; p < 0, /43

39 Abréviation : conclusions Les belges semblent plus économes! On retrouve ce pic à 160 caractères dans le corpus suisse. La longueur et le taux d abréviation des messages à la Réunion et au Québec laissent envisager une utilisation différente (à vérifier)! Autre effet possible encore : la loi de Zipf. Rapport entre la fréquence des mots et leur taux d abréviation? 39/43

40 Plan 1 Introduction 2 L approche quantitative La démarche quantitative La étrisation Le choix des outils statistiques Les problèmes d échantillonnage 3 Exemples de résultats La question de l abréviation 4 Conclusion 40/43

41 Conclusion générale L approche quantitative s avère utile pour explorer la variation, en particulier diastratique ; Son caractère systématique permet déjà de repérer quelques erreurs dans les corpus ; On obtient un tableau intéressant sur les pratiques d abréviations : messages les plus abréviés sont rédigés par des femmes, jeunes (moins de 15 ans) ; Plusieurs variables influencent cette pratique, y compris la zone géographique. De nombreuses pistes de recherches restent ouvertes! 41/43

42 References I Chabert, G. (2010). Sms et tal : kl 1trè*? Cougnon, L. and François, T. (2010). Quelques contributions des statistiques à l analyse sociolinguistique d un corpus de SMS. In Proceedings of 10th International Conference JADT. Cougnon, L. and François, T. (2011). Étudier l écrit sms. un objectif du projet sms4science (à paraître). Linguistik. Cougnon, L. and Ledegen, G. (2010). C est écrire comme je parle. une étude comparatiste de variétés de français dans l écrit sms. Modern French Identities, 2(94) : Kilgarriff, A. (2005). Language is never ever ever random. Corpus linguistics and linguistic theory, 1(2) : /43

43 References II Ling, R. (2005). The sociolinguistics of sms : An analysis of sms use by a random sample of norwegians. In Ling, R. and Pedersen, P., editors, Mobile Communications : Renegotiation of the social sphere, pages Springer. Ling, R. (2006). The length of text messages and use of predictive texting : Who uses it and how much do they have to say? In Annual meeting of the Association of Internet Researchers, Chicago, IL. Moreau, M. (1997). Sociolinguistique : les concepts de base. Editions Mardaga, Sprimont. Panckhurst, R. (2009). Short message service (sms) : typologie et problématiques futures. 43/43

Activité 1 : échantillonnage

Activité 1 : échantillonnage Activité échantillonnage, intervalle de fluctuation, prise de décision (à partir d un même thème) Les trois activités qui suivent s inspirent du document «ressources pour la classe de première générale

Plus en détail

Comprendre, construire et interpréter les statistiques

Comprendre, construire et interpréter les statistiques Comprendre, construire et interpréter les statistiques Petit précis d usage des statistiques à l attention des non statisticiens NOTE METHODOLOGIQUE Note méthodologique réalisée par Léo Mignot, sociologue,

Plus en détail

Méthodes d investigation

Méthodes d investigation Méthodes d investigation 1 LE QUESTIONNAIRE LE questionnaire 1. l économie générale du questionnaire : 2. L avant questionnaire 3. la construction du questionnaire 4. Le choix de l échantillon 2 1. Le

Plus en détail

FOTO - L OMNIBUS MENSUEL DE CROP LE NOUVEAU CROP-EXPRESS

FOTO - L OMNIBUS MENSUEL DE CROP LE NOUVEAU CROP-EXPRESS FOTO - L OMNIBUS MENSUEL DE CROP LE NOUVEAU CROP-EXPRESS 550, RUE SHERBROOKE OUEST MONTRÉAL (QUÉBEC) H3A 1B9 BUREAU 900 TOUR EST T 514 849-8086, POSTE 3064 Réflexions méthodologiques Depuis des années,

Plus en détail

Analyse de l évolution de la structure des ménages dans l enquête sur le budget des ménages

Analyse de l évolution de la structure des ménages dans l enquête sur le budget des ménages Analyse de l évolution de la structure des ménages dans l enquête sur le budget des ménages S. Winandy, R. Palm OCA GxABT/ULg oca.gembloux@ulg.ac.be décembre 2011 1 Introduction La Direction Générale Statistique

Plus en détail

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction. Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction. Etudes et traitements statistiques des données : le cas illustratif de la démarche par sondage INTRODUCTION

Plus en détail

L essentiel sur les tests statistiques

L essentiel sur les tests statistiques L essentiel sur les tests statistiques 21 septembre 2014 2 Chapitre 1 Tests statistiques Nous considérerons deux exemples au long de ce chapitre. Abondance en C, G : On considère une séquence d ADN et

Plus en détail

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. 1 Généralités sur les tests statistiques 2

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. 1 Généralités sur les tests statistiques 2 UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 Master d économie Cours de M. Desgraupes MATHS/STATS Document 4 : Les tests statistiques 1 Généralités sur les tests

Plus en détail

N 334 - SIMON Anne-Catherine

N 334 - SIMON Anne-Catherine N 334 - SIMON Anne-Catherine RÉALISATION D UN CDROM/DVD CONTENANT DES DONNÉES DU LANGAGE ORAL ORGANISÉES EN PARCOURS DIDACTIQUES D INITIATION LINGUISTIQUE A PARTIR DES BASES DE DONNÉES VALIBEL Introduction

Plus en détail

Étudier l'écrit SMS Un objectif du projet sms4science

Étudier l'écrit SMS Un objectif du projet sms4science Étudier l'écrit SMS Un objectif du projet sms4science Louise-Amélie Cougnon (UCLouvain, ILC, Cental) & Thomas François (Aspirant FNRS, UCLouvain, ILC, Cental) Abstract This paper details an international

Plus en détail

Yosra GHLISS, Université Paul Valery- Montpellier, Praxiling UMR 5267 Frédéric ANDRÉ, Université Paris-Sorbonne, EA 4509, STIH

Yosra GHLISS, Université Paul Valery- Montpellier, Praxiling UMR 5267 Frédéric ANDRÉ, Université Paris-Sorbonne, EA 4509, STIH Yosra GHLISS, Université Paul Valery- Montpellier, Praxiling UMR 5267 Frédéric ANDRÉ, Université Paris-Sorbonne, EA 4509, STIH Rennes, le 23 Octobre 2015 Etudier les SMS Caractéristique principale Pratique

Plus en détail

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7 Table des matières Préface Public 1 Structure de l ouvrage 1 Caractéristiques de l ouvrage 3 Contenu 3 Pédagogie 4 Remarques sur l adaptation française 4 Ressources numériques 5 Biographie 6 PREMIÈRE PARTIE

Plus en détail

Guide francophone d analyse systématique des articles scientifiques (GFASAS) S. Tétreault 1, E. Sorita, A. Ryan & A. Ledoux (2013)

Guide francophone d analyse systématique des articles scientifiques (GFASAS) S. Tétreault 1, E. Sorita, A. Ryan & A. Ledoux (2013) Guide francophone d analyse systématique des articles scientifiques (GFASAS) S. Tétreault 1, E. Sorita, A. Ryan & A. Ledoux (2013) Considérant le nombre d articles scientifiques disponibles, il est essentiel

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

En 2014, comment mener à bien une enquête aléatoire en population générale par téléphone?

En 2014, comment mener à bien une enquête aléatoire en population générale par téléphone? En 2014, comment mener à bien une enquête aléatoire en population générale par téléphone? Prémila Choolun 1, François Beck 2, Christophe David 1, Valérie Blineau 1, Romain Guignard 3, Arnaud Gautier 3,

Plus en détail

Collecte de données. Laurent Dorey

Collecte de données. Laurent Dorey Laurent Dorey Mercredi 16 Décembre 2014 Programme : Recensement & Echantillonnage Étapes pour sélectionner un échantillon La population observée La base de sondage Les unités d enquête La taille de l échantillon

Plus en détail

Sommaire. Rentabilité du retour d une franchise de baseball de la Ligue majeure de baseball à Montréal (les «Expos»)

Sommaire. Rentabilité du retour d une franchise de baseball de la Ligue majeure de baseball à Montréal (les «Expos») Sommaire Rentabilité du retour d une franchise de baseball de la Ligue majeure de baseball à Montréal (les «Expos») Novembre 2013 Table des matières 1. CONTEXTE ET OBJECTIFS... 3 2. MÉTHODES DE RECHERCHE...

Plus en détail

Chapitre 3 : INFERENCE

Chapitre 3 : INFERENCE Chapitre 3 : INFERENCE 3.1 L ÉCHANTILLONNAGE 3.1.1 Introduction 3.1.2 L échantillonnage aléatoire 3.1.3 Estimation ponctuelle 3.1.4 Distributions d échantillonnage 3.1.5 Intervalles de probabilité L échantillonnage

Plus en détail

Évaluations aléatoires : Comment tirer au sort?

Évaluations aléatoires : Comment tirer au sort? Évaluations aléatoires : Comment tirer au sort? William Parienté Université Catholique de Louvain J-PAL Europe povertyactionlab.org Plan de la semaine 1. Pourquoi évaluer? 2. Comment mesurer l impact?

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

MODÈLE CROP DE CALIBRATION DES PANELS WEB

MODÈLE CROP DE CALIBRATION DES PANELS WEB MODÈLE CROP DE CALIBRATION DES PANELS WEB 550, RUE SHERBROOKE OUEST MONTRÉAL (QUÉBEC) H3A 1B9 BUREAU 900 TOUR EST T 514 849-8086, POSTE 3064 WWW.CROP.CA Le Protocole CROP de calibration des panels en ligne

Plus en détail

d évaluation Objectifs Processus d élaboration

d évaluation Objectifs Processus d élaboration Présentation du Programme pancanadien d évaluation Le Programme pancanadien d évaluation (PPCE) représente le plus récent engagement du Conseil des ministres de l Éducation du Canada (CMEC) pour renseigner

Plus en détail

L élaboration des données de comptabilité annuelle et l analyse économique

L élaboration des données de comptabilité annuelle et l analyse économique L élaboration des données de comptabilité annuelle et l analyse économique Stéphane Gregoir (stephane.gregoir@edhec.edu) Juin 2008 Objectifs Illustrer quelques uns des problèmes que l on peut rencontrer

Plus en détail

La base de données textuelles orales VALIBEL

La base de données textuelles orales VALIBEL La base de données textuelles orales VALIBEL de la variation aux variétés http://www.uclouvain.be/valibel.html Alice Bardiaux (FNRS UCL) parcours : du corpus à l étude de la variation centre de recherche

Plus en détail

- Mobiliser les résultats sur le second degré dans le cadre de la résolution d un problème.

- Mobiliser les résultats sur le second degré dans le cadre de la résolution d un problème. Mathématiques - classe de 1ère des séries STI2D et STL. 1. Analyse On dote les élèves d outils mathématiques permettant de traiter des problèmes relevant de la modélisation de phénomènes continus ou discrets.

Plus en détail

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,

Plus en détail

L intimidation au Québec. 19 novembre 2012

L intimidation au Québec. 19 novembre 2012 L intimidation au Québec 19 novembre 2012 2 La présente étude a été réalisée par Internet auprès de 652 personnes de plus de 18 ans, réparties dans toutes les régions du Québec. Les entrevues ont été réalisées

Plus en détail

La méthode des quotas

La méthode des quotas La méthode des quotas Oliviero Marchese, décembre 2006 1 La méthode des quotas Principe de la méthode Point de départ et but recherché Caractère «intuitif» de la méthode A quoi ressemble une feuille de

Plus en détail

Le système d info. Données de toutes sortes. Collaborateurs concernés. Action vers l extérieur

Le système d info. Données de toutes sortes. Collaborateurs concernés. Action vers l extérieur Acteurs : clients, fournisseurs, prospects etc. Actualités : lois, économie, concurrence Données de toutes sortes Trier Le système d info Stocker Traiter Action vers l extérieur Collaborateurs concernés

Plus en détail

EVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO

EVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO EVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO Auteur Baguinébié Bazongo 1 Ingénieur Statisticien Economiste Chef de l Unité de recherche à l Institut national

Plus en détail

UNIVERSITE PARIS 1 PANTHEON SORBONNE LICENCE DE SCIENCES ECONOMIQUES. STATISTIQUE APPLIQUEE F. Gardes / P. Sevestre. Fiche N 7.

UNIVERSITE PARIS 1 PANTHEON SORBONNE LICENCE DE SCIENCES ECONOMIQUES. STATISTIQUE APPLIQUEE F. Gardes / P. Sevestre. Fiche N 7. UNIVERSITE PARIS 1 PANTHEON SORBONNE LICENCE DE SCIENCES ECONOMIQUES STATISTIQUE APPLIQUEE F. Gardes / P. Sevestre Fiche N 7 (avec corrigé) L objet de ce TD est de vous initier à la démarche et à quelques

Plus en détail

Comprendre le partage des contenus journalistiques sur les réseaux socionumériques

Comprendre le partage des contenus journalistiques sur les réseaux socionumériques Comprendre le partage des contenus journalistiques sur les réseaux socionumériques Enjeux, défis, compétences Dario Compagno 18 juin 2015 Projet ANR Info-Rsn Questions fondamentales Comment les ressources

Plus en détail

Les consommations de produits psychoactifs à la fin de l adolescence en Nord Pas de Calais Exploitation régionale de l enquête ESCAPAD 2000/2001

Les consommations de produits psychoactifs à la fin de l adolescence en Nord Pas de Calais Exploitation régionale de l enquête ESCAPAD 2000/2001 Les consommations de produits psychoactifs à la fin de l adolescence en Nord Pas de Calais Exploitation régionale de l enquête ESCAPAD 2000/2001 Pôle Enquêtes en Population Générale François BECK, Stéphane

Plus en détail

Le risque Idiosyncrasique

Le risque Idiosyncrasique Le risque Idiosyncrasique -Pierre CADESTIN -Magali DRIGHES -Raphael MINATO -Mathieu SELLES 1 Introduction Risque idiosyncrasique : risque non pris en compte dans le risque de marché (indépendant des phénomènes

Plus en détail

STATISTIQUES. Cours I : Test d hypothèses. Télécom Physique Strasbourg Module 2101. Fabrice Heitz. Octobre 2014

STATISTIQUES. Cours I : Test d hypothèses. Télécom Physique Strasbourg Module 2101. Fabrice Heitz. Octobre 2014 Télécom Physique Strasbourg Module 2101 STATISTIQUES Cours I : Test d hypothèses Fabrice Heitz Octobre 2014 Fabrice Heitz (Télécom PS) Statistiques 2014 1 / 75 Cours I TESTS D HYPOTHÈSES Fabrice Heitz

Plus en détail

Méthodes Statistiques Appliquées à la Qualité et à la Gestion des Risques - Le Contrôle Statistique

Méthodes Statistiques Appliquées à la Qualité et à la Gestion des Risques - Le Contrôle Statistique Méthodes Statistiques Appliquées à la Qualité et à la Gestion des Risques - Le Contrôle Statistique Jean Gaudart Laboratoire d Enseignement et de Recherche sur le Traitement de l Information Médicale jean.gaudart@univmed.fr

Plus en détail

Plan d études 2015-2016 du Baccalauréat (Ba) en communication multilingue

Plan d études 2015-2016 du Baccalauréat (Ba) en communication multilingue Plan d études 2015-2016 du Baccalauréat (Ba) en communication multilingue Répartition des crédits obligatoires en BA et progression des modules Modules de l enseignement Crédits 1. Langue A 20 2. Langues

Plus en détail

Chacune des valeurs d une variable en est une modalité particulière.

Chacune des valeurs d une variable en est une modalité particulière. Psychologie générale Jean Paschoud STATISTIQUE Sommaire Rôle de la statistique Variables Échelles de mesure Résumer, décrire Comparer Rôle de la statistique La statistique est avant tout un outil permettant

Plus en détail

Estimation: intervalle de fluctuation et de confiance. Mars 2012. IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Estimation: intervalle de fluctuation et de confiance. Mars 2012. IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison Estimation: intervalle de fluctuation et de confiance Mars 2012 IREM: groupe Proba-Stat Estimation Term.1 Intervalle de fluctuation connu : probabilité p, taille de l échantillon n but : estimer une fréquence

Plus en détail

Les indices anthropométriques

Les indices anthropométriques Les indices anthropométriques Construction, enjeux et analyse statistique Gilles CAPON UR 106 - «Nutrition, Alimentation, Sociétés» Institut de recherche pour le développement Plan Concepts Calcul des

Plus en détail

MOBILISER LE LANGAGE

MOBILISER LE LANGAGE MOBILISER LE LANGAGE ORAL ÉCRIT Communiquer avec les adultes et avec les autres enfants par le langage, en se faisant comprendre. O-1 Dire de mémoire et de manière expressive plusieurs comptines et poésies.

Plus en détail

Panorama des statistiques à l UCL

Panorama des statistiques à l UCL Support en Méthodologie et Calcul Statistique Panorama des statistiques à l UCL Dedonder Jonathan Lefevre Nathalie Van Pachterbeke Matthieu Les statistiques : quand? Contenu Conception du projet Quand

Plus en détail

La détection de spams : un jeu d enfant?

La détection de spams : un jeu d enfant? La détection de spams : un jeu d enfant? Tristan Mary-Huard, chargé de recherche INRA à INRA-AgroParisTech Comment distinguer automatiquement un spam d un message normal? Les filtres anti-spams analysent

Plus en détail

Cours 7: Conception des systèmes interactifs (partie 1)

Cours 7: Conception des systèmes interactifs (partie 1) Cours 7: Conception des systèmes interactifs (partie 1) Anastasia.Bezerianos@lri.fr (plusieurs slides sont basés sur des slides de T. Tsandilas, W. Mackay, M. Beaudouin Lafon, D. Vogel et S. Greenberg)

Plus en détail

L'INFORMATIQUE À L'ÉCOLE MATERNELLE. Premier compte-rendu d étude exploratoire

L'INFORMATIQUE À L'ÉCOLE MATERNELLE. Premier compte-rendu d étude exploratoire 129 L USAGE DE L INFORMATIQUE À L ÉCOLE MATERNELLE Premier compte-rendu d étude exploratoire Théo PRINIOTAKIS, Sandrine COURTOIS Contexte C est une recherche en didactique de l informatique en milieu préélémentaire

Plus en détail

Enquête mensuelle de conjoncture auprès des ménages

Enquête mensuelle de conjoncture auprès des ménages Note Méthodologique Dernière mise à jour : 27-1-214 Enquête mensuelle de conjoncture auprès des ménages Présentation de l enquête L Insee réalise depuis janvier 1987 l enquête mensuelle de conjoncture

Plus en détail

Enquête. sur la prévalence tabagique chez les adolescents en province de Luxembourg. Cahier de bord n 2

Enquête. sur la prévalence tabagique chez les adolescents en province de Luxembourg. Cahier de bord n 2 Cahier de bord n 2 Enquête sur la prévalence tabagique chez les adolescents en province de Luxembourg Service Prévention-Santé Observatoire de la Santé de la Province de Luxembourg SOMMAIRE 1. CONTEXTE

Plus en détail

Le bootstrap expliqué par l exemple

Le bootstrap expliqué par l exemple Le bootstrap expliqué par l exemple 1 Le bootstrap expliqué par l exemple 1. Les concepts du bootstrap 2. Des variantes adaptées au contexte 3. Comparaison des différentes méthodes 4. Les cas sensibles

Plus en détail

LOAD PROFILING : ESTIMATION D UNE COURBE DE CONSOMMATION ET PRECISION D ESTIMATION

LOAD PROFILING : ESTIMATION D UNE COURBE DE CONSOMMATION ET PRECISION D ESTIMATION LOAD PROFILING : ESTIMATION D UNE COURBE DE CONSOMMATION ET PRECISION D ESTIMATION Olivier Chaouy EDF R&D 1, avenue du Général de Gaulle - 92141 Clamart Cedex - France olivier.chaouy@edf.fr Résumé : Le

Plus en détail

GUIDE METHODOLOGIQUE POUR REALISER UNE THESE QUALITATIVE. I. La démarche pas à pas. Lire la bibliographie : thèses, articles

GUIDE METHODOLOGIQUE POUR REALISER UNE THESE QUALITATIVE. I. La démarche pas à pas. Lire la bibliographie : thèses, articles GUIDE METHODOLOGIQUE POUR REALISER UNE THESE QUALITATIVE I. La démarche pas à pas Date Démarche Trouver un sujet qui vous intéresse Lire la bibliographie : thèses, articles Participer au séminaire «thèse»

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

Éducation aux médias et littératie médiatique

Éducation aux médias et littératie médiatique L Éducation aux médias : Perspectives pour la formation Éducation aux médias et littératie médiatique J e suis chercheur en information et communication à l Université catholique de Louvain, et depuis

Plus en détail

LES CAHIERS DU CEPS/INSTEAD Population & Emploi. Spécificités et performances des canaux de recrutement. Anne-Sophie GENEVOIS

LES CAHIERS DU CEPS/INSTEAD Population & Emploi. Spécificités et performances des canaux de recrutement. Anne-Sophie GENEVOIS LES CAHIERS DU CEPS/INSTEAD Population & Emploi Spécificités et performances des canaux de recrutement Anne-Sophie GENEVOIS Cahier n 2011-01 Janvier 2011 Spécificités et performances des canaux de recrutement

Plus en détail

féminisme et de nuire aux femmes et à leurs intérêts. A partir de l intention de contrer ce danger, un certain nombre d études ont été menées sur le

féminisme et de nuire aux femmes et à leurs intérêts. A partir de l intention de contrer ce danger, un certain nombre d études ont été menées sur le 1. Introduction Cette étude porte sur le sujet des hommes en mouvement 1 en Suisse. Son objectif général est de décrire et de comprendre l affirmation, à la fois identitaire et politique, de ce mouvement,

Plus en détail

TABLEAU 5 Nombre moyen (et écarts types) de mots produits selon le niveau scolaire et les trois conditions de révision

TABLEAU 5 Nombre moyen (et écarts types) de mots produits selon le niveau scolaire et les trois conditions de révision Dans ce tableau, si le chercheur ne s intéresse pas aux notes item par item mais simplement à la note globale, alors il conservera seulement les première et dernière colonnes et calculera des statistiques

Plus en détail

I n t r o d u c t i o n Les étapes de la recherche à l a r e c h e r c h e

I n t r o d u c t i o n Les étapes de la recherche à l a r e c h e r c h e I n t r o d u c t i o n Les étapes de la recherche à l a r e c h e r c h e Les objectifs pédagogiques Savoir délimiter les trois phases distinctes de la recherche Savoir identifier, pour chacune des trois

Plus en détail

Chapitre VI Échantillonages et simulations

Chapitre VI Échantillonages et simulations Chapitre VI Commentaires : Récursivement, les commentaires ne sont pas à l attention des élèves.. Fluctuation d échantillonnage Définition : En statistiques, un échantillon de taille n est la liste des

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

Estimation et tests statistiques, TD 5. Solutions

Estimation et tests statistiques, TD 5. Solutions ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études

Plus en détail

Introduction à l analyse statistique et bioinformatique des puces à ADN

Introduction à l analyse statistique et bioinformatique des puces à ADN Formation INSERM 10 février 2004 Introduction à l analyse statistique et bioinformatique des puces à ADN Gaëlle Lelandais lelandais@biologie.ens.fr 1 Première Partie Analyse d une puce à ADN : Le recherche

Plus en détail

Analyse de donne es Exercices

Analyse de donne es Exercices Analyse de donne es Exercices Table des matières Séquence 1 : Détermination des types d enquêtes, choix d échantillons... 3 Application n 1 : Construire un sondage par quotas... 3 Application n 2 : Construire

Plus en détail

Aline Drapeau, Ph.D.

Aline Drapeau, Ph.D. (Communauté de pratique en épidémiologie psychosociale) Aspects méthodologiques de l échantillonnage Aline Drapeau, Ph.D. Pourquoi échantillonner? Objectifs de l étude visent une population cible spécifique

Plus en détail

Evaluation générale de la qualité des données par âge et sexe

Evaluation générale de la qualité des données par âge et sexe Analyse démographique pour la prise des décisions. Tendances, et inégalités de mortalité et de fécondité en Afrique francophone : les outils en ligne de l UNFPA / UIESP pour l'estimation démographique.

Plus en détail

Textos au Canada : encodage, analyses en cours et analyses projetées

Textos au Canada : encodage, analyses en cours et analyses projetées Textos au Canada : encodage, analyses en cours et analyses projetées Christian Guilbault, Université Simon Fraser Patrick Drouin, Université de Montréal Plan de cette présentation 1. Texto4science.ca :

Plus en détail

Stratégies métacognitives. Leur intégration dans la classe de FLE (1) 1- Introduction 2- Domaine d action 3- L apport théorique

Stratégies métacognitives. Leur intégration dans la classe de FLE (1) 1- Introduction 2- Domaine d action 3- L apport théorique Stratégies métacognitives. Leur intégration dans la classe de FLE (1) Raquel Partemi rpartemi@logos.uncu.edu.ar María Cristina Azcona sanchere@speedy.com.ar Noemí Jiménez castellotejimenez@yahoo.com.ar

Plus en détail

I - Introduction à La psychologie Expérimentale

I - Introduction à La psychologie Expérimentale LA METHODE EXPERIMENTALE I - Introduction à La psychologie Expérimentale I.1. Introduction I.2. Critiques concernant l utilisation de la méthode expérimentale en psychologie I.2.A. Critiques morales I.2.A.

Plus en détail

ÉTUDES QUANTITATIVES. Collection MCAM Identifiant : ENQUÊTE. Jean-Claude BORDICHINI. Publication le 14 octobre 2013 Version 1.b

ÉTUDES QUANTITATIVES. Collection MCAM Identifiant : ENQUÊTE. Jean-Claude BORDICHINI. Publication le 14 octobre 2013 Version 1.b ÉTUDES QUANTITATIVES Collection MCAM Identifiant : ENQUÊTE Jean-Claude BORDICHINI Paternité - Pas d'utilisation Commerciale - Pas de Modification : http://creativecommons.org/licenses/by-nc-nd/2.0/fr/

Plus en détail

Introduction à l expérimentation en marketing

Introduction à l expérimentation en marketing Romain Cadario romain.cadario@dauphine.fr Séminaire, Master 102 Université Paris Dauphine, Octobre 2014 1 Zlatan et le beau temps 63% des individus préfèrent un temps chaud vs. froid, alors que cette proportion

Plus en détail

L ENQUETE PAR QUESTIONNAIRE

L ENQUETE PAR QUESTIONNAIRE L ENQUETE PAR QUESTIONNAIRE 1 Pourquoi utiliser cet outil en évaluation? L'enquête par questionnaire est un outil d observation qui permet de quantifier et comparer l information. Cette information est

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

THÉORIE DU CHANGEMENT, THÉORIE DE LA MESURE

THÉORIE DU CHANGEMENT, THÉORIE DE LA MESURE Atelier ivoirien sur l évaluation d impact pour la prise de décision dans les secteurs sociaux THÉORIE DU CHANGEMENT, THÉORIE DE LA MESURE Marianne Bertrand Université de Chicago / J-PAL 22-26 juin 2015

Plus en détail

Rapport sur la méthodologie

Rapport sur la méthodologie Sondage des votants et des non-votants 2002 Rapport sur la méthodologie Établi pour : Élections Canada Date : Juin 2002 Centre de recherche Décima, 2002 Table des matières Introduction...1 Méthodologie

Plus en détail

MATHÉMATIQUES CYCLE TERMINAL DE LA SÉRIE ÉCONOMIQUE ET SOCIALE ET DE LA SÉRIE LITTERAIRE CLASSE DE PREMIÈRE

MATHÉMATIQUES CYCLE TERMINAL DE LA SÉRIE ÉCONOMIQUE ET SOCIALE ET DE LA SÉRIE LITTERAIRE CLASSE DE PREMIÈRE Annexe MATHÉMATIQUES CYCLE TERMINAL DE LA SÉRIE ÉCONOMIQUE ET SOCIALE ET DE LA SÉRIE LITTERAIRE CLASSE DE PREMIÈRE L enseignement des mathématiques au collège et au lycée a pour but de donner à chaque

Plus en détail

Recommandations pour la rédaction du mémoire de MASTER 1 ère année en psychologie sociale, du travail et ressources humaines

Recommandations pour la rédaction du mémoire de MASTER 1 ère année en psychologie sociale, du travail et ressources humaines Recommandations pour la rédaction du mémoire de MASTER 1 ère année en psychologie sociale, du travail et ressources humaines Isabel Urdapilleta Responsable Pédagogique du Master 1 psychologie sociale,

Plus en détail

Cartes de contrôle aux mesures

Cartes de contrôle aux mesures Cartes de contrôle aux mesures 1 Une introduction à la maîtrise statistique des processus Deux objets ne sont jamais rigoureusement identiques. Quelles que soient les techniques utilisées pour fabriquer

Plus en détail

AVANT-PROPOS L analyse des données

AVANT-PROPOS L analyse des données AVANT-PROPOS L analyse des données Godelieve MASUY-STROOBANT Nos «sociétés de l information» voient se multiplier les bases de données administratives et les enquêtes ad hoc le plus souvent destinées à

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

Réalisation d une étude épidémiologique

Réalisation d une étude épidémiologique Réalisation d une étude épidémiologique Dr A.TIBICHE, Médecin Epidémiologiste, Service d Epidémiologie et de Médecine Préventive, CHU de Tizi-Ouzou. Introduction La réalisation d une étude épidémiologique

Plus en détail

COURS DE STATISTIQUES (24h)

COURS DE STATISTIQUES (24h) COURS DE STATISTIQUES (24h) Introduction Statistiques descriptives (4 h) Rappels de Probabilités (4 h) Echantillonnage(4 h) Estimation ponctuelle (6 h) Introduction aux tests (6 h) Qu est-ce que la statistique?

Plus en détail

Comment réaliser votre étude de marché. Pascale GARNIER - MCP MARKETING Estelle DELABRE - SILOUET

Comment réaliser votre étude de marché. Pascale GARNIER - MCP MARKETING Estelle DELABRE - SILOUET Comment réaliser votre étude de marché Pascale GARNIER - MCP MARKETING Estelle DELABRE - SILOUET Sommaire Objectifs de la conférence Préambule Méthode pour organiser votre réflexion Quelques conseils Partie

Plus en détail

Lois de probabilité. Anita Burgun

Lois de probabilité. Anita Burgun Lois de probabilité Anita Burgun Problème posé Le problème posé en statistique: On s intéresse à une population On extrait un échantillon On se demande quelle sera la composition de l échantillon (pourcentage

Plus en détail

Concept d évaluation de l ANQ. Enquête nationale sur la satisfaction des patients en réadaptation à partir des données 2013

Concept d évaluation de l ANQ. Enquête nationale sur la satisfaction des patients en réadaptation à partir des données 2013 Concept d évaluation de l ANQ Enquête nationale sur la satisfaction des patients en réadaptation à partir des données 2013 Version 1.1, février 2015 Sommaire 1 Introduction... 2 1.1 Contexte... 2 2 Déroulement

Plus en détail

Cours IFT6266, Exemple d application: Data-Mining

Cours IFT6266, Exemple d application: Data-Mining Cours IFT6266, Exemple d application: Data-Mining Voici un exemple du processus d application des algorithmes d apprentissage statistique dans un contexte d affaire, qu on appelle aussi data-mining. 1.

Plus en détail

3. COMPARAISON DE PLUS DE DEUX GROUPES

3. COMPARAISON DE PLUS DE DEUX GROUPES 3. COMPARAISON DE PLUS DE DEUX GROUPES La comparaison de moyennes de plus de deux échantillons se fait généralement par une analyse de variance (ANOVA) L analyse de variance suppose l homogénéité des variances

Plus en détail

LES MÉTHODES DE RECHERCHE EN SCIENCES HUMAINES

LES MÉTHODES DE RECHERCHE EN SCIENCES HUMAINES LES MÉTHODES DE RECHERCHE EN SCIENCES HUMAINES Les méthodes de recherche en sciences humaines sont des procédures définies qui sont utilisées en vue de développer la connaissance scientifique des phénomènes

Plus en détail

Internet est-il l avenir des enquêtes Génération?

Internet est-il l avenir des enquêtes Génération? Établissement public sous double tutelle des ministères de l'éducation nationale, de l'enseignement supérieur et de la Recherche du Travail, de l Emploi, de la Formation professionnelle et du Dialogue

Plus en détail

Problématique de la qualité des données statistiques

Problématique de la qualité des données statistiques Revue du Schéma directeur de la Statistique du Mali Problématique de la qualité des données statistiques La qualité : «l ensemble des propriétés et caractéristiques d un produit ou d un service qui lui

Plus en détail

CONSEILS POUR LA REDACTION DU RAPPORT DE RECHERCHE. Information importante : Ces conseils ne sont pas exhaustifs!

CONSEILS POUR LA REDACTION DU RAPPORT DE RECHERCHE. Information importante : Ces conseils ne sont pas exhaustifs! CONSEILS POUR LA REDACTION DU RAPPORT DE RECHERCHE Information importante : Ces conseils ne sont pas exhaustifs! Conseils généraux : Entre 25 et 60 pages (hormis références, annexes, résumé) Format d un

Plus en détail

Un corpus longitudinal de SMS d adolescents : de la constitution du corpus à l analyse de l écriture SMS

Un corpus longitudinal de SMS d adolescents : de la constitution du corpus à l analyse de l écriture SMS Un corpus longitudinal de SMS d adolescents : de la constitution du corpus à l analyse de l écriture SMS Olga Volckaert-Legrier volckaer@univ-tlse2.fr Université Toulouse Jean Jaurès Recueil mené en collaboration

Plus en détail

Bilan Social des Entreprises. Guide pratique d utilisation pour les équipes syndicales

Bilan Social des Entreprises. Guide pratique d utilisation pour les équipes syndicales Paris, le 22 mars 2011 Bilan Social des Entreprises Guide pratique d utilisation pour les équipes syndicales Le bilan social est un document extrêmement utile pour une équipe syndicale. Beaucoup de renseignements

Plus en détail

Module de Formation N 4 NOTIONS COMPLÉMENTAIRES : LES INDICES

Module de Formation N 4 NOTIONS COMPLÉMENTAIRES : LES INDICES Module de Formation N 4 NOTIONS COMPLÉMENTAIRES : LES INDICES INTRODUCTION Cette présentation est consacrée aux indices statistiques. Elle s adresse à des non statisticiens travaillant dans les services

Plus en détail

Maintenir des seniors en activité professionnelle : du diagnostic au plan d action

Maintenir des seniors en activité professionnelle : du diagnostic au plan d action Maintenir des seniors en activité professionnelle : du diagnostic au plan d action Enjeux Fiche 1 À partir du 1 er janvier 2010, les entreprises et les établissements employant au moins 50 salariés risquent

Plus en détail

UTFPR. Nada Benlahbib. [DATA MINING] Fertility Data Set

UTFPR. Nada Benlahbib. [DATA MINING] Fertility Data Set UTFPR [DATA MINING] Fertility Data Set Sommaire Introduction... 2 1. Description de la base de données... 3 1.1. Origine de la base... 3 1.2. Description des attributs... 3 1.3. Exploration des données...

Plus en détail

BIG DATA : PASSER D UNE ANALYSE DE CORRÉLATION

BIG DATA : PASSER D UNE ANALYSE DE CORRÉLATION BIG DATA : PASSER D UNE ANALYSE DE CORRÉLATION À UNE INTERPRÉTATION CAUSALE Arthur Charpentier Professeur d actuariat à l Université du Québec, Montréal Amadou Diogo Barry Chercheur à l Institut de santé

Plus en détail

Niveau. Situation étudiée. Type d activité. Durée. Objectifs. Seconde.

Niveau. Situation étudiée. Type d activité. Durée. Objectifs. Seconde. Simuler des expériences aléatoires avec une calculatrice Niveau Seconde. Situation étudiée Différentes selon les séances : Séance 1 : Jeu de pile ou face, tirages de boule dans une urne avec des proportions

Plus en détail

inscription Enseignement difficultés école maternelle école obligatoire associations de parents journal de classe

inscription Enseignement difficultés école maternelle école obligatoire associations de parents journal de classe difficultés journal de classe inscription école gratuiteactivités en dehors de l école école obligatoire école maternelle associations de parents Enseignement En Belgique, les enfants sont obligés d aller

Plus en détail

LA PRESSE. Rapport. Sondage : Ce que les femmes du Québec pensent du féminisme, de leur vie personnelle et professionnelle. 5 mars 2009.

LA PRESSE. Rapport. Sondage : Ce que les femmes du Québec pensent du féminisme, de leur vie personnelle et professionnelle. 5 mars 2009. LA PRESSE Rapport Sondage : Ce que les femmes du Québec pensent du féminisme, de leur vie personnelle et professionnelle 5 mars 2009 P a g e 1 TABLE DES MATIÈRES 1. MÉTHODOLOGIE... 3 2. FAITS SAILLANTS...

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail