Inférence sur diverses mesures d association entre variables catégorielles: Méthodes bayésiennes



Documents pareils
Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

Chapitre 3. Les distributions à deux variables

Relation entre deux variables : estimation de la corrélation linéaire

Principe d un test statistique

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Introduction à l approche bootstrap

Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1

IUT de Laval Année Universitaire 2008/2009. Fiche 1. - Logique -

FORMULAIRE DE STATISTIQUES

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

Licence Economie-Gestion, 1ère Année Polycopié de Statistique Descriptive. Année universitaire :

Programmation linéaire

SERIE 1 Statistique descriptive - Graphiques

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

UNE REPRESENTATION GRAPHIQUE DE LA LIAISON STATISTIQUE ENTRE DEUX VARIABLES ORDONNEES. Éric TÉROUANNE 1

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

PROBABILITES ET STATISTIQUE I&II

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Séries Statistiques Simples

Statistiques Descriptives à une dimension

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Exercices supplémentaires sur l introduction générale à la notion de probabilité

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Chapitre 3 : INFERENCE

Programmation linéaire

Étude des résultats des investisseurs particuliers sur le trading de CFD et de Forex en France

TESTS D HYPOTHÈSE FONDÉS SUR LE χ².

EXERCICES - ANALYSE GÉNÉRALE

Représentation des Nombres

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

Traitement des données avec Microsoft EXCEL 2010

Logiciel XLSTAT version rue Damrémont PARIS

Evaluation générale de la qualité des données par âge et sexe

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Continuité et dérivabilité d une fonction

1. Vocabulaire : Introduction au tableau élémentaire

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Leçon N 4 : Statistiques à deux variables

Focus. Lien entre rémunération du travail et allocation de chômage

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

VI. Tests non paramétriques sur un échantillon

Cours Fonctions de deux variables

Raisonnement probabiliste

Localisation des fonctions

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

Qu est-ce-qu un Warrant?

Dérivés Financiers Options

TABLE DES MATIERES. C Exercices complémentaires 42

Fonctions de plusieurs variables

Chapitre 2/ La fonction de consommation et la fonction d épargne

Complément d information concernant la fiche de concordance

Annexe commune aux séries ES, L et S : boîtes et quantiles

Analyse tarifaire en ligne (TAO) de l'omc

Définition 0,752 = 0,7 + 0,05 + 0,002 SYSTÈMES DE NUMÉRATION POSITIONNELS =

Observatoire Gleeden de l infidélité

Cours d électricité. Circuits électriques en courant constant. Mathieu Bardoux. 1 re année

Introduction au datamining

Figure 1a Wasmannia auropunctata (Ouvrière), morphologie. 1 millimètre

Chapitre 1 : Évolution COURS

note d Temps de travail des enseignants du second degré public : pour une heure de cours, une heure de travail en dehors 13.13

La création de vêtements, éléments de génétiques, et de maquillage.

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

FD/YMC N Contacts IFOP : Frédéric Dabi / Yves-Marie Cann POUR

Chaînes de Markov au lycée

Table des matières. I Mise à niveau 11. Préface

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

ANALYSE GÉNÉRALE - PROPOSITION DE CORRIGÉ. Exercice 1

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Spécialité auxiliaire en prothèse dentaire du brevet d études professionnelles. ANNEXE IIb DEFINITION DES EPREUVES

Le projet DRIAS : premières études et documents

Fiche PanaMaths Calculs avec les fonctions sous Xcas

Autonomie et fragilités de la recherche académique Financements sur projet et reconfigurations du travail scientifique

Circuits RL et RC. Chapitre Inductance

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

Statistique : Résumé de cours et méthodes

Analyse de la variance Comparaison de plusieurs moyennes

Statistique Descriptive Élémentaire

Exo7. Probabilité conditionnelle. Exercices : Martine Quinio

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes

FONDEMENTS MATHÉMATIQUES 12 E ANNÉE. Mathématiques financières

Synthèse. Jeux d argent. Internet et jeux vidéo. Comparaison avec les apprentis

S initier aux probabilités simples «Question de chance!»

Logiciel de Base. I. Représentation des nombres

INF6304 Interfaces Intelligentes

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

«Cours Statistique et logiciel R»

LES DIFFERENTS TYPES DE MESURE

L'instruction if permet d'exécuter des instructions différentes selon qu'une condition est vraie ou fausse. Sa forme de base est la suivante:

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

4.14 Influence de la température sur les résistances

LE GRAND ÉCART L INÉGALITÉ DE LA REDISTRIBUTION DES BÉNÉFICES PROVENANT DU FRACTIONNEMENT DU REVENU

Lire ; Compter ; Tester... avec R

Donner les limites de validité de la relation obtenue.

Notes du cours MTH1101 Calcul I Partie II: fonctions de plusieurs variables

Item 169 : Évaluation thérapeutique et niveau de preuve

Transcription:

Inférence sur diverses mesures d association entre variables catégorielles: Méthodes bayésiennes Jean-Marc Bernard Laboratoire de Psychologie Environnementale CNRS UMR 8069 & Université Paris 5 Journée d études L Analyse Statistique des Données Catégorielles en Sciences Humaines et Sociales Boulogne-Billancourt, 6 Juin 2006 1

1. INTRODUCTION 2

Objectifs de cet exposé Concernant les mesures d association Illustrer la richesse des questions qu on peut poser, et des conclusions possibles Articulation Description / Inférence Concernant l étape descriptive Définir indices adaptés à la structure des données, et à chaque question posée En particulier, indices pour répondre au problème de la grandeur des liaisons, des effets Conclusions descriptives Concernant l inférence statistique Répond au problème de la genéralisabilité des conclusions descriptives Parfaite adéquation des méthodes bayésiennes Méthodes bayésiennes permettent de faire de l inférence sur n importe quel indice, n importe propriété globale 3

Données catégorielles Structure de données Unités statistiques (individus, sujets): I Une ou plusieurs variables dépendantes toutes catégorielles: J, K, etc.. Prototype: un questionnaire Structures étudiées ici I->J2*K2 I->J*K I->J2*K2*L2... Plan Inférence bayésienne illustrée sur I->J3 Tableaux de contingence, mesures d association Exemples 4

2. INFERENCE STATISTIQUE APPROCHE BAYESIENNE 5

Exemple illustratif Données: taille n = 24, K = 3 catégories. Catégorie k 1 k 2 k 3 Effectifs a 10 8 6 Fréquences observées et parentes Fréquences obs. f 0.417 0.333 0.250 1 Fréquences par. θ θ 1 θ 2 θ 3 1 Question simple: L inférence porte sur un paramètre initial ou dérivé d intérêt. On a f 1 = 0.417. Que dire de θ 1? On a f 1 f 2 = 0.084. Que dire de θ 1 θ 2? Question complexe: L inférence porte sur plusieurs paramètres conjointement. On observe descriptivement une certaine propriété d intérêt, f 1 > f 2 > f 3 Que dire de la version parente de cette propriété, θ 1 > θ 2 > θ 3? 6

De la description a l inférence Etape descriptive: Une conclusion descriptive peut toujours s exprimer par le fait que les fréquences observées f (ou des indices dérivés g(f)) possèdent une certaine propriété P: Descriptif: P(f) est vrai Etape inductive: L inférence statistique consiste à parvenir à une conclusion sur les fréquences θ (ou les paramètres dérivés g(θ)), sur la base des données observées a. De façon générale, la question de l inférence peut se formuler par: Peut-on généraliser la propriété P à la population, i.e. aux paramètres θ? Inductif: P(θ) est-il vrai? 7

Méthodes d inférence statistique Méthodes fréquentistes Les plus communes: e.g. χ 2 tests de signification, Limitées concernant les questions qu elles autorisent: souvent H 0 d absence de liaison, d effet Pas toutes valides si effectifs petits Inférence dépend des données qui auraient pu être observées (stopping-rule) Méthodes bayésiennes Moins connues en SHS, mais en plein essor Valides pour des petits effectifs Permettent de faire des inférences sur n importe quel paramètre ou propriété globale, notamment sur taille des effets Conclusions plus naturelles en termes de probabilités sur les paramètres inconnus 8

Une probabilité peut en cacher une autre! Fréquences observées, les f Fréquences parentes ou vraies, les θ Ce sont les paramètres inconnus sur lesquels porte l inférence Probabilités fréquentistes Celles mises en jeu dans l inférence fréquentiste. S interprètent comme des fréquences que l on obtiendrait par des répliques (à l infini) du jeu de données, dans les mêmes conditions de recueil. Probabilités bayésiennes Celles résultant de l inférence bayésienne. Ce sont des probabilités épistémiques, i.e. qui décrivent un état d incertitude et/ou de connaissance. Quelle est la probabilité qu il pleuve ce soir?... qu il ait plu dans la matinée? 9

Inférence bayésienne: généralités Comment répond-on au problème de l inférence dans le cadre bayésien? Principe général: à partir des effectifs a = (a 1,..., a K ), et d une distribution initiale sur les paramètres θ = (θ 1,..., θ K ), on dérive une distribution finale sur ces mêmes paramètres. Prob (θ) Prob (θ a) Les distributions initiale et finale expriment de façon probabiliste l état initial (avant les données) et l état final (après les données) de connaissance sur θ. Réponse bayésienne au problème de l inférence se déduit de la distribution finale en calculant: Prob ( P(θ) vraie a) 10

Inférence bayésienne sur des fréquences Distributions de Dirichlet Famille de distributions initiales privilégiée pour l inférence sur des fréquences Distribution initiale: (θ 1, θ 2, θ 3 ) Di(α 1, α 2, α 3 ) Distribution finale: (θ 1, θ 2, θ 3 ) a Di(α 1 + a 1, α 2 + a 2, α 3 + a 3 ) Forces initiales et finales L inférence bayésienne peut être décrite en termes de forces: chaque force initiale α k est actualisée en une force finale α k + a k Force totale: ν = α k ν + n 11

Choix des forces initiales α Formaliser un état initial d ignorance La distribution finale exprime l information sur les paramètres apportée par les données: α k = 0, Haldane (1948) α k = 1/K, Perks (1947) α k = 1/2, Jeffreys (1961) α k = 1, Bayes-Laplace Différences faibles (Bernard, 1996) Solution usuelle (Jeffreys): Adoptée ici α k = 1/2 Modèle Dirichlet imprécis (IDM) Considérer un ensemble de distribution de Dirichlet; conclusions en termes d intervalles de probabilité (Bernard, 1996, 2005; Walley, 1996): 0 α k 1 et ν = α k = 1 12

Distribution finale Distribution bayésienne finale: (θ 1, θ 2, θ 3 ) Di(10 + 1/2, 8 + 1/2, 6 + 1/2) Le simplexe: Représentation triangulaire Les 3 sommets correspondent à chacune des 3 compositions en fréquences les plus extrêmes: (1, 0, 0) (gauche), (0, 1, 0) (bas), (0, 0, 1) (droite). Caractéristiques de la distribution Le centre de la distribution correspond (à peu près) à la f = (0.42, 0.33, 0.25) Sa dispersion reflète l effectif total n = 24. 13

Les deux ingrédients 0,1,0 1,0,0 0,0,1 0,1,0 1,0,0 0,0,1 Conclusion inductive: Prob(θ 1 > θ 2 > θ 3 ) = 0.423 14

3. TABLEAUX DE CONTINGENCE MESURES D ASSOCIATION 15

Tableau de contingence: 2 exemples Données Civilité : Observation à l entrée d un magasin des individus qui tiennent la porte à la personne qui les suit, selon leur sexe (Moser, Corroyer, 2002) Porte? Oui Non Homme 222 144 Sexe Femme 254 260 Données Cheveux-Yeux : Couleur des yeux et Couleur des cheveux, sur n = 5387 individus (Fisher). Cheveux Noir Chat Blond Roux Noir 326 688 343 98 MarrF 38 116 84 48 Yeux MarrC 241 584 909 403 Bleu 110 188 412 681 Vert 3 4 26 85 16

Types de questions statistiques Questions symétriques Liaison, association entre J et K Attraction entre modalités j J et k K, ou sur-représentation de certaines cases jk Répulsion entre modalités j et k, ou sous-représentation de certaines cases jk Questions asymétriques Problèmes de comparaison: La répartition selon K diffère t-elle selon les modalités de J. Y-a t-il un effet du SEXE sur PORTE? Y-a t-il des implications ou quasi-implications entre certaines modalités, j = k? Par exemple: Y eux : V erts = Chev : Roux? 17

Notations, Premières statistiques Effectifs observés: a jk pour chaque case jk Fréquences conjointes et marginales Fréquences conjointes f jk : f jk = n jk /n Fréquences marginales f j et f k : f j = k K f jk f k = j J f jk Exemple: Civilité Porte? Oui Non Total Homme 0.25 0.16 0.42 Femme 0.29 0.30 0.58 Total 0.54 0.46 1.000 18

Fréquences conditionnelles Fréquences conditionnelles en ligne f j k = f jk f j Porte? Oui Non Total Homme 60.7% 39.3% 100% Femme 49.4% 50.6% 100% Moy 54.1% 45.9% 100% Fréquences conditionnelles en colonne f k j = f jk f k Porte? Oui Non Moy Homme 46.6% 35.6% 41.6% Femme 53.4% 64.4% 58.4% Total 100.0% 100.0% 100.0% 19

Indépendance locale et globale Indépendance locale (ou absence de liaison) entre deux modalités j et k, lorsque: j k ssi f k j = f j ssi ssi f j k = f k f jk = f j f k Indépendance globale (ou absence de liaison) entre J et K lorsque: les fréquences conditionnelles en ligne sont les mêmes pour chaque ligne, les fréquences conditionnelles en colonne sont les mêmes pour chaque colonne J K ssi j, k, f k j = f j ssi j, k, f j k = f k ssi a, b, f jk = f j f k i.e. lorsque chaque fréquence conjointe f jk est égale à la fréquence-produit f j f k correspondante. Rôle important des fréquences-produits f jk = f j f k 20

Divers indices d association Une panoplie d indices (Goodman, Kruskal, 1954, 1959) Indices locaux Comparer une fréquence conjointe à une fréquence de référence, i.e. f jk à f jk Comparer une fréquence conditionnelle à une fréquence marginale, i.e. f j k à f k Comparer plusieurs fréquences conditionnelles, i.e. f j k à f j k Comparaison: par différence, rapport, accroissement relatif Odds-ratio, un rapport de deux rapports PEM (Cibois,2004) Indices globaux Coefficient de contingence, φ ou φ 2 V 2 de Cramer, etc.. 21

Un indice de liaison local Taux de liaison entre modalités j et k (e.g. Rouanet et al., 1987): t jk = f jk f jk f ab [ = O T ] T S interprète comme un taux de sur- ou de sousreprésentation par rapport à l indépendance Porte? Oui Non Homme 0.12-0.14 Femme -0.09 0.10 Sens de la liaison selon t jk > 0 attraction, sur-représentation = 0 indépendance locale < 0 répulsion, sous-représentation = 1 répulsion maximale, incompatibilité stricte 22

5. DOSSIER CIVILITÉ 23

Civilité: Taux liaison (Hom,Oui) Descriptivement: t obs = 0.12 Inductivement Prob(t par > 0.0) = 0.9996 Prob(t par [0.05; 0.19]) = 0.95 Median=0.121-1.0-0.5 0.0 Parametre derive 24

Civilité: Différence (Oui/Hom,Oui/Fem) Descriptivement: DIF obs = 0.11 Inductivement Prob(DIF par [0.05; 0.18]) = 0.95 Prob( 0.15 < DIF par < 0.15) = 0.87 Median=0.112-1.0-0.5 0.0 0.5 1.0 Parametre derive 25

Civilité: Rapport (Oui/Hom,Oui/Fem) Descriptivement: RAP obs = 1.23 Inductivement Prob(RAP par [1.10; 1.38]) = 0.95 Median=1.227 0.0 0.5 1.0 1.5 Parametre derive 26

Indices plus complexes Odds-ratio OR obs = f jk/f jk f j k /f j k PEM (pourcentage de l écart maximum) PEM obs = max f jk f jk f j f jk, f jk f jk f k f jk Coefficient de contingence φ 2 φ 2 obs = jk f jk t 2 jk 27

Civilité: Odds-ratio (Hom,Oui) Descriptivement: OR obs = 1.58 Inductivement Prob(OR par [1.21; 2.07]) = 0.95 Prob(OR par [1.11; 2.27]) = 0.99 Median=1.578 0.0 0.5 1.0 1.5 2.0 2.5 3.0 Parametre derive 28

Civilité: PEM (Hom,Oui) Descriptivement: PEM obs = 0.14 Inductivement Prob(PEM par [0.06; 0.23]) = 0.95 Median=0.143-1.0-0.5 0.0 0.5 1.0 Parametre derive 29

Civilité: Coefficient de contingence Descriptivement: φ 2 obs = 0.012 Inductivement Prob(φ 2 par [0.002; 0.031]) = 0.95 Median=0.012 0.00 0.05 0.10 Parametre derive 30

6. DOSSIER CHEVEUX-YEUX 31

Dossier Cheveux-Yeux Données Couleur des yeux et Couleur des cheveux, relevée sur n = 5387 individus (Fisher). Cheveux Noir Chat Blond Roux Noir 326 688 343 98 MarrF 38 116 84 48 Yeux MarrC 241 584 909 403 Bleu 110 188 412 681 Vert 3 4 26 85 Problème Résumer les attractions et répulsions entre modalités lignes et modalités colonnes, de façon descriptive et inductive 32

Analyse descriptive Tableau des taux de liaison Noir Chat Blond Roux Noir 0.68 0.61-0.28-0.72 MarrF -0.00 0.38-0.11-0.31 MarrC -0.15-0.07 0.29-0.23 Bleu -0.41-0.54-0.10 1.01 Vert -0.81-0.88-0.33 1.95 Attractions / répulsions Noir MarrF = Noir Chat Blond Roux MarrC = Bleu Vert 33

Analyse inductive: Attractions / Répulsions Probabilités bayésiennes, Prob(τ jk > 0) Noir Chat Blond Roux Noir 1.00 1.00 0.00 0.00 MarrF 0.50 1.00 0.09 0.00 MarrC 0.00 0.01 1.00 0.00 Bleu 0.00 0.00 0.00 1.00 Vert 0.00 0.00 0.00 1.00 Attractions / répulsions (garantie 0.95) Noir MarrF? MarrC Bleu Vert Noir Chat Blond Roux? 34

Analyse inductive: Sur-représentations élevées Probabilités bayésiennes, Prob(τ jk > 0.50) Noir Chat Blond Roux Noir 0.99 0.99 0.00 0.00 MarrF 0.00 0.10 0.00 0.00 MarrC 0.00 0.00 0.00 0.00 Bleu 0.00 0.00 0.00 1.00 Vert 0.00 0.00 0.00 1.00 Sur-représentations > 0.50 (garantie 0.95) Noir Noir Chat Blond Roux MarrF? MarrC Bleu Vert 35

Et avec 10 fois moins de données? Sur-représentations > 0.50, Bayésien Noir Chat Blond Roux Noir?? MarrF?? MarrC Bleu Vert Sur-représentations > 0.50, IDM Noir Chat Blond Roux Noir?? MarrF? MarrC Bleu Vert?? 36

De l association à l implication Jusqu ici: Intérêt: Ecarts à l indépendance Point de référence implicite: i.e. t jk = 0 indépendance, Maintenant: Intérêt: Implications ou Quasi-implications Point de référence: sous-représentation maximale, i.e. t jk = 1 Si t jk = 1, alors j = non-k (implication stricte) Si t jk 1, alors j non-k (quasi-implication) Idée: confronter les données à un modèle logique 37

7. DOSSIER FRACTIONS 38

Données Fractions Données Extrait d une expérience de Psychologie Développementale sur la maitrise des fractions chez l enfant (n = 165 sujets). Deux épreuves J et K consistent à déterminer une quantité à l aide d une fraction qui exprime: un rapport partie-partie (épreuve J), un rapport partie-tout (épreuve K): K k k J j 36 3 j 36 90 Analyse descriptive à vue En général, la réussite à J implique la réussite à K (36/39). Il y a quasi-implication: j k. La réciproque k j est loin d être vérifiée. 39

Analyse descriptive Problème. Peut-on conclure à une quasiimplication, j k? Indice descriptif. L indice Del fournit une mesure de l écart des fréquences observées à un modèle logique quelconque (une ou plusieurs cases d erreur ) (Loevinger, 1947; Hildebrand et al. 1977; Bernard, Charron, 1996). Pour le modèle j = k dans un tableau 2 2, l indice Del vaut soit 1 t jk d j= k = 1 f jk f j f k Indice Del varie de 0 (indépendance) à 1 (modèle logique strictement vérifié). Pour les données Fractions d a= b = 0.86 d b= a = 0.35 40

Analyse inductive Distribution bayésienne conjointe des deux indices Del parents: δ j= k et δ j= k. b a 1 0.8 0.6 0.4 0.2 0 a b 0 0.2 0.4 0.6 0.8 1 Résumé inductif Prob (δ a= b > 0.70 & δ b= a < 0.50) = 0.96 41

Autre exemple, Stades modèle logique Les données: Recherche sur les stades de Piaget (Jamison, 1977): n = 101 enfants soumis à 2 épreuves, avec 3 degrés de réussite chacune: Sériation Inclusion k1 k2 k3 j1 14 0 0 j2 15 5 2 j3 19 20 26 Hypothèse d intérêt peut s exprimer par soit comme un modèle logique M = (k3 = j3 et k2 = (j2 ou j3)) soit comme un ensemble de cases d erreur Analyse statistique (Danis et al., 2000) Indice Del moyen pour l ensemble des cases d erreur Propriété globale à partir des indices Del pour chaque case d erreur 42

8. DOSSIER RELIGION 43

Dossier Religion (Degenne, Lebeaux, 1996) A Prier (Oui=a / Non=a ) B Aller à l église (id.) C Croire au paradis (id.) D Education religieuse aux enfants (id.) Profil Effectif A B C D a b c d 100 a b c d 2 a b c d 14 a b c d 2 a b c d 9 a b c d 0 a b c d 17 a b c d 0 a b c d 302 a b c d 7 a b c d 89 a b c d 15 a b c d 172 a b c d 16 a b c d 455 a b c d 324 n = 1524 44

Indice implicatif multivarié Indice implicatif multivarié (Bernard, 2002) Pour chaque profil p = ijkl, mesure le degré d accord avec le modèle (p = ) (p est absent): d p= = 1 f ijkl f i f j f k f l Généralise l indice Del et le taux de liaison Interprétation d p= = 0: indépendance locale d p= = 1; profil absent, donc implication stricte Indice négatif si profil sur-représenté 45

Des effectifs à l indice d p= Tableau des effectifs c c d d d d ab 100 2 14 2 ab 9 0 17 0 a b 302 7 89 15 a b 172 16 455 324 Tableau des d p= c c d d d d ab -5.58 0.58 0.39 0.72 ab 0.68 1.00 0.60 1.00 a b -1.07 0.85 0.59 0.78 a b 0.37 0.81-0.11-1.50 46

Quasi-implications (descriptif) seuil d quasi = 0.50 Tableau des d p= (en gras si > 0.50) c c d d d d ab -5.58 0.58 0.39 0.72 ab 0.68 1.00 0.60 1.00 a b -1.07 0.85 0.59 0.78 a b 0.37 0.81-0.11-1.50 Résumé descriptif Prier(a) Eglise(b) Educ.(d) Paradis(c) Educ.(d) Eglise(b) (Prier(a) OU Paradis(c)) 47

Quasi-implications (inductif) seuil d quasi = 0.50 Table des P rob(δ p= 0.50) (IDM) c c d d d d ab 0.00 0.43 0.18 0.71 ab 0.91 0.99 0.82 1.00 a b 0.00 1.00 0.99 1.00 a b 0.00 1.00 0.00 0.00 Résumé inductif, à la garantie γ = 0.90, Prier(a) ET Paradis(c) Eglise(b) Prier(a) (Eglise(b) OU Educ.(d)) Paradis(c) (Prier(a) OU Educ.(d)) Eglise(b) (Prier(a) OU Paradis(c)) 48