1 / 29 Modélisation et analyse des trajectoires de soins par treillis de concepts Pr Nicolas Jay nicolas.jay@univ-lorraine.fr Le SNIIRAM pour la recherche en santé Rennes 27/06/2017
2 / 29 Pourquoi analyser les parcours de soins? Objectifs généraux Calibrage de l offre de soins, pilotage, planification Coordination des acteurs Amélioration de l efficience et de la qualité des soins Épidémiologie Évaluation des pratiques surveillance sanitaire
3 / 29 Pourquoi analyser les parcours de soins? Objectifs spécifiques Pour les connaître!! Pour les classer Pour en mesurer les determinants : facteurs individuels, sociaux, démographiques, environnementaux, liés au système de soin Pour en mesurer les couts, l efficience Pour les comparer à des parcours a priori (référentiels, guides de bonne pratique)
4 / 29 Trajectoires institutionnelles : Qui travaille avec qui? Un problème combinatoire
4 / 29 Trajectoires institutionnelles : Qui travaille avec qui? Un problème combinatoire
4 / 29 Trajectoires institutionnelles : Qui travaille avec qui? Un problème combinatoire
4 / 29 Trajectoires institutionnelles : Qui travaille avec qui? Un problème combinatoire
4 / 29 Trajectoires institutionnelles : Qui travaille avec qui? Un problème combinatoire nombre de combinaisons 0 1000 3000 5000 5 4 3 2 10 20 30 40 50 Nombre d'hopitaux
Un problème d extraction de connaissances 5 / 29
6 / 29 Analyse formelle de concepts Wille (1982), Barbut et Montjardet (1970), Birkhoff(1940) Contexte Formel K = (G,M, I) G : objets M : attributs I : une relation binaire dans G M. (g,m) I : l objet g possède l attribut m. diabete hypertension dyslipidemie angor p1 p2 p3 p4 p5 p6 p7 p8
6 / 29 Analyse formelle de concepts Wille (1982), Barbut et Montjardet (1970), Birkhoff(1940) Contexte Formel K = (G,M, I) G : objets M : attributs I : une relation binaire dans G M. (g,m) I : l objet g possède l attribut m. diabete hypertension dyslipidemie angor p1 p2 p3 p4 p5 p6 p7 p8
7 / 29 Opérateurs de dérivation Définition : 2 G 2 M : A = {m M g A,(g,m) I} diabete hypertension dyslipidemie angor : 2 M 2 G : B = {g G m B,(g,m) I} Exemple {p1,p7} = {diabete, hypertension} {diabete, hypertension} = {p1,p7,p8} p1 p2 p3 p4 p5 p6 p7 p8
7 / 29 Opérateurs de dérivation Définition : 2 G 2 M : A = {m M g A,(g,m) I} : 2 M 2 G : B = {g G m B,(g,m) I} Exemple {p1,p7} = {diabete, hypertension} {diabete, hypertension} = {p1,p7,p8} diabete hypertension dyslipidemie angor p1 p2 p3 p4 p5 p6 p7 p8
7 / 29 Opérateurs de dérivation Définition : 2 G 2 M : A = {m M g A,(g,m) I} : 2 M 2 G : B = {g G m B,(g,m) I} Exemple {p1,p7} = {diabete, hypertension} {diabete, hypertension} = {p1,p7,p8} diabete hypertension dyslipidemie angor p1 p2 p3 p4 p5 p6 p7 p8
8 / 29 Concept formel Définition un concept formel est un couple C = (A,B) G M tel que : A = B et B = A A est l extension de C. B est l intension de C. B(G,M, I) ou B(K) l ensemble des concepts formels du contexte K par définition, A et B sont fermés : (A ) = A et (B ) = B diabete hypertension dyslipidemie angor p1 p2 p3 p4 p5 p6 p7 p8
8 / 29 Concept formel Définition un concept formel est un couple C = (A,B) G M tel que : A = B et B = A A est l extension de C. B est l intension de C. B(G,M, I) ou B(K) l ensemble des concepts formels du contexte K par définition, A et B sont fermés : (A ) = A et (B ) = B diabete hypertension dyslipidemie angor p1 p2 p3 p4 p5 p6 p7 p8
9 / 29 Concept formel Définition un concept formel est un couple C = (A,B) G M tel que : A = B et B = A A est l extension de C. B est l intension de C. B(G,M, I) ou B(K) l ensemble des concepts formels du contexte K par définition, A et B sont fermés : (A ) = A et (B ) = B diabete hypertension dyslipidemie angor p1 p7 p8 p2 p3 p4 p5 p6
10 / 29 Ordre sur les concepts Définition Soient deux concepts C 1 = (A 1,B 1 ) et C 2 = (A 2,B 2 ) C 1 C 2 A 1 A 2 B 2 B 1 (B(K), ) est un treillis p1,p2,p3,p4,p5,p6,p7,p8 hypertension diabete ø C1 C2 C3 p1,p2,p3,p7,p8 p1,p4,p5,p6,p7,p8 hypertension,diabete angor, diabete, dyslipidemie C4 C5 p1,p7,p8 p5,p7 hypertension,diabete,angor,dyslipidemie p7 C6
11 / 29 Extraction de connaissance : Treillis de Galois H1 H2 H3 p1 p2 p3 p4 p5 p6
Prise en charge du cancer du poumon en région Bourgogne 12 / 29
ECD, motifs fréquents et icebergs Recherche de motifs fréquents (Agrawal et al. (1993)) support σ K : M [0; 1] B σ K (B) = B G σ K ({diabete,hypertension}) = 3 8 diabete hypertension dyslipidemie angor p1 p2 p3 p4 p5 p6 p7 p8 13 / 29
14 / 29 Iceberg de concepts (Stumme et al. 2002) Concept fréquent soit minsupp [0; 1] un seuil de support minimum. soit (A,B) B(K) est dit fréquent si : σ K (B) minsupp Stumme et al. (2002) : Titanic Zaki et Hsiao (2005) : CHARM-L Szathmary, Valtchev, Napoli (2008) : Snow et Touch, Coron
14 / 29 Iceberg de concepts (Stumme et al. 2002) Concept fréquent soit minsupp [0; 1] un seuil de support minimum. soit (A,B) B(K) est dit fréquent si : σ K (B) minsupp Stumme et al. (2002) : Titanic Zaki et Hsiao (2005) : CHARM-L Szathmary, Valtchev, Napoli (2008) : Snow et Touch, Coron p1,p2,p3,p4,p5,p6,p7,p8 hypertension diabete ø C1 C2 C3 p1,p2,p3,p7,p8 p1,p4,p5,p6,p7,p8 hypertension,diabete angor, diabete, dyslipidemie C4 C5 p1,p7,p8 p5,p7 hypertension,diabete,angor,dyslipidemie p7 C6
14 / 29 Iceberg de concepts (Stumme et al. 2002) Concept fréquent soit minsupp [0; 1] un seuil de support minimum. soit (A,B) B(K) est dit fréquent si : σ K (B) minsupp Stumme et al. (2002) : Titanic Zaki et Hsiao (2005) : CHARM-L Szathmary, Valtchev, Napoli (2008) : Snow et Touch, Coron
14 / 29 Iceberg de concepts (Stumme et al. 2002) Concept fréquent soit minsupp [0; 1] un seuil de support minimum. soit (A,B) B(K) est dit fréquent si : σ K (B) minsupp Stumme et al. (2002) : Titanic Zaki et Hsiao (2005) : CHARM-L Szathmary, Valtchev, Napoli (2008) : Snow et Touch, Coron
Prise en charge du cancer du poumon en région Bourgogne 15 / 29
Prise en charge du cancer du poumon en région Bourgogne 15 / 29
Prise en charge du cancer (tout type) en Lorraine 16 / 29
A l intérieur d un établissement 17 / 29
Profils de morbidité et coûts des trajectoires 18 / 29
Profils de morbidité et coûts des trajectoires 18 / 29
19 / 29 Détection de cas Sur quels critères sélectionner des cas de cancer dans le PMSI méthode : appariement PMSI/registres, fouille de données résultats : des algorithmes de sélection
Qualité des données évaluation de la cohérence interne des données méthode : s appuyer sur la redondance de l information dans la trajectoire de soins résultats : certains patients dans le PMSI ont plusieurs cancers dans des organes différents (multisites)??? Exemple, en Lorraine 2007 sein : 10% de cancers multisites foie : 30% os : 50% 26 patients présentent 3 cancers : Os-Poumon-disgestif. 83% des 789 séjours dans un seul établissement 20 / 29
Treillis des localisations 21 / 29
Associations médicamenteuses 22 / 29
Fréquent = intéressant?
24 / 29 Stabilité d un concept formel Définition [Kuznetsov (2007)] soit C = (A,A ) un concept formel de B(K). γ(c) = {X A X = A } 2 A la stabilité mesure de la cohésion de l extension elle traduit dans quelle mesure un concept dépend de certains objets de son extension. un concept stable a une existence «réelle» même si la description de son extension est bruitée
Effets du filtre par la stabilité 25 / 29
Concepts instables et fréquents 26 / 29
Concepts instables et fréquents 26 / 29
27 / 29 Conclusion Utilisation secondaire de données volumineuses et complexes Recours à des techniques de fouille : exploration, visualisation, simplification, classification, génération d hypothèse Intérêt de l Analyse de Formelle de Concept : modèle simple versatilité fouille, classification, visualisation limites modèle simple, pas de prise en compte du temps variables quantitatives : discrétisation, pattern structures Le modèle ne fait pas tout. Limites et contenu des trajectoires : fenêtre d observation quelles variables? quelle représentation et quelle granularité?
Merci de votre attention 28 / 29