Conception de Systèmes Intelligents pour la Télémédecine Citoyenne

Dimension: px
Commencer à balayer dès la page:

Download "Conception de Systèmes Intelligents pour la Télémédecine Citoyenne"

Transcription

1 Département Informatique École Doctorale Informatique et Information pour la Société Conception de Systèmes Intelligents pour la Télémédecine Citoyenne Thèse présentée et soutenue publiquement le 29 Septembre 2006 pour l obtention du Doctorat de l INSA de Lyon (spécialité informatique) par Hussein Atoui Composition du jury Rapporteurs: François Charpillet Directeur de Recherche INRIA Joël Colloc Professeur, Université du Havre Directeurs de thèse: Paul Rubel Professeur, INSA de Lyon Directeur de l INSERM ERM107 Jocelyne Fayn Ingénieur de Recherche, INSERM Examinateur Jean-Pierre Boissel Professeur, Département de Pharmacologie Clinique Faculté RTH Laennec INSERM ERM 107, MTIC (Méthodologies de Traitement de l Information en Cardiologie)

2 À ma famille, mes amis, mon village, mon sud, À tous les êtres chers perdus victimes de la barbarie qui a ravagé le Liban dans l indifférence et la complicité du monde entier, À tous celles et ceux qui m ont aidé pendant ces années, un grand Merci.

3 Table des matières Table des matières vi I Introduction 1 II Aide à la décision en médecine, le projet européen EPI- MEDICS 5 1 Maladies cardiovasculaires, télémédecine et aide à la décision Contexte médical Le diagnostic L électrocardiologie quantitative L ECG standard 12D L ECG : les différentes ondes et les intervalles de temps L ECG, outil de détection du dysfonctionnement cardiaque La télémédecine citoyenne : le projet EPI-MEDICS Introduction Evolution : passé, présent et futur EPI-MEDICS L aide à la décision en médecine Généralités Les systèmes d aide à la décision Les principales approches utilisées pour l aide à la décision Conclusion III Conception, validation et stratégies de déploiement de la plateforme décisionnelle d EPI-MEDICS 25 2 Aide à la décision en télécardiologie Contexte et objectifs Interprétation automatique de l ECG Les réseaux de neurones Conception, réalisation et évaluation du module d interprétation de l ECG par réseaux de neurones

4 iv Discussion Quantification du risque cardiovasculaire par approche probabiliste Choix méthodologiques Les réseaux bayésiens Apprentissage des réseaux bayésiens Configuration du modèle probabiliste de stratification du risque cardiovasculaire La base de données INDANA Réalisation du réseau bayésien Résultats Discussion Conclusion Vers un modèle multi-classifieurs multi-modules du diagnostic de l infarctus : Interaction du module neuronal et du module bayésien dans le processus décisionnel global Acquisition de l ECG PEM et synthèse de l ECG standard Introduction Modalités d acquisition de l ECG PEM Approches conventionnelles Choix méthodologiques Bases de données d apprentissage et de test Configuration du modèle de synthèse de l ECG standard 12D par réseaux de neurones Constitution des ensembles d apprentissage et de test Evaluation de la variation naturelle intra-patients entre les ECG de référence et les ECG d urgence Configuration de la structure des réseaux de neurones Processus d apprentissage et d évaluation Résultats Discussion Conclusion Evaluation diagnostique sur la base de données de Lund Ensemble d apprentissage et ensemble de test Configuration et apprentissage des comités de réseaux de neurones spécifiques aux patients Comparaison des interprétations automatiques des ECG synthétisés par rapport à la vérité clinique Discussion & Conclusion Evaluation de la qualité de la synthèse des ECG standards 12D à partir des ECG 3D du PEM Objectifs Population d étude Prétraitement des ECG Configuration de la structure des réseaux de neurones

5 v Processus d apprentissage des réseaux de neurones génériques Processus d apprentissage des réseaux de neurones spécifiques Vérification et validation de la synthèse de l ECG 12D Résultats Discussion Conclusion Mise en place de la plateforme décisionnelle du PEM Objectifs Etat actuel de développement du PEM à l étape de prototype Le PEM : intelligence embarquée dans un environnement pervasif multi-acteurs de télémédecine citoyenne Architecture pervasive générique Génération et gestion d alarmes Détection des arythmies et des ischémies Reconstruction de l ECG standard 12D à partir de l ECG PEM 3D Vers un produit final : stratégies de déploiement du module de synthèse de l ECG embarqué dans le PEM Le PEM, un dispositif autonome Le PEM, un dispositif semi-autonome Scénario d utilisation du module de synthèse d ECG Conclusion IV Conclusion générale 120 Bibliographie 124 V Annexes 135 A Dossier Médical Personnel embarqué dans le PEM 136 A.1 Contenu du dossier de santé du patient A.2 Données démographiques A.3 Résultats d analyses biologiques A.4 Eléments du dossier cardiologique A.4.1 Données cliniques A.4.2 Interprétation de l ECG au repos A.4.3 Résultats des tests de l ECG d effort A.4.4 Diagnostic cardiologique A.4.5 Procédures et traitements A.5 Facteurs de risque cardiovasculaire A.5.1 Classe de Santé A.5.2 Facteurs de risque majeurs A.5.3 Autres facteurs de risque

6 vi B La base de données INDANA 141 C Architecture des réseaux de neurones utilisés pour la synthèse de l ECG143 D SCPECG Processor 149 E EPI-MEDICS : modèles de données globaux du PEM 152 F Publications 155 Résumé 158

7 Liste des tableaux 2.1 Exemple de validation croisée pour N=5. L ensemble des données d apprentissage est divisé en 5 sous-ensembles : s1, s2, s3, s4, et s5. L apprentissage est ensuite effectué sur les N 1 sous-ensembles s2 à S5 et l erreur est calculée sur le sous-ensemble restant s1, servant de validation. Cette opération est réitérée quatre fois en choisissant chaque fois un ensemble de validation différent. Enfin, un taux d erreur moyen est calculé et l apprentissage est refait en utilisant la totalité de l ensemble de données Matrice de confusion Résultats de l interprétation en 4 catégories (D1, D2, D3, D4) des ECG d urgence de l ensemble de test, effectuée par les deux experts, en fonction de la vérité clinique (199 cas d infarctus (AMI) et 789 cas de contrôle). Ce tableau illustre les résultats de l interprétation unaire effectuée sur les ECG d urgence sans avoir eu connaissance des ECG de référence des patients Même résultats que dans le tableau 2.3, obtenus en prenant en compte une information supplémentaire : l ECG de référence de chaque patient (analyse sérielle) Scores de risque en pourcentage de la survenue d une maladie coronaire en fonction de l âge, du sexe et des caractéristiques de la douleur de thoracique. D après Diamond et Forrester, N Engl J Med Illustration du déroulement de l algorithme de triangulation. Les clusters retenus pour l arbre de jonction sont marqués par une étoile (*) Variables retenues pour réaliser les modèles de stratification : réseau bayésien, comité de réseau de neurones et analyse discriminante Corrélations moyennes (en pourcentage) entre les dérivations d origine et les dérivations synthétisées au moyen d un modèle de régression générique en fonction du sous-ensemble de dérivations ECG 12D utilisées comme entrées pour la synthèse. Résultats extraits de [119] portant sur un ensemble d apprentissage de 72 ECG 12D sans ensemble de test indépendant Erreur quadratique moyenne (RMS) en µv entre les dérivations DI, DII, V1, V2, V3, V4, V5 et V6 des ECG de référence et ECG d urgence des sous ensembles DS1, DS2 et DS3, après exclusion des 5 valeurs les plus extrêmes Erreur quadratique moyenne (RMS) en µv et coefficients de corrélation (r) entre les dérivations V1,V3... V6 originales et celles synthétisées par les comités de réseaux de neurones spécifiques (ANN-S) et les modèles de régression spécifiques (REG-S) sur les ECG des sous-ensembles DS1, DS2 et DS3, après élimination des 5 valeurs les plus extrêmes

8 3.4 Comparaison par les tests statistiques (t-tests : pairwised et trimmed) de la différence en termes d erreur RMS obtenue par les comités de réseaux de neurones et les modèles de régression spécifiques Concordance entre les interprétations des ECG originaux et les interprétations des ECG synthétisés par réseaux de neurones (ANN-S) et par régression (REG-S). Le logiciel de diagnostic classe les ECG suivant 4 catégories de risque : pas de risque, risque mineur, moyen et majeur Description de la base de données CHDB Erreur quadratique moyenne (RMS) en µv et coefficients de corrélation entre les dérivations DI, DII, V1, V2, V3, V4, V5 et V6 du premier et du deuxième ECG Cardiette du sous ensemble SE2, après élimination des 5% des cas les plus extrêmes (N=35) Erreur quadratique moyenne (RMS) en µv et coefficients de corrélation entre les dérivations DI, DII et V2 du premier ECG Cardiette et du deuxième ECG PEM du sous ensemble SE2 (N=35) Erreur quadratique moyenne (RMS) en µv et coefficients de corrélation entre les dérivations DI, DII et V2 du deuxième ECG Cardiette et de l ECG PEM associé du sous ensemble SE2 (N=35) Erreur quadratique moyenne (RMS) en µv et coefficients de corrélation entre les dérivations V1,V3... V6 originales et celles synthétisées par le comité de réseaux de neurones générique (ANN-G) et le modèle de régression générique (REG-G) sur les ECG 2 du sous-ensemble SE2 (N=35) Erreur quadratique moyenne (RMS) en µv et coefficients de corrélation entre les dérivations V1,V3... V6 originales et celles synthétisées par les comités de réseaux de neurones spécifiques (ANN-S) et les modèles de régression spécifiques (REG-S) sur les ECG du sous-ensemble SE2 (N=35) Comparaison par les t-tests (pairwised et trimmed) de la différence en termes d erreurs RMS obtenues par les comités de réseaux de neurones et les modèles de régression génériques et spécifiques (N=35) Erreur quadratique moyenne (RMS) en µv et coefficients de corrélation entre les dérivations V1,V3... V6 originales des 2ème ECG 12D de SE2 et celles synthétisées à partir des ECG PEM chronologiquement homologues par le comité de réseaux de neurones générique (ANN-G) et le modèle de régression générique (REG-G) (N=35) Erreur quadratique moyenne (RMS) en µv et coefficients de corrélation entre les dérivations V1,V3... V6 originales et celles synthétisées par les comités de réseaux de neurones spécifiques (ANN-S) et les modèles de régression spécifiques (REG-S) sur les ECG du sous-ensemble SE2 (N=35) Comparaison par les tests statistiques t-tests (pairwised et trimmed) de la différence en termes d erreurs RMS obtenues par les comités de réseaux de neurones et les modèles de régression génériques et spécifiques lorsque les entrées sont des ECG PEM (N=35) viii

9 ix 3.16 Concordance entre les interprétations des ECG originaux et celles de ECG synthétisés à partir des dérivations DI, DII et V2 de l ECG 12D Cardiette 2 par le comité de réseaux de neurones génériques (ANN-G) et par le modèle de régression générique (REG-G). Le logiciel de diagnostic classe les ECG suivant 4 catégories de risque : pas de risque, risque mineur, moyen et majeur Même résultats que dans le tableau 3.16, mais pour les comités de réseaux de neurones spécifiques (ANN-S) et les modèles de régression spécifiques (REG-S) Même résultats que dans le tableau 3.16, mais pour les ECG reconstruits à partir des dérivations DI, DII et V2 de l ECG PEM Même résultats que dans le tableau 3.17, mais pour les ECG reconstruits à partir des dérivations DI, DII et V2 de l ECG PEM B.1 Tableau descriptif des variables et labels de la base de données INDANA. 142

10 Table des figures 1.1 ECG standard 12D : positionnement des électrodes, ondes et intervalles. D après the ECG learning center. http ://medlib.med.utah.edu/kw/ecg Evolution de l ECG au cours d un infarctus Le centre d intérêt de l informatique médicale traditionnelle est en train d évoluer des professionnels de santé vers les consommateurs (citoyen/patient). D après Gunther Eysenbach, Consumer health informatics, BMJ Le projet EPI-MEDICS permet, grâce à un système personnel d enregistrement de l ECG, lorsqu un problème est détecté dans l ECG d un patient, et selon le niveau de gravité évalué, de prévenir le médecin du patient et/ou le service d urgence. Les données médicales sont alors disponibles sur le Web et grâce à un accès sécurisé, les professionnels de santé peuvent prendre en charge le patient et orienter correctement ses soins Illustration d un des 70 prototypes PEM (Personal ECG Monitor) développés dans le cadre du projet EPI-MEDICS pour permettre la détection précoce des syndromes cardiaques dans un contexte de télémédecine citoyenne Fonctionnement des neurones : chaque neurone m additionne les valeurs de ses entrées (n 1, n 2, n 3 ) multipliées par des poids (W 1, W 2, W 3 ), passe le résultat dans une fonction d activation, et le renvoie aux neurones qui le suivent Exemples de fonctions d activation Illustration d un réseau de neurones de type perceptron multi-couches Illustration du fonctionnement du comité de réseaux de neurones unaires/sériels utilisé pour l interprétation de l ECG Comparaison du pouvoir discriminant de deux méthodes de classement. Selon ces deux tracés de courbes ROC, la méthode A est meilleure que la méthode B Courbes ROC pour les 50 réseaux de neurones ainsi que celle du comité obtenu en analyse unaire Courbes ROC pour les 50 réseaux de neurones ainsi que celle du comité obtenu en analyse sérielle Comparaison des courbes ROC des différentes méthodes en analyse unaire et sérielle Schéma synoptique du processus décisonnel embarqué dans le PEM : a) sa version actuelle ; b) une future version que nous proposons avec l introduction d un deuxième score de risque basé sur le dossier médical du patient

11 xi 2.10 Illustration d algorithmes de stratification du risque cardiovasculaire développés dans le cadre d EPI-MEDICS Réseau bayésien simple Réseau bayésien bug an Même graphe que Figure 2.12 après moralisation Même graphe que Figure 2.12 après triangulation L arbre de jonction obtenu à partir du réseau bayésien avec les clusters retenus du processus de triangulation (ovales) et les séparateurs induits (carrés) Réseau bayésien utilisé pour estimer le risque cardiovasculaire Illustration de la structure individuelle des réseaux de neurones utilisés pour estimer le risque cardiovasculaire Proposition d un modèle décisionnel global incorporant des modules bayésien et neuronal qui collaborent par l intermédiaire d un système de règles de logique floue Positionnement des électrodes dans l ECG PEM 3D Vs. l ECG standard 12D Différents types de modèles de synthèse de l ECG 12D à partir d un sousensemble de dérivations 3D : (a) cinq réseaux individuels avec 3 entrées et 1 sortie ; (b) réseau global avec 3 entrées, 5 sorties Illustration de la structure individuelle des réseaux de neurones utilisés pour la synthèse de l ECG 12D : une couche d entrée de 3 neurones (DI, DII, V2), une couche de sortie de 5 neurones (V1, V3, V4, V5, V6), et h couches cachées de n neurones Programme d interprétation automatique de l ECG suivant 4 niveaux de risque Courbes ROC résultant de la comparaison entre la classification des ECG dérivés par réseaux de neurones et par régression, par rapport à la vérité clinique des ECG originaux correspondants Illustration de l alignement des signaux ECG par corrélation croisée Illustration de l apprentissage et de la validation des comités de réseaux de neurones génériques et spécifiques Visualisation des intervalles de temps utilisés pour l apprentissage des comités de réseaux de neurones génériques et spécifiques (PT : P-Onset -18 à T-offset +38 msec) et pour tester leur capacité de généralisation (QT : Q-onset -18 à T-offset +38 msec). En cas d absence de l onde P, on remplace le pointeur P-onset par un pointeur virtuel tel que l intervalle PQ correspondant à l intervalle PQ moyen Incidence de la méthode de synthèse de l ECG sur la calcul des paramètres ECG de type syntaxique. A gauche sur l ECG d origine, le tracé présente une petite onde R et une grande onde S. A droite, sur l ECG de synthèse, aspect typique dit QS. L onde R, microvoltée, n a pas été detectée et par conséquent la durée de l onde Q est passée de 0 à 92 msec et celle de l onde S de 70 msec à

12 xii 3.10 Illustration de la qualité de synthèse de l ECG standard 12D à partir de l ECG PEM 3D Le PEM (Personal ECG monitor) au service de la prévention et la détection précoce de la survenue d événements cardiovasculaires Un exemple d architecture d EPI-MEDICS : un serveur web assure la gestion intelligente des échanges de messages, et des applications clientes distribuées servant à envoyer et à recevoir les demandes XML de télé-expertise via HTTPS Scénario d alarme majeure Scénario d alarme moyenne Grille pervasive au service de la télémédecine. Inspiré de David De Roure, Mobile Medical Monitoring, National e-science Centre Talk Scénario d utilisation du module de synthèse d ECG. Le cardiologue acquiert un ECG standard 12D du patient, accède via Internet au serveur d application qui, à l aide d un service web, réserve les ressources nécessaires, calcule et met à jour les dispositifs de synthèse d ECG par réseaux de neurones dans le PEM D.1 Ecran de configuration du logiciel SCP-ECG processor

13 Première partie Introduction 1

14 Introduction Contexte Les maladies cardiovasculaires représentent de nos jours la principale cause de mortalité en France et en Europe [1]. Or, la majorité des décès d origine cardiaque surviennent dans la phase pré-hospitalière [2, 3, 4, 5]. Une détection précoce des différents cardiopathies permettrait d assurer une prise en charge adéquate, d améliorer la qualité de vie des patients et de réduire le coût pour la société. Il s agit là de l objectif ultime du projet européen EPI-MEDICS (Enhanced Personal Intelligent & Mobile System for Detection & Interpretation of Cardiovascular Syndromes) [6]. Ce projet, qui s inscrit dans le droit fil de ce que l on appelle aujourd hui la télémédecine citoyenne, propose la création d un système intelligent portable et utilisable par tous, le PEM (Personal ECG Monitor), pour détecter les arythmies et diagnostiquer les infarctus dès l apparition des premiers symptômes [7]. Moyennant l acquisition d un électrocardiogramme (ECG) par l utilisateur (citoyen/patient), le PEM a pour vocation de stratifier le risque de la survenue d un évènement cardiovasculaire (arythmie, ischémie), de générer différents niveaux d alarmes et de transmettre les données stockées dans le PEM aux professionnels de santé ou aux structures d urgence concernés. Pour atteindre ces objectifs, il est nécessaire de résoudre une variété de problèmes liés aux cycles de fonctionnement du système : de l acquisition et l enregistrement de l ECG à l interprétation des données recueillies, jusqu à l émission et la gestion des alarmes. Cela impose de concevoir des solutions innovantes à ces problèmes très particuliers liés à la télémédecine citoyenne et de développer une plateforme logicielle pervasive basée en grande partie sur des composants embarqués dans le PEM. Parmi les différentes problématiques à résoudre, la plus importante et sans doute la plus difficile est de rendre le système de décision auto adaptatif en fonction de la spécificité du patient et auto-améliorant en fonction des éventuelles fausses alarmes ou détections manquées. Les méthodes à mettre en œuvre relèvent des domaines de l intelligence artificielle et de l aide à la décision (fusion des données, logique floue, approche neuronale, etc.). Partant d une première solution consistant à interpréter les ECG standards à 12

15 3 dérivations (ECG 12D) au moyen de comités de réseaux de neurones, nous chercherons à améliorer l intelligence du système en stratifiant le risque de survenue d un évènement cardiovasculaire en combinant l interprétation de l ECG avec l historique clinique du patient. Il s agit en l occurrence d un problème d aide au diagnostic consistant à mettre en œuvre des algorithmes (réseaux de neurones, réseaux bayésiens... ) résolvant un problème de classement tenant compte de l incertitude sur la situation réelle de l objet étudié. Considérant qu il n existe pas d ultime méthode, nous essayerons de tirer profit des points forts de chacune des méthodes d aide à la décision existantes en proposant un modèle hybride, multi-experts, multi-modules formé d une combinaison de classifieurs et de méthodes de classement pour interpréter l ECG du patient, tout en tenant compte des facteurs de risque (antécédents cardiaques, cholestérol, tabagisme... ) propres à l utilisateur concerné afin de déclencher l alarme la plus appropriée. Une deuxième problématique est de permettre l enregistrement de l ECG par l utilisateur avec le minimum d assistance professionnelle, et de rendre cet ECG accessible, sous un format compréhensible et interprétable, aux professionnels de santé (cardiologue, médecin traitant). Il est donc impératif de proposer l utilisation d un système d enregistrement simplifié permettant de recueillir l essentiel de l information spatio-temporelle contenue dans l ECG 12-D avec un nombre minimum d électrodes faciles à placer par le patient lui-même. La solution proposée par le projet EPI-MEDICS est d enregistrer un ECG PEM simplifié consistant en 3 dérivations pseudo-orthogonales (DI, DII, V2) formant un sous-ensemble de l ECG standard à 12 dérivations, ramenant ainsi le nombre d électrodes actives nécessaires à l enregistrement de l ECG PEM de 9 à 4. Encore fautil, pour une bonne acceptabilité de l approche EPI-MEDICS par les professionnels de santé, proposer des moyens permettant de transformer l ECG PEM en ECG 12-D, seule forme d électrocardiogramme que les cardiologues ont l habitude d interpréter avec une très grande précision. Les méthodes habituellement utilisées pour synthétiser un ECG standard 12-D à partir d un nombre réduit d électrodes reposent sur des techniques de régression linéaire multiple. Nous proposons dans ce mémoire une méthode de reconstruction non-linéaire originale basée sur l utilisation de réseaux de neurones que nous validerons sur plusieurs bases de données ECG sérielles que nous avons sélectionné pour être le plus représentatives possible du type de populations d études concernées par une utilisation future du PEM. Notre validation sera réalisée tant en termes de contenu informationnel vis à vis de la capacité de détecter un infarctus qu en termes de qualité de la reconstruction des différents échantillons des signaux manquants. Enfin, nous terminons ce mémoire en proposant une architecture de déploiement de la plateforme décisionnelle du PEM dans le contexte des systèmes d information et de communication pervasifs intégrant des serveurs web applicatifs et des grilles de calcul. Le chapitre 1 est consacré à la présentation du contexte médical de nos recherches : les maladies cardiovasculaires, et en particulier l évocation des causes, des effets et conséquences de l infarctus du myocarde. De même, nous faisons le point sur les différents moyens de prévention (facteurs de risque) et de diagnostic (ECG) de l infarctus du myocarde. Ensuite, nous présentons le contexte applicatif de la thèse, à savoir la télémédecine citoyenne

16 4 et le projet européen EPI-MEDICS, tout en mettant l accent sur le produit phare du projet : le PEM. Enfin, nous abordons la discipline d aide à la décision en médecine et les principales techniques d intelligence artificielle utilisées en informatique médicale pour diagnostiquer une pathologie à partir d indicateurs prélevés sur le patient (ECG... ). Le chapitre 2 présente la plateforme d aide à la décision que nous avons développée pour diagnostiquer l infarctus du myocarde. La réalisation de cette plateforme est basée sur une approche multi-modules, multi-experts utilisant des méthodes de classement du domaine de l intelligence artificielle. Elle permet d établir une probabilité de la survenue de l évènement cardiovasculaire à partir de : L interprétation de l ECG PEM : Cette interprétation est effectuée à l aide de comités de réseaux de neurones artificiels sur les ECG enregistrés par l utilisateur lui-même. La stratification des facteurs de risque : il s agit d estimer le taux de risque de la survenue d un événement cardiovasculaire en s appuyant sur les facteurs de risque, les données cliniques, etc. préalablement stockés dans le dossier médical de l utilisateur du PEM. Nous proposons une solution à base de réseaux bayésiens. Enfin, pour combiner l interprétation de l ECG avec le résultat de la stratification des facteurs de risque, nous proposons un modèle décisionnel global incorporant les modules bayésien et neuronal qui collaborent par l intermédiaire d un système de règles de logique floue. Le chapitre 3 est dévolu à la présentation de solutions permettant la reconstruction de l ECG standard 12D à partir de l ECG PEM 3D enregistré par l utilisateur du PEM. L objectif est de permettre non seulement une détection précise de l ischémie, mais également une reproduction la plus fidèle possible des caractéristiques enregistrées par l ECG 12D standard si ce dernier était enregistré simultanément avec l ECG 3D du PEM. Nous proposons deux approches : l une générique visant à construire un module de synthèse applicable à tout patient, l autre spécifique à chaque patient, et des solutions à base de comités de réseaux de neurones artificiels que nous comparerons à des solutions plus traditionnelles basées sur la synthèse au moyen de matrices de transformations linéaires obtenues par régression linéaire multiple. Enfin, le chapitre 4 est consacré à la présentation des aspects liés au déploiement et à la maintenance des modules d aide à la décision du PEM, en particulier le module neuronal d interprétation de l ECG PEM, et le module de gestion et d envoi d alarmes, ainsi que les stratégies de déploiement du module de reconstruction de l ECG par comités de réseaux de neurones.

17 Deuxième partie Aide à la décision en médecine, le projet européen EPI-MEDICS 5

18 Chapitre 1 Maladies cardiovasculaires, télémédecine et aide à la décision 1.1 Contexte médical Les maladies cardiovasculaires, notamment l infarctus du myocarde 1, comptent parmi les principales causes de maladie, d invalidité et de décès en Europe et aux États-Unis et avec le vieillissement des populations, le nombre de décès d origine cardiaque ira sans doute en croissant. Or, la majorité des décès d origine cardiaque surviennent dans la phase pré-hospitalière [2, 3, 4, 5]. Une détection précoce des premiers symptômes d une cardiopathie permettrait très probablement d assurer une meilleure prise en charge et en conséquence adéquate, d améliorer la qualité de vie des patients et de réduire le coût pour la société. Plusieurs études épidémiologiques ont en effet montré l impact potentiel en termes de mortalité et de morbidité cardiaque d une diminution de la durée entre l apparition des symptômes et la prise en charge effective des patients [2]. Quand importe plus que où [3]. Il faudrait en pratique arriver à réduire le temps séparant l apparition des symptômes et le début des traitements à moins de deux heures contre quatre en moyenne actuellement. Or comme on va le voir ci-après, le problème n est pas simple. Même les meilleurs experts se trompent parfois. Et l ischémie cardiaque peut être instable : présente au domicile du patient, elle peut avoir disparu à l arrivée au service des urgences, pour réapparaître quelques heures après quand le patient est revenu à domicile. D où l intérêt des solutions de télémédecine citoyenne telles que celles proposées par EPI-MEDICS que nous évoquons dans la dernière partie de ce chapitre. 1 L infarctus du myocarde est la conséquence d une occlusion coronaire brutale. Cela déclenche une ischémie myocardique régionale sévère qui, si elle se pérennise, engendre des lésions cellulaires irréversibles.

19 Chapitre 1. Maladies cardiovasculaires, télémédecine et aide à la décision Le diagnostic Le diagnostic de l infarctus du myocarde s appuie sur la mise en évidence de conséquences cliniques et biologiques [8, 9, 10, 11, 12]. Le diagnostic clinique Le symptôme classique de l infarctus du myocarde dans sa forme typique est la douleur thoracique. Cette douleur dure au moins 20 minutes, elle est violente, parfois insupportable. Elle irradie souvent aux membres supérieurs vers le bord cubital, la mâchoire inférieure. Elle peut également irradier vers l épigastre, mais jamais en dessous de l ombilic. L infarctus du myocarde débute presque toujours sans cause déclenchante évidente, avec un horaire d apparition prédominant dans les heures de la matinée, mais pouvant s étaler sur l ensemble des 24 heures. Il peut apparaître au cours d un effort physique, par exemple sportif ; dans ce cas l arrêt de l effort ne permet pas de le faire céder. La douleur peut être absente, la symptomatologie peut alors se limiter à des signes digestifs (nausées, vomissement, gêne épigastrique, etc.). Le diagnostic biologique Les lésions cellulaires causées par l infarctus entraînent une perte d étanchéité membranaire, voire une lyse de la membrane cellulaire. Il en résulte une libération de molécules intra-cytoplasmiques. Dès lors des enzymes myocardiques (la myoglobine, la myosine, etc.) seront retrouvées dans le sang périphérique, et peuvent y être repérées via une analyse biologique. 1.2 L électrocardiologie quantitative Le diagnostic précoce de l infarctus n est pas chose facile. Les douleurs thoraciques peuvent avoir d autres causes que l infarctus, et certains épisodes ischémiques sont silencieux, notamment en cas de diabète. Le seul élément d aide à la décision objectif et facile à mettre en œuvre en situation pré-hospitalière pour faire le diagnostic d un événement cardiaque et de sa sévérité (angine de poitrine, infarctus aigu, risque de décès, etc.) et pour guider les traitements est l électrocardiogramme (ECG) [13]. L ECG est une représentation de l activité électrique du coeur enregistrée par des électrodes placées sur la surface du corps. Les différents modes d enregistrements

20 Chapitre 1. Maladies cardiovasculaires, télémédecine et aide à la décision 8 électrocardiographiques se distinguent par le nombre et la nature des dérivations utilisées ainsi que par les éventuelles transformations linéaires qui leur sont appliquées. Les deux techniques d investigations les plus répandues actuellement sont : l ECG 12D (12 dérivations) l ECG 3D, ou le vectocardiogramme (VCG) Nous ne traitons pas le VCG dans ce rapport, car son utilisation est très peu répandue L ECG standard 12D L ECG standard comporte 12 dérivations (Figure 1.1) respectivement enregistrées dans le plan frontal et selon des directions parallèles au plan horizontal (dérivations précordiales). Les six dérivations frontales sont habituellement identifiées comme suit : DI : mesure de la différence de potentiel (DDP) bipolaire entre le bras droit et le bras gauche. DII : mesure de la DDP bipolaire entre le bras droit et la jambe gauche. DIII : mesure de la DDP bipolaire entre le bras gauche et la jambe gauche. avr : mesure du potentiel unipolaire augmenté du bras droit. avl : mesure du potentiel unipolaire augmenté du bras gauche. avf : mesure du potentiel unipolaire augmenté de la jambe gauche. DIII, avr, avl et avf peuvent être calculés à partir de DI et DII comme suit : 1. DIII = DII - DI 2. avr = -0.5(DI+DII) = 3 2 VR 3. avl = DI - 0.5DII = 3 2 VL 4. avf = DII - 0.5DI = 3 2 VF Les six dérivations précordiales sont définies comme suit : V1 mesure le potentiel unipolaire de l électrode V1 située sur le 4ème espace intercostal droit, à droite du sternum. V2 mesure le potentiel unipolaire de l électrode V2 sur le 4ème espace intercostal gauche, au bord gauche du sternum. V3 est située entre V2 et V4. V4 est située sur le 5ème espace intercostal gauche, sur la ligne médioclaviculaire. V5 est située sur le 5ème espace intercostal gauche, sur la ligne axillaire antérieure. V6 est située sur le 5ème espace intercostal gauche, sur la ligne axillaire moyenne. Les potentiels unipolaires V1-V6 et VR, VL, VF sont obtenus en mesurant la DDP entre chacune des électrodes concernées et la borne contrôle de Wilson qui est le potentiel moyen de VR, VL et VF.

21 Chapitre 1. Maladies cardiovasculaires, télémédecine et aide à la décision L ECG : les différentes ondes et les intervalles de temps L ECG est le témoin direct de différentes phases cycliques (Figure 1.1), indiquant les grandes étapes de l activation électrique du coeur : la dépolarisation des oreillettes : onde P la dépolarisation des ventricules : onde QRS la repolarisation des ventricules : onde T Les intervalles de temps généralement considérés sont, outre la durée de QRS : la durée d une dépolarisation et repolarisation ventriculaire : intervalle QT la durée d un cycle ventriculaire complet : intervalle RR la durée d un cycle atrial complet : intervalle PP L ECG, outil de détection du dysfonctionnement cardiaque De nos jours, L ECG est considéré comme un moyen fiable, non-invasif, de faible coût, et surtout de détection précoce d un nombre considérable d anomalies cardiaques (infarctus, arythmie, etc. ) qui dépasse de loin les techniques d imagerie habituelles. En plus, l apport technologique a ouvert une nouvelle ère de l exploration du champ électrique cardiaque baptisée l électrocardiologie quantitative, ou numérique. L infarctus du myocarde vu de l ECG L infarctus du myocarde commence par une réduction, voir une rupture, brutale de l approvisionnement sanguin d une région du coeur. Ensuite une série d événements est déclenchée en commençant par une ischémie sous-endocardique 2 ou transmurale, suivie de la nécrose 3, et la fibrose si l approvisionnement sanguin ne retourne pas à la normale dans un délai approprié. Les variations de l ECG reflétant cet ordre suivent habituellement un modèle bien connu selon la localisation et la gravité de l infarctus. En général, plus le nombre de dérivations détectant un infarctus est grand, plus grave est le pronostic. L évolution classique d un infarctus du myocarde vu à travers l ECG comporte les étapes suivantes (en supposant que l ECG précédant l infarctus était normal, Figure 1.2A) : augmentation de l amplitude et de la largeur de l onde T ; dans certains cas, apparition d un sus-décalage du segment ST (Figure 1.2B) sus-décalage du segment ST (ST-elevation) accompagné d une certaine variation de l onde T (Figure 1.2C) 2 L ischémie sous-endocardique se traduit, sur l électrocardiogramme, par une onde T exagérément positive 3 Dégénérescence des cellules et des tissus attribuable à un défaut de vascularisation qui empêche une irrigation sanguine normale

22 Chapitre 1. Maladies cardiovasculaires, télémédecine et aide à la décision 10 Fig. 1.1 ECG standard 12D : positionnement des électrodes, ondes et intervalles. D après the ECG learning center. http ://medlib.med.utah.edu/kw/ecg

23 Chapitre 1. Maladies cardiovasculaires, télémédecine et aide à la décision 11 apparition d une onde Q, diminution du sus-décalage du segment ST, ainsi qu une inversion de l onde T, ce qui correspond à une nécrose (Figure 1.2D) onde Q et inversion de l onde T, ce qui correspond à la fois à une nécrose et une fibrose (Figure 1.2E) onde Q et normalisation de l onde T (fibrose) (Figure 1.2F) Fig. 1.2 Evolution de l ECG au cours d un infarctus. Les Critères ESC de diagnostic de l infarctus En août 2000, la Société Européenne de Cardiologie (ESC) a publié un document consensuel répertoriant les critères à utiliser pour faire un diagnostic de l infarctus aiguë du myocarde [14]. La liste des changements observés sur l ECG indiquant une ischémie myocardique susceptible d évoluer en infarctus de myocarde est établie comme suit : Patients avec sus-décalage du segment ST 0.2 µv dans au moins 2 dérivations contiguës des dérivations V1, V2, et V3, ou 0.1 µv dans les autres dérivations.

24 Chapitre 1. Maladies cardiovasculaires, télémédecine et aide à la décision 12 Patients sans sus-décalage du segment ST mais avec une dépression du segment ST ou/et des anomalies de l onde T dans au moins 2 dérivations contiguës, en plus d une inversion symétrique de l onde T présente dans au moins 2 dérivations contiguës. L affinement régulier des critères de diagnostic de l infarctus et la découverte et la mise au point de nouveaux marqueurs biologiques, électriques... permet à chaque fois un meilleur dépistage des patients à risque d infarctus. Néanmoins, le problème n est pas complètement résolu : le nombre de faux négatifs (détections manquées) est encore significatif. En effet, dans une étude publiée en 1993, McCarthy et al [15] ont montré qu au moins 25% des patients qui avaient un infarctus du myocarde ont été renvoyés de l hôpital sans traitement à cause d une sous-estimation du sus-décalage du segment ST. De même, 80% des patients admis dans des unités de soins coronariens consécutivement à des indications suggérant un infarctus du myocarde sont renvoyés sans pouvoir confirmer un diagnostic d infarctus [16, 17] Plus récemment, en 2000, Pope et al. [18] ont étudié l incidence des facteurs liés au sexe, race, absence des caractéristiques habituelles des ischémies cardiaques... sur l incapacité de détecter une ischémie cardiaque chez des patients admis à l hôpital pour suspicion d ischémie. Sur la population d étude de plus de patients (889 patients avec un infarctus aigu et 966 patients avec une angine de poitrine instable), 2.1 % des patients avec un infarctus et 2.3 % avec une angine instable n ont pas été détectés. En plus, les patients qui avaient une ischémie cardiaque mais qui étaient : de sexe féminin de moins de 55 ans (odds ratio 4 de 6.7), non-blancs (odds ratio de 2.2), se plaignant d un souffle court (odds ratio de 2.7), ou ayant un ECG normal (odds ratio de 3.3), étaient moins susceptibles d être détectés et par la suite hospitalisés. De même, selon cette étude, les patients avec un infarctus aigu qui étaient : non-blancs (odds ratio de 4.5), ou ayant un ECG normal (odds ratio de 7.7), étaient moins susceptibles d être hospitalisés. De plus, seulement 410 des 1445 patients ayant une ischémie myocardique présentaient sur leur ECG recueilli lors de leur admission au service des urgences, les critères ECG standards de présence d une ischémie. Enfin, les études qui ont suivi [19], [20],... ont confirmé ces constatations et réaffirmé l intérêt majeur de continuer à affiner les critères de diagnostic de l infarctus. D où l intérêt du travail présenté dans ce mémoire qui vise à mettre au point un procédé intelligent de surveillance médicale à la portée du grand public permettant de détecter les patients à risque dès la survenue d un événement cardiaque, n importe où, n importe quand, à 4 un odds ratio est le rapport entre la probabilité de contracter la maladie en présence de certains facteurs ou caractéristiques et la probabilité de la contracter dans le cas contraire. Un odds ratio de 4 signifie qu une personne ayant la caractéristique à l étude est quatre fois plus susceptible d être affectée que quelqu un qui ne les présente pas, tandis qu un odds ratio de 0,5 signifie qu elle l est moitié moins.

25 Chapitre 1. Maladies cardiovasculaires, télémédecine et aide à la décision 13 domicile, au travail, ou en ambulatoire, en combinant analyse automatique d un ECG simplifié et prise en compte du contexte clinique du patient. L analyse et l interprétation automatique des ECG L avènement de l ECG numérique et le développement de l informatique ont rendu possible l analyse et l interprétation automatique des ECG. Les premiers travaux remontent au début des années 60. Mais l ECG n est devenu véritablement numérique qu avec l apparition des microprocesseurs au milieu et à la fin des années 70. Aujourd hui au moins 90% des électrocardiographes vendus aux Etats Unis ou en Europe incluent un module d analyse et d interprétation automatique des ECG. Il s agit, à notre connaissance, d une des rares applications médicales pour laquelle les systèmes experts sont sortis des laboratoires de recherche et sont utilisés en routine clinique dans des environnements différents de leur lieu d origine. Ceci n a été rendu possible que grâce à une action de recherche internationale concertée qui a duré plus de 15 ans et a permis de constituer différentes bases de données permettant de valider les algorithmes d analyse et d interprétation automatique de l ECG, l action CSE Common Standards for quantitative Electrocardiography [21]. Typiquement, un outil informatique d analyse automatique de l ECG consiste en un ensemble de modules permettant l acquisition du signal, l analyse et l interprétation du rythme, la détection d un complexe QRS type, la reconnaissance des différentes ondes, l extraction d un ensemble de paramètres destinés à caractériser le signal et son affectation à une ou plusieurs classes de diagnostic, c est à dire réalisant les différentes étapes de ce que l on appelle plus communément une reconnaissance de formes. L approche traditionnelle est principalement basée sur des descripteurs morphologiques et temporels du signal familiers aux cliniciens tels que la présence ou l absence d une onde Q, le rapport de R/S... La deuxième approche extrait des descripteurs quantitatifs au moyen d outils mathématiques tels que la transformée de Fourier, l analyse en ondelettes, etc. Ces descripteurs sont par la suite utilisés par des méthodes issues de l intelligence artificielle (analyse discriminante, réseaux de neurones, logique floue, ou des systèmes à base de règles) pour réaliser une interprétation automatique de l ECG [22]. Plusieurs dizaines de systèmes d analyse automatique de l ECG ont été développés [23], mais très peu ont été expérimentés en milieu hospitalier, dont notamment le système d analyse et d interprétation automatique des ECG/VCG connu sous le nom de Système de Lyon. Ce système permet l enregistrement d ECG 12D ou de VCG, la détermination du complexe QRS type à l aide d un algorithme de classification non hiérarchique, et réalise l interprétation automatique du contour grâce à une approche de type heuristique mettant en œuvre des logiques ternaires (algèbre de Post) [24]. Plus récemment, d autres systèmes basés sur des méthodes issues de l intelligence artificielle (logique floue, systèmes

26 Chapitre 1. Maladies cardiovasculaires, télémédecine et aide à la décision 14 experts, réseaux de neurones, etc.) ont été développés et commencent à être implantés en milieu hospitalier, en ambulatoire ou à domicile [7]. Analyse unaire vs analyse sérielle La plupart des programmes d interprétation automatique de l ECG évoqués ci-dessus réalisent ce que l on appelle une analyse unaire, c est à dire qu ils analysent un seul ECG par patient sans tenir compte des autres ECG éventuels du patient. Cependant, malgré l intérêt suscité par l analyse unaire de l ECG au cours des dernières décennies et la multitude de méthodes qui ont déjà vu le jour, la performance des programmes automatisés basés sur l analyse unaire est encore limitée. La précision diagnostique globale ne dépasse guère le chiffre de 80 % [25]. Le constat doit être tempéré par le fait que la précision diagnostique des meilleurs cardiologues lorsqu ils ont à leur disposition un seul ECG est elle même limitée à environ 82-83%. Ceci est imputable au fait que l approche unaire ne prend pas suffisamment en compte la spécificité du patient. La tendance au cours de ces dernières années fut donc de développer des systèmes d analyse dite sérielle [22, 26, 27, 28, 29] où le patient est considéré comme sa propre référence. L interprétation de l ECG concerné est alors établie en termes d évolution par rapport aux enregistrements précédents. Cette tendance vaut aussi pour l interprétation humaine. Dans un récent document consensuel de l ACC/AHA (American College of Cardiology/American Heart Association) [13], les cardiologues sont eux aussi incités à améliorer leur interprétation de l ECG en le comparant par rapport à un ECG de référence. En d autres termes, il faut tenir compte de l évolution sérielle des ECG. 1.3 La télémédecine citoyenne : le projet EPI- MEDICS Introduction L évolution technologique dans le secteur des communications est en voie de révolutionner les relations entre les individus et les collectivités. De façon plus spécifique, l avènement des nouvelles technologies de l information et des télécommunications (NTIC) permet d envisager de nouvelles façons d exercer la médecine, et d offrir des services médicaux spécialisés ou ultraspécialisés dans des environnements (à domicile, en ambulatoire, etc.) qui, jusqu à maintenant, n ont pu en bénéficier. Il s agit de la télémédecine ou médecine dite à distance. La télémédecine se définit comme étant l union des télécommunications et de la médecine [30, 31]. Elle consiste à utiliser les nouvelles technologies de l information pour [32] : effectuer des consultations à distance : téléconsultation (par exemple, transmission d ECG à un autre établissement pour avis sans nécessairement transférer le patient)

27 Chapitre 1. Maladies cardiovasculaires, télémédecine et aide à la décision 15 [33], interpréter des données médicales à distance : téléexpertise (par exemple, interrogation d un spécialiste en lui transmettant les données sur le patient pour un diagnostic complémentaire) [34, 35], ou assurer une surveillance à domicile des patients : télésurveillance (par exemple, suivi des personnes âgées à domicile [36, 37], suivi d une grossesse à risque, etc.) Evolution : passé, présent et futur La mise en œuvre d architectures de télémédecine nécessite la prise en compte des éléments suivants : des réseaux ouverts, des bases de données médicales, des moyens de représentation et d échange de données biomédicales numériques, des outils et des interfaces de communication multi-acteurs et multimédias, des algorithmes de détection immédiate d anomalies, des outils et des interfaces de représentation dynamique des données. De nombreux projets européens, dans le cadre des programmes AIM (Advanced Informatics in Medicine) et Health Telematics ont permis de réaliser des avancées significatives dans ce domaine en créant de nouveaux concepts et des standards à chaque niveau de cette architecture [38, 39, 40, 41]. Ainsi, en cardiologie, une première étape, sans doute la plus fondamentale pour l ouverture des systèmes d information médicale au bénéfice de la Santé Publique, a été la conception et l implémentation du protocole de communication standard SCP-ECG (Standard Communications Protocol for Computerized Electrocardiography) [42, 43, 44]. Ce protocole propose un standard universel pour l échange de données ECG (contenu et format des données), donne des directives pour l encodage des signaux ECG, et inclut aussi un protocole de transport approprié, le tout basé sur le modèle OSI. Une deuxième étape a été le développement d un modèle conceptuel de référence pour l archivage des données électrocardiographiques pouvant être transmises via le protocole SCP-ECG, et compatible avec toutes les options de ce dernier. Ce modèle est l un des résultats majeurs du projet ŒDIPE (Open European Data Interchange and Processing for Electrocardiography, ) [45, 46]. Mais le contexte sociétal actuel est en train de changer. Du fait du vieillissement des populations..., on s oriente de plus en plus vers des approches de type soins à domicile et de self-care et plus généralement vers la télémédecine citoyenne. La principale conséquence est une réorientation fondamentale des centres d intérêt de l informatique médicale qui ne sont plus focalisés sur les professionnels de santé mais sur les consommateurs (citoyens/patients) (Figure 1.3). Le patient devient l acteur principal du système à l instar d EPI-MEDICS où le patient enregistre ses propres ECG et documente ses propres symptômes. Cette évolution est favorisée par une utilisation de plus en plus fréquente de systèmes embarqués intelligents et communicants et la fédération de différents faits et acquis issus de la recherche : l utilisation des systèmes d information, le

28 Chapitre 1. Maladies cardiovasculaires, télémédecine et aide à la décision 16 Fig. 1.3 Le centre d intérêt de l informatique médicale traditionnelle est en train d évoluer des professionnels de santé vers les consommateurs (citoyen/patient). D après Gunther Eysenbach, Consumer health informatics, BMJ 2000.

29 Chapitre 1. Maladies cardiovasculaires, télémédecine et aide à la décision 17 développement d infrastructures de communication pervasives, mobiles et faciles à utiliser, la miniaturisation la plus importante possible des microcomposants, la baisse de leur coût et l augmentation de leurs performances, et la construction de systèmes de gestion basés sur le contexte et des interfaces naturelles et personnalisées. Un exemple type de cette évolution vers la télémédecine citoyenne est le projet EPI- MEDICS, que nous présentons brièvement ci-après EPI-MEDICS Le projet EPI-MEDICS (Enhanced Personal Intelligent & Mobile System for Detection & Interpretation of Cardiovascular Syndromes) (Figure 1.4) a deux objectifs principaux [47] : détecter, aussitôt que possible, le début d une ischémie ou d une arythmie en enregistrant les changements des ECG des patients à risque, impliquer sans délai, mais seulement si nécessaire, les structures de santé. Pour réaliser ces objectifs et en particulier pour détecter de manière précoce les dysfonctionnements cardiaques dès l apparition des premiers symptômes, à domicile ou en ambulatoire, EPI-MEDICS a développé un moniteur personnel d ECG (PEM : Personal ECG Monitor) (Figure 1.5) peu coûteux, de petite taille, intelligent et facile d utilisation, doté d un serveur embarqué et d un composant métier d analyse quantitative de l ECG. Le PEM est capable d enregistrer un ECG 3D simplifié contenant la quasi-totalité des informations spatio-temporelles produite par l activité du cœur et d envoyer via Bluetooth et GPRS ou UMTS différents types de messages ou d alarmes convoyant des ECG et un mini-dossier médical de l utilisateur aux services de santé concernés, grâce à des téléphones portables de 2ème ou 3ème génération. Le seul équipement requis pour les professionnels de santé est une connexion Internet. Tous les messages du patient aux médecins sont écrits en XML [48] et encapsulent les données des ECG suivant le standard SCP-ECG. Ce mode de fonctionnement est censé faciliter l acceptation du PEM par les professionnels de santé et devrait permettre une très large diffusion de ce concept. Le système de décision embarqué dans le PEM comporte quatre sous-ensembles : détection des arythmies 5, des ischémies 6, génération d alarmes et de leur niveau prenant si possible en considération des informations cliniques telles que les facteurs de risque du patient, gestion de l envoi des alarmes tenant compte des non-réponses éventuelles des serveurs d alarme ou des professionnels de santé contactés, etc. 5 Dérèglement dans le système de conduction électrique du coeur (rythme trop lent lorsqu il s agit de bradycardie ; ou trop rapide, on parle alors de tachycardie) pouvant entraîner des conséquences plus ou moins graves : étourdissements, nausées, vertiges, palpitations, douleurs, etc. 6 Arrêt ou insuffisance de la circulation sanguine dans une partie du corps ou un organe, qui prive les cellules d apport d oxygène et entraîne leur nécrose. Les infarctus sont consécutifs à des ischémies.

30 Chapitre 1. Maladies cardiovasculaires, télémédecine et aide à la décision 18 Fig. 1.4 Le projet EPI-MEDICS permet, grâce à un système personnel d enregistrement de l ECG, lorsqu un problème est détecté dans l ECG d un patient, et selon le niveau de gravité évalué, de prévenir le médecin du patient et/ou le service d urgence. Les données médicales sont alors disponibles sur le Web et grâce à un accès sécurisé, les professionnels de santé peuvent prendre en charge le patient et orienter correctement ses soins.

31 Chapitre 1. Maladies cardiovasculaires, télémédecine et aide à la décision 19 Fig. 1.5 Illustration d un des 70 prototypes PEM (Personal ECG Monitor) développés dans le cadre du projet EPI-MEDICS pour permettre la détection précoce des syndromes cardiaques dans un contexte de télémédecine citoyenne. La réalisation de la plateforme décisionnelle du PEM n a été rendue réalisable que grâce à l apport de différentes techniques d intelligence artificielle automatisant les processus d aide à la décision implémentés dans le PEM. Tous ne sont d ailleurs pas encore opérationnels. Seuls ont été expérimentés sur le terrain une première version des modules de détection d arythmies et d ischémie et de génération des alarmes. Leur optimisation et plus particulièrement la prise en compte des informations cliniques pour améliorer la décision constituent justement l un des principaux apports de ce mémoire. Dans la suite de ce chapitre, nous exposerons brièvement l évolution de l aide à la décision en médecine, en mettant l accent sur les systèmes d aide à la décision et en général les principales méthodes développées dans le cadre de cette discipline. Dans le chapitre 2, nous présenterons en détail les techniques que nous avons adoptées pour concevoir les modules décisionnels susceptibles d être intégrés dans la plateforme d aide à la décision du PEM : le module d interprétation de l ECG et celui de la stratification des facteurs de risque. Enfin, dans le chapitre 4, nous présenterons les aspects liés au déploiement de ces modules d aide à la décision, des modules de gestion et d envoi d alarme,... qui ont ou qui vont être installés dans le PEM.

32 Chapitre 1. Maladies cardiovasculaires, télémédecine et aide à la décision L aide à la décision en médecine Généralités La médecine est une discipline qui requiert une prise de décision. Ce processus résulte de la confrontation d un problème réel à l expérience acquise (savoir-faire) et à un corpus de connaissances théoriques (savoir) dans le but d effectuer un choix. La difficulté de la prise de décision en médecine vient de la situation d incertitude, qui tient à plusieurs raisons : l incertitude sur les connaissances : certaines connaissances sont d ordre statistique et sont associées par nature à un risque d erreur, mais d autres connaissances sont incomplètes, par défaut d exploration ; l incertitude sur les faits : la description de l état présent n est jamais parfaite, soit par manque de moyens ou de temps (urgence), soit par défaut de mesure ou mauvaise interprétation d un symptôme, d un signe ou d un résultat ; l incertitude du langage : le flou et l ambiguïté des notions manipulées perturbent le traitement et la transmission de l information Les systèmes d aide à la décision Les avancées de l informatique et plus particulièrement l avènement des systèmes d information, les bases de données, les dossiers informatisés, etc. ont facilité la prise de décision médicale en améliorant l accès aux données pertinentes. Néanmoins, il ne s agit là que d une aide indirecte facilitant l accès aux présentations des faits sur lesquels le praticien doit appliquer un raisonnement. Les systèmes d aide à la décision vont beaucoup plus loin : ils ont l ambition d assister l homme, et dans certaines situations, en particulier à domicile ou en ambulatoire, à le suppléer en remplaçant ou en reproduisant le raisonnement humain [49]. Caractéristiques Plusieurs caractéristiques permettent de décrire les systèmes d aide à la décision suivant le type de problème à résoudre, le mode d intervention, la nature de l interaction, ou enfin la technique employée. Applications Les systèmes d aide à la décision peuvent s appliquer à deux types de problèmes :

33 Chapitre 1. Maladies cardiovasculaires, télémédecine et aide à la décision 21 un problème de diagnostic (par exemple, catégoriser un ECG en normal ou suspect) dans le but de séparer ce qui est de ce qui n est pas, compte tenu de l incertitude sur la situation réelle de l objet d étude ; un problème d optimisation dans le but d indiquer la démarche la plus efficace (par exemple, une stratégie thérapeutique) compte tenu de l objectif et des contraintes (coût, risque, difficulté, environnement). Fonctionnement Plusieurs modes de fonctionnement sont possibles : le mode passif suppose l intervention explicite et directe de l utilisateur pour décrire le problème (par exemple, l état du patient) et interroger le système. le mode semi-actif correspond à un système dont le déclenchement automatique répond à une intervention humaine (par exemple, le système d alarme qui alerte sur un changement d état du patient, comme dans le cadre d EPI-MEDICS). le mode actif est celui d un système à déclenchement automatique et autonome (par exemple, un système de télésurveillance) Les principales approches utilisées pour l aide à la décision Les méthodes utilisées pour l aide au diagnostic relèvent toutes de la reconnaissance de formes. Des centaines d articles et de livres ont été écrits sur le sujet [50]. Les principales approches sont : l approche statistique, syntaxique, les systèmes à base de connaissances, les réseaux de neurones. Il n est pas dans notre objectif de présenter en détail l ensemble des méthodes développées par le passé, mais juste celles qui nous semblent les plus pertinentes dans notre contexte applicatif. On trouvera une revue de détail des différentes méthodes dans l article de synthèse de Jain et al [51] qui insistent en outre sur l importance de la phase d extraction des caractéristiques qui précède la reconnaissance de formes elle-même et montrent l intérêt de combiner plusieurs classifieurs. Approche neuronale Il s agit de méthodes inspirées des structures neuronales et du fonctionnement cérébral, d où le nom fréquent de réseau de neurones artificiels [52]. Le réseau neuronal est un programme qui met en jeu des neurones reliés entre eux par des connexions. Chaque neurone réalise la sommation des stimuli des neurones afférents, chaque connexion étant affectée d une pondération. Cette sommation obéit à différentes formes de fonctions, dites de transfert ou d activation (tout ou rien, fonction en escalier,

34 Chapitre 1. Maladies cardiovasculaires, télémédecine et aide à la décision 22 sigmoïde... ), et si le résultat dépasse un certain seuil d activation, alors le neurone envoie un stimulus aux neurones afférents. Approche statistique L approche statistique [53] concerne essentiellement les méthodes de régression ou de classement multidimensionnelles qui permettent d expliquer la valeur d une réponse ou l appartenance à un groupe en fonction des valeurs de plusieurs variables dites explicatives. Il s agit notamment de l analyse discriminante, de la régression logistique dans le cas d une réponse qualitative, de la régression multiple dans le cas d une réponse quantitative, ou du modèle de Cox dans le cas d une variable de réponse censurée (analyse de survie). Ces méthodes répondent à deux objectifs : réduire le nombre souvent considérable de variables potentiellement explicatives à un sous-ensemble d usage et obtenir d une manière plus aisée une équation prédictive. Etant probablement la méthode statistique de classement la plus utilisée, l analyse discriminante linéaire est une méthode de reconnaissance de formes statistique basée sur une technique d apprentissage supervisé, très facile à mettre en œuvre [54]. Le but est de déterminer la classe d une observation en calculant la distance de Mahalanobis entre l observation et le centre de chacune des classes et en affectant l observation à la classe pour laquelle la distance de Mahalanobis est minimale. Le modèle est établi à partir d un un ensemble d observations (ensemble d apprentissage) pour lesquelles les classes sont connues. À partir de cet ensemble d apprentissage, l analyse discriminante établit un ensemble de fonctions linéaires des facteurs prédictifs, connues sous le nom de fonctions discriminantes, du type : Y = v 1 X 1 + v 2 X v n X n + C (1.1) où les v i sont des coefficients discriminants, les x i sont les variables d entrée (les facteurs prédictifs) et le C est une constante. Ces fonctions discriminantes sont employées pour prévoir la classe d une nouvelle observation. Pour un problème de classement avec k classes, k fonctions discriminantes sont construites. Etant donnée une nouvelle observation, toutes les fonctions discriminantes sont évaluées et l observation est assignée à la classe i si la ième fonction discriminante a la valeur la plus élevée.

35 Chapitre 1. Maladies cardiovasculaires, télémédecine et aide à la décision 23 Approche probabiliste L approche probabiliste, reposant sur l application du théorème de Bayes, permet de calculer la probabilité d une maladie connaissant les signes du malade. L application sur un problème de diagnostic médical du théorème de Bayes établit que la probabilité a posteriori d un diagnostic D i, lorsque le signe S est présent, est fonction de la probabilité a priori du diagnostic et de la probabilité conditionnelle d observer le signe lorsque le diagnostic est présent : P (D i /S) = P (D i) P (S/D i ) P (S) = P (D i) P (S/D i ) ( j P (D j)p (S/D j )) (1.2) La méthode bayésienne tient compte des signes positifs et négatifs et permet de calculer le diagnostic le plus probable [55]. La détermination des probabilités a priori (incidence de la maladie) et des probabilités conditionnelles (fréquence d un signe dans une maladie) suppose l exploitation d une base de données médicales enregistrant les signes et le diagnostic de chaque cas. Approche symbolique Il s agit essentiellement des systèmes dits experts [56] qui sont des logiciels de résolution de problèmes, qui permettent de représenter sous forme explicite et déclarative les connaissances et le comportement d un expert humain, afin qu il puisse être reproduit par un programme. Les limites de cette approche tiennent aux contraintes de formulation de la connaissance (connaissance imparfaite, relations multiples, difficulté de formalisation du raisonnement, contrainte du dialogue avec l utilisateur, nécessité de consensus) Conclusion L aide à la décision est une discipline qui a suscité beaucoup d intérêt au cours des dernières décennies et énormément de méthodes ont déjà vu le jour. Cependant, aucune méthode ne s est imposée comme étant la méthode de référence et la tendance au cours de ces dernières années fut l essor des systèmes hybrides où les résultats de plusieurs méthodes d aide à la décision sont combinés. En effet, à l instar des systèmes multi-experts où la combinaison des interprétations de plusieurs experts est plus performante que celle de chacun des experts pris individuellement [25], la combinaison des résultats de plusieurs classifieurs (comités de réseaux de neurones) conduit à des résultats de meilleure qualité que ceux du meilleur classifieur (meilleur réseau de neurones du comité) [57]. De même, la combinaison des résultats de plusieurs méthodes de classement (fusion de données via des heuristiques entre un comité de réseaux de neurones et un réseau bayésien) sera probablement plus performante que n importe quelle méthode considérée individuellement

36 Chapitre 1. Maladies cardiovasculaires, télémédecine et aide à la décision 24 [58]. C est ce concept que nous allons développer dans le prochain chapitre : Aide à la décision en télécardiologie.

37 Troisième partie Conception, validation et stratégies de déploiement de la plateforme décisionnelle d EPI-MEDICS 25

38 Chapitre 2 Aide à la décision en télécardiologie 2.1 Contexte et objectifs Comme déjà indiqué dans l introduction de ce mémoire, l objectif principal d EPI- MEDICS est de permettre la détection précoce de l infarctus du myocarde dès l apparition des premiers symptômes afin de pouvoir intervenir rapidement et administrer un traitement immédiat et efficace. Dans ce contexte, l ECG, grâce à son caractère non-invasif, sa rapidité de mise en œuvre, et son faible coût reste un examen objectif de choix. Cependant, comme évoqué dans le chapitre 1, sa performance diagnostique reste limitée. Ainsi Pope et al [18] ont montré qu en pratique clinique lorsque l on applique les critères ECG classiques de diagnostic de l infarctus, au moins 25% des patients qui avaient un infarctus du myocarde ne sont pas diagnostiqués et sont renvoyés de l hôpital sans traitement. Sans doute de nouvelles méthodes de reconnaissance de forme combinées à de nouvelles méthodes de traitement du signal (analyse en ondelettes, etc.) pourront elles permettre d améliorer ces performances. Les résultats de l action CSE ont montré en effet que les meilleurs programmes d analyse automatique de l ECG sont aussi performants que les meilleurs cardiologues [25]. Mais il faut savoir aussi que la performance des cardiologues est accrue lorsqu ils connaissent le contexte du patient. En effet, de nombreuses études [59, 60, 61, 62] ont montré que l analyse de l ECG combinée avec l historique clinique et les résultats des dernières analyses médicales du patient est le meilleur moyen pour effectuer un diagnostic précoce de l infarctus du myocarde, en particulier dans un contexte d urgence ou en ambulatoire. La principale problématique est donc de pouvoir trouver la meilleure solution pour fusionner des données de nature différente (dichotomique, catégorique et continue), en provenance de sources diverses (ECG, données cliniques,... ) afin d établir un score de risque et déclencher une alarme appropriée. Or ce domaine de la fusion de données est devenu particulièrement important pour un grand nombre d applications tels que la ro-

39 Chapitre 2. Aide à la décision en télécardiologie 27 botique, l interprétation d image ou dans notre contexte, la télémédecine. De nombreuses approches ont été développées afin d assurer une combinaison optimale des données. Aussi Jeanpierre et al. [63] et Bellot et al. [64] ont développé une approche de fusion de données dans le cadre d une application de télémédecine. Il s agit du projet Diatelic qui a pour objectif d assister à domicile des personnes souffrant d insuffisance rénale à travers un recueil régulier de données auprès patient (poids, tension, température,... ) à l aide de capteurs. Ces données, hétérogènes, incertaines et bruitées sont fusionnées au sein d un réseau bayésien dynamique afin de pouvoir établir un diagnostic. Enfin, pour passer d une mesure absolue (poids du patient) à une mesure relative prenant en compte la spécificité du patient, on fait appel à des opérateurs de logique floue. Mettre au point de nouvelles méthodes de fusion de données dans le domaine de la télécardiologie impose que l on puisse disposer de bases de données encapsulant pour chaque patient à la fois des ECG, des données cliniques et son historique médical recueillis de façon synchrone. Malheureusement, il n existe pas encore de telles bases de données contenant un nombre significatif de cas. A l inverse, il existe un certain nombre de bases de données collectées sur différentes populations de patients mais comportant soit des ECG, soit des données cliniques. En l absence de bases de données synchrones bien documentées, l alternative est donc : d exploiter séparément les bases de données ECG et les bases de données cliniques, de développer séparément des modules d interprétation de l ECG et de stratification des facteurs de risque, enfin de concevoir des scénarios de collaboration entre ces différents modules. C est cette approche que nous allons développer tout au long de ce chapitre en présentant tout d abord une méthode d interprétation automatique de l ECG mettant en œuvre des comités de réseaux de neurones artificiels optimisés pour diagnostiquer les infarctus aiguës, puis une méthode visant à quantifier l importance du risque cardiovasculaire au moyen d un réseau bayésien. Enfin nous proposons un modèle de diagnostic cardiologique global combinant les résultats de l interprétation de l ECG et de l évaluation des facteurs de risque. 2.2 Interprétation automatique de l ECG Il existe de par le monde plusieurs dizaines, voire plusieurs centaines de programmes d interprétation automatique de l ECG. La plupart sont basés sur une approche heuristique ou mélangent approche heuristique et approche statistique. En effet, peu de programmes basés sur une approche statistique pure ou sur des réseaux de neurones ont reçu une acceptabilité suffisante du corps médical qui exige généralement qu un programme d interprétation automatique de l ECG justifie, en termes médicaux compréhensibles par l ensemble des professionnels de santé, les raisons de la décision. Le contexte d application d un tel module dans le cadre du projet EPI-MEDICS est

40 Chapitre 2. Aide à la décision en télécardiologie 28 tout autre car ici l on cherche avant tout à privilégier la performance de la détection d une ischémie ou d un infarctus aiguë en minimisant le nombre de faux positifs et de faux négatifs sachant que par ailleurs l on envoie l ECG au cardiologue pour qu il puisse contrôler s il le juge utile la qualité de l interprétation. Dans ce contexte, l utilisation de comités de réseaux de neurones artificiels paraît extrêmement pertinente. Les réseaux de neurones en effet constituent un paradigme informatique de reconnaissance de formes qui s est avéré très prometteur pour résoudre des applications de médecine en général [65] et plus particulièrement le diagnostic de l infarctus. De nombreuses études ont démontré la qualité de l interprétation automatique de l ECG par réseaux de neurones dans le cadre d un scénario de diagnostic de l infarctus du myocarde. Parmi ces études, il convient de citer plus particulièrement Baxt [66] et Harrison et al. [67] qui ont utilisé l historique médical du patient ainsi que des données d ECG et des données cliniques comme entrées du réseau de neurones. Des études plus récentes [68, 69] ont utilisé les réseaux de neurones dans le but de faire un outil d aide à la décision dédié aux services d urgence. Utilisant uniquement l ECG 12D comme données d entrée au réseau de neurones, Hedén et al. [70] pouvaient détecter l infarctus avec un taux de réussite égal voire meilleur qu à celui d un cardiologue expérimenté. Une autre étude [22] a montré l intérêt d utiliser des paramètres sériels de l ECG pour diagnostiquer l infarctus. Dans le reste de cette section, nous allons présenter les réseaux de neurones, les mécanismes d apprentissage ainsi que les techniques d optimisation, en particulier l approche multi-expert par des comités de réseaux de neurones. Ensuite, nous allons présenter les méthodes statistiques utilisées comme témoin de comparaison avec les réseaux de neurones : l analyse discriminante. Enfin, nous présentons les évaluations effectuées sur une base de données ECG, la base de données de Lund, par rapport à l analyse discriminante et deux experts humains : un cardiologue expérimenté et un médecin interne Les réseaux de neurones Définition Les réseaux de neurones artificiels sont des modèles de calcul dont la conception est très schématiquement inspirée du fonctionnement cérébral et des structures neuronales. Ils sont généralement optimisés par des méthodes d apprentissage de type statistique qui leur permettent de prendre des décisions s appuyant davantage sur la perception que sur le raisonnement logique formel [71]. Couches, connexions et fonctions d activation Un réseau de neurones est ainsi constitué de neurones connectés par des liaisons qui permettent à chaque neurone d envoyer et recevoir des signaux en provenance des neurones

41 Chapitre 2. Aide à la décision en télécardiologie 29 qui le précèdent. Chacune de ces connexions reçoit une pondération qui détermine son impact sur les neurones qu elle connecte. Chaque neurone dispose ainsi d une entrée, qui lui permet de recevoir de l information d autres neurones, mais aussi d une fonction d activation, qui est dans les cas les plus simples, une simple fonction identité du résultat obtenu par l entrée, et enfin une sortie (Figure 2.1). Fig. 2.1 Fonctionnement des neurones : chaque neurone m additionne les valeurs de ses entrées (n 1, n 2, n 3 ) multipliées par des poids (W 1, W 2, W 3 ), passe le résultat dans une fonction d activation, et le renvoie aux neurones qui le suivent. Le choix d une fonction d activation se révèle être un élément constitutif important des réseaux de neurones. Le plus souvent des fonctions non linéaires seront nécessaires. Les fonctions couramment utilisées comme fonctions d activation sont (Figure 2.2) : La fonction logistique : Y = F (X) = La fonction tangente hyperbolique : Les fonctions à seuil telles que : Y = 1 (1 + e ( dx) ) (2.1) 2 (1 + e ( 2X) ) 1 (2.2) Y = [ 0 si X < 0 1 si X > 0 (2.3) Types de réseaux Les réseaux de neurones ont suscité beaucoup d intérêt au cours des dernières décennies et énormément de variantes ont déjà vu le jour : les perceptrons multi-couches [72], les réseaux de Kohonen [73, 74], les réseaux de Hopfield [75], etc. Les perceptrons multi-couches L exemple de réseau de neurones le plus utilisé reste le perceptron multi-couches (Figure 2.3). Dans un perceptron, les neurones sont organisés suivant une couche d entrée, une couche de sortie, et une ou plusieurs couches cachées qui assurent la connexion entre l entrée et la sortie du réseau :

42 Chapitre 2. Aide à la décision en télécardiologie 30 (a) La fonction logistique. (b) La fonction tangente hyperbolique. (c) La fonction à seuil. Fig. 2.2 Exemples de fonctions d activation. La couche d entrée reçoit les données sources que l on veut utiliser pour l analyse. Dans le cas de l aide au diagnostic médical, cette couche recevra les symptômes. Sa taille est donc directement déterminée par le nombre de variables d entrées. La couche de sortie donne le résultat obtenu. Dans le cas de l aide au diagnostic médical, cette couche donne le diagnostic sous forme d une probabilité entre 0 (sujet sain), et 1 (diagnostic confirmé). Sa taille est directement déterminée par le nombre de variables (ou diagnostic) qu on veut en sortie. La couche intermédiaire est dite cachée dans le sens qu elle n a qu une utilité intrinsèque pour le réseau de neurones et n a pas de contact direct avec l extérieur. Le principe de fonctionnement est le suivant : nous disposons initialement d une base de connaissances constituée de couples de données entrées / sorties (symptômes, signes cliniques / pathologie) et nous souhaitons utiliser cette base de données pour configurer et entraîner le réseau de neurones, grâce à un algorithme informatique, à reproduire les associations constatées entre les entrées et les sorties de la base de connaissances. Les fonctions d activation de la couche cachée sont en général non linéaires mais il n y a pas de règle à respecter. Le choix du nombre de couches cachées et de leur taille n est pas implicite et doit être ajusté. En général, plusieurs tests sont nécessaires. On commence par exemple par prendre une moyenne du nombre de neurones des couches d entrée et de sortie, mais ce n est pas toujours le meilleur choix. Il est donc souvent nécessaire, pour obtenir de bons résultats, d essayer le plus de tailles possibles.

43 Chapitre 2. Aide à la décision en télécardiologie 31 Fig. 2.3 Illustration d un réseau de neurones de type perceptron multi-couches. Les étapes de conception d un réseau de neurones Choix et préparation des échantillons Le processus d élaboration d un réseau de neurones commence par le choix et la préparation des échantillons de données. En général une partie de l ensemble de données est simplement écarté de l échantillon d apprentissage et conservé pour les tests hors échantillon afin de vérifier la capacité de généralisation du réseau. Elaboration de la structure du réseau La structure du réseau dépend étroitement du type de réseau : un perceptron standard, un réseau de Hopfield, un réseau de Kohonen, etc. Ensuite en fonction du type choisi, l élaboration de la structure du réseau peut varier : dans le cas du perceptron, il faudra aussi déterminer le nombre de neurones dans la couche cachée. Apprentissage L apprentissage consiste à calculer les pondérations optimales des différentes liaisons du réseau de neurones, en utilisant un échantillon de données (par exemple une base de données ECG, où les paramètres de l ECG alimentent l entrée du réseau et le diagnostic médecin de l ECG sert comme vérité clinique et sera comparé par rapport à la sortie du réseau). L apprentissage peut se faire de différentes manières : Le mode supervisé : dans ce type d apprentissage, le réseau s adapte par comparaison entre le résultat qu il a calculé, en fonction des entrées fournies, et la réponse attendue en sortie. Ainsi, le réseau va se modifier jusqu à ce qu il trouve la bonne sortie, c est-à-dire celle attendue, correspondant à une entrée donnée. Le mode non-supervisé : Dans ce cas, l apprentissage travaille sur un ensemble de données sans information préalable sur le nombre de classes et sur la classe des échantillons. Il est généralement basé sur des probabilités. Le réseau va se modifier en fonction des régularités statistiques de l entrée et établir des catégories, en attribuant et en optimisant un critère d appartenance aux catégories identifiées par

44 Chapitre 2. Aide à la décision en télécardiologie 32 l apprentissage. Par la suite, dans le cadre de notre application, du fait que nous disposons de la vérité sur la sortie du réseau, nous nous intéresserons surtout à l apprentissage supervisé que nous allons détailler ci-après. Apprentissage par rétropropagation La méthode d apprentissage supervisé la plus utilisée est la rétropropagation [76]. Le principe de la rétropropagation consiste à alimenter le réseau de neurones par les données de l ensemble d apprentissage, et en fonction de l erreur obtenue en sortie par rapport à la vérité (sortie de l ensemble), nous corrigeons les poids accordés aux neurones. On montre chaque exemple au réseau de neurones, puis on propage ces valeurs vers la sortie. La prédiction que l on obtient en sortie est au début erronée. On calcule la valeur de l erreur (c est à dire la différence entre les valeurs désirées et les valeurs prédites), puis on rétropropage cette erreur en remontant le réseau et en modifiant les poids proportionnellement à la contribution de chacun à l erreur totale. On répète ce mécanisme pour chaque exemple de données et tant que le taux de reclassement sur les données s améliore. Il faut bien prendre garde cependant de ne pas surentraîner un réseau de neurones en lui faisant apprendre par coeur car il deviendrait alors moins performant. Il existe diverses techniques qui permettent d éviter de tomber dans le phénomène de sur-apprentissage telles que la validation croisée (cross-validation), et l arrêt précoce (early stopping) : L arrêt précoce consiste à diviser l ensemble d apprentissage en deux sous-ensembles. Le premier sous-ensemble sert à entraîner le réseau. Le deuxième sous-ensemble, dit de validation, joue le rôle d arbitre de telle sorte que le cycle d apprentissage est répété tant que l erreur obtenue en sortie sur les données de l ensemble de validation est décroissante. La validation croisée consiste à diviser l ensemble d apprentissage en N (par exemple 5) sous-ensembles égaux et disjoints. L apprentissage est ensuite effectué sur les N 1 sous-ensembles et l erreur (e i ) est calculée sur le sous-ensemble restant, servant de validation. La procédure est répétée N fois, en choisissant à chaque fois un sous-ensemble de validation différent. Enfin, un taux d erreur moyen (E) est calculé et l apprentissage est refait en utilisant cette fois la totalité de l ensemble de données avec comme condition d arrêt l erreur moyenne (E) calculée lors de l étape précédente (tableau 2.1) Techniques d optimisation Les réseaux de neurones, dans leur structure même, permettent de nombreuses améliorations : choix du nombre de couches cachées, du nombre de neurones dans les couches cachées, du type de fonctions d activation, etc. Mais la technique la plus pertinente semble être la combinaison de différents classifieurs pour former ce que dans la

45 Chapitre 2. Aide à la décision en télécardiologie 33 Tab. 2.1 Exemple de validation croisée pour N=5. L ensemble des données d apprentissage est divisé en 5 sous-ensembles : s1, s2, s3, s4, et s5. L apprentissage est ensuite effectué sur les N 1 sous-ensembles s2 à S5 et l erreur est calculée sur le sous-ensemble restant s1, servant de validation. Cette opération est réitérée quatre fois en choisissant chaque fois un ensemble de validation différent. Enfin, un taux d erreur moyen est calculé et l apprentissage est refait en utilisant la totalité de l ensemble de données. Série d apprentissage s2 s3 s4 s5 s1 s3 s4 s5 s1 s2 s4 s5 s1 s2 s3 s5 s1 s2 s3 s4 Validation s1 s2 s3 s4 s5 littérature on qualifie de comités ou ensembles de réseaux de neurones. L objectif est d améliorer la capacité de généralisation en combinant plusieurs réseaux individuels entraînés à effectuer la même tâche, ce qui produit une performance largement supérieure à celle obtenue par chaque réseau individuel. L intérêt et l efficacité de l approche ensembliste pour améliorer la performance des réseaux de neurones ont déjà été justifiés à la fois théoriquement [77, 78] et empiriquement [79]. La création d un comité de réseaux de neurones est souvent divisée en deux étapes [80]. La première est la création des réseaux individuels composants le comité et la seconde est la combinaison appropriée de ces réseaux pour produire la sortie du comité. La façon et l impact de combiner les sorties individuelles ont été étudié dans [78]. Dans cet article, on a montré que l erreur quadratique réalisée par le comité, lorsqu il s agit de réaliser une prédiction unique, est égale à l erreur quadratique moyenne des réseaux individuels diminuée de la diversité, définie comme étant la variance des sorties des réseaux individuels. C est la raison pour laquelle, pour réduire l erreur sur le comité, il faut augmenter la diversité, sans trop augmenter les erreurs des réseaux individuels. La méthode la plus simple pour créer des comités de réseaux de neurones est d entraîner, sur un même ensemble d apprentissage, une sélection de réseaux individuels choisis avec un paramétrage aléatoire initial des poids. Comme l initialisation des poids est faite aléatoirement au début, les réseaux évoluent différemment dans la phase d apprentissage et donnent donc des résultats sensiblement différents. Une approche plus élaborée consiste à entraîner chacun des réseaux du comité sur un sous-ensemble différent de l ensemble d apprentissage initial. Les variantes de cette approche sont diverses. Dans la technique du Bagging [81], chaque sous-ensemble d apprentissage est tiré uniformément, avec remise, de l ensemble initial. La prédiction finale est basée sur la sortie des divers réseaux du comité : moyenne des sorties, vote majoritaire des classifieurs, etc. Le Boosting [82] utilise aussi le tirage avec remise, mais les échantillons sont construits de façon à favoriser le tirage des exemples considérés comme difficiles à classer par le réseau précédent. La prédiction fi-

46 Chapitre 2. Aide à la décision en télécardiologie 34 nale est une combinaison (vote pondéré) des diverses prédictions. Une troisième approche consiste à réaliser une sélection ciblée (à la place d une simple sélection aléatoire) du paramétrage initial des poids des réseaux [83, 84, 85] Enfin, les performances des réseaux de neurones peuvent être améliorées an appliquant un pré-traitement des données, tels que l analyse en composantes principales (ACP). L ACP sur les données en entrée du réseau permet en effet de ne garder que les caractéristiques importantes des données de départ et se concrétise en général par un apprentissage plus efficace du réseau de neurones [22, 86] Conception, réalisation et évaluation du module d interprétation de l ECG par réseaux de neurones Développer une nouvelle méthode de reconnaissance de formes et en particulier un nouveau module d interprétation automatique de l ECG nécessite de pouvoir disposer d un ensemble d apprentissage et de test conséquent et de s assurer de la qualité et de la robustesse des algorithmes développés en effectuant des évaluations rigoureuses par comparaison par rapport aux experts humains. Grâce aux coopérations instaurées par le projet EPI-MEDICS, nous avons eu la chance de pouvoir accéder à une base de données ECG sérielles constituée par l équipe du Professeur Edenbrandt de l Université de Lund en Suède, dont la caractéristique majeure est d avoir été collectée dans différents services d urgence cardiologique des Hôpitaux de Lund dans le but de constituer une base de données de référence pour la mise au point de systèmes d aide à la décision pour la détection de l infarctus aiguë. Bien que les ECG aient été collectés à un stade d évolution de l ischémie qui est bien postérieur à celui survenant en ambulatoire ou au domicile des patients, nous pensons néanmoins que la base de données de Lund est une base de données majeure, non pas pour optimiser les processus de décision qui seront utilisés dans le PEM et qui de toutes façons devront être spécifiques aux patients, mais au moins pour valider les concepts et l architecture des réseaux de neurones qui nous allons présenter dans la suite de ce chapitre, juste après une brève description de la base de données de Lund. Ensembles d apprentissage et de test La base de données de Lund est composée d ECG enregistrés sur des patients qui se sont présentés au service des urgences de l Hôpital Universitaire de Lund (Suède) entre janvier 1990 et Juin 1997 [22]. Chaque ECG a été classé dans l une des deux catégories suivantes : 1. AMI (Acute Myocardial Infarction), si l ECG enregistré provenait d un patient pour lequel le diagnostic d infarctus a été confirmé lors de sa sortie de l unité des soins

47 Chapitre 2. Aide à la décision en télécardiologie 35 coronariens avec un diagnostic d infarctus. 2. Contrôle, si l ECG enregistré provenait d un patient pour lequel le diagnostic confirmé était un diagnostic autre que AMI. Pour chaque ECG enregistré, un ECG précédent du même patient a été sélectionné dans la base de données de l hôpital. Les ECG de la catégorie AMI et leurs prédécesseurs ont été regroupés dans le groupe AMI et les paires correspondant à la catégorie contrôle ont été assignées au groupe de contrôle. Le diagnostic d AMI a été établi si au moins 2 des 3 critères suivants ont été confirmés : une douleur thoracique caractéristique durant au moins 20 min, un niveau élevé de créatine kinase (CK), ou des changements électocardiographiques sériels caractéristiques. Des valeurs de créatine kinase-mb > 0.23 mkat/l ainsi qu une augmentation et une diminution typiques ont été utilisés pour diagnostiquer l AMI. Les marqueurs électrocardiographique de l AMI sont : une apparition d une onde Q dans au moins 2 dérivations contiguës et/ou une inversion de l onde T présente dans au moins 2 dérivations contiguës après un susdécalage du segment ST dans ces dérivations. Enfin, un cardiologue expérimenté a validé chaque diagnostic. Les ECG ont été recueillis par un électrocardiographe 12 dérivations et échantillonnés à une fréquence de 1000 Herz. Pour chaque ECG, on dispose d un complexe médian P- QRS-T d une durée de 1 sec représentatif de l enregistrement de 10 sec d origine. La population d étude consiste en un total de 4691 paires d ECG. Le groupe final d AMI est composé de 902 paires d ECG (546 hommes et 356 femmes, âge : m ± σ = 74 ± 11 ans) et le groupe final de contrôle de 3789 paires d ECG (1954 hommes et 1835 femmes, âge : m ± σ = 70 ± 15 ans). Interprétation des ECG par des experts humains Chaque ECG d urgence de la base de données de Lund a été interprété de manière indépendante par un cardiologue expérimenté et par un médecin interne, d abord en ne tenant compte que du seul ECG enregistré dans le service d urgence, puis en tenant compte de l ECG de référence. Les ECG ont été classés dans les catégories suivantes : 1. D1 : Infarctus confirmé. 2. D2 : Infarctus probable. 3. D3 : Infarctus peu probable. 4. D4 : pas d infarctus. Ces diagnostics ont été établis en n ayant aucune autre information à leur disposition que les ECG et les dates d acquisition des deux ECG (analyse sérielle).

48 Chapitre 2. Aide à la décision en télécardiologie 36 Méthodes En situation d urgence et également dans le cadre de l utilisation du PEM, deux situations peuvent se produire. Soit l on dispose d un ECG de référence : dans ce cas il vaut mieux réaliser une analyse sérielle. Soit l on ne dispose pas d un ECG de référence car inexistant ou l on n arrive pas à le retrouver faute d un système d information performant : dans ce cas il faudra se contenter d un programme d analyse unaire. C est exactement cette démarche que nous avons suivie en développant deux versions du programme d interprétation automatique des ECG toutes les deux basées sur des comités de réseaux de neurones de type perceptron multicouches (PMC), l un de type unaire que nous tenterons sur les enregistrements effectués en urgence, l autre de type sérielle prenant en compte les paramètres de l ECG référence pour établir le diagnostic des ECG enregistrés en urgence. La première étape a été de constituer deux ensembles d apprentissage et de test indépendants. L ensemble de test a été formé en tirant 988 cas au hasard sur la totalité de la base de données de Lund (199 cas d AMI et 789 cas de contrôle). L ensemble d apprentissage est composé du reste des 3703 cas (soit 703 cas d AMI et 3000 cas de contrôle). La deuxième étape vise à réduire la quantité de données. En effet, un programme d analyse automatique des ECG calcule en moyenne 500 à 1000 descripteurs. Dans notre cas nous disposons pour chaque enregistrement : ECG de référence et ECG d urgence, de (11 12)= 132 paramètres choisis pour leur pertinence eu égard à la détection des AMI [8]. Ils correspondant à 11 mesures caractéristiques des ondes QRS et T sur chacune des 12 dérivations : durée de QRS ; aire de QRS ; amplitudes de Q, R, et S ; et 6 mesures de ST-T : (amplitude de ST-J, pente de ST, amplitude de ST 2/8, amplitude de ST 3/8, amplitude de T positive et amplitude de T négative). Pour l ensemble des ECG d urgence, nous effectuons une analyse en composantes principales (ACP), afin de réduire le nombre de variables. A l issue de l ACP, 16 variables sont conservées : elles correspondent à la durée de QRS, l aire de QRS, les amplitudes des ondes Q, R et S, les amplitudes de ST et la durée de l onde T. Ces 16 variables constitueront notre premier jeu de données et seront utilisées pour l analyse unaire. Pour permettre l analyse sérielle, une nouvelle analyse en composantes principales est effectuée sur la différence entre les 132 paramètres des ECG courants et ceux des ECG de référence. 16 nouveaux paramètres correspondant à l évolution de la durée de QRS, l aire de QRS, les amplitudes des ondes Q, R et S, les amplitudes de ST et la durée de l onde T entre ECG courants et ECG de référence, sont extraits, et, ajoutés aux 16 paramètres décrits ci-dessus, les 32 paramètres formeront le deuxième jeu de données. Ces deux jeux de données sont ensuite utilisés pour configurer deux comités de réseaux de neurones : le premier pour les paramètres unaires et le deuxième pour les paramètres sériels. Les performances obtenues par les deux comités de réseaux de neurones sont enfin comparés par rapport aux résultats d une analyse discriminante effectuée en utilisant les

49 Chapitre 2. Aide à la décision en télécardiologie 37 mêmes ensembles d apprentissage et de test que pour les réseaux de neurones et ceux obtenus par l interprétation réalisée par deux experts : un cardiologue expérimenté et un médecin interne. Enfin, pour réaliser notre modèle de réseaux de neurones, ainsi que tous les tests d évaluation, nous avons utilisé Matlab TM et sa boîte à outils réseaux de neurones. L analyse discriminante a été réalisée avec le logiciel XLSTAT TM. Réalisation du modèle de réseaux de neurones Plusieurs paramètres sont à déterminer au niveau de l architecture des réseaux : nombre de neurones sur la couche cachée, fonctions d activation pour le passage d une couche à l autre, algorithme utilisé en apprentissage, etc. Choix de l algorithme d apprentissage Pour les perceptrons multicouches (PMC), Matlab dispose de la version basique de l algorithme de rétropropagation, mais également d une variété d algorithmes d apprentissage basés sur le principe de rétropropagation qui varient en coût de calcul et vitesse de convergence : les algorithmes de la famille quasi-newton, ceux basés sur la descente du gradient conjugué, etc. Certains de ces algorithmes sont adaptés à des tâches de classement alors que d autres sont plus performants dans l approximation de fonctions. Parmi ces algorithmes, la méthode de Levenberg-Marquardt [87, 88] est devenue un standard pour l optimisation de l erreur quadratique à cause de ses propriétés de convergence rapide et de robustesse. De même, Levenberg-Marquardt est un algorithme très puissant d optimisation non-linéaire ce qui l a fait adopter pour de nombreuses tâches de classement dans divers domaines [89, 90, 91, 92]. Pour notre application, nous avons donc décidé d utiliser l algorithme de Levenberg- Marquardt. Enfin, pour éviter le sur-apprentissage, nous avons utilisé la méthode d arrêt précoce (early stopping), déjà décrite dans la section Choix des fonctions d activation Le choix de la rétro-propagation pour l apprentissage du réseau impose des fonctions dérivables. Les fonctions sigmoïdes comme la fonction tangente-sigmoïde, la fonction logarithme-sigmoïde ou la fonction gaussienne sont les fonctions usuellement utilisées pour les neurones des couches cachées. Dans notre situation, nous souhaitons avoir en sortie du réseau des valeurs comprises entre 0 et 1, où un 1 correspond à la catégorie AMI et 0 signifie que le cas appartient à l ensemble de contrôle. Nous avons donc choisi d utiliser des fonctions logarithme-sigmoïde à la fois pour la couche cachée et celle de sortie. Choix de l architecture neuronale Il s agit de fixer le nombre de couches cachées ainsi que le nombre de neurones dans chaque couche. Le choix d une seule couche cachée nous a semblé être un bon compromis entre la complexité (et donc le temps de calcul)

50 Chapitre 2. Aide à la décision en télécardiologie 38 et la performance du réseau. Reste encore le problème du nombre de neurones qui la composent. Il n y a pas de règles ou de lois en la matière, et ce nombre se détermine souvent empiriquement. C est un travail long et fastidieux qui nécessite de nombreuses expérimentations. Notre objectif étant dans un premier temps d évaluer la robustesse des réseaux de neurones, nous avons utilisé la configuration utilisée dans [22], à savoir 10 neurones sur la couche cachée pour l analyse unaire (jeu de données de 16 variables) et 15 neurones pour l analyse sérielle (jeu de données de 32 variables). Le nombre de neurones en entrée sera égal au nombre de paramètres du jeu de données, et la couche de sortie sera composée d un seul neurone, indiquant si le patient fait partie de la classe des AMI ou de la classe de contrôle. Enfin, notre méthode se diffère sur plusieurs points de la méthode adoptée par Ohlson et al [22] : Un paramètrage de réseaux de neurones différents (au niveau de la fonction d activation des neurones de la couche cachée). Une différence au niveau de l apprentissage (version basique vs. la variante Levenberg-Marquardt de l algorithme de rétropropagation). Une politique différente pour éviter le surapprentissage (arrêt précoce vs. validation croisée). La figure 2.4 illustre le fonctionnement du comité de réseaux de neurones unaires/sériels. Ce comité reçoit les 16/32 paramètres unaires/sériels et établit un score de risque compris entre 0 et 1. Dans le cadre d EPI-MEDICS 4 niveaux de risque ont été défini : pas de risque : si le score de risque est compris entre 0 et risque mineur : si le score de risque est compris entre et risque moyen : si le score de risque est compris entre 0.25 et risque majeur : si le score de risque est supérieur à 0.45.

51 Chapitre 2. Aide à la décision en télécardiologie 39 Fig. 2.4 Illustration du fonctionnement du comité de réseaux de neurones unaires/sériels utilisé pour l interprétation de l ECG.

52 Chapitre 2. Aide à la décision en télécardiologie 40 Tests d évaluation - Courbes ROC Quatre situations sont habituellement issues de l évaluation d une méthode de reconnaissance de formes (comités de réseaux de neurones ou analyse discriminante) dichotomique (2 classes) sur un échantillon de test. En effet, le résultat de l affectation peut être positif ou négatif, et la pathologie est présente (vrai) ou absente (faux). Deux interprétations des résultats du classifieur sont correctes (vrai positif et vrai négatif). Deux sont fausses (faux positif et faux négatif). Ces quatre situations peuvent donc être représentées sous la forme d une matrice de confusion 2 2. Tab. 2.2 Matrice de confusion. Vérité Résultats de la machine Maladie présente Maladie absente Classement vrai positif faux positif positif a b Classement faux négatif vrai négatif négatif c d Les paramètres issus de la matrice de confusion permettent de calculer quatre ratios indicateurs de la qualité de la méthode de classement : sensibilité : pourcentage d avoir une interprétation positive quand la pathologie est présente : a / (a + c) spécificité : pourcentage d avoir une interprétation négative quand il n y a pas de pathologie : d / (b + d) ; valeur prédictive positive : pourcentage d avoir un cas présentant la pathologie quand l interprétation est positive : a / (a + b) ; valeur prédictive négative : pourcentage d avoir un cas ne présentant pas la pathologie quand l interprétation est négative : d / (c + d). La performance en % de bien classés de la méthode de classement est définie par la ratio suivant : (a+d)/(a+b+c+d). Les matrices de confusion sont obtenues en fixant un seuil de risque au delà duquel le diagnostic établi par la méthode de classement pour le cas en question est jugé comme pathologique. Pour chaque seuil, une matrice de confusion, et donc les spécificités et sensibilités associées, sont calculées. Pour chacune des deux méthodes de classement (réseaux de neurones et analyse discriminante), nous utilisons les spécificités et sensibilités associées à chaque seuil pour ensuite tracer la courbe ROC (Receiver Operator Characteristic curve) associée. Cette dernière représente la sensibilité en fonction de (1-spécificité). Elle permet de régler la capacité diagnostique des tests, en permettant au chercheur d effectuer le compromis souhaité entre spécificité et sensibilité. L aire sous la courbe ROC sert comme indicateur de

53 Chapitre 2. Aide à la décision en télécardiologie 41 la performance générale de la méthode à évaluer : plus cette aire est élevée, meilleure est la méthode (Figure 2.5). Fig. 2.5 Comparaison du pouvoir discriminant de deux méthodes de classement. Selon ces deux tracés de courbes ROC, la méthode A est meilleure que la méthode B. Résultats Evaluation de l interprétation des experts humains Les experts humains, cardiologue et médecin interne, ont classé les 988 ECG d urgence de l ensemble de test en 4 catégories (D1 : infarctus confirmé, D2 : probable, D3 : peu probable, D4 : pas d infarctus) en tenant compte dans un premier temps uniquement de l ECG d urgence (analyse unaire), puis en tenant compte de l ECG de référence (analyse sérielle). En analyse unaire, le cardiologue a classé 86 ECG dans la catégorie D1 (infarctus confirmé), 371 ECG en D2 (infarctus probable), 391 ECG en D3 (infarctus peu probable) et 140 ECG en D4 (pas d infarctus). Le médecin interne a classé à son tour 32 ECG en D1, 171 ECG en D2, 688 ECG en D3 et 97 ECG en D4. En analyse sérielle, le cardiologue a classé 80 ECG dans la catégorie D1 (infarctus confirmé), 282 ECG en D2 (infarctus probable), 483 ECG en D3 (infarctus peu probable) et 143 ECG en D4 (pas d infarctus). Le médecin interne a classé à son tour 41 ECG en D1, 174 ECG en D2, 455 ECG en D3 et 318 ECG en D4. Le tableau 2.3 illustre les résultats de l analyse unaire des deux experts par rapport à la vérité clinique. De la même façon, le tableau 2.4 illustre les résultats de l analyse sérielle des deux experts. À partir des ces résultats, nous avons calculé 3 paires de sensibilité/spécificité D1 (infarctus confirmé) contre D2+D3+D4(infarctus probable, peu probable ou pas d infarctus considéré comme contrôle) ; D1+D2 (infarctus confirmé ou probable considéré

54 Chapitre 2. Aide à la décision en télécardiologie 42 comme infarctus) contre D3+D4 (infarctus peu probable ou pas d infarctus considéré comme contrôle) ; D1+D2+D3 (Infarctus confirmé, probable ou peu probable considéré comme infarctus) contre D4 (pas d infarctus considéré comme contrôle) par analyse (unaire/sérielle), et nous avons utilisé pour construire deux courbes ROC par expert (cardiologue/interne, figures 2.8(c) et 2.8(d)). Pour l analyse unaire, le cardiologue réalise une sensibilité de 34% et une spécificité de 97% pour D1 contre D2+D3+D4 ; 83% et 63% pour D1+D2 contre D3+D4 ; 97% et 17% pour D1+D2+D3 contre D4. Le médecin interne réalise une sensibilité de 13% et une spécificité de 99% pour D1 contre D2+D3+D4 ; 50% et 86% pour D1+D2 contre D3+D4 ; 97% et 11% pour D1+D2+D3 contre D4. Pour l analyse sérielle, le cardiologue réalise une sensibilité de 34% et une spécificité de 98% pour D1 contre D2+D3+D4 ; 78% et 73% pour D1+D2 contre D3+D4 ; 96% et 17% pour D1+D2+D3 contre D4. Le médecin interne réalise une sensibilité de 15% et une spécificité de 98% pour D1 contre D2+D3+D4 ; 56% et 87% pour D1+D2 contre D3+D4 ; 92% et 38% pour D1+D2+D3 contre D4. Tab. 2.3 Résultats de l interprétation en 4 catégories (D1, D2, D3, D4) des ECG d urgence de l ensemble de test, effectuée par les deux experts, en fonction de la vérité clinique (199 cas d infarctus (AMI) et 789 cas de contrôle). Ce tableau illustre les résultats de l interprétation unaire effectuée sur les ECG d urgence sans avoir eu connaissance des ECG de référence des patients. Cardiologue D2+D3+D4 D1 D3+D4 D1+D2 D4 D1+D2+D3 Contrôles : n = Infarctus (AMI) : n = Sensibilité (%) Spécificité (%) Médecin interne D2+D3+D4 D1 D3+D4 D1+D2 D4 D1+D2+D3 Contrôles : n = Infarctus (AMI) : n = Sensibilité (%) Spécificité (%) Evaluation de l interprétation des réseaux de neurones et de l analyse discriminante Dans un deuxième temps, pour chacun des deux jeux de données : paramètres issus de l ACP sur les ECG d urgence de la base de données de Lund, utilisés pour faire de l analyse unaire.

55 Chapitre 2. Aide à la décision en télécardiologie 43 Tab. 2.4 Même résultats que dans le tableau 2.3, obtenus en prenant en compte une information supplémentaire : l ECG de référence de chaque patient (analyse sérielle) Cardiologue D2+D3+D4 D1 D3+D4 D1+D2 D4 D1+D2+D3 Contrôles : n = Infarctus (AMI) : n = Sensibilité (%) Spécificité (%) Médecin interne D2+D3+D4 D1 D3+D4 D1+D2 D4 D1+D2+D3 Contrôles : n = Infarctus (AMI) : n = Sensibilité (%) Spécificité (%) paramètres issus de l ACP sur les ECG d urgence et de référence de la base de données de Lund, utilisés pour faire de l analyse sérielle. j ai effectué l apprentissage de deux comités de réseaux de neurones et de deux modèles d analyse discriminante avec l ensemble d apprentissage de 3703 patients. L architecture des deux comités de réseaux de neurones peut être définie comme suit : Pour l analyse unaire : un comité de 50 réseaux de neurones, avec une architecture individuelle d une couche cachée de 10 neurones. Pour l analyse sérielle : un comité de 50 réseaux de neurones, avec une architecture individuelle d une couche cachée de 15 neurones. Ensuite, j ai évalué la performance des comités de réseaux de neurones et de l analyse discriminante sur les 988 paires d ECG de l ensemble de test. La sortie globale de chacun des deux comités est la moyenne des sorties individuelles des 50 réseaux sur l ensemble de test. Les aires sous les courbes ROC correspondant aux ensembles d apprentissage unaire et sériel des réseaux de neurones sont respectivement de 0.92 et Les figures 2.6 et 2.7 illustrent les courbes ROC des 50 réseaux et de la sortie globale des comités sur l ensemble de test en analyse unaire et sérielle. Les deux figures montrent clairement une amélioration sensible des performances du comité (aire sous la courbe ROC de 0.861) par rapport à chacun des réseaux individuels (meilleur réseau : aire sous la courbe ROC de 0.837), confirmant ainsi les résultats de la littérature évoqués plus haut dans la section Cette augmentation des performances est encore plus nette dans le cas de l analyse sérielle (comité : aire de 0.876, meilleur réseau : aire de 0.838). Ce qui peut être interprété comme une application du théorème

56 Chapitre 2. Aide à la décision en télécardiologie 44 central limite Sensibilité Sortie individuelle de chacun des 50 réseaux Sortie globale du comité, aire = Spécificité Fig. 2.6 Courbes ROC pour les 50 réseaux de neurones ainsi que celle du comité obtenu en analyse unaire. Enfin, les figures 2.8(a) à 2.8(d) montrent les courbes ROC de l ensemble des méthodes de diagnostic testées dans cette section : comités de réseaux de neurones, analyse discriminante, cardiologue et médecin interne, en analyse unaire et sérielle. En analyse unaire, les aires sous les courbes ROC sont respectivement de pour le comité de 50 réseaux de neurones, pour l analyse discriminante, pour le cardiologue et pour le médecin interne. En analyse sérielle les performances sont sensiblement meilleures. Le comité de réseaux de neurones affiche une aire sous la courbe ROC de 0.876, l analyse discriminante une aire de 0.787, le cardiologue une aire de et le médecin interne une aire de Ces résultats montrent la supériorité des réseaux de neurones par rapport à l analyse discriminante et l interprétation des experts humains en analyse unaire et sérielle. De même, ils démontrent l intérêt de l analyse sérielle.

57 Chapitre 2. Aide à la décision en télécardiologie Sensibilité Sortie individuelle de chacun des 50 réseaux Sortie globale du comité, aire = Spécificité Fig. 2.7 Courbes ROC pour les 50 réseaux de neurones ainsi que celle du comité obtenu en analyse sérielle Discussion Il apparaît clairement que les réseaux de neurones utilisés en comité donnent de meilleurs résultats que les méthodes statistiques (plus particulièrement ici l analyse discriminante). En effet, si l analyse discriminante donne des résultats équivalents à ceux d un réseau de neurones pris individuellement, la supériorité des réseaux de neurones provient de la combinaison de leurs résultats. On peut assimiler cette méthode à un système multi-experts. Le théorème central limite montre donc son intérêt dans de telles situations. La base de données de Lund sur laquelle nous avons travaillé n échappe pas aux problèmes inhérents aux bases de données médicales : en effet, on peut penser qu elle ne contient pas que des cas d infarctus aigus et des cas parfaitement sains. Au contraire, d autres maladies sont sans doute présentes dans les ECG, mais elles ne sont pas référencées : elles peuvent donc fausser le diagnostic du classifieur. De plus, les diagnostics d infarctus enregistrés dans la base de données ont été réalisés après confirmation ultérieure de l infarctus et à partir de données médicales autres que l enregistrement. Le diagnostic aurait pu être différent s il avait été effectué seulement à partir des ECG. Enfin, et c est bien connu, il n y a pas de vérité en médecine : des cas classés dans la catégorie de contrôle pourraient en réalité très bien faire partie de la catégorie des AMI et réciproquement. Les performances de nos classifieurs n en deviennent que plus relatives. En effet, l ECG enregistré à l admission ne représente qu un instantané (en fait 10 sec)

58 Chapitre 2. Aide à la décision en télécardiologie Paramètres unaires, aire = Paramètres sériels, aire = Spécificité Paramètres unaires, aire = Paramètres sériels, aire = Spécificité Sensibilité (a) Comités de réseaux de neurones Sensibilité (b) Analyse discriminante ECG courant, aire = ECG de référence + ECG courant, aire = Spécificité ECG courant, aire = ECG de référence + ECG courant, aire = Spécificité Sensibilité (c) Cardiologue Sensibilité (d) Médecin interne Fig. 2.8 Comparaison des courbes ROC des différentes méthodes en analyse unaire et sérielle.

59 Chapitre 2. Aide à la décision en télécardiologie 47 de la vie du patient. Une ischémie présente à cet instant peut très bien se résorber toute seule et ne pas provoquer une montée enzymatique ou au contraire, l ECG à l admission peut être tout à fait normal et un infarctus aigu peut se développer une demi heure après. En fait, il faudrait enregistrer l ECG en continu et le corréler minute par minute ou même seconde par seconde avec des explorations quantitatives de l état du myocarde telles que mesure continue des enzymes, imagerie continue par IRM... impossible à réaliser en routine clinique. Néanmoins, les résultats obtenus dans cette base de données de taille relativement importante montrent bien l importance de la variabilité inter-observateurs de l interprétation humaine, même en disposant d un tracé de référence, et de l aide au diagnostic qui doit être apportée, même à un cardiologue confirmé. Comme relaté récemment par Bates et al [93], notre étude renforce de façon significative l intérêt d utiliser les technologies de l information pour améliorer la précision diagnostique. A titre d illustration, pour une spécificité de 90%, la meilleure sensibilité de l interprétation humaine est de 52% alors que la sensibilité de notre comité de réseaux de neurones atteint 67%, d où un gain de 15%. Les perspectives d optimisation et d amélioration de notre méthode de classement par réseaux de neurones sont nombreuses : Une première piste d amélioration est liée aux réseaux de neurones : optimisation de l architecture, du paramétrage initial précédant l apprentissage, de l algorithme d apprentissage, de la combinaison des sorties individuelles des réseaux composants le comité, etc. Architecture du réseau. Il faut savoir que notre objectif était d évaluer la robustesse des réseaux de neurones. Nous avons pour cela utilisé une configuration déterminée dans [22]. Cependant, un travail d optimisation doit être fait pour déterminer l architecture la plus adaptée à ce type de problèmes, c est à dire l interprétation automatique des ECG. Dans la littérature, de nombreux travaux de recherche ont permis de développer des méthodes de reconstruction automatique de l architecture des réseaux de neurones moyennant des algorithmes génétiques [94]. Paramétrage initial pré-apprentissage. Dans notre application, nous avons choisi pour chaque réseau individuel un paramétrage initial aléatoire des poids. Si cette approche reste la plus simple et la plus souvent utilisée dans la littérature, de nouvelles stratégies privilégiant une sélection ciblée du paramétrage initial des réseaux ont commencé à prouver leur efficacité à améliorer la performance des réseaux de neurones [95, 96]. Une deuxième piste d amélioration est liée à l utilisation d informations supplémentaires, en plus de l ECG, tels que les données cliniques, l historique médical, etc. de manière à établir un diagnostic plus personnalisé et plus adapté. Cette approche est décrite dans la deuxième partie de ce chapitre.

60 Chapitre 2. Aide à la décision en télécardiologie 48 Conclusion Actuellement, de nombreux travaux de recherche tentent de développer de nouvelles approches d aide à la décision, dans le but de réaliser des systèmes intelligents qui tiennent compte de la spécificité de l utilisateur. Le cas concret sur lequel nous avons travaillé relevait du domaine de l électrocardiologie quantitative et de l interprétation automatique des ECG. Nous avons tout d abord proposé un modèle original de traitement des données, puis nous nous sommes plus particulièrement intéressés à la détection des ischémies. Les résultats obtenus montrent l intérêt de l utilisation de comités de réseaux de neurones par rapport à des méthodes statistiques (plus particulièrement l analyse discriminante). Le théorème central limite a montré sa puissance : il permet d augmenter considérablement les performances des réseaux de neurones pris individuellement. Quoiqu il en soit, il n existe certainement pas de méthode universelle pour l aide à la décision, mais il va falloir au contraire procéder par fusion de classifieurs et par fusion de données en intégrant davantage d information (données cliniques, historique médical, etc.) dans le processus décisionnel. 2.3 Quantification du risque cardiovasculaire par approche probabiliste Le système de décision embarqué dans le PEM pour la détection des ischémies est dans sa version actuelle basé sur l utilisation de comités de réseaux de neurones artificiels avec une génération d alarmes et de leur niveau prenant en considération les scores de risque évalués par les réseaux de neurones. Cependant, pour obtenir un diagnostic plus précis et plus personnalisé, nous avons envisagé une deuxième approche qui consiste à inclure dans le processus décisionnel une stratification des informations cliniques du patient telles que les facteurs de risque. Le fait d ajouter une information supplémentaire dans la décision finale devrait permettre d avoir une marge de sécurité supplémentaire. À titre d exemple, si pour un sujet sain de 45 ans sans antécédents cardiaques, le module d interprétation neuronal établit un score diagnostic qui correspond à une alarme d importance majeure, il est probable que l acquisition de l ECG PEM ne se soit pas déroulée correctement (position pendant l enregistrement, électrodes mal placées... ). Par contre, si dans la famille il y a eu des antécédents d infarctus avant 50 ans, il se pourrait que l on soit en présence d une ischémie et il faudrait demander l avis d un cardiologue et donc suggérer à l utilisateur de transmettre l ECG à son médecin traitant ou à un centre

61 Chapitre 2. Aide à la décision en télécardiologie 49 de compétences. D où l intérêt de tenir compte des facteurs de risque de la personne utilisatrice du PEM pour revoir à la hausse ou à la baisse le score de risque et l alarme associée. La figure 2.9 illustre l évolution du processus décisionnel que nous préconisons de mettre en place dans le PEM. La version actuellement embarquée dans le PEM consiste en un module neuronal qui analyse l ECG et en fonction du score de risque déclenche l alarme majeure, moyenne, mineure voire aucune alarme. La nouvelle version devrait inclure en plus du module neuronal, un module de stratification des facteurs de risque que nous allons décrire dans le reste de cette section. Ce module intervient après l interprétation de l ECG PEM, lorsque l ECG est jugé comme suspect (ce qui correspond à une alarme moyenne ou mineure) soit pour confirmer le niveau d alarme, soit le modifier en fonction des facteurs de risque du sujet. Fig. 2.9 Schéma synoptique du processus décisonnel embarqué dans le PEM : a) sa version actuelle ; b) une future version que nous proposons avec l introduction d un deuxième score de risque basé sur le dossier médical du patient.

62 Chapitre 2. Aide à la décision en télécardiologie Choix méthodologiques Pour fusionner des données quantitatives (taux de cholestérol, paramètres ECG... ) et qualitatives (historique médical du patient) dans un seul et unique procédé de décision, différentes approches existent. Approche heuristique La première approche, qui a été abordée dans le cadre d EPI-MEDICS, a consisté à concevoir un système à base de règles, sous forme d algorithmes (Figure 2.10). Ces règles ont été élaborées à partir de directives et recommandations de comités d experts de santé publique en général et de cardiologie en particulier. Fig Illustration d algorithmes de stratification du risque cardiovasculaire développés dans le cadre d EPI-MEDICS. À titre d exemple l algorithme A2 calcule pour les sujets sains la probabilité d une athérosclérose coronarienne en se basant sur la douleur thoracique en tant qu information de base. Il s agit du modèle probabiliste établi par Diamond et al [97]. Ce modèle est basé sur trois types de douleur (douleur non-angineuse, douleur typique d angine de poitrine ou douleur d angine de poitrine atypique), sur quatre classes d âge (30-39, 40-49, 50-59, 60-69) et sur le sexe. Pour chaque variable, un score est donné (tableau 2.5) et le risque d une maladie coronaire est donné en fonction du total des points. En fait ces algorithmes n ont pas vraiment été implémentés dans le PEM car même si l on sait calculer, à partir de ces règles, des facteurs (score/index) de risque, aucun expert n a été capable d indiquer concrètement comment combiner ces scores avec l interprétation des ECG pour moduler le degré d alarme.

63 Chapitre 2. Aide à la décision en télécardiologie 51 Tab. 2.5 Scores de risque en pourcentage de la survenue d une maladie coronaire en fonction de l âge, du sexe et des caractéristiques de la douleur de thoracique. D après Diamond et Forrester, N Engl J Med douleur non-angineuse douleur atypique d angine douleur typique d angine Age H F Age H F Age H F Approche probabiliste L autre approche consiste à utiliser des méthodes d intelligence artificielle pour développer des modèles de quantification du risque cardiovasculaire à partir des connaissances médicales et des bases de données cliniques. Notre objectif est d utiliser la méthode qui pallie au mieux les problèmes spécifiques posés par notre application : prendre des décisions basées sur des données incomplètes et de natures différentes et expliquer le raisonnement en fonction des résultats. C est pour ces raisons que nous avons choisi une approche probabiliste basée sur l utilisation des réseaux bayésiens pour réaliser notre module de facteurs de risque. En effet, selon le type d application, l utilisation des réseaux bayésiens peut être envisagée au même titre que celle d autres modèles : réseaux de neurones, systèmes experts, arbres de décision, etc. Les aspects suivants des réseaux bayésiens les rendent, dans de nombreux cas, préférables aux autres modèles : Acquisition des connaissances : Les réseaux bayésiens donnent la possibilité de rassembler et de fusionner des connaissances de diverses natures dans un même modèle. Représentation des connaissances : La représentation graphique d un réseau bayésien est explicite, intuitive et compréhensible par un nonspécialiste, ce qui facilite à la fois la validation du modèle, ses évolutions éventuelles et surtout son utilisation. Typiquement, un décideur est beaucoup plus enclin à s appuyer sur un modèle dont il comprend le fonctionnement qu à faire confiance à une modèle Boîte noire. Utilisation des connaissances : Un réseau bayésien est polyvalent, i.e. on peut se servir du même modèle pour évaluer, prévoir, diagnostiquer, ou optimiser des décisions, ce qui contribue à rentabiliser l effort de construction du réseau bayésien. Enfin, l intérêt de l approche des réseaux bayésiens [55] par rapport à d autres techniques d intelligence artificielle telles que les réseaux de neurones... est justifié par leur capacité à modéliser l incertitude inhérente au raisonnement médical et à prendre des décisions basées sur des données incomplètes et de natures différentes (discrète, continue) [98]. Les applications cliniques mettant en œuvre l utilisation les réseaux bayésiens sont

64 Chapitre 2. Aide à la décision en télécardiologie 52 variables : de l aide au diagnostic à l imagerie et au traitement du signal, en passant par l analyse de données, etc. [99, 100, 101, 102]. Dans le reste de cette section, nous allons présenter les réseaux bayésiens et leur mise en œuvre sur une base de données clinique : la base de données INDANA [103]. Cette base de données réunit des données médicales individuelles (âge, sexe, cholestérol... ) de patients présentant une hypertension artérielle avec un suivi sur 7 ans et l enregistrement de la survenue ou de la non survenue des événements cardiovasculaires suivants : infarctus, accident vasculaire cérébral (AVC), mort d origine cardiovasculaire. Nous entraînerons le réseau bayésien à utiliser ces données pour prédire le risque cardio-vasculaire, et nous comparerons ses performances par rapport à deux autres méthodes utilisées comme témoin : les réseaux de neurones, et l analyse discriminante Les réseaux bayésiens Les réseaux bayésiens [50] font partie de la famille des modèles graphiques qui regroupent entre autres : les modèles de Markov cachés, les filtres de Kalman, etc. Ces modèles sont le mariage entre la théorie des probabilités et celle des graphes. Dans cette section, nous allons commencer par présenter quelques principes et concepts de base des modèles graphiques. Ensuite nous allons nous focaliser sur un modèle particulier de la famille des modèles graphiques : les réseaux bayésiens en termes de structure, paramètres et inférence. Terminologie Un modèle graphique est un outil utilisé pour illustrer visuellement (théorie des graphes) et représenter de façon factorisée une distribution conjointe de probabilités sur un ensemble de variables d un problème donné (théorie des probabilités) [104]. Un graphe est composé d une série de nœuds 1, représentant les variables et événements du monde réel, connectés par des arêtes, représentant les interactions entre les nœuds, qui peuvent être orientées. Dans ce dernier cas, nous pouvons parler de graphe orienté (Directed Graph, DG). Une chaîne est une série de nœuds telle que chacun de ces nœuds est connecté à son prédécesseur via une arête. Un chemin est une chaîne telle que chaque arête est orientée dans la même direction que la chaîne. Un cycle est un chemin qui commence et se termine au même nœud. Un chemin est dit simple si et seulement si chaque nœud est visité une seule fois. Un cycle est dit simple si, et seulement si, tous ses nœuds sont uniques à l exception du nœud de départ et de celui d arrivée. Un graphe acyclique orienté (Directed Acyclic Graph : DAG) est un graphe orienté qui n a pas de cycles. 1 Dans la suite du rapport, les termes nœuds et variables seront employés de façon interchangeable

65 Chapitre 2. Aide à la décision en télécardiologie 53 Dans un DAG, une arête lie un nœud, intitulé parent, à un autre nœud, intitulé enfant. Si X 1 est le parent de X 2 et X 2 est le parent de X 3, alors X 1 est un ancêtre de X 3 et X 3 est à son tour un descendant de X 1. Une famille est formée d un nœud X et de ses parents. Une forêt est un DAG tel que chaque nœud a au plus un parent. Un arbre est une forêt où chaque nœud a un parent et un seul sauf la racine de l arbre. Une corde est une arête connectant deux nœuds non-consécutifs. Un graphe triangulé est un DAG où tous les cycles de longueur 3 ont forcément une corde. Le terme complet décrit un graphe non-orienté où chaque nœud est connecté au reste des nœuds du graphe. Un cluster est simplement un sous-groupe de nœuds dans un graphe. Une clique est le plus grand ensemble de nœuds, connectés deux à deux : il s agit d un sous-graphe complet. Généralités Un réseau bayésien est une version particulière de modèles graphiques représentée sous forme d un DAG dont les nœuds incarnent les objets et événements du monde réel. Les relations cause à effet entre les nœuds sont représentées par des arêtes orientées du nœud cause vers le nœud effet (Figure 2.11). Chaque nœud a une distribution de probabilité conditionnelle P(X i P arents(x i )) qui quantifie l effet du parent sur le nœud. Une probabilité a priori est affectée aux nœuds racines (sans parents). Fig Réseau bayésien simple La spécification probabiliste du réseau bayésien passe par la représentation d une distribution de probabilité conjointe pour tous ses nœuds. Cette distribution conjointe est défini comme le produit des distributions conditionnelles locales : P (X 1..., X n ) = N P (X i P a(x i )) (2.4) i=1 où P a(x i ) désigne l ensemble des parents du nœud X i.

66 Chapitre 2. Aide à la décision en télécardiologie 54 À partir des probabilités conditionnelles, de la structure du réseau et de la distribution de la probabilité conjointe, nous pourrons alors calculer la probabilité a posteriori qu un nœud prend tel ou tel état. La probabilité a posteriori P (X Y ) étant donnée la probabilité a priori P (X) et la probabilité conditionnelle P (Y X) de Y sachant que X est vrai (true) est donnée par la théorème de Bayes comme suit : P (X Y ) = P (Y X)P (X) P (Y ) (2.5) Pour configurer un réseau bayésien, il est nécessaire de spécifier les Distributions des Probabilités Conditionnelles (CPD) pour tous les nœuds ayant des parents et la probabilité a priori des nœuds racines. Inférence et arbre de jonction Par définition, l inférence consiste à calculer la probabilité de chaque état d un nœud dans un réseau bayésien, quand d autres nœuds sont observés. Plusieurs algorithmes ont été proposés pour réaliser l inférence. Le plus répandu est l algorithme de l arbre de jonction [105, 106, 107]. Fonctionnement L algorithme de l arbre de jonction est un processus à trois étapes : transformation, propagation et marginalisation. 1. l étape de transformation consiste à construire un arbre de jonction à partir du réseau bayésien 2. l étape de propagation, comme son nom l indique, consiste à propager le vecteur des valeurs de nœuds observés puis à réaliser l inférence sur l arbre de jonction 3. l étape de marginalisation consiste à marginaliser les variables non-observées du réseau. Nous allons illustrer la manière dont l algorithme procède en reprenant le même exemple que dans [55] : il s agit d un réseau bayésien modélisant le comportement du marché boursier (indice boursier en hausse, en baisse, voire effondré). Ce comportement est estimé par rapport au bug de l an 2000 et est sensé modéliser ses répercussions sur le secteur électrique, les réseaux de télécommunications, les transports, le service public et le secteur financier (banques) (Figure 2.12). Les rapports d influence sont indiqués à travers les liens orientés (cause à effet) entre les diverses variables du réseau. À noter qu il ne s agit que d une représentation simplifiée d un cas réel beaucoup plus complexe et dans lequel de nombreux facteurs entrent en jeu. Transformation en arbre de jonction

67 Chapitre 2. Aide à la décision en télécardiologie 55 Fig Réseau bayésien bug an Moralisation : la moralisation d un graphe consiste à connecter les parents des nœuds deux à deux et à enlever l orientation des arêtes. La moralisation de notre réseau engendre la création de 3 arêtes supplémentaires Rail-Transport aérien, Transports- Service public et Transports-Banques (Figure 2.13). Fig Même graphe que Figure 2.12 après moralisation. Triangulation : Un graphe non-orienté est triangulé si tous les cycles de plus de 3 nœuds ont une corde. La triangulation est réalisée à travers un processus d élimination 2 de nœuds comme suit : 1. pour i=1 à N (N désigne le nombre de nœuds) (a) sélectionner le nœud qui engendre l ajout d un minimum d arêtes lorsqu il est supprimé. Si nous avons le choix entre plusieurs, alors il faut choisir 2 L élimination d un nœud u dans un graphe non-orienté consiste à d abord connecter tous ses nœuds voisins deux à deux et ensuite à supprimer le nœud u et toutes les arêtes connectées à ce nœud

68 Chapitre 2. Aide à la décision en télécardiologie 56 celui qui induit le cluster ayant le plus petit poids 3 (b) connecter tous les nœuds du cluster induit par le nœud sélectionné (c) retenir le cluster induit s il n est pas un sous-ensemble d un des clusters retenus au cours des itérations précédentes (d) supprimer le nœud sélectionné du graphe 2. modifier le graphe initial en ajoutant les arêtes que nous venons de créer. La figure 2.14 présente le réseau bayésien moralisé et triangularisé. Fig Même graphe que Figure 2.12 après triangulation. Construction de l arbre de jonction : Les clusters retenus (tableau 2.6) du processus de triangulation constituent à leur tour les nœuds de l arbre de jonction. Le problème réside alors dans la manière de les connecter afin de satisfaire la définition d un arbre de jonction. Cela peut être effectué via l algorithme cité dans [55] comme suit : 1. créer n arbres, chacun contenant une seule clique. 2. pour chaque paire de cliques A et B : créer un séparateur, S AB, contenant l intersection A B 3. recommencer le processus jusqu à ce que n-1 séparateurs soient créés et insérés dans la forêt, ensuite (a) sélectionner et enlever le séparateur S AB ayant la plus grande masse 4 de la liste des séparateurs. Si deux séparateurs ont une même masse, alors il faut supprimer celui qui a le plus petit coût 5 3 La notion de poids est définie comme suit : le poids d un nœud est défini comme le nombre d états que ce nœud peut prendre le poids d un cluster est le produit des poids de ses nœuds 4 La masse d un séparateur est le nombre de variables qu il contient 5 Le coût d un séparateur S AB est le poids de A plus le poids de B

69 Chapitre 2. Aide à la décision en télécardiologie 57 Tab. 2.6 Illustration du déroulement de l algorithme de triangulation. Les clusters retenus pour l arbre de jonction sont marqués par une étoile (*). Arêtes Arêtes Cluster Etape éliminées ajoutées induit 1 Bourse - Banques, Service public, Transports, Bourse* 2 Télécom Electricité-Banques Electricité, Banques, Service public, Télécom* 3 Transport aérien Electricité-Transports Electricité, Transports, Rail, Transport aérien* 4 Rail - Electricité, Transports, Rail 5 Electricité - Service public, Banques, Transports, Electricité* 6 Transports - Banques, Service public, Transports 7 Banques - Service public, Banques 8 Service public - Service public (b) si deux cliques A et B se trouvent dans deux arbres distincts de la forêt, alors il faut les connecter en insérant S AB entre eux, ce qui signifie la fusion des deux arbres 4. l arbre final obtenu représente l arbre de jonction souhaité (Figure 2.15). Initialisation du réseau Lorsque l arbre de jonction est prêt, l étape suivante consiste à l initialiser en affectant des fonctions de potentiels 6 à ses nœuds comme suit : 1. pour chaque cluster et séparateur, initialiser le potentiel à 1 φ A 1 2. pour chaque nœud u, attribuer un cluster A contenant la famille de u (u et ses parents). Ensuite, insérer la probabilité conditionnelle P (X u X pa(u) ) dans φ A comme suit : φ A φ A.P (X u X pa(u) ) Propagation et marginalisation La marginalisation des nœuds du réseau bayésien se fait à travers un algorithme de propagation globale qui consiste à passer un message (information nouvelle) d une clique à une autre, filtré à travers les séparateurs entre ces cliques. Un passage de message (message passing) entre deux clusters A et B consiste à : 6 Un potentiel φ A sur un ensemble de variables X a est une fonction qui prend l ensemble des affectations possibles des valeurs des variables de X a et rend une valeur dans l intervalle [0, [

70 Chapitre 2. Aide à la décision en télécardiologie 58 Fig L arbre de jonction obtenu à partir du réseau bayésien avec les clusters retenus du processus de triangulation (ovales) et les séparateurs induits (carrés). passer le message du cluster A vers le séparateur S AB, ce qui implique la mise à jour du potentiel du séparateur S AB : φ S ancien φ SAB AB φ SAB Σ A SAB φ A passer le message du séparateur S AB vers le cluster B, soit : φ B φ ancien φ SAB B φ S ancien AB Introduction d observations L observation (evidence) est représentée sous forme d une fonction de vraisemblance (likelihood) d une variable X u notée λ Xu (x u ) qui est calculée comme suit : lorsque la variable X u est observée, la fonction de vraisemblance est : 1 lorsque xu est l état observé de Xu λ Xu (x u ) = { 0 dans le cas contraire (2.6) lorsque X u n est pas observé, la fonction de vraisemblance est une constante, λ Xu (x u ) 1 n, pour les n états x u de X u. Lorsqu une observation (X u = x u ) est entrée dans le réseau, la mise à jour des fonctions de vraisemblance se fait de la manière suivante :

71 Chapitre 2. Aide à la décision en télécardiologie 59 codage de l observation sous forme de fonction de vraisemblance λ nouvelle X u identification du cluster A contenant u et mise à jour de φ A et λ Xu comme suit : 1. φ A φ A λ nouvelle X u 2. λ Xu λ nouvelle X u Apprentissage des réseaux bayésiens L apprentissage d un réseau bayésien doit permettre d estimer les probabilités conditionnelles de chaque nœud du réseau à partir d un échantillon de données. Cas de données complètes Dans le cas où toutes les variables sont observées, la méthode la plus simple et la plus utilisée est l estimation statistique qui consiste à estimer la probabilité d un événement par la fréquence d apparition de l événement dans la base de données. Cette approche, appelée maximum de vraisemblance (MV), nous donne alors : P (X i = x k parent(x i ) = c j ) = θ i,j,k = N i,j,k Σ k N i,j,k (2.7) où, N i,j,k est le nombre d événements dans la base de données pour lesquels la variable X i est dans l état x k et ses parents sont dans la configuration c j. Cas de données incomplètes Dans les applications pratiques, les bases de données sont très souvent incomplètes. Certaines variables ne sont observées que partiellement ou même jamais. La méthode d estimation de paramètres avec des données incomplètes la plus couramment utilisée est fondée sur l algorithme itératif EM (Expectation - Maximisation) [108, 109]. Il s agit d une méthode générale d optimisation qui peut être appliquée dans certains cas de maximum de vraisemblance (Maximum Likelihood) d estimation des paramètres comme suit : θ = arg max P(X = x θ, M) (2.8) θ où θ est un vecteur de paramètres, X est une variable aléatoire ayant x comme valeurs observées, et M est le modèle (réseau bayésien,... ).

72 Chapitre 2. Aide à la décision en télécardiologie 60 Déroulement L algorithme E.M. est basé sur une décomposition du problème d optimisation grâce à l introduction d une variable aléatoire z dite cachée dans le modèle ce qui rend le problème d optimisation analytiquement faisable. Toutefois, au lieu d essayer de maximiser la vraisemblance des données observées P (X θ), nous allons maximiser la vraisemblance de la distribution jointe de X et Z = {z i } N 1 (N désigne le nombre de classes), P (X, Z θ). Nous allons utiliser le logarithme de cette formule, log(p (X, Z θ)). En plus, puisque nous ne pouvons pas connaître les valeurs des variables aléatoires z i, nous utilisons l espérance (expectation) de cette quantité, soit une distribution quelconque Q(Z). L algorithme E.M. consiste en deux étapes (E-step et M-step) qui seront exécutées à chaque itération comme suit : E-step Elle consiste à calculer la valeur espérée (expected value) du log-probabilité de la distribution jointe de X et Z comme suit : Q(θ, θ k ) = E Z [log(p (X, Z θ, M)) X = x, θ k ] (2.9) M-step Au cours de cette étape les paramètres θ sont mis à jour comme suit : θ k+1 = arg max Q(θ, θ k ) (2.10) θ θ k désigne la série des valeurs des paramètres obtenues à la kème itération de l algorithme. Ces deux étapes seront répétées jusqu à ce que l algorithme converge vers un maximum : tant que θ k θ k 1 ɛ Configuration du modèle probabiliste de stratification du risque cardiovasculaire L objectif est réaliser un outil de prédiction individualisée du risque cardio-vasculaire, en vue de le combiner avec le modèle de réseaux de neurones. Nous posons le problème de la prédiction du risque cardio-vasculaire comme un problème d apprentissage supervisé à partir de données de suivi de populations à risque, dans lequel l événement à prédire est représenté par deux classes, survenue ou non survenue d un événement cardiaque (infarctus, accident vasculaire cérébral, mort d origine cardiovasculaire). Pour réaliser cet objectif nous avons utilisé la base de données INDANA [103] que nous présentons rapidement ci-après. Puis nous décrivons la structure du réseau bayésien dont nous évaluons les performances en référence à un modèle neuronal et d analyse discriminante.

73 Chapitre 2. Aide à la décision en télécardiologie La base de données INDANA La base de données INDANA [103] réunit les données individuelles de 10 essais thérapeutiques randomisés et conduits pour évaluer dans le temps l efficacité de traitements anti-hypertenseurs. Les sujets faisant partie de cette base de données ont été suivis, en moyenne, sur une période de 5 ans durant laquelle toute incidence d événements de nature cardiovasculaire a été relevée : accident vasculaire cérébral, infarctus du myocarde, décès par accident vasculaire cérébral, décès par infarctus du myocarde. La survenue d un événement cardiovasculaire est codé 1, l absence d événement est codé 0 (cas contrôle). Pour chaque patient, la base de données contient, au minium, des données démographiques, médicales et cliniques enregistrées au début du suivi : âge, sexe, pression artérielle systolique et diastolique, indice de masse corporelle, etc., ainsi que les antécédents d infarctus du myocarde, d accident vasculaire cérébral, de diabète et de traitement antihypertenseur. Parmi ces variables, nous en avons retenu 13 pour leur pertinence vis à vis de la stratification du risque cardiovasculaire. Elles sont listées dans la table 2.7. Tab. 2.7 Variables retenues pour réaliser les modèles de stratification : réseau bayésien, comité de réseau de neurones et analyse discriminante. Variable Âge Pression artérielle systolique Pression artérielle diastolique Indice de masse corporelle Cholestérolémie totale Taux de glucose sanguin Sexe Hypertrophie ventriculaire gauche Antécédent d infarctus de myocarde Antécédent d accident vasculaire cérébral Antécédent de diabète Antécédent de traitement antihypertenseur Tabagisme Evénement cardiovasculaire Type continu continu continu continu continu continu discret discret discret discret discret discret discret discret Enfin, la base de données INDANA a été divisée de façon aléatoire en 2 sous-ensembles afin d obtenir un ensemble d apprentissage de cas pour la configuration du réseau bayésien et un ensemble de test de 5004 sujets pour évaluer la performance du réseau bayésien. Les mêmes ensembles d apprentissage et de test ont ensuite été utilisés pour

74 Chapitre 2. Aide à la décision en télécardiologie 62 entraîner et tester le modèle d analyse discriminante et un comité de réseaux de neurones Réalisation du réseau bayésien Un réseau bayésien est un modèle probabiliste causal. En d autres termes, les variables sont liées par un lien de cause à effet : prédécesseurs et successeurs. Pour cette raison, le choix d une structure modélisant le problème en question est crucial. Même, si des algorithmes d apprentissage de structures ont été développés, l approche manuelle reste la plus fiable et la plus souvent adoptée. La structure du réseau bayésien a été déterminée de façon manuelle en se basant sur les connaissances théoriques [9, 11, 110] et le savoir-faire des experts du domaine, notamment avec l aide du docteur Gueyffier de l Hôpital Cardiologique de Lyon. En effet une série de réunions avec le docteur Gueyffier m a permis : D abord d étudier et analyser la base de données INDANA afin d extraire les variables qui pourraient servir dans l élaboration du modèle de stratification du risque cardiovasculaire. Ensuite, de déterminer les influences en termes de liens de cause-à-effet entre les diverses variables du modèle. Enfin, de tester divers configurations de réseaux bayésiens. Ces configurations sont déterminées en fonction du nombre de variables utilisées et les liens causaux entre ces variables. A noter que nous aurions pu adopter une des diverses approches de recueil de connaissances utilisés surtout dans l élaboration des systèmes experts et des systèmes de gestion de bases de connaissances : les outils et méthodes proposés pour aider au transfert d expertise (KADS [111], KOD [112],... voire ceux permettant d apprendre de nouvelles connaissances à partir d exemples [113, 114]. Mais du fait qu il ne s agit que d un premier essai pour évaluer la faisabilité d une telle approche, à savoir les réseaux bayésiens, j ai opté pour une simple collaboration avec le cardiologue. La figure 2.16 illustre le réseau bayésien que nous avons utilisé pour stratifier les facteurs de risque. Ce réseau prend en entrée les données cliniques, démographiques, l historique médical, etc. du patient et donne une estimation du risque de la survenue d un événement cardiovasculaire. Enfin, pour créer notre modèle de réseau bayésien, nous avons utilisé le logiciel Bayesialab TM.

75 Chapitre 2. Aide à la décision en télécardiologie 63 Fig Réseau bayésien utilisé pour estimer le risque cardiovasculaire. Réalisation du comité de réseaux de neurones Notre objectif étant uniquement d évaluer la robustesse du réseau bayésien par rapport à un témoin, nous avons choisi de l évaluer par rapport à un comité de 50 réseaux de neurones que nous avons configuré comme suit : Apprentissage : l apprentissage est réalisé comme pour l interprétation des ECG en nous basant sur la méthode de Levenberg-Marquardt [87, 88]. Pour éviter le phénomène de sur-apprentissage, nous avons utilisé la méthode d arrêt précoce (early stopping), déjà décrite dans la section Fonctions d activation : comme nous voulons avoir en sortie du réseau des valeurs comprises entre 0 et 1, nous utilisons par 2 fois des fonctions logarithme-sigmoïde. Architecture neuronale : le choix d une seule couche cachée avec 10 neurones sur la couche cachée semble être un bon compromis entre la complexité (et donc le temps de calcul) et la performance du réseau (Figure 2.17). Le modèle de réseaux de neurones a été réalisé avec Matlab TM et la boite à outils réseaux de neurones de Matlab.

76 Chapitre 2. Aide à la décision en télécardiologie 64 Fig Illustration de la structure individuelle des réseaux de neurones utilisés pour estimer le risque cardiovasculaire Résultats Les trois méthodes de stratification du risque cardiovasculaire ont été évaluées sur l ensemble de test de 5004 cas extrait de la base de données INDANA en comparant les courbes ROC. L évaluation a montré une large supériorité de l approche bayésienne, avec une aire sous la courbe ROC de 0.80 contre 0.75 pour le comité de réseaux de neurones et 0.74 pour le modèle d analyse discriminante Discussion Le choix d un raisonnement probabiliste à base de réseaux bayésiens est justifié pour deux raisons : la portabilité : le modèle peut être facilement étendu à d autres maladies cardiovasculaires. Rappelons que le PEM est à la base configuré pour détecter les arythmies et l ischémie. la simplicité : Au delà de l apprentissage automatique en termes de probabilités conditionnelles et a priori des facteurs de risque, le fait qu il s agit d un modèle probabiliste graphique permet d envisager que le médecin traitant de l utilisateur du PEM puisse régler les paramètres du réseau (probabilités a priori, liens causeeffet... ) de manière à affecter d un poids plus important un facteur de risque spécifique au patient.

77 Chapitre 2. Aide à la décision en télécardiologie Conclusion Le modèle proposé n est qu un prototype qui permet d établir une prédiction individualisée du risque cardio-vasculaire chez des patients présentant une hypertension artérielle [115]. Cela signifie que pour une population plus large, d autres facteurs que le modèle n a pas pris en considération, pourraient influencer la survenue d une maladie cardiaque. De même, l impact des facteurs en termes de liens cause-effet pourrait être différent. La prochaine étape serait donc d évaluer le modèle sur d autres bases de données, voire de configurer plusieurs variantes du modèle qui seraient adaptées à une série de profils types de l utilisateur du PEM. 2.4 Vers un modèle multi-classifieurs multi-modules du diagnostic de l infarctus : Interaction du module neuronal et du module bayésien dans le processus décisionnel global L utilisation du module neuronal d interprétation de l ECG avec des seuils de risque réglables en fonction de la personne utilisatrice du PEM devrait permettre d améliorer la sensibilité de détection d une ischémie. Cependant, il y a un intérêt capital à réduire le taux des faux-négatifs tout en maintenant une sensibilité optimale. Cela n est pas réalisable sans l introduction du module bayésien avec une interaction suffisamment souple entre les deux modules. C est la raison pour laquelle l étape finale dans la réalisation du module décisionnel du PEM devrait être l introduction d une couche logicielle pilote qui va gérer l interaction entre les modules et émettre l alarme la plus appropriée. Il s agit d un système à base de règles traitant tous les cas de figures possibles. Pour réaliser ce système, on peut utiliser une approche classique de règles basée soit sur la logique booléenne soit sur la logique dite floue. Dans le PEM, nous envisageons de concevoir un système à base de règles floues [116, 117, 118]. Le choix d une telle technologie est lié au fait que la logique floue permet d introduire une graduation dans des notions auparavant soit vraies soit fausses. En effet, s appuyant sur la théorie mathématique des sous-ensembles flous qui est une extension de la théorie des ensembles classiques pour la prise en compte d ensembles définis de façon imprécise, la logique floue est utilisée dans des domaines aussi variés que l automatisme, la robotique, l environnement, la médecine (aide au diagnostic), etc. L intérêt de la logique floue est d assurer que les différentes méthodes de diagnostic ne soient pas en compétition, mais au contraire, on cherchera à utiliser leur complémentarité pour améliorer le processus décisionnel. Dans la suite de cette section, nous présentons brièvement la logique floue, son intérêt, ses concepts et un exemple de mise en œuvre d applications de règles floues, ainsi que ce qui pourrait être le scénario décisionnel global dans le PEM après déploiement

78 Chapitre 2. Aide à la décision en télécardiologie 66 des modules neuronal, bayésien et du système de règles floues. À noter que la réalisation du système de logique floue et la validation du scénario global nécessite d avoir une base de données contenant à la fois des ECG sériels, ainsi que des dossiers médicaux exhaustifs pour chaque patient. Cette base de données, en cours de construction, spécifique au PEM, devrait permettre de réaliser et valider le modèle décisionnel global présenté ci-après. Le scénario décisionnel global (Figure 2.18) devrait être comme suit : Un patient X, présentant un certain nombre de signes de gêne se sert de son PEM pour enregistrer un ECG Une fois enregistré et chargé dans le système, l ECG sera interprété par le module neuronal et un premier score de risque est calculé. En fonction de ce score, l ECG est jugé comme : anormal, suspect, ou normal : Si l ECG est anormal, l alarme majeure est déclenchée. Si l ECG est normal, un message confortant est émis à l utilisateur. Si l ECG est suspect, le premier score de risque sera conjugué avec un deuxième score de risque issu du module bayésien et le score de risque global permettra de déclencher l alarme appropriée : majeure, moyenne, mineure. Cette approche qui est l une des perspectives de recherche future de nos travaux pour être évaluée sur la base de données qui est en cours de constitution grâce aux expérimentations pilotes qui sont actuellement réalisées avec les PEM prototypes.

79 Chapitre 2. Aide à la décision en télécardiologie 67 Fig Proposition d un modèle décisionnel global incorporant des modules bayésien et neuronal qui collaborent par l intermédiaire d un système de règles de logique floue.

80 Chapitre 3 Acquisition de l ECG PEM et synthèse de l ECG standard 3.1 Introduction Un des objectifs du projet EPI-MEDICS est de permettre à l utilisateur d enregistrer ses propres ECG sans la moindre assistance. C est la raison pour laquelle le système d enregistrement ECG du PEM est basé sur un nombre limité d électrodes (4), faciles à positionner, correspondant respectivement aux dérivations périphériques (DI, DII) et à la dérivation précordiale V2. Ce système simplifié, pseudo-orthogonal, présente néanmoins l avantage de recueillir la quasi-totalité de l information spatio-temporelle de l activité électrique cardiaque. Or, dans le cas où une situation d alarme est détectée et envoyée par le PEM, il est nécessaire de rendre l ECG critique accessible par le cardiologue destinataire de l alarme, sous forme compréhensible et interprétable, à savoir l ECG 12D, qui est, en pratique clinique, le mode de représentation électrocardiologique le plus usité de par le monde. Il est ainsi essentiel de synthétiser un ECG standard 12D à partir de l ECG 3D du PEM. Cette reconstruction doit permettre non seulement une détection précise de l ischémie, mais également une reproduction la plus fidèle possible des caractéristiques qu on pourrait avoir dans l ECG standard 12D si ce dernier avait été enregistré simultanément avec l ECG 3D du PEM. La plupart des investigations antérieures sur la synthèse de l ECG ont généralement adopté des techniques de modélisation linéaires telles que la régression multiple. Or, ces méthodes sont très sensibles à la position des électrodes, au bruit musculaire et aux artefacts causés par les mouvements des bras et du corps, aux interférences avec d autres appareils,... Ces perturbations peuvent produire une différence significative entre les ECG et par la suite empêcher une bonne qualité de synthèse. En outre, les méthodes de synthèse décrites dans la littérature sont quasiment toutes basées sur des méthodes d approximation par un modèle linéaire [119, 120, 121], alors que le rapport entre les signaux cardiaques n est pas forcément un processus linéaire [122, 123].

81 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 69 A notre connaissance, seuls Scherer et al [124] ont abordés le problème de la nonlinéarité de la synthèse de l ECG standard 12D à partir d un sous-ensemble de dérivations (DI, DII, V2) en proposant une technique de synthèse linéaire par parties obtenue en divisant le signal ECG en quatre portions : le segment PR, le complexe QRS, le segment ST-T (y compris l onde T) et l intervalle TP. Pour chaque portion du signal, un modèle de régression linéaire multiple calcule une matrice de transformation minimisant l erreur quadratique moyenne (RMS) entre le signal original et le signal synthétisé. L inconvénient majeur de cette approche concerne les discontinuités introduites au niveau des extrémités de chaque segment, discontinuités qui sont amplifiées par les niveaux des lignes de bases des dérivations DI, DII et V2. Ceci rend la méthode de reconstruction extrêmement sensible aux modifications des tensions de polarisation des électrodes et explique pourquoi cette méthode n est pas utilisée en routine clinique. C est la raison pour laquelle j ai décidé de m orienter vers des techniques résolument non-linéaires basées sur des réseaux de neurones. Dans la suite de ce chapitre nous allons tout d abord présenter les modalités d acquisition de l ECG PEM, puis une méthode originale de synthèse de l ECG standard 12D à partir de l ECG PEM 3D mettant en œuvre des comités de réseaux de neurones artificiels, Enfin nous évaluerons notre approche comparativement aux méthodes traditionnelles de la littérature. 3.2 Modalités d acquisition de l ECG PEM Le système d acquisition de l ECG du PEM est basé sur le positionnement dit de Mason-Likar des dérivations périphériques DI et DII, et sur la dérivation précordiale V2. Les électrodes doivent être positionnées comme indiqué dans la figure 3.1 : L électrode JAUNE doit être placée sur l épaule gauche (à environ 2 cm de l extrémité basse de la clavicule), le plus loin possible du coeur. L électrode ROUGE doit être placée sur l épaule droite (à environ 2 cm de l extrémité basse de la clavicule), le plus loin possible du coeur. L électrode BLANC doit être placée dans le quatrième espace intercostal (c està-dire pour les hommes, approximativement sur la ligne joignant les 2 mamelons), à peu près à 2 cm à gauche du sternum. L électrode VERT doit être placée sur la hanche gauche (dans la crête iliaque gauche). L électrode NOIR doit être placée sur la hanche droite (dans la fosse iliaque droite). Rappelons que le système Mason-Likar est le système de positionnement des électrodes qui est utilisé traditionnellement lors des tests d effort. Ces tests consistent en l enregistrement d un ECG durant le déroulement d un exercice physique calibré. Ils ont pour

82 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 70 Fig. 3.1 Positionnement des électrodes dans l ECG PEM 3D Vs. l ECG standard 12D. objectif de favoriser l apparition, en continu ou à intervalles programmés, d anomalies qui habituellement ne surviennent qu à l effort (maladie des artères coronaires). Pour ce type de tests, un positionnement des électrodes de façon traditionnelle (12 dérivations) est inadéquat à cause du bruit musculaire des bras et des jambes (myogramme). Or, avec le PEM, l utilisateur est amené à enregistrer ses propres ECG et est donc amené à bouger. D où l intérêt du système de Mason-Mikar pour le positionnement des électrodes du PEM. Cette configuration a été conçue dans le cadre du projet EPI-MEDICS avec le quadruple objectif : 1. d utiliser un nombre minimal d électrodes facile à placer, particulièrement dans des conditions d utilisation à domicile, en selfcare, en ambulatoire ou en situations d urgence ; 2. de contenir suffisamment d informations pour diagnostiquer les ischémies et les arythmies ; 3. de minimiser le nombre de dérivations de l ECG 12D à synthétiser (autrement dit de constituer si possible un sous-ensemble de l ECG 12D standard) ; 4. d optimiser la qualité de la synthèse des dérivations manquantes de l ECG 12D. Elle est basée sur une série d études dans le cadre du projet EPI-MEDICS qui ont permis de démontrer [125] qu une configuration pseudo-orthogonale de dérivations basée sur DI, DII et V2 ou sur DI, DII et V3 contient suffisamment d informations spatiotemporelles pour diagnostiquer l ischémie et l arythmie si la prise de décision est basée sur des méthodes d analyse multivariée ou de soft computing telles que les réseaux de neurones. Il a été également démontré au cours du projet EPI-MEDICS [126], qu en prenant les coef-

83 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 71 ficients de corrélation entre les dérivations enregistrées et synthétisées comme marqueurs de la qualité de la reconstruction de l ECG standard 12D, que les meilleurs sous-ensembles de dérivations semblent être (DI, DII, V2), (DI, AVF, V2) et (DI, DII, V3) (tableau 3.1). Mais du fait qu il est plus facile de placer V2, le projet a choisi (DI, DII et V2) comme meilleur sous-ensemble de dérivations du PEM. Tab. 3.1 Corrélations moyennes (en pourcentage) entre les dérivations d origine et les dérivations synthétisées au moyen d un modèle de régression générique en fonction du sous-ensemble de dérivations ECG 12D utilisées comme entrées pour la synthèse. Résultats extraits de [119] portant sur un ensemble d apprentissage de 72 ECG 12D sans ensemble de test indépendant. Sous-ensemble V1 V2 V3 V4 V5 V6 m DI,DII,V DI,DII,V DI,DII,V , DI,DII,V DI,DII,V DI,DII,V DI, AVF,V Approches conventionnelles Dans la littérature scientifique, la reconstruction de l ECG 12D à partir d un sousensemble de dérivations est généralement basée sur une matrice générique de coefficients calculés à partir d un ensemble d ECG provenant de différents patients via des techniques statistiques telles que la régression linéaire [127, 120, 128, 121]. En outre, différentes études ont conclu que la reconstruction la plus fidèle est réalisée à l aide d une matrice de coefficients spécifiques dérivés des ECG du patient [121, 127]. Toutefois, la plupart des méthodes développées pour la synthèse de l ECG 12D ont été uniquement évaluées à l aide des critères de qualité classique tels que les coefficients de corrélation ou l erreur quadratique moyenne RMS (Root Mean Square Error)... et les enregistrements ECG 12D qui ont servi à l évaluation des résultats étaient les mêmes que ceux qui ont servi pour le calcul des coefficients de synthèse (ensembles de test identiques aux ensembles d apprentissage). Très peu d études ont essayé d évaluer l évolution de la qualité de la reconstruction de l ECG dans le temps, où le bruit ou les artefacts causés par des électrodes mal placées ou les interférences avec d autres appareils..., sont susceptibles de produire une différence significative entre les ECG et par la suite empêcher une bonne qualité de synthèse. En effet, dans le meilleur des cas, la validation a été effectuée sur des ECG enregistrés au maximum 24h après le recueil des ECG sur lesquels le modèle de synthèse a été paramétré et en conservant la même position des électrodes [119].

84 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 72 Enfin, à notre connaissance, aucune étude n a tenté de réaliser une évaluation plus poussée de la qualité de la synthèse en utilisant des descripteurs syntaxiques familiers aux cliniciens tels que la présence ou l absence d une onde Q, le rapport de R/S... ou en testant l impact de la reconstruction au niveau diagnostique et décisionnel. Il faut en effet rappeler qu en routine clinique le diagnostic électrocardiologique est basé de façon universelle sur des valeurs de paramètres d amplitudes et de durées des différentes ondes dans des combinaisons de sous-ensembles de dérivations parmi les 12, en fonction des types de pathologie. Il est donc très important de pouvoir reconstruire un ECG 12D standard à partir de l ECG PEM 3D afin que ce dernier puisse être conservé dans le dossier patient comme un ECG de référence si nécessaire. En outre, la grande majorité des logiciels d analyse automatique de l ECG traitant l ECG 12D, la reconstruction de l ECG PEM en ECG 12D autorisera son réanalyse éventuelle par d autres programmes. 3.4 Choix méthodologiques Comme le PEM est prévu pour être utilisé à grande échelle et sur le long terme comme outil d accompagnement quotidien, il fallait tenir compte de ces contraintes en développant des méthodes de synthèse performantes capable de s adapter à la variabilité de jour en jour de l ECG. Cependant, si toutes les méthodes utilisées pour la synthèse de l ECG sont basées sur la régression linéaire, avec une qualité de synthèse acceptable sur des ECG similaires, aucune de ces méthodes n a été évaluée sur des ECG enregistrés dans des conditions réelles avec le risque de bruit ou d artéfacts. Dans de telles conditions, les méthodes non linéaires telles que les réseaux de neurones artificiels (ANN, artificial neural networks) nous semblaient susceptibles de compenser les faiblesses des méthodes linéaires. En effet, la littérature scientifique est pleine d exemples dans d autres domaines d application où les approches non linéaires ont représenté une alternative plus efficace que les approches dites classiques [129, 130]. De même, les réseaux de neurones, mis à part leur utilisation comme classifieurs universels, grâce à leurs capacités d apprentissage, sont un outil intéressant pour l approximation de fonctions complexes. Plusieurs études [131, 132, 133] ont établi que les réseaux de neurones multicouches standards avec seulement une couche cachée sont capables d approximer n importe quelle fonction, si suffisamment de neurones cachés sont disponibles. Dans ce sens, les réseaux de neurones sont une classe d approximateurs universels. C est pour ces raisons que j ai développé une méthode originale de synthèse de l ECG 12D basée sur l utilisation des réseaux de neurones artificiels. La méthode a deux versions : une version générique et une version spécifique. La version générique a pour objectif de calculer des coefficients de synthèse établis à partir de bases de données d ECG standard 12D. Cette matrice de transformation générique peut être intégrée dans le module de synthèse d ECG du PEM lors de l initialisation de l outil.

85 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 73 Toutefois, contrairement à la très grande diversité morphologique des ECG interindividus en fonction de l âge et du sexe au sein d une même catégorie diagnostique [134], leur très nette stabilité au cours du temps chez le même sujet en l absence de nouvelles cardiopathies [135] suggère de fait que la qualité de la reconstruction pourrait être améliorée par l utilisation d une matrice de transformation spécifique à chaque individu. La version spécifique permet ainsi d obtenir des coefficients de synthèse personnalisés à l utilisateur du PEM. Cela nécessite de disposer d au moins un ECG standard 12D de référence pour le patient en plus de l ECG PEM afin d établir la matrice spécifique du patient. Idéalement, l ECG 12D de référence et l ECG PEM devraient être acquis simultanément pour s affranchir de la variabilité naturelle d un ECG à l autre. De plus, pour pouvoir tester la qualité de la synthèse sur des ECG autres que ceux qui ont servi pour l apprentissage il faut disposer, pour chaque patient, d au moins un deuxième ECG 12D standard et, d une manière générale, de bases de données d ECG sériels. Ces bases de données seront décrites dans la prochaine section. 3.5 Bases de données d apprentissage et de test Pour élaborer et valider nos méthodes de synthèse des ECG 12D, nous avons utilisé deux bases de données. La première est la base de données ECG de Lund, déjà décrite dans le chapitre 2. La deuxième est une base de données composée d ECG enregistrés sur des patients hospitalisés au service des soins intensifs de l hôpital cardiologique de Lyon [136], identifiée durant le projet EPI-MEDICS sous le nom de la base de données CHDB (Cardiology Hospital in-patients Database). La base de données CHDB contient un total de 386 ECG 3D PEM et de 316 ECG 12D standard enregistrés par deux techniciens à moins d une demi-heure d intervalle entre les deux ECG. L enregistrement est d une durée de 10 sec, avec une fréquence d échantillonnage de 500 Herz. Les ECG 12D ont été enregistrés par un électrocardiographe numérique standard (Cardiette TM ). 50 ECG standard ont été exclus parce qu aucun ECG PEM n a été enregistré dans un intervalle de temps raisonnable. De même, 20 ECG PEM ont été exclus parce qu aucun ECG 12D n a été enregistré sur ces patients pendant la même période. Parmi les 266 paires restantes d ECG enregistrés sur les mêmes patients, 6 paires ont été exclues parce que les patients avaient un stimulateur cardiaque et 65 paires d ECG ont été exclues parce que les tracés étaient de très mauvaise qualité. La population d étude issue de la base de données CHDB consiste finalement en une série de 195 paires d ECG recueillis sur 131 patients. 85 paires d ECG ont été enregistrées par le premier technicien et les 110 autres paires par le deuxième technicien. Les ECG ont été traités par le programme de Lyon [24] afin d extraire de l enregistrement de 10 sec d origine, un complexe P-QRS-T type d une durée d 1 sec représentatif de l enregistrement de 10 sec. De même, le programme de Lyon a été utilisé pour déterminer le début et la fin des ondes P, QRS et T.

86 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard Configuration du modèle de synthèse de l ECG standard 12D par réseaux de neurones L objectif de cette section est de présenter notre méthode originale de synthèse de l ECG standard 12D à partir de l ECG PEM 3D mettant en œuvre des comités de réseaux de neurones artificiels. Pour construire les réseaux de neurones, un indispensable préalable est de bien sélectionner les échantillons de données qui serviront aux apprentissages et aux validations. Puis nous décrirons l architecture des réseaux de neurones qui seront utilisés pour la synthèse de l ECG standard et la méthode utilisée pour configurer leur structure. Enfin, nous validerons la configuration retenue sur des ECG sériels extraits de la base de données de Lund Constitution des ensembles d apprentissage et de test À partir de la base de données de Lund, j ai extrait, par sélection aléatoire, un premier sous-ensemble de 100 patients appelé DS1. Le sous-ensemble DS1 servira à déterminer la meilleure configuration de l architecture des réseaux de neurones. Deux autres sousensembles de données, DS2 et DS3, de 100 patients chacun, seront utilisés pour évaluer la qualité de synthèse des réseaux de neurones. Le sous-ensemble DS2, lui aussi obtenu par tirage aléatoire, permettra de tester notre méthode sur des patients sélectionnés de façon aléatoire, ce qui sous-entend qu ils sont susceptibles de présenter, en termes d évolution, une grande variabilité intra-patients due à de possibles changements diagnostiques, à des électrodes mal placées, à une inversion d électrodes... entre l ECG de référence et l ECG d urgence. Le sous-ensemble DS3 est constitué de 100 patients qui n ont pas montré de changements sériels significatifs sur leur 2ème ECG suivant la méthode d analyse sérielle CAVIAR [26]. Le sous-ensemble DS3 permet donc de tester notre méthode de synthèse sur des ECG dont on a vérifié qu ils n ont pas d évolution diagnostique significative ou d inversion d électrodes. La population d étude est ainsi composée de 300 paires d ECG provenant de 112 hommes et 188 femmes, avec un âge moyen de 79 ans (40-96 ans), enregistrés en moyenne à un an d intervalle (0-64 mois) Evaluation de la variation naturelle intra-patients entre les ECG de référence et les ECG d urgence Nos trois sous-ensembles DS1-3 sont constitués d ECG sériels enregistrés en moyenne à un an d intervalle. Il pourrait donc y avoir de grandes différences entre les deux ECG. Il est donc nécessaire de vérifier si la différence entre les ECG de référence et les ECG

87 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 75 d urgence n est pas trop grande pour ne pas affecter outre mesure la qualité de la synthèse. On effectue donc un contrôle de cohérence en calculant, pour chacun des 300 patients, les coefficients de corrélation entre les dérivations DI, DII, V1, V2... V6 du premier et deuxième ECG Configuration de la structure des réseaux de neurones Le problème de la synthèse des 5 dérivations (V1, V3, V4, V5, V6) manquantes à partir du sous-ensemble des 3 dérivations (DI, DII, V2) est un problème d approximation de fonction. Or de nombreux travaux de recherche ont montré que les réseaux de neurones [131, 132, 133], et en particulier les réseaux de type perceptron multicouches, constituent un outil de choix pour résoudre ce problème d approximation. Deux solutions sont alors envisageables : soit utiliser autant de réseaux que de signaux à générer (Figure 3.2(a)), soit d utiliser un seul réseau à 5 sorties (Figure 3.2(b)). Notre choix s est porté vers la solution présentée dans la figure 3.2(b). Ce choix est justifié par les raisons suivantes : 1. Sur le plan théorique : Combiner l approximation des dérivations V1, V3... V6 (sortie du réseau) à partir des dérivations DI, DII et V2 dans un seul et unique réseau apporte davantage de richesse au niveau du jeu de données, au niveau de la combinaison de ces données et aura un impact positif sur la configuration des neurones de la (des) couche(s) cachée(s). En plus, le fait qu il y a une forte corrélation entre les dérivations spatialement adjacentes (V1-V2, V2-V3, V3-V4,... ) confortée par le fait que les cardiologues, en analysant l ECG, analysent les dérivations par paires ou par triplets, justifie le choix de combiner les données dans un réseau global. 2. Sur la plan expérimental : Une série de tests préalables nous a permis de confirmer le constat que le réseau global est meilleur que les 5 réseaux individuels. Chaque réseau individuel consiste en une couche d entrée de 3 neurones (un pour chaque signal enregistré), une couche de sortie de 5 neurones (un pour chaque signal dérivé), et h couches cachées de n neurones (Figure 3.3). Par ailleurs, il convient de noter que la solution de la synthèse des fonctions V1, V3... V6 au moyen d un réseau multicouches est tributaire à la fois du choix de l architecture du réseau et de la sélection initiale des poids et des biais. L architecture sera définie de manière expérimentale au moyen d une série de tests où l on fera varier le nombre de couches cachées (h=1, 2), le nombre de neurones par couche cachée (n=3, 5, 8, 10, 15), et les fonctions d activation pour les neurones des couches cachées (linéaire ou sigmoïde). Concernant la couche de sortie, notre choix s est porté sur des fonctions d activation linéaire, à la fois sur la base de considérations théoriques (les relations V i = f (DI, DII, V2) sont quasi-linéaires, les signaux sont d amplitude crête à crête variable, et peuvent être positifs ou négatifs), qu au vu des résultats de la revue de la littérature qui indique que les meilleurs résultats de l approximation de fonctions au moyen de réseaux de neurones s obtiennent généralement en utilisant des fonctions d activation linéaire.

88 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 76 (a) (b) Fig. 3.2 Différents types de modèles de synthèse de l ECG 12D à partir d un sousensemble de dérivations 3D : (a) cinq réseaux individuels avec 3 entrées et 1 sortie ; (b) réseau global avec 3 entrées, 5 sorties. Pour dépasser les limitations de performance inhérents au processus d apprentissage des réseaux de neurones tel que la sélection des paramètres initiaux des réseaux, nous avons comme dans le chapitre précédent, adopté une approche multi-experts, multi-classifieurs qui consiste à utiliser des comités de N=50 réseaux de neurones artificiels. La sortie du comité de réseaux de neurones est obtenue en moyennant les sorties des réseaux individuels. L objectif est ici encore, de bénéficier des résultats de l application du théorème central limite en combinant les sorties des 50 réseaux individuels pour gommer les différences globales et d obtenir des performances en termes de qualité de synthèse sensiblement meilleures que pour chacun des réseaux pris individuellement Processus d apprentissage et d évaluation Idéalement, pour effectuer l apprentissage, nous aurions besoin d au moins 3 ECG sériels par patient pour dériver un comité de réseaux de neurones spécifique au patient : un premier ECG pour effectuer l apprentissage du réseau, un deuxième pour stopper l apprentissage afin d éviter le surapprentissage, et un dernier pour évaluer la capacité de généralisation du comité. Malheureusement, les bases de données à notre disposition ne comportent pas plus de deux ECG sériels par patient. Pour surmonter cette difficulté, j ai adopté une stratégie en deux temps qui consiste tout d abord à déterminer la structure idéale des réseaux de neurones individuels et le nombre moyen d itérations K sur un ensemble d apprentissage (en fait DS1), puis à évaluer les performances de cette structure

89 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 77 Fig. 3.3 Illustration de la structure individuelle des réseaux de neurones utilisés pour la synthèse de l ECG 12D : une couche d entrée de 3 neurones (DI, DII, V2), une couche de sortie de 5 neurones (V1, V3, V4, V5, V6), et h couches cachées de n neurones.

90 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 78 idéale sur les deux ensembles de test DS2 et DS3 en stoppant l apprentissage des réseaux de neurones spécifiques au patient au bout d un nombre d itérations fixe égal à K. 1. Configuration des comités de réseaux de neurones : Comme indiqué ci-avant, on utilise le sous-ensemble DS1 pour déterminer la meilleure structure des réseaux du comité et pour calculer le nombre fixe d itérations K à employer. Le processus est le suivant : On réalise, pour chaque patient de DS1 et pour chacun des N=50 réseaux du comité de réseaux de neurones, un apprentissage sur l ECG de référence du patient. L apprentissage est arrêté lorsque la mesure d erreur sur l ECG de test (ECG d urgence) du patient commence à croître. Ce processus est répété pour chacun des h n t structures (h=nombre de couches cachées ; n=nombre de neurones par couche ; t=type des fonctions d activation). La meilleure configuration est celle qui affiche la plus faible erreur de reconstruction moyenne sur l ensemble des 100 ECG test de DS1. Le nombre d itérations K est déterminé en calculant, pour chaque patient, la moyenne du nombre maximum des itérations pour chacun des 50 réseaux individuels et en faisant la moyenne de ces valeurs sur les 100 patients du sousensemble DS1. 2. Vérification et validation : Le but de cette deuxième étape est de vérifier si la configuration des réseaux (architecture et nombre fixe d itérations K) déterminée lors de l étape précédente est performante sur d autres sous-ensembles d ECG, en l occurrence, DS2 et DS3. Elle consiste à déterminer, pour chaque patient, un comité spécifique de 50 ANN en utilisant les signaux de l ECG de référence du patient comme ensemble d apprentissage. La structure de chaque ANN est celle déterminée lors de l étape précédente et le nombre d itérations utilisé pour l apprentissage est fixé égal à K. Les comités de réseaux de neurones élaborés sur les ECG de référence des patients de DS2 et DS3 sont ensuite utilisés pour synthétiser à partir des signaux DI, DII et V2 des ECG de test de DS2 et DS3, les signaux V1, V3... V6 supposés manquants. Ces ECG synthétisés sont ensuite comparés aux ECG originaux à l aide d une analyse quantitative qui consiste à : (a) Calculer l erreur quadratique moyenne RMS (Root Mean Square) et le coefficient de corrélation entre les dérivations originales et celles synthétisées sur la totalité du tracé d 1 sec (onde P, complexe QRS et onde T compris). (b) Comparer ces valeurs par rapport à celles obtenues en utilisant un modèle de régression multiple spécifique du type : V i = a i0 + a i1 DI + a i2 DII + a i3 V 2 (3.1) où a ij sont les coefficients spécifiques calculés à partir des ECG de référence. (c) Exclure, pour chacune des 2 méthodes et pour chaque dérivation, 5% des valeurs RMS les plus élevées et 5% des coefficients de corrélation les plus bas. Cette étape est prévue pour éviter tout biais produit par les cas extrêmes sur le calcul des écarts type et des moyennes [137]. (d) Effectuer des tests statistiques (paired et trimmed paired t-tests) pour vérifier si les différences observées entre les comités de réseaux de neurones et les modèles de régression multiple sont statistiquement significatives.

91 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard Résultats Evaluation de la variabilité naturelle intra-patients entre les ECG de référence et les ECG d urgence originaux Le tableau 3.2 illustre les valeurs des erreurs RMS entre le premier et le deuxième ECG des sous-ensembles DS1, DS2 et DS3. La valeur moyenne de l erreur RMS sur la totalité du tracé d 1 sec (onde P, complexe QRS et onde T compris) pour les dérivations DI, DII, V1, V2, V3, V4, V5, V6 est de 140 µv pour DS1, 149 µv pour DS2 et 113 µv pour DS3. Ces chiffres illustrent une variabilité intra-patients entre les ECG de référence et les ECG d urgence plus importante pour les sous-ensembles DS1 et DS2 par rapport à DS3, ce qui pourrait avoir un effet sur la qualité de synthèse. Ceci sera confirmé dans la partie consacrée à l évaluation quantitative. Tab. 3.2 Erreur quadratique moyenne (RMS) en µv entre les dérivations DI, DII, V1, V2, V3, V4, V5 et V6 des ECG de référence et ECG d urgence des sous ensembles DS1, DS2 et DS3, après exclusion des 5 valeurs les plus extrêmes. Dérivation DS1 (N=95) DS2 (N=95) DS3 (N=95) DI DII V V V V V V RMS moyenne Meilleure configuration des réseaux de neurones : architecture et nombre moyen d itérations La détermination de la meilleure configuration d un réseau de neurones est un problème difficile. De nombreux paramètres entrent en jeu : type de réseau, nombre de couches cachées (h), nombre de neurones par couche (n), type des fonctions d activation, algorithme d apprentissage utilisé, critère de mesure de la qualité du réseau. Le type de réseau (perceptron multi-couches avec 3 entrées et 5 sorties) et le type de la fonction d activation de la couche de sortie (fonction linéaire) ont été fixés dans la section 3 sur la base de considérations théoriques et pratiques. Concernant l algorithme d apprentissage, nous avons choisi une des variantes de l algorithme de rétropropagation

92 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 80 fournies par Matlab adapté à l approximation de fonctions. Il s agit de l algorithme de descente de gradient conjugué (scaled conjugate gradient algorithm, SCG) [138]. Enfin, concernant le critère de qualité, nous avons opté pour la mesure de l erreur quadratique moyenne (RMS) entre les sorties de chaque réseau de neurones et les signaux correspondants réels provenant des enregistrements ECG d urgence de DS1. D autres critères de qualité auraient été possibles (mesure de la qualité diagnostique du signal reconstruit, différences de signaux en valeur absolue,... ), mais ont été jugés trop complexes à mettre en œuvre dans cette étape préliminaire de détermination de la meilleure configuration possible des réseaux de neurones. La meilleure configuration ANN est déterminée expérimentalement en effectuant l apprentissage des h n t structures différentes obtenues en faisant varier le nombre de couches cachées (h=1, 2), le nombre de neurones par couche (n=3, 5, 8, 10, 15) et le type de fonction d activation (t=linéaire, sigmoïde : tangente sigmoïde (tansig), logarithmesigmoïde (logsig)). La fonction d activation utilisée dans la couche de sortie est linéaire. Les meilleurs résultats ont été obtenus pour h=1 couche cachée de n=15 neurones, une fonction d activation de type tangente sigmoïde et K=75 itérations. Les résultats détaillés des performances des h n t structures en termes d erreur RMS sur les ECG d urgence de DS1 sont présentés en annexe C. Evaluation quantitative de la qualité de la reconstruction Pour évaluer quantitativement la qualité de la reconstruction par les réseaux de neurones des 5 dérivations ECG (V1, V3,... V6) synthétisées à partir des sous-ensembles (DI, DII, V2) de l ECG standard 12D et comparer les résultats avec ceux obtenus au moyen d une méthode de synthèse basée sur la régression multiple, nous avons procédé comme suit : Nous avons d abord commencé par calculer l erreur quadratique moyenne RMS et le coefficient de corrélation (r) entre les dérivations originales et celles synthétisées par les réseaux de neurones. Les calculs sont effectués en considérant la totalité des signaux à notre disposition c.à.d 1 sec de tracé. Nous avons ensuite éliminé les 5 cas les plus extrêmes et comparé les valeurs RMS et r par rapport à celles obtenues avec la méthode de régression multiple. Nous avons enfin effectué des tests statistiques (paired et trimmed t-tests) pour vérifier si la différence observée entre les comités de réseaux de neurones et les modèles de régression multiple est statistiquement significative. Les résultats de l évaluation quantitative de la performance des comités de réseaux de neurones et des modèles de régression multiple en termes d erreur RMS et coefficients de corrélation sont illustrés dans le tableau 3.3. Ces résultats montrent la supériorité de la synthèse de l ECG par réseaux de neurones avec une erreur RMS de 76 (DS1), 100 (DS2) et 64 (DS3) µv en moyenne et une corrélation moyenne de 92% (DS1), 91% (DS2) et 97% (DS3) par rapport à celle de la régression multiple avec une erreur RMS moyenne de 83 (DS1), 108 (DS2), et 73 (DS3) µv et une corrélation moyenne de 91% (DS1), 90%

93 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 81 (DS2) et 96% (DS3). À noter que la performance est meilleure pour les ECG du sousensemble DS3 par rapport à ceux de DS1 et DS2. Cela montre qu une grande partie de la différence observée entre les dérivations originales et celles synthétisées pourrait être due à des électrodes mal placées ou à un changement physiologique ou diagnostique de l état du patient dans les sous-ensembles DS1 et DS2. Le tableau 3.4 résume les résultats des tests statistiques effectués sur les valeurs des erreurs RMS des 2 méthodes. D après ces résultats, dans les deux approches de synthèse, la différence entre les réseaux de neurones et la régression multiple est statistiquement significative (p 0.001). Tab. 3.3 Erreur quadratique moyenne (RMS) en µv et coefficients de corrélation (r) entre les dérivations V1,V3... V6 originales et celles synthétisées par les comités de réseaux de neurones spécifiques (ANN-S) et les modèles de régression spécifiques (REG-S) sur les ECG des sous-ensembles DS1, DS2 et DS3, après élimination des 5 valeurs les plus extrêmes. DS1 (N=95) DS2 (N=95) DS3 (N=95) Dérivation RMS r RMS r RMS r A V N V N V V S V R V E V G V V S V Tab. 3.4 Comparaison par les tests statistiques (t-tests : pairwised et trimmed) de la différence en termes d erreur RMS obtenue par les comités de réseaux de neurones et les modèles de régression spécifiques. Sous-ensembles Pairwised t-test Trimmed t-test DS1 (N=95) < 10 4 < 10 5 DS2 (N=95) < 10 3 < 10 5 DS3 (N=95) < 10 7 < 10 9

94 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard Discussion Il est toujours difficile de comparer des résultats d évaluation d une nouvelle méthode telle que la méthode de synthèse des ECG par ANN à ceux publiés dans la littérature lorsque les bases de données utilisées sont différentes. Les résultats vont dépendre non seulement du type de population et des cardiopathies, mais également des caractéristiques techniques de l enregistrement des ECG et des mesures utilisées pour évaluer la qualité de la synthèse. Ainsi les valeurs RMS seront fortement tributaires de la fréquence d échantillonnage et des intervalles ECG considérés. Les coefficients de corrélation seront maximum lorsque l on ne considère que l onde QRS, et seront plus faible lorsque l on prend en compte la totalité des ondes P, QRS et T. Il est donc indispensable de confronter les résultats d une nouvelle méthode par rapport à ceux obtenus avec une méthode standard en utilisant la même base de données et les mêmes mesures de dissimilarité. C est ce que nous avons fait en comparant les résultats de notre méthode de synthèse par ANN avec ceux obtenus en mettant en œuvre sur les mêmes données une méthode de synthèse par régression multiple. Les chiffres les plus réalistes publiés dans la littérature mentionnent des coefficients de corrélation médians de respectivement r=0.978 pour des tracés enregistrés à t=0 sec d intervalle (ie l ensemble de test est le même que l ensemble d apprentissage) et r=0.953 pour des enregistrements réalisés à 24h d intervalle sans changement de position des électrodes (méthode de régression spécifique, [119]). Les chiffres que nous avons obtenus sur DS2 sont de respectivement r=0.942 pour la régression linéaire et r=0.947 pour les comités de réseaux d ANN, sachant que, à la différence des résultats publiés par Nelwan et al [119], nos résultats ont été obtenus sur des tracés enregistrés en moyenne à 1 an d intervalle et en considérant 1 sec de tracés (soit la totalité des intervalles P, QRS, T) au lieu du seul intervalle QT. Quoique non comparables à cause de la nature des ECG de notre population d étude, nous estimons que les résultats que nous avons obtenus tant en termes de coefficients de corrélation moyens que d erreurs RMS nous semblent suffisamment probants pour pouvoir dire que la méthode de synthèse par comités de réseaux de neurones spécifiques surpasse très nettement la méthode de synthèse par régression spécifique et mériterait d être mise en œuvre en routine clinique Conclusion La qualité de la reconstruction de l ECG 12D par réseaux de neurones par rapport à l approche classique de synthèse par régression linéaire m a encouragé à continuer à effectuer une évaluation quantitative plus poussée de la qualité de synthèse en estimant le degré d altération du diagnostic des ECG synthétisés par rapport aux ECG de référence. Dans cette perspective, j ai réalisé une évaluation de l approche de synthèse par réseaux de neurones d un point de vue décisionnel en utilisant une population d étude composée

95 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 83 de plus de 800 paires d ECG 12D classés soit dans la catégorie apparition d un infarctus aiguë (AMI), soit dans la catégorie contrôles extraits de la base de données de Lund. La méthode d évaluation et les résultats sont présentés ci-après en section 3.7. Une autre étape est d évaluer les potentialités de notre méthode pour synthétiser un ECG standard 12D à partir de l ECG 3D enregistré par le PEM. Cependant, pour évaluer la qualité des synthèses de l ECG standard à partir de l ECG PEM, il faut disposer d une base de données regroupant à la fois, et pour chaque patient, plusieurs paires ECG PEM, ECG standard 12D chronologiquement homologues. Idéalement chaque paire d ECG devrait être enregistrée de façon synchrone et sérielle. L acquisition des paires d ECG devrait être effectuée à plusieurs jours voire plusieurs mois d intervalle. Cela nous permettrait d effectuer une évaluation, à la fois en termes de similarité entre l ECG 12D synthétisé à partir de l ECG PEM et l ECG 12D original, et en termes de contenu diagnostique de l ECG synthétisé par rapport à celui d origine. Malheureusement à ce jour, nous ne disposons pas de telles bases de données. Pour circonvenir ce défaut, j ai adopté une approche alternative qui consiste en une évaluation sur un ensemble d ECG de la base de données CHDB. 3.7 Evaluation diagnostique sur la base de données de Lund Après avoir testé dans la section précédente, à l aide de critères traditionnels de qualité (erreur quadratique moyenne RMS et coefficient de corrélation), la capacité des réseaux de neurones à synthétiser l ECG 12D à partir d un sous-ensemble de dérivations (DI, DII, et V2), l objectif de cette section est de présenter une évaluation de l approche de synthèse par réseaux de neurones d un point de vue décisionnel en utilisant une population d étude extraite de la base de données de Lund et composée d ECG d infarctus et d ECG de contrôle. En d autres termes, il s agit d observer l impact de la synthèse sur l interprétation de l ECG dérivé par rapport à celle obtenue sur l ECG d origine correspondant. Pour cela, je me suis servi d un programme d interprétation automatique développé à partir du modèle présenté dans le chapitre précédent (Figure 3.4) : pour comparer le degré de concordance des interprétations réalisées par le programme sur les ECG d urgence reconstruits par rapport à la vérité clinique, i.e. la catégorie à laquelle appartient l ECG d urgence d origine, pour mesurer la concordance entre les interprétations du programme sur les ECG d urgence reconstruits par rapport à celles réalisées sur les ECG d urgence d origine. Dans le reste de cette section, nous allons d abord présenter les ensembles d apprentissage et de test que nous avons construit pour évaluer la méthode de synthèse par réseaux de neurones. Ensuite, nous allons présenter les protocoles d évaluation et enfin les résultats des évaluations effectuées par rapport à la régression multiple.

96 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 84 Fig. 3.4 Programme d interprétation automatique de l ECG suivant 4 niveaux de risque Ensemble d apprentissage et ensemble de test À partir de la base de données de Lund, j ai extrait le même sous-ensemble de test, composé de 988 paires d ECG (199 cas d AMI et 789 cas de contrôle) que celui utilisé pour tester la méthode de diagnostic par réseaux de neurones développée dans le chapitre 2. Ensuite, j ai éliminé toutes les paires d ECG contenant des blocs (c est à dire avec une durée de l onde QRS supérieure à 120 ms). L ensemble de données final est donc composé de 808 paires d ECG enregistrés en moyenne à un an d intervalle (0-7 ans), provenant de 411 hommes et 397 femmes avec un âge moyen de 71 ans (40-95 ans). Parmi ces 808 patients, 151 ont développé un infarctus aiguë lors de leur admission dans le service d urgence et comme expliqué dans le chapitre 2, leur ECG d urgence a été classé dans la catégorie infarctus. En conséquence, nous avons classé les 151 paires d ECG correspondants dans la catégorie d infarctus (AMI), et les 657 paires d ECG restants dans la catégorie de contrôle. Dans la suite, nous appelons ensemble d apprentissage, l ensemble formé des 808 ECG de référence et ensemble de test, l ensemble des 808 ECG d urgence correspondants.

97 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard Configuration et apprentissage des comités de réseaux de neurones spécifiques aux patients Pour synthétiser les dérivations (V1, V3, V4, V5, V6) à partir du sous-ensemble de dérivations (DI, DII, V2), j ai utilisé comme précédemment des comités de 50 réseaux de neurones artificiels. L architecture de chaque réseau individuel, l algorithme d apprentissage ainsi que le nombre d itérations sont ceux décrits dans la section 3.6. Pour chacun des 808 patients de la population d étude, un comité de réseaux de neurones spécifique au patient est calculé. L apprentissage des réseaux est effectué sur l ECG de référence avec un nombre d itérations fixe pour éviter le sur-apprentissage. L ECG d urgence va ensuite servir pour évaluer la capacité de généralisation du comité Comparaison des interprétations automatiques des ECG synthétisés par rapport à la vérité clinique Ce premier test a pour objectif d évaluer la qualité de la synthèse par comités de réseaux de neurones et par régression en mesurant la concordance entre la vérité clinique des ECG originaux d urgence et le diagnostic obtenu par application du programme d interprétation automatique développé dans le chapitre précédent. Le protocole d évaluation que nous avons mis en œuvre commence par extraire les 808 ECG d urgence classés en deux catégories : infarctus et contrôle de la base de données, puis à créer les deux ECG de synthèse en appliquant tour à tour les deux types de transformations spécifiques, comités de réseaux de neurones et régression multiple. Ensuite, la deuxième étape est l application du logiciel de diagnostic sur les ECG générés par les méthodes de synthèse, ainsi que sur les ECG originaux. Le programme classifie les ECG en 4 catégories suivant le risque d infarctus : pas de risque, risque mineur, risque moyen et risque majeur. La troisième étape consiste à combiner les ECG appartenant aux deux premières catégories : pas de risque et risque mineur, et à les considérer comme ECG de contrôle. De même, les ECG appartenant aux catégories restantes : risque moyen et majeur, sont considérés comme étant des ECG d infarctus. La dernière étape est la comparaison de l interprétation automatique par rapport à la vérité clinique. Cette comparaison est réalisée par le biais de courbes ROC. Pour chacun des 2 ensembles d ECG : ECG reconstruits par comités de réseaux de neurones et ECG reconstruits par régression, une courbe ROC est calculée. Le degré de concordance entre vérité clinique et interprétation automatique est mesuré par l aire sous la courbe ROC. Plus l aire sous la courbe ROC est élevée, plus la méthode de synthèse est performante. La figure 3.5 illustre les courbes ROC résultant de la comparaison de l interprétation automatique des 808 ECG d urgence de la population d étude reconstruits par réseaux de neurones et par régression par rapport à la vérité clinique sur les ECG originaux. La performance, mesurée par le biais de l aire sous la courbe ROC, est respectivement

98 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard Sensibilité Comité spécifique, aire = Régression spécifique, aire = Spécificité Fig. 3.5 Courbes ROC résultant de la comparaison entre la classification des ECG dérivés par réseaux de neurones et par régression, par rapport à la vérité clinique des ECG originaux correspondants pour les ECG synthétisés par réseaux de neurones et pour ceux synthétisés par régression. Ces résultats sont remarquablement élevés car à peine inférieurs à ceux obtenus sur les ECG originaux (aire de 0.872), avec un net avantage de la méthode de synthèse par réseaux de neurones par rapport à la régression. Comparaison des interprétations automatiques des ECG synthétisés par rapport aux interprétations automatiques des ECG d origine Le deuxième test d évaluation de la qualité de la synthèse par comités de réseaux de neurones et par régression a pour objectif de mesurer la concordance entre les interprétations des ECG synthétisés et les interprétations des ECG d urgence originaux. Ce test permettra de vérifier si notre méthode de synthèse permet de reconstruire des ECG renfermant suffisamment d information diagnostic pour que les logiciels d interprétation automatique fournissent des diagnostics concordant à ceux qui seraient obtenus sur les ECG originaux. Le tableau 3.5 illustre les cas de concordance (éléments sur la diagonale de la matrice de confusion) et de discordance d interprétation entre les ECG d origine et les ECG dérivés par réseaux de neurones et par régression. L analyse des résultats nous apprend deux choses : 1. La qualité de synthèse réalisée par les comités de réseaux de neurones permet une

99 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 87 meilleure concordance d interprétation entre ECG originaux et synthétisés par rapport à la performance réalisée par la méthode de régression. 2. Tous les éléments de la matrice de confusion, en dehors de la tridiagonale, sont nuls ce qui signifie que les interprétations entre l ECG original et les ECG de synthèse ne différent au maximum que de un degré dans l estimation de la qualité de l ischémie, et donc qu il n y a pas de discordance sévère entre les interprétations. Le fait que le diagnostic puisse passer d une catégorie à la catégorie adjacente est d autant plus probable que la sortie des ANN est proche des seuils de décision. Tab. 3.5 Concordance entre les interprétations des ECG originaux et les interprétations des ECG synthétisés par réseaux de neurones (ANN-S) et par régression (REG-S). Le logiciel de diagnostic classe les ECG suivant 4 catégories de risque : pas de risque, risque mineur, moyen et majeur. Original pas de risque risque mineur risque moyen risque majeur (383) (219) (110) (96) ANN-S pas de risque (374) risque mineur (209) risque moyen (119) risque majeur (106) REG-S pas de risque (379) risque mineur (212) risque moyen (113) risque majeur (104) Discussion & Conclusion Après avoir prouvé au cours de la section 3.6 la faisabilité de l approche de synthèse de l ECG standard 12D à partir d un sous-ensemble de dérivations par le biais de comités de réseaux de neurones, cette section vient renforcer les premières constatations de l efficacité de l approche. En effet, la deuxième phase d évaluation exposée dans cette section a montré que les comités de réseaux de neurones dépassent en qualité de synthèse les méthodes prônées par la littérature scientifique [121, 128], basées sur la régression multiple. De plus, les ECG 12D dérivés à partir du sous-ensemble de dérivations : DI, DII et V2 contiennent suffisamment d information diagnostic et sont suffisamment similaires aux ECG 12D d origine pour permettre une concordance d interprétation très élevée. Encore faut-il tester l efficacité de la méthode à synthétiser l ECG standard 12D à partir de l ECG 3D enregistré par le PEM d EPI-MEDICS. Autrement dit, il s agit de prouver la capacité de la méthode des comités de réseaux de neurones à synthétiser des ECG 12D à partir d ECG 3D enregistrés dans un contexte de télémédecine citoyenne. Ce sera l objectif de la prochaine et dernière étape de validation que nous présentons ci-après.

100 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard Evaluation de la qualité de la synthèse des ECG standards 12D à partir des ECG 3D du PEM Objectifs Si l intérêt de notre approche de synthèse d ECG par réseaux de neurones est déjà prouvé, l étape logique suivante est d évaluer la performance de la méthode sur les ECG 3D du PEM enregistrés à plusieurs jours d intervalle, tenant compte des conditions d acquisition des ECG et d un minimum de variabilité de jour en jour de l ECG. Rappelons que le système d acquisition de l ECG du PEM est basé sur le positionnement de Mason- Likar des dérivations périphériques DI et DII, et sur la dérivation précordiale V2, et que l utilisateur est amené à enregistrer ses propres ECG et est donc amené à bouger. L évaluation de la qualité de la synthèse de l ECG standard 12D à partir de l ECG PEM 3D sera effectuée sur un sous-ensemble d ECG 12D et PEM 3D de la base de données CHDB que nous décrirons dans la section suivante. Cette évaluation va consister tout d abord à utiliser des critères traditionnels de qualité (erreur quadratique moyenne RMS et coefficient de corrélation) pour mesurer la capacité des réseaux de neurones à synthétiser l ECG 12D à partir d un sous-ensemble de dérivations (DI, DII, et V2) du PEM. Toutefois, la mise en œuvre de cette approche n est pas simple. En effet, pour pallier aux contraintes liées à l utilisation de deux appareils différents (PEM pour les ECG 3D et Cardiette pour les ECG 12D) pour enregistrer les ECG et au fait que l enregistrement des deux ECG (12D et 3D) n est pas synchronisé, il est indispensable de recourir d abord à un procédé d alignement des signaux avant de pouvoir effectuer des mesures des différences entre les dérivations reconstruites et celles de référence. Ensuite, nous effectuons une évaluation d un point de vue diagnostic pour tester l impact de la synthèse sur la qualité de l interprétation. Ceci sera réalisé en mesurant la concordance entre les interprétations élaborées par le programme d interprétation automatique, développé dans le chapitre 2, sur les ECG 12D reconstruits à partir des ECG PEM 3D, et les interprétations réalisées sur les ECG Cardiette d origine. Ces dernières sont considérées comme étant la vérité. De plus, par rapport aux sections précédentes, nous présenterons deux versions de la méthode de synthèse : une version générique ayant pour objectif de calculer des coefficients de synthèse établis à partir d un ensemble d ECG standard 12D, ainsi qu une version spécifique permettant d obtenir des coefficients de synthèse personnalisés à l utilisateur du PEM à partir de ses propres ECG. En effet, lors de la première utilisation du PEM, il est probable que l on ne dispose pas encore de transformation spécifique, et il est donc important de savoir s il faut plutôt utiliser une matrice de transformation générique obtenue par régression multiple ou une méthode de synthèse basée sur des comités de réseaux de neurones.

101 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard Population d étude Pour constituer notre population d étude, nous avons extrait de la base de données CHDB une série de paires d ECG en appliquant un ensemble de règles décrites ci-après. Rappelons, en préambule, que la base de données CHDB contient, après un premier contrôle de qualité et de cohérence, 195 paires d ECG provenant de 131 patients. Chaque patient possède une, deux, voire plusieurs paires d ECGs (Tableau 3.6). Chacune des paires consiste en un ECG standard 12D et en un ECG PEM 3D basé sur les dérivations DI, DII et V2. Tab. 3.6 Description de la base de données CHDB. 195 paires d ECG (3D et 12D) pour 131 patients Nb de patients Nb de paires par patient Contrôle de qualité et de cohérence Interprétation des ECG par des experts humains Chaque ECG 12D de la base de données CHDB a été interprété de manière indépendante par un cardiologue expérimenté. Chaque ECG a été classé dans l une des deux catégories suivantes : 1. ACS (Acute Coronary Syndrome), si un syndrome coronarien aigu (ACS) a été diagnostiqué sur l ECG. 2. Contrôle, si l ECG enregistré provenait d un patient pour lequel le diagnostic était autre que ACS. Les 195 ECG standard 12D ont été classés en respectivement 60 cas diagnostiqués ACS et 128 cas de contrôle. Les 7 cas restants n ont pu être diagnostiqué et ont donc été éliminés de notre base de données. A l issue de cette étape, notre ensemble de données est formé de 188 paires d ECG provenant de 130 patients se répartissant ainsi : patients ont 1 paire d ECG, patients ont 2 paires d ECG, 3. 5 patients ont 3 paires d ECG, 4. et 3 patients ont 4 paires d ECG.

102 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 90 Nous avons donc subdivisé la base CHDB en deux sous-ensembles : SE1 est formé des 83 patients de la population d étude ayant une seule paire d ECG PEM 3D et Cardiette 12D et SE2 est formé des 47 patients ayant au moins deux paires d ECG PEM et Cardiette. Pour les 8 patients du sous-ensemble SE2 ayant plus de deux paires d ECG, nous n avons retenu que les deux premières paires d ECG 3D et 12D à condition qu elles aient été enregistrées à au moins 1 jour d intervalle. SE2 est donc constitué de 47 2 paires d ECG provenant de 47 patients. Les 94 paires d ECG standard et les 94 paires d ECG PEM ont été enregistrés en moyenne à 3 (1-21) jours d intervalle. Processus de contrôle de la cohérence entre les ECG PEM et les ECG 12D standards Du fait que l enregistrement des ECG n est pas synchrone et en raison du statut cardiaque très évolutif typique des patients dans un service de soins intensifs, il pourrait y avoir de grandes différences entre les deux ECG PEM et 12D, souvent acquis à quelques dizaines de minutes d intervalle, et plus encore pour les cas de SE2, où les deux paires d ECG ont été enregistrées jusqu à 3 jours d intervalle. Ces différences pourraient affecter de manière considérable la mesure des écarts entre les ECG de synthèse et les ECG 12D d origine, surtout en cas d apparition de troubles de la conduction ou du fait de l évolution d une ischémie aiguë. Les différences imputables à l évolution de l état cardiaque pourraient en effet être beaucoup plus importantes que celles dues aux algorithmes de reconstruction des dérivations manquantes. L objectif de cette étape est donc de vérifier si la différence entre les ECG PEM et Cardiette n est pas trop grande et d éliminer les paires d enregistrements dont les différences dépassent un certain seuil, pour éviter de fausser les mesures de la qualité de la synthèse. Le contrôle de cohérence est effectué comme suit : pour chacun des 47 patients du sousensemble SE2, une analyse de corrélation est effectuée entre les dérivations DI, DII, V1, V2... V6 du premier et deuxième ECG Cardiette et entre les dérivations DI, DII et V2 du premier ECG Cardiette et du deuxième ECG PEM. Enfin, une troisième et dernière analyse de corrélation est effectuée entre les dérivations DI, DII et V2 du deuxième ECG Cardiette et de l ECG PEM associé. Les tracés sont jugés cohérents si aucun des coefficients de corrélation entre deux dérivations chronologiquement homologues n est inférieur à 0.2, seuil établi de façon expérimentale sur la base de données étudiée. A la suite de cette étape, 10 patients ont été éliminés du sous-ensemble SE2. L ensemble de données final consiste donc en une série de (83+37) 157 paires d ECG collectées sur 120 patients (82 hommes, 38 femmes ; moyenne d âge ± écart type = 61 ± 15 ans). Un syndrome coronarien aigu (ACS) a été diagnostiqué sur 46 (29%) des 157 ECG standard 12D : (SE1 : 21 ECG ACS et 62 ECG de contrôle et SE2 : 25 ECG ACS et 49 ECG de contrôle) Prétraitement des ECG Pour aligner les tracés ECG issus du PEM et des électrocardiographes 12D, nous avons tout d abord aligné les débuts des QRS (déterminés par le programme de Lyon) des deux

103 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 91 tracés puis nous avons évalué, au moyen d un algorithme de corrélation croisée (cross correlation) [139] le décalage entre les deux enregistrements en analysant les segments allant du début de l onde Q jusqu à la fin de l onde T (QT) des dérivations V2 des deux signaux comme suit (Figure 3.6) : Calcul de la corrélation croisée dans l intervalle QT. Estimation du décalage entre les deux signaux par la localisation de la valeur maximale de la fonction de corrélation. Utilisation du décalage calculé par corrélation croisée pour aligner toutes les dérivations des ECG PEM et Cardiette Configuration de la structure des réseaux de neurones Pour synthétiser les dérivations (V1, V3, V4, V5, V6) à partir du sous-ensemble de dérivations (DI, DII, V2) enregistrées par le PEM, nous avons utilisé comme précédemment un ensemble de comités de 50 réseaux de neurones artificiels constitués de perceptrons multi-couches (PMC). L apprentissage des PMC est effectué à l aide d un algorithme de rétropropagation supervisée (scaled conjugate gradient algorithm, SCG). Chaque réseau consiste en une couche d entrée de 3 neurones (un pour chaque signal enregistré), une couche de sortie de 5 neurones (un pour chaque signal dérivé), et 1 couche cachée de 15 neurones. En d autres termes, il s agit de la même configuration que celle que nous avions obtenue lors de l évaluation sur la base de données de Lund dans les sections précédentes Processus d apprentissage des réseaux de neurones génériques Pour palier au fait que nous ne disposions que d un nombre restreint d ECG standard 12D (83 ECG), nous avons adopté un processus d apprentissage du comité de réseaux de neurones génériques mettant en œuvre une technique de validation croisée (crossvalidation), déjà expliquée dans le chapitre 2, comme suit : l ensemble des 83 ECG 12D de SE1 est divisé en M=10 sous-ensembles égaux et disjoints. Ensuite, pour I = 1 à M, chaque réseau individuel du comité réalise un apprentissage sur les M 1 sous-ensembles restant et l erreur est calculée sur le sous-ensemble I, servant de validation. Les ECG des M 1 sousensembles sont juxtaposés pour former un enregistrement ECG artificiel continu. L arrêt de l apprentissage est réalisé en surveillant l erreur de reconstruction (erreur quadratique moyenne, RMS) sur le sous-ensemble restant I, où les ECG ont été également juxtaposés pour former un enregistrement ECG continu. Le cycle d apprentissage est répété tant que l erreur obtenue en sortie sur les données de l ensemble de validation I est décroissante. La procédure est répétée N fois pour chacun des réseaux du comité. Un nombre fixe d itérations K est alors déterminé en mémorisant pour chacun des M N apprentissages le nombre d itérations et en calculant la moyenne de ces valeurs. Enfin, l apprentissage des

104 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 92 Fig. 3.6 Illustration de l alignement des signaux ECG par corrélation croisée.

105 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 93 N=50 PMC est refait en utilisant la totalité de l ensemble de données SE1 et en prenant comme critère d arrêt le nombre fixe d itérations calculé lors de l étape précédente (Figure 3.7) Processus d apprentissage des réseaux de neurones spécifiques Comme déjà indiqué plus haut, l idéal serait d avoir au moins 3 ECG sériels par patient pour réaliser un apprentissage spécifique au patient. Or avec SE2, nous ne disposons au maximum que de 2 enregistrements sériels par patient. Pour compenser ce manque de données, nous avons adopté la même stratégie que pour la base de données de Lund en utilisant comme critère d arrêt de l apprentissage un nombre fixe d itérations K. En pratique nous avons retenu la valeur de K que nous avons calculé sur les 83 ECG 12D de SE1, soit K=56. Pour chacun des 37 patients du sous-ensemble SE2, nous avons configuré un comité de réseaux de neurones spécifiques. L apprentissage de chacun des N=50 réseaux du comité est effectué sur le premier ECG 12D. Cet apprentissage est conditionné par le nombre fixe d itérations K Vérification et validation de la synthèse de l ECG 12D Pour vérifier la capacité de généralisation des deux versions générique et spécifique de notre méthode de synthèse de l ECG par comités de réseaux de neurones, nous avons testé les deux types de comités sur la deuxième paire d ECG 12D et ECG PEM des 37 patients du sous-ensemble SE2 (la deuxième paire d ECG par patient). Quatre synthèses sont réalisées au total pour chacune des paires d ECG en appliquant tour à tour les comités de réseaux de neurones génériques puis spécifiques aux dérivations DI, DII et V2 de l ECG Cardiette et de l ECG PEM. La qualité de ces synthèses sera évaluée à deux niveaux : 1. Evaluation quantitative par mesures de similarité : il s agit d évaluer la similarité entre les signaux d origine et ceux synthétisés à l aide de mesures du type erreur quadratique moyenne (RMS) et coefficient de corrélation. Pour cette comparaison, nous avons utilisé l intervalle QT (en fait Q-onset -18 à T-offset + 38 msec) de l ECG (Figure 3.8). Les mesures d erreur et de corrélation obtenues sur les ECG synthétisés par comités de réseaux de neurones génériques et spécifiques sont ensuite comparées par rapport à celles obtenues en utilisant des modèles de régression multiple génériques et spécifiques. Ensuite, pour chacune des 4 méthodes et pour chaque dérivation, 5% des valeurs RMS les plus élevées et 5% des coefficients de corrélation les plus bas. Enfin, deux tests statistiques, paired et trimmed paired t-tests, sont effectués pour déterminer si les différences enregistrées entre les deux approches sont statistiquement significatives.

106 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 94 Fig. 3.7 Illustration de l apprentissage et de la validation des comités de réseaux de neurones génériques et spécifiques.

107 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 95 Fig. 3.8 Visualisation des intervalles de temps utilisés pour l apprentissage des comités de réseaux de neurones génériques et spécifiques (PT : P-Onset -18 à T-offset +38 msec) et pour tester leur capacité de généralisation (QT : Q-onset -18 à T-offset +38 msec). En cas d absence de l onde P, on remplace le pointeur P-onset par un pointeur virtuel tel que l intervalle PQ correspondant à l intervalle PQ moyen. 2. Evaluation diagnostique : l exactitude de la reconstruction de l ECG 12D est évaluée au niveau diagnostique en mesurant le degré de concordance entre les résultats de l interprétation automatisée de l ECG de référence et ceux obtenus sur l ECG synthétisé. Cette interprétation est réalisée de la même façon que pour la base de données de Lund en utilisant le programme de diagnostic développé dans le chapitre 2 pour classer respectivement les ECG dérivés par voie générique et ceux générés par voie spécifique à l aide des comités de réseaux de neurones et des modèles de régression multiple. Nous comparons ensuite les interprétations des ECG synthétisés au moyen des modèles de transformations génériques et spécifiques aux résultats de la stratification en deux groupes (contrôle et infarctus) des ECG de référence, réalisée par le même programme que ci-dessus, résultat qui sera considéré comme étant la vérité. La meilleure méthode de synthèse est celle qui fournit la meilleure concordance Résultats Evaluation de la variabilité inter-patients naturelle des ECG Le tableau 3.7 illustre les valeurs des erreurs RMS et des coefficients de corrélation entre le premier et le deuxième ECG standards de SE2 enregistrés à 3 jours d intervalle en moyenne en unité de soins coronariens. La valeur moyenne de l erreur RMS dans l intervalle QT (Q-onset -18 à T-offset +38 msec) pour les dérivations DI, DII, V1, V2,

108 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 96 V3, V4, V5, V6 est de 106 µv. Le coefficient de corrélation est 0.92 en moyenne. Les deux tableaux suivants présentent les résultats entre chacun de ces ECG Cardiette et le deuxième ECG PEM, afin d observer une double confrontation. Le tableau 3.8 illustre les valeurs des erreurs RMS et des coefficients de corrélation entre le premier ECG Cardiette et le deuxième ECG PEM. La valeur moyenne de l erreur RMS dans l intervalle QT pour les dérivations DI, DII et V2 est de 107 µv. Le coefficient de corrélation est de 0.87 en moyenne. Enfin, le tableau 3.9 illustre les valeurs des erreurs RMS et des coefficients de corrélation entre le deuxième ECG Cardiette et l ECG PEM associé. La valeur moyenne de l erreur RMS au niveau de l intervalle QT pour les dérivations DI, DII et V2 est de 80 µv. Le coefficient de corrélation est 0.93 en moyenne. Tab. 3.7 Erreur quadratique moyenne (RMS) en µv et coefficients de corrélation entre les dérivations DI, DII, V1, V2, V3, V4, V5 et V6 du premier et du deuxième ECG Cardiette du sous ensemble SE2, après élimination des 5% des cas les plus extrêmes (N=35). Cardiette 1 vs Cardiette 2 Dérivation RMS (±σ) r (±σ) DI 60 (± 30).93 (±) 0.09 DII 73 (± 32).85 (±) 0.18 V2 125 (± 58).95 (±) 0.07 V1 82 (± 44).95 (±) 0.08 V3 135 (± 57).95 (±) 0.04 V4 136 (± 56).92 (±) 0.08 V5 139 (± 59).90 (±) 0.13 V6 100 (± 41).91 (±) 0.10 Tab. 3.8 Erreur quadratique moyenne (RMS) en µv et coefficients de corrélation entre les dérivations DI, DII et V2 du premier ECG Cardiette et du deuxième ECG PEM du sous ensemble SE2 (N=35). Cardiette 1 vs PEM 2 Dérivation RMS (±σ) r (±σ) DI 93 (± 42).84 (±) 0.18 DII 98 (± 39).83 (±) 0.19 V2 130 (± 64).94 (±) 0.07

109 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 97 Tab. 3.9 Erreur quadratique moyenne (RMS) en µv et coefficients de corrélation entre les dérivations DI, DII et V2 du deuxième ECG Cardiette et de l ECG PEM associé du sous ensemble SE2 (N=35). Cardiette 2 vs PEM 2 Dérivation RMS (±σ) r (±σ) DI 78 (± 38).88 (±) 0.16 DII 74 (± 36).92 (±) 0.11 V2 87 (± 33).98 (±) 0.03 Ces résultats illustrent tout d abord la variabilité de jour en jour de l ECG standard 12D (Cardiette 1 vs Cardiette 2). Cette variabilité est accentuée avec l introduction du positionnement Mason-Likar pour l ECG PEM sur les dérivations DI et DII (Cardiette 1 vs PEM 2). Ce double effet va avoir des conséquences importantes sur la qualité de la synthèse de l ECG standard. Evaluation quantitative Dérivations précordiales (V1, V3... V6) synthétisées à partir de (DI, DII, V2) de l ECG Cardiette Les résultats de l évaluation quantitative en termes d erreur RMS et coefficients de corrélation des dérivations précordiales (V1, V3... V6) synthétisées à partir de (DI, DII, V2) de l ECG Cardiette 2 de SE2 en utilisant tour à tour le comité de réseaux de neurones et le modèle de régression génériques déduits à partir des ECG 12D de SE1 sont illustrés dans le tableau Ces résultats montrent une légère supériorité de la synthèse des ECG par réseaux de neurones, avec une RMS moyenne de 122 µv dans le segment QT versus une RMS moyenne de 126 µv pour la régression générique. Au niveau de la corrélation entre les dérivations synthétisées et les dérivations originales, les deux méthodes affichent une performance à peu près similaire avec une corrélation moyenne de L évaluation quantitative des comités de réseaux de neurones et des modèles de régression spécifiques est illustrée dans le tableau Ces résultats montrent une assez nette supériorité de la synthèse d ECG par réseaux de neurones spécifiques, avec une RMS moyenne de 94 µv dans l intervalle QT, par rapport à la régression spécifique avec une RMS moyenne de 108 µv. Au niveau de la corrélation entre les dérivations synthétisées et les dérivations originales, la synthèse par réseaux de neurones spécifiques affiche des corrélations supérieures à celles de la régression spécifique avec des corrélations moyennes de respectivement 0.96 et 0.95 dans l intervalle QT. Le tableau 3.12 résume les résultats des tests statistiques effectués sur les valeurs des erreurs RMS des 4 méthodes. D après ces résultats, seule l approche de synthèse spécifique

110 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 98 Tab Erreur quadratique moyenne (RMS) en µv et coefficients de corrélation entre les dérivations V1,V3... V6 originales et celles synthétisées par le comité de réseaux de neurones générique (ANN-G) et le modèle de régression générique (REG-G) sur les ECG 2 du sous-ensemble SE2 (N=35). V1, V3... V6 à partir de DI, DII et V2 Cardiette Méthode Dérivation RMS (±σ) r (±σ) A V1 87 (± 42).97 (±) 0.02 N V3 108 (± 50).97 (±) 0.03 N V4 171 (± 77).88 (±) V5 152 (± 65).91 (±) 0.09 G V6 96 (± (±) 0.07 R V1 88 (± 42).97 (±) 0.02 E V3 111 (± 49).96 (±) 0.04 G V4 176 (± 73).88 (±) V5 157 (± 63).90 (±) 0.07 G V6 98 (± 45).92 (±) 0.08 Tab Erreur quadratique moyenne (RMS) en µv et coefficients de corrélation entre les dérivations V1,V3... V6 originales et celles synthétisées par les comités de réseaux de neurones spécifiques (ANN-S) et les modèles de régression spécifiques (REG-S) sur les ECG du sous-ensemble SE2 (N=35). V1,V3... V6 à partir de DI, DII et V2 Cardiette Méthode Dérivation RMS (±σ) r (±σ) A V1 68 (± 30).98 (±) 0.02 N V3 93 (± 45).98 (±) 0.02 N V4 114 (± 45).95 (±) V5 112 (± 42).95 (±) 0.04 S V6 84 (± 34).95 (±) 0.04 R V1 75 (± 33).98 (±) 0.02 E V3 99 (± 46).97 (±) 0.02 G V4 140 (± 55).92 (±) V5 132 (± 46).93 (±) 0.05 S V6 93 (± 40).94 (±) 0.06 * p 0.01, ** p 10 5 (paired t-tests)

111 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 99 affiche une différence statistiquement significative (p< 10 6 ) entre les réseaux de neurones et la régression multiple. Tab Comparaison par les t-tests (pairwised et trimmed) de la différence en termes d erreurs RMS obtenues par les comités de réseaux de neurones et les modèles de régression génériques et spécifiques (N=35). Pairwised t-test Trimmed t-test Méthodes ANN-G vs REG-G ANN-S vs REG-S < 10 6 < 10 7 Dérivations précordiales (V1, V3... V6) synthétisées à partir de (DI, DII, V2) de l ECG PEM Les résultats de l évaluation quantitative en termes d erreur RMS et coefficients de corrélation des dérivations précordiales (V1, V3... V6) synthétisées à partir de (DI, DII, V2) de l ECG PEM 2 au moyen du comité de réseaux de neurones générique et du modèle de régression générique dérivés comme précédemment à partir des ECG Cardiette de SE1, sont illustrés dans le tableau Ces résultats montrent une légère supériorité de la synthèse d ECG par réseaux de neurones génériques, avec une RMS moyenne de 131 µv dans l intervalle QT, par rapport la régression générique avec une RMS moyenne de 134 µv. Au niveau de la corrélation entre les dérivations synthétisées et les dérivations originales, la synthèse d ECG par réseaux de neurones génériques affiche une supériorité plus nette avec une corrélation moyenne de 0.92 dans l intervalle QT, par rapport à la régression générique avec une corrélation moyenne de L évaluation quantitative des comités de réseaux de neurones spécifiques et des modèles de régression spécifiques est illustrée dans le tableau Ces résultats montrent la supériorité de la synthèse d ECG par réseaux de neurones spécifiques, avec une RMS moyenne de 118 µv dans l intervalle QT, par rapport la régression spécifique avec une RMS moyenne de 126 µv. Au niveau de la corrélation entre les dérivations synthétisées et les dérivations originales, la synthèse par réseaux de neurones spécifiques affiche une corrélation supérieure à celle de la régression spécifique avec une corrélation moyenne de respectivement 0.93 et 0.92 dans l intervalle QT. Le tableau 3.15 résume les résultats des tests statistiques effectués sur les valeurs des erreurs RMS des 4 méthodes. D après ces résultats, seule l approche de synthèse spécifique affiche une différence statistiquement significative (p< 0.05) entre les réseaux de neurones et la régression multiple. La qualité de la synthèse affichée par notre approche de comités de réseaux de neurones ne semble pas être globalement très supérieure à celle de l approche traditionnelle de régression linéaire, en particulier au niveau générique. Cependant, vu le fait que dans notre étude les ECG sont enregistrés suivant deux systèmes d acquisition différents :

112 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 100 Tab Erreur quadratique moyenne (RMS) en µv et coefficients de corrélation entre les dérivations V1,V3... V6 originales des 2ème ECG 12D de SE2 et celles synthétisées à partir des ECG PEM chronologiquement homologues par le comité de réseaux de neurones générique (ANN-G) et le modèle de régression générique (REG-G) (N=35). V1,V3... V6 à partir de DI, DII et V2 PEM Méthode Dérivation RMS (±σ) r (±σ) A V1 108 (± 49).96 (±) 0.03 N V3 120 (± 59).96 (±) 0.03 N V4 169 (± 72).88 (±) V5 156 (± 66).89 (±) 0.09 G V6 104 (± 40).90 (±) 0.09 R V1 113 (± 51).95 (±) 0.03 E V3 121 (± 62).96 (±) 0.04 G V4 172 (± 67).88 (±) V5 157 (± 64).88 (±) 0.09 G V6 105 (± 43).89 (±) 0.09 * p 0.05 (paired t-test) Tab Erreur quadratique moyenne (RMS) en µv et coefficients de corrélation entre les dérivations V1,V3... V6 originales et celles synthétisées par les comités de réseaux de neurones spécifiques (ANN-S) et les modèles de régression spécifiques (REG-S) sur les ECG du sous-ensemble SE2 (N=35). V1,V3... V6 à partir de DI, DII et V2 PEM Méthode Dérivation RMS (±σ) r (±σ) A V1 90 (± 35).95 (±) 0.04 N V3 120 (± 61).97 (±) 0.02 N V4 147 (± 69).91 (±) V5 132 (± 53).92 (±) 0.05 S V6 99 (± 43).91 (±) 0.09 R V1 102 (± 42).94 (±) 0.05 E V3 110 (± 50).96 (±) 0.03 G V4 164 (± 72).89 (±) V5 150 (± 58).90 (±) 0.07 S V6 103 (± 47).90 (±) 0.10 * p 0.01 (paired t-test)

113 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 101 positionnement standard pour l ECG 12D et positionnement Mason Likar pour l ECG PEM et l introduction d un déphasage dû à l asynchronisme existant entre les horloges d échantillonnage des dispositifs d enregistrement PEM et Cardiette, la différence devient plus évidente. En effet, ces contraintes ont généré une différence moyenne en termes d erreur RMS de 76 µv et une corrélation moyenne de 0.90 entre les dérivations originales DI et DII des ECG 12D et ECG 3D chronologiquement homologues (tableau 3.9). L effet Mason-Likar sur DI est plus important que la variabilité de jour en jour de l ECG standard 12D (tableau 3.7). Par ailleurs, il convient de remarquer que les valeurs RMS et les corrélations des dérivations V1, V3... V6 synthétisées par les comités ANN-S à partir des tracés PEM 2 sont tout à fait comparables à celles mesurées entre les tracés Cardiette 1 et Cardiette 2 (tableau 3.7). On peut donc penser que l on pourrait encore améliorer les résultats si l on construisait des réseaux spécifiques sur des ECG 12D enregistrés en position Mason-Likar. Tab Comparaison par les tests statistiques t-tests (pairwised et trimmed) de la différence en termes d erreurs RMS obtenues par les comités de réseaux de neurones et les modèles de régression génériques et spécifiques lorsque les entrées sont des ECG PEM (N=35). Pairwised t-test Trimmed t-test Méthodes ANN-G vs REG-G ANN-S vs REG-S < 0.05 < 0.03 Evaluation diagnostique sur SE2 Dérivations précordiales (V1, V3... V6) synthétisées à partir de (DI, DII, V2) de l ECG Cardiette 2 Le tableau 3.16 illustre le degré de concordance entre les interprétations automatiques des ECG Cardiette originaux de SE2 (2ème enregistrement) et celles des ECG 12D synthétisés par le comité de réseaux de neurones génériques et par le modèle de régression multiple générique à partir des dérivations DI, DII et V2 de l ECG Cardiette original lorsqu on considère l interprétation des ECG Cardiette 2 originaux comme étant la vérité. De même, le tableau 3.17 illustre le degré de concordance entre l interprétation automatique des ECG Cardiette originaux et celle des ECG 12D synthétisés par les comités de réseaux de neurones spécifiques et les modèles de régression multiple spécifiques. Les résultats de l évaluation de l impact de la synthèse sur le contenu diagnostique de l ECG montrent une concordance globalement élevée entre les interprétations des ECG synthétisés et celles des ECG de référence. Les matrices de confusion sont quasiment tridiagonales, à l exception d un seul cas diagnostiqué respectivement comme présentant un risque majeur sur l ECG 12D d origine et un risque mineur sur les ECG de synthèse

114 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 102 sauf pour la synthèse par régression spécifique où il est classé dans la catégorie risque moyen. 31 ECG de synthèse sur 37 sont diagnostiqués à l identique de l ECG 12D original. Sur les 6 cas restants, 5 se retrouvent dans des classes adjacentes de part et d autre de la diagonale de la matrice de confusion. Cette tridiagonalité s explique en partie par la nature des règles d affectation à une classe qui sont basées sur des seuils appliqués à la sortie du comité de réseaux de neurones. Il suffit qu un cas soit à la limite du seuil de décision pour qu un epsilon de variation des tracés, donc des paramètres, le fasse changer d une catégorie à l autre. Par ailleurs, il convient de noter aussi que certains paramètres de type syntaxique (tels que les amplitudes et les durées des ondes Q, R, S, R, S,... ) mesurés sur l ECG sont très sensibles à de petites variations. A titre d exemple, en cas de présence d un morphotype de type QRS ou RS avec une toute petite onde R, une très faible modification de l onde R ou du niveau de la ligne de base peut conduire à des modifications conséquentes des paramètres mesurés (Figure 3.9). Comme déjà évoqué dans le chapitre 2, l introduction de fonctions d appartenance floue permettrait sans doute d atténuer ces changements intempestifs de catégorie liés aux seuils de décision utilisés pour mesurer les paramètres ECG de nature syntaxique (relatifs aux ondes Q, R, S,... ) ou pour catégoriser un ECG en l une ou l autre des classes de diagnostic. (a) (b) Fig. 3.9 Incidence de la méthode de synthèse de l ECG sur la calcul des paramètres ECG de type syntaxique. A gauche sur l ECG d origine, le tracé présente une petite onde R et une grande onde S. A droite, sur l ECG de synthèse, aspect typique dit QS. L onde R, microvoltée, n a pas été detectée et par conséquent la durée de l onde Q est passée de 0 à 92 msec et celle de l onde S de 70 msec à 0. Dérivations précordiales (V1, V3... V6) synthétisées à partir de (DI, DII, V2) de l ECG PEM 2 Le tableau 3.18 illustre le degré de concordance entre les interprétations automatiques des ECG Cardiette 2 Originaux et celles des ECG 12D synthétisés à partir des dérivations DI, DII et V2 de l ECG PEM chronologiquement homologue (ECG PEM 2) par le comité de réseaux de neurones génériques et le modèle de régression multiple générique, l interprétation des ECG Cardiette 2 étant considérée comme étant la vérité. De même, le tableau 3.19 illustre le degré de concordance entre les interprétations automatiques des ECG Cardiette 2 originaux et celles des ECG 12D synthétisés par les comités de réseaux de neurones spécifiques et les modèles de régression

115 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 103 Tab Concordance entre les interprétations des ECG originaux et celles de ECG synthétisés à partir des dérivations DI, DII et V2 de l ECG 12D Cardiette 2 par le comité de réseaux de neurones génériques (ANN-G) et par le modèle de régression générique (REG-G). Le logiciel de diagnostic classe les ECG suivant 4 catégories de risque : pas de risque, risque mineur, moyen et majeur. Original pas de risque risque mineur risque moyen risque majeur (6) (15) (5) (11) ANN-G pas de risque (8) risque mineur (14) risque moyen (6) risque majeur (9) REG-G pas de risque (7) risque mineur (15) risque moyen (5) risque majeur (10) Tab Même résultats que dans le tableau 3.16, mais pour les comités de réseaux de neurones spécifiques (ANN-S) et les modèles de régression spécifiques (REG-S). Original pas de risque risque mineur risque moyen risque majeur (6) (15) (5) (11) ANN-S pas de risque (7) risque mineur (15) risque moyen (5) risque majeur (10) REG-S pas de risque (6) risque mineur (16) risque moyen (5) risque majeur (10)

116 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 104 multiple spécifiques. Tab Même résultats que dans le tableau 3.16, mais pour les ECG reconstruits à partir des dérivations DI, DII et V2 de l ECG PEM 2. Original pas de risque risque mineur risque moyen risque majeur (6) (15) (5) (11) ANN-G pas de risque (5) risque mineur (12) risque moyen (13) risque majeur (7) REG-G pas de risque (6) risque mineur (13) risque moyen (10) risque majeur (8) Bien que moins probants, ces résultats sont néanmoins satisfaisants car 34 cas sur 37 cas se retrouvent ici encore sur la tridiagonale de la matrice de confusion. Deux cas supplémentaires montrent un changement de catégorie diagnostique qui va au delà de la catégorie adjacente. Ainsi un cas passe de la catégorie pas de risque à la catégorie risque moyen, un autre passe de la catégorie risque moyen à la catégorie pas de risque. Comme pour l évaluation quantitative, le fait d avoir utilisé des ECG enregistrés à plusieurs minutes d intervalle avec deux systèmes d acquisition différents, ie un positionnement des électrodes DI et DII standard pour l ECG 12D et Mason Likar pour l ECG PEM 3D, parfois des électrodes mal-placées... a pu générer des différences importantes entre les dérivations originales DI et DII des ECG 12D et ECG 3D. Cette variabilité, très importante dans certains cas, a empêché une bonne qualité de synthèse et a dû altérer le contenu diagnostique des ECG. Si l on prend comme critère de qualité le pourcentage de diagnostics sans changements de catégorie (ie la somme des éléments de la diagonale des matrices de confusion divisée par le nombre total de cas analysés, soit 37), ANN-S semble plus performant que REG-S, mais pas plus performant que ANN-G. De façon surprenante, la régression générique (REG-G) avec 21/37 classés à l identique, semble être la méthode la plus performante. Ces résultats sont cependant à prendre avec précaution car avec seulement 37 cas, l ensemble de test n est pas suffisamment représentatif pour en tirer des conclusions définitives.

117 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 105 Tab Même résultats que dans le tableau 3.17, mais pour les ECG reconstruits à partir des dérivations DI, DII et V2 de l ECG PEM 2. Original pas de risque risque mineur risque moyen risque majeur (6) (15) (5) (11) ANN-S pas de risque (7) risque mineur (9) risque moyen (13) risque majeur (8) REG-S pas de risque (8) risque mineur (7) risque moyen (14) risque majeur (8) Discussion Comme le démontre la figure 3.10, La qualité de reconstruction par notre méthode de synthèse de l ECG 12D par comités de réseaux de neurones artificiels spécifiques est excellente compte tenu du faible nombre de dérivations qui ont servi pour réaliser la synthèse et le fait que les ECG ont été enregistrés dans de vraies situations cliniques, par des techniciens différents et avec diverses configurations de positionnement des électrodes. En effet, les différences de similarité entre les ECG originaux et ceux synthétisés se sont avérées principalement dues à des électrodes mal placées ou explicables par les différences de positionnement des électrodes périphériques selon le système de recueil dit de Mason- Likar versus des électrodes fixées aux extrémités des membres et par conséquent n ont pas perturbé le diagnostic dans la majorité des cas. Par ailleurs, malgré le fait qu au niveau générique, les réseaux de neurones n ont pas dépassé en performance la régression multiple, nous croyons que notre approche peut être optimisée en utilisant une base de données d ECG plus grande et plus représentative lors de la phase d apprentissage. De plus, la marge de progression reste conséquente, tant au niveau des collectes d ECG plus adaptés (au moins 3 ECG sériels... ) que du prétraitement des données, de l optimisation de l apprentissage via des techniques d apprentissage sélective [96], évolutive [95]...

118 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard Conclusion Dans ce chapitre, nous avons présenté l étude exhaustive d une méthode originale de synthèse de l ECG 12D par application de comités de réseaux de neurones artificiels que j ai développé au cours de ma thèse. Les évaluations quantitatives et cliniques de la méthode ont démontré son intérêt majeur dans le cadre d un scénario de télémédecine : acquisition d un ECG simplifié à domicile ou en ambulatoire, et génération de l ECG standard 12D correspondant. Les performances enregistrées par la méthode de réseaux de neurones sur des ECG 12D sériels ou des ECG 12D et ECG PEM enregistrés dans des conditions simulant celles d utilisation du PEM (c est à dire en ambulatoire ou à domicile, acquisition par le patient, son entourage ou un/une aide soignant(e), avec un positionnement d électrodes différent de celui de l ECG standard 12D), ont largement dépassé les méthodes conventionnelles publiées dans la littérature. Les premiers résultats des expérimentations de la méthode de synthèse ont été présentés lors de la conférence internationale IEEE Computers in Cardiology 2004 [140]. Un deuxième article, sur l évaluation sur la base de données CHDB, a été soumis pour publication à la revue internationale Methods of Information in Medicine [141], et un troisième article est en cours de rédaction.

119 Chapitre 3. Acquisition de l ECG PEM et synthèse de l ECG standard 107 V1 V3 V4 V5 V6 REG G REG S Original ANN S ANN G Fig Illustration de la qualité de synthèse de l ECG standard 12D à partir de l ECG PEM 3D.

120 Chapitre 4 Mise en place de la plateforme décisionnelle du PEM 4.1 Objectifs Dans ce chapitre, nous allons principalement exposer et traiter les problèmes liées au déploiement des méthodes d intelligence artificielle abordées dans les précédents chapitres, dans la plateforme logicielle du système. Une première problématique est liée à la création des modules de calcul du risque cardiovasculaire : il s agit du module neuronal d interprétation de l ECG PEM, du module bayésien de quantification des facteurs de risque à partir des données du dossier médical de l utilisateur du PEM, et de la couche de collaboration entre les deux modules suivant un système à base de règles de logique floue. Une deuxième problématique est liée au déploiement du module de synthèse de l ECG 12D à partir de l ECG PEM 3D enregistré par l utilisateur (citoyen/patient) lui-même, avec le minimum d assistance professionnelle. Une troisième problématique est de rendre l aide à la décision dans le système adaptée à la spécificité de chaque utilisateur. Les autres problématiques liées à la génération d alarmes et de leur niveau, la gestion de l envoi des alarmes tenant compte des non-réponses éventuelles des serveurs d alarme ou des professionnels de santé contactés... seront brièvement abordés.

121 Chapitre 4. Mise en place de la plateforme décisionnelle du PEM Etat actuel de développement du PEM à l étape de prototype Quatre-vingt prototypes du PEM ont été construits et évalués selon différents scénario d utilisation dans différents centres, à Lyon, Brescia, Catania, Lund et Trento, dans des services d urgence, des unités de soins intensifs, des cliniques de cardiologie, en médecine de ville, au domicile du patient et en ambulatoire, par différents professionnels (cardiologues, généralistes, techniciens ECG, infirmières,... ) et par des patients eux-mêmes [7, 47]. Dans la suite de cette section, nous allons décrire les fonctionnalités et services disponibles dans le PEM à l état actuel de développement Le PEM : intelligence embarquée dans un environnement pervasif multi-acteurs de télémédecine citoyenne Le projet EPI-MEDICS a développé un PEM intelligent et pervasif pour la détection précoce de la survenue d événements cardiovasculaires chez les patients et citoyens utilisateurs du système. La plateforme décisionnelle embarquée dans le PEM permet : la détection des arythmies, le diagnostic des ischémies, la génération d alarmes, et la gestion intelligente des messages d alarmes de manière à assurer un acheminement sécurisé et dans les plus courts délais aux professionnels de santé appropriés : SAMU, médecin traitant... (Figure 4.1) Fig. 4.1 Le PEM (Personal ECG monitor) au service de la prévention et la détection précoce de la survenue d événements cardiovasculaires.

122 Chapitre 4. Mise en place de la plateforme décisionnelle du PEM Architecture pervasive générique Pour permettre une communication pervasive entre les acteurs de l application (utilisateur du PEM, SAMU, cardiologue, etc.) communiquant à l aide de divers outils (PEM, téléphone portable, PDA, etc.), EPI-MEDICS a réalisé une architecture générique basée sur les technologies d Internet (TCP/IP) et le meta-language XML pour la représentation, le stockage et la communication des données [6, 142]. L architecture pervasive d EPI-MEDICS (Figure 4.2) consiste en une application principale installée sur un serveur web dont le principal objectif est d assurer la gestion de l échange des messages, et des applications clients distribuées, la communication étant sécurisée grâce au protocole HTTPS. Un message contient une partie liée à la communication, une copie du dossier de santé électronique, et tout autre fichier attaché tel qu un ECG au format SCP-ECG. Pour assurer la bonne réception de l information dans un délai acceptable, l architecture permet d acheminer partout, différents types de notification par le biais des divers moyens et technologies de communication de l ère actuelle (Pager, SMS, PDA, etc.). Fig. 4.2 Un exemple d architecture d EPI-MEDICS : un serveur web assure la gestion intelligente des échanges de messages, et des applications clientes distribuées servant à envoyer et à recevoir les demandes XML de télé-expertise via HTTPS.

123 Chapitre 4. Mise en place de la plateforme décisionnelle du PEM Génération et gestion d alarmes Différents niveaux d alarmes sont générés suivant la sévérité de l événement cardiaque : alarmes majeure, moyenne, mineure, ou pas d alarme. Les alarmes de niveau majeur (infarctus aigu, arythmies sévères) sont transmises au SAMU ou à l un des centres d urgence identifiés et stocké dans le PEM en utilisant Bluetooth et GPRS via le téléphone portable de l utilisateur (Figure 4.3). Sont transmis en priorité : 1. un message d alarme indiquant la cause et le degré de gravité de l alarme ; 2. les données permettant d identifier et de localiser le patient ; 3. l ECG qui a été la cause de la génération de l alarme ; 4. le dossier médical du patient, notamment ses antécédents cardiaques et ses facteurs de risque ; 5. l ECG de référence (s il existe) ; 6. un descriptif des symptômes cliniques (si le patient a eu le temps de les documenter) ; 7. l ECG précédant l ECG anormal (si spécifié par les paramètres d envoi du patient). Fig. 4.3 Scénario d alarme majeure. Dans le cas d une alarme de niveau moyen (suspicion d ischémie, arythmie atypique), l ensemble des informations (ECG PEM et le dossier médical électronique embarqué) est envoyé à un serveur d alarmes (Figure 4.4) qui envoie dès réception un SMS au médecin traitant (cardiologue ou généraliste) identifié dans la liste des contacts du patient embarquée dans le PEM. Ce SMS indique la raison et l importance du niveau d alarme, le numéro du téléphone portable du patient, l adresse du serveur d alarmes (couramment : http ://pem-alarm.insa-lyon.fr ou http ://pemalarm. univ-lyon1.fr), un identifiant de 6 chiffres générés aléatoirement et un mot de passe choisi aléatoirement dans un dictionnaire de mots courants de 6 à 8 caractères. Le médecin traitant peut alors se connecter au serveur d alarmes au moyen d Internet, visualiser l ensemble des informations disponibles pour ce patient au moyen d un simple browser Web, et prendre les décisions qui

124 Chapitre 4. Mise en place de la plateforme décisionnelle du PEM 112 s imposent : contacter le patient, requalifier le niveau d alarme en alarme majeure en demandant au serveur d envoyer l ensemble des informations au SAMU, demander une télé-expertise auprès d un confrère, copier le ou les ECGs stockés temporairement sur le serveur d alarme dans le dossier médical du patient... Fig. 4.4 Scénario d alarme moyenne. Dans le cas d une alarme de niveau mineur, le PEM affiche un message invitant l utilisateur à signaler ce message à son médecin traitant à l occasion d une prochaine visite à son cabinet. Le contenu du message est archivé dans le PEM en même temps que l ECG et les résultats de l analyse quantitative et le médecin pourra par la suite télécharger et visualiser l ECG concerné. Enfin, si la probabilité du risque cardiovasculaire n est pas significative, le PEM émet un message réconfortant au patient : pas de risque, état cardiaque normal Détection des arythmies et des ischémies La détection des arythmies est basée sur un système à base de règles de logique floue. Le module d interprétation du rythme cardiaque, conçu mais pas encore implanté dans le PEM, calcule les variations de l ECG PEM par rapport à un ECG de référence. Suivant la catégorie auquel correspond l utilisateur du PEM, à savoir, athlète professionnel 1, sujet sain, sujet avec des antécédents d arythmies dans le passé, sujet souffrant de problèmes cardiaques, le module applique une série de règles standards utilisées pour détecter l arythmie. Ces règles originalement faites en logique booléenne ont été traduites en logique floue 1 Il est en effet connu que l ECG d un sportif professionnel est très différent de l ECG d un sujet de même âge, du même sexe et de même catégorie diagnostique mais non sportif. En particulier, le segment ST peut présenter des décalages par rapport à la ligne de base de l ECG avoisinant les critères d ischémie chez un sujet sain, sportif professionnel

125 Chapitre 4. Mise en place de la plateforme décisionnelle du PEM 113 pour permettre plus de flexibilité et sensibilité dans l interprétation. La détection des ischémies est basée sur l utilisation de comités de réseaux de neurones artificiels de respectivement 100 réseaux pour l analyse unaire et 75 pour l analyse sérielle. L analyse unaire n est invoquée que si aucun ECG de référence n est disponible. Les réseaux de neurones sont représentés suivant un format texte, développé dans le cadre d EPI-MEDICS. Ce format contient la description de tous les paramètres des réseaux de neurones (poids, biais, fonctions d activation) afin de rendre possible son déploiement. Enfin, un logiciel, simulant le fonctionnement des réseaux de neurones, charge les réseaux du comité, récupère les paramètres unaires/sériels et lance l interprétation de l ECG PEM [143] Reconstruction de l ECG standard 12D à partir de l ECG PEM 3D Lors de l enregistrement d un ECG, le PEM peut détecter un disfonctionnement cardiaque et contacter un centre d appel (SAMU) ou un professionnel de santé (médecin traitant). Comme nous l avons déjà expliqué, le PEM est conçu pour envoyer l ECG responsable du déclenchement de l alarme dans un format compréhensible et interprétable par les cardiologues, à savoir l ECG standard 12D, encodé suivant la norme SCP-ECG. Pour assurer la reconstruction de l ECG standard, un module de synthèse, basé une matrice de transformation générique, a été embarqué dans le PEM. Au cours du projet EPI-MEDICS, diverses approches de synthèse ont été évaluées ou développées, dont notamment la méthode de reconstruction par réseaux de neurones que j ai développé et présenté dans ce rapport de thèse. Cette méthode originale et très prometteuse a été testée sous Matlab mais n a pas encore été implémentée dans le PEM. Une étude va être menée pour déterminer la meilleure stratégie de déploiement, du fait du coût de calcul que nécessite l apprentissage de comités de réseaux de neurones à grande échelle (tous les futurs utilisateurs du PEM). Quelques réponses sont fournies dans la suite de ce chapitre. 4.3 Vers un produit final : stratégies de déploiement du module de synthèse de l ECG embarqué dans le PEM D un point de vue technique, l intégration des technologies d analyse multivariée telles que les réseaux de neurones dans un système d aide à la décision tel que le PEM pour réaliser un module de synthèse de l ECG tend à être coûteux en termes d espace mémoire

126 Chapitre 4. Mise en place de la plateforme décisionnelle du PEM 114 et de temps de calcul, particulièrement pendant la phase d apprentissage des réseaux de neurones. Cependant, une fois le processus d apprentissage réalisé, la synthèse d un enregistrement ECG de 10 sec ne prend qu environ 5 sec sur un ordinateur Pentium IV de 2 GHz sous Matlab. Cette durée de traitement sera alors encore bien réduite en phase opérationnelle en utilisant le langage C. D autres part, il faut savoir que l objectif principal de la synthèse d ECG n est pas la prise de décision dans le PEM mais plutôt la reproduction la plus fidèle possible d un ECG 12D correspondant à l ECG PEM critique afin de le rendre interprétable par le cardiologue destinataire. Dans le PEM, la reconstruction des dérivations (V1, V3,... V6) manquantes permet de produire un enregistrement ECG compatible au standard SCP-ECG qui sera stocké dans la carte mémoire du PEM. Deux types de solutions pourraient être utilisés pour réaliser le module de synthèse de l ECG par réseaux de neurones, suivant notre perception de l opérabilité du PEM : système complètement autonome ou semi autonome Le PEM, un dispositif autonome La puissance de calcul de l informatique embarquée a progressé énormément cette dernière décennie approchant aujourd hui les capacités de calcul d un Pentium III de 800 MHz. Ce potentiel de calcul pourrait nous permettre de doter le PEM d un moteur d apprentissage des réseaux de neurones. Ce moteur utiliserait les bases de données d ECG propre à l utilisateur du système pour mettre à jour le jeu de paramètres des comités de réseaux de neurones spécifiques Le PEM, un dispositif semi-autonome Bien que le choix d un dispositif complètement autonome semble être séduisant, une étude de l intérêt de l introduction de telles puissances de calcul et surtout de son impact au niveau du prix unitaire de l appareil, devrait être effectuée. Une solution moins coûteuse et plus facilement évolutive au niveau matériel mais qui peut être plus compliquée à mettre en place du point de vue logiciel, consiste à se servir des moyens de communication intégrés dans le PEM (Blue Tooth, GPRS, serveur web... ) pour permettre la communication de données entre le PEM et les professionnels de santé. De tels moyens permettent d envoyer les ECG collectés par le patient à un serveur web sur lequel chaque patient disposerait d un dossier médical électronique ainsi que de sa propre base de données ECG. Ces données peuvent être dynamiquement mises à jour et révisées au moyen de technologies de grilles de calcul et de services web.

127 Chapitre 4. Mise en place de la plateforme décisionnelle du PEM 115 Service web et grille de calcul : grille pervasive La technologie service web en informatique médicale Par définition, un service web est une entité logicielle conçue pour permettre l interaction fluide et transparente entre des applications hétérogènes à travers un réseau. Un service web est doté d une interface décrite dans un format interprétable par les machines : le format WSDL. Les applications interagissent avec le service web moyennant des messages en SOAP 2, transmis via HTTP avec une sérialisation XML en conjonction avec les standards Web. L architecture des services web comprend trois technologies émergentes : SOAP, WSDL 3, et UDDI 4. Un processus service web typique inclut : un fournisseur de services (provider) qui déploie les services web représentant la gamme de services, applications et spécificités systèmes fournies par ce fournisseur, et qui seront publiées dans un registre UDDI, un demandeur de service (requester) qui fouille le registre à la recherche du service requis et pourrait par la suite être mis en lien avec le fournisseur. Les services web fournissent une base de référence commune pour déployer, représenter et formater à la fois les entrées et les sorties des données des applications d informatique médicale existantes. L apport de l infrastructure grille de calcul L intérêt majeur d une plateforme de synthèse d ECG est de permettre une application à grande échelle de l apprentissage neuronal afin de configurer un dispositif de transformation spécifique à chaque utilisateur du PEM. Cependant, un tel objectif n est pas réalisable sans la mise en œuvre de ressources de calcul suffisantes. D où l intérêt de faire appel à une infrastructure à base de grille de calcul. Une grille de calcul est une infrastructure matérielle et logicielle qui fournit un accès consistant, pervasif et non coûteux à des ressources de traitement conséquentes. Au cours des 5 dernières années, les outils de développement et de déploiement des applications de grille de calcul sont devenus de plus en plus nombreux : Legion (http ://legion.virginia.edu), Condor (http :// Unicore (http :// org), Globus (http :// etc. Ces outils permettent la coordination des ressources qui ne sont pas sujet à un contrôle centralisé en utilisant des protocoles et interfaces génériques et standards et de délivrer une qualité de service constante. La combinaison de ces technologies de service web et grille de calcul sous l intitulé 2 SOAP (Simple Object Access Protocol) est un protocole de transmission de messages. SOAP n est ni lié à un système d exploitation ni à un langage de programmation. En tant que tel, il s agit d un important composant de base pour développer des applications distribuées 3 WSDL est le langage de description des services Web (Web Services Description Language). Un fichier WSDL est un document XML décrivant un ensemble de messages SOAP et la manière dont les messages sont échangés 4 UDDI (Universal Discovery Description and Integration) est l équivalent des pages jaunes dans les services Web. Une entrée du répertoire UDDI est constituée d un fichier XML qui décrit une entreprise et les services qu elle offre.

128 Chapitre 4. Mise en place de la plateforme décisionnelle du PEM 116 de grille pervasive suscite de plus en plus d intérêt en télémédecine [144]. La figure 4.5 illustre bien l utilité d une stratégie de déploiement faisant appel à de telles technologies dans le cadre de notre application. Fig. 4.5 Grille pervasive au service de la télémédecine. Inspiré de David De Roure, Mobile Medical Monitoring, National e-science Centre Talk.

129 Chapitre 4. Mise en place de la plateforme décisionnelle du PEM Scénario d utilisation du module de synthèse d ECG Moyennant la technologie des services web et l infrastructure de grille de calcul, la tâche d apprentissage des réseaux de neurones est déléguée à un service web. Ce dernier s approprie des ressources de calcul nécessaires pour effectuer un apprentissage d un comité de réseaux de neurones spécifiques et pour renvoyer les résultats au PEM. Le mode de fonctionnement envisagé est le suivant (Figure 4.6) : Lors de la première utilisation du système et jusqu à l acquisition d un ECG standard de référence, l utilisateur enregistre un ECG 3D et l ECG artificiel 12D correspondant serait synthétisé à partir de l ECG PEM en appliquant le comité de réseaux de neurones génériques stocké initialement dans le PEM. Le module de synthèse d ECG est mis à jour par l ajout d un dispositif de synthèse d ECG spécifique à l occasion d une des visites du patient chez son cardiologue. Cette mise à jour est conditionnée par l acquisition d un ECG standard 12D par le cardiologue. Ce dernier accède via Internet à l un des serveurs d application d EPI- MEDICS, envoie l ECG du patient au serveur d application qui, à l aide d un service web, calcule et retourne un comité de réseaux de neurones spécifique au patient. En effet, à chaque nouvelle acquisition d ECG standard 12D, le cardiologue devrait envoyer ces nouveaux ECG au serveur d application pour être stockés dans une base de données propre au patient. Cette base de données servira ultérieurement à mettre à jour à la fois les dispositifs de synthèse d ECG spécifique et générique. En outre, même si la synthèse spécifique s est avérée être plus précise, la reconstruction par voie générique reste particulièrement attrayante dans les situations où le bruit ou des artefacts sont relevés sur les signaux. En effet, alors que la reconstruction spécifique peut devenir davantage influencée par ce phénomène et produire des ECG de mauvaise qualité avec un risque d altérer le contenu diagnostique, la reconstruction générique est moins vulnérable à cet effet puisqu elle a été obtenue à partir d un grand ensemble d ECG anonymes et variables intra et inter sujets. Pour ces raisons, chaque fois que l utilisateur du PEM acquiert un nouvel ECG, les deux dispositifs de synthèse spécifique et générique sont employés pour produire respectivement deux ECG de synthèse, l un générique et l autre spécifique. Un module d analyse de la qualité du signal devrait être conçu pour déterminer le meilleur ECG synthétisé suivant une série de test : par exemple, comparaison par rapport à l ECG de référence acquis par le cardiologue, etc. Ceci aiderait à éviter les erreurs de diagnostic dues à une mauvaise qualité d ECG synthétisés.

130 Chapitre 4. Mise en place de la plateforme décisionnelle du PEM 118 Fig. 4.6 Scénario d utilisation du module de synthèse d ECG. Le cardiologue acquiert un ECG standard 12D du patient, accède via Internet au serveur d application qui, à l aide d un service web, réserve les ressources nécessaires, calcule et met à jour les dispositifs de synthèse d ECG par réseaux de neurones dans le PEM.

131 Chapitre 4. Mise en place de la plateforme décisionnelle du PEM Conclusion Dans ce chapitre, nous avons présenté les aspects liés au déploiement et à la maintenance de la plateforme décisionnelle du PEM, en particulier le module neuronal d interprétation de l ECG PEM, et le module de gestion et d envoi d alarmes. Nous avons également présenté les stratégies de déploiement du module de reconstruction de l ECG par comités de réseaux de neurones intégrant des serveurs web applicatifs et des grilles de calcul. La mise en application de ce module dans le cadre d un scénario global à grande échelle de calcul d une matrice de synthèse spécifique à chaque utilisateur du PEM serait sans doute l une des principales perspectives de recherche future de nos travaux.

132 Quatrième partie Conclusion générale 120

133 Conclusion générale Ce mémoire constitue une présentation détaillée de mes travaux de recherche au cours de 4 années de thèse. Ces travaux, qui s inscrivent dans la continuité du projet européen EPI-MEDICS qui a pour objectif la réalisation d un moniteur personnel d ECG (PEM), ont contribué à mettre en œuvre les modules de diagnostic automatique de l infarctus et la synthèse de l ECG standard. Ces modules seront les fondements de la future plateforme d aide à la décision qui sera embarquée dans le PEM. Trois domaines d étude ont été abordés dans cette thèse : le classement automatique, la fusion de données, et l approximation de signaux. Pour chacune de ces parties, nous présentons ci-après un résumé de notre contribution et quelques perspectives. Interprétation automatique de l ECG et fusion de données Résumé Les travaux présentés dans la première partie du document (chapitre 2) interviennent dans la réalisation des divers modules de la plateforme intelligente d aide à la décision qui sera ultérieurement intégrée dans le PEM. Cette plateforme, basée sur l utilisation de techniques d intelligence artificielle, combinera à la fois l interprétation de l ECG du patient et des données cliniques contenues dans son dossier médical personnel pour générer un score de risque d infarctus. L architecture fonctionnelle de la plateforme fut l objet d une présentation lors des Journées Sciences, Technologies et Imagerie pour la Médecine à Nancy en Mars 2005 [145]. Le module d interprétation des ECG enregistrés par l utilisateur lui-même établit un diagnostic d infarctus du myocarde par le biais des réseaux de neurones qui ont montré une performance de diagnostic élevée, comparable à celle des experts cardiologues. Cette supériorité des réseaux de neurones, par rapport à des approches traditionnelles telles que l analyse discriminante, provient principalement de la combinaison de leurs résultats.

134 122 Le module de stratification des facteurs de risque par réseaux bayésiens permet d estimer le taux de risque de la survenue d un événement cardiovasculaire en s appuyant sur les facteurs de risque propres au patient. La performance enregistrée par l approche des réseaux bayésiens s est avérée très prometteuse. J ai été invité à présenter une communication orale sur les résultats du module bayésien lors du 6ème STAFF Studies Symposium qui a été organisé par le Duke Medical Center de Durham à St Jean d Ardières en septembre De même, la présentation de la méthode et des résultats viennent d être acceptés pour publication à la conférence internationale IEEE Computers in Cardiology 2006 [115]. Perspectives Les perspectives d évolution et d amélioration des méthodes présentées dans cette partie, les réseaux de neurones et les réseaux bayésiens, sont très nombreuses pour diverses raisons : d une part liées au fait qu il faudrait explorer de nouvelles approches d optimisation des méthodes actuelles. En effet, la marge de progression reste conséquente : au niveau du prétraitement des données (le choix de l ACP pour les réseaux de neurones... ), et de l optimisation de l apprentissage neuronal via des techniques d apprentissage sélective [96], évolutive [95], etc. d autre part, liés au fait qu il faudrait tester d autres techniques de prédiction, notamment pour le module de stratification des facteurs de risque. Les réseaux bayésiens dynamiques devraient être testés par rapport aux réseaux bayésiens statiques que nous avons utilisés jusqu à présent. Mais cela est conditionné par le fait d avoir une base de données dynamique où chaque patient dispose d un suivi régulier avec enregistrement de tous les ECG, données cliniques, évolution diagnostique dans la base de données. En d autres termes, il faudrait avoir, pour le même patient, un historique médical complet et sériel afin de pouvoir établir une stratification évolutive du risque cardiovasculaire. De même, la construction (en cours) d une base de données PEM (ECG PEM, ECG standards, données cliniques, etc.) devrait permettre de tester différents scénarios d interaction entre les classifieurs grâce à la mise en œuvre d algorithmes de logique floue pour maximiser la sensibilité d interprétation du système tout en conservant une spécificité élevée. Enfin, la validation des diverses méthodes et techniques développées au cours de cette thèse nécessitent d effectuer des évaluations cliniques conséquentes pour s assurer de la qualité des algorithmes mis en place, évaluations qui sont de fait freinées par l absence de bases de données dans ce domaine. Une première étape d évaluation va être effectuée sur une série de bases de données à laquelle nous avons récemment eu accès (BUSSEL- TON [146], MRACS [147]). Ultérieurement, les méthodes et algorithmes développés et implémentés dans le système vont faire l objet d une expérimentation pilote et d une évaluation clinique en région Rhône-Alpes dans le cadre du projet SIPIRA (Système Intégré Pervasif Intelligent de suivi de patients cardiaques en région Rhônes-Alpes), etc.

135 Synthèse de l ECG par comités de réseaux de neurones 123 Résumé L autre apport de cette thèse est le développement d une méthode originale et performante permettant la synthèse de l ECG standard 12 dérivations à partir d un ECG simplifié enregistré par le patient. Les évaluations effectuées sur une population d étude de 300 patients de la base de données de Lund ont montré une amélioration de plus de 15% en qualité de signal par rapport aux méthodes linéaires préconisées par la littérature. Les résultats de cette expérimentation ont été présentés à la conférence internationale IEEE Computers in Cardiology en septembre 2004 [140]. La deuxième étape d évaluation, diagnostique, sur la base de données de Lund est prévue pour publication. La troisième étape d évaluation sur la base de données CHDB (ECG PEM 3D et ECG standard 12D) a été soumise pour publication dans la revue internationale Methods of Information in Medicine [141]. Cette dernière phase d évaluation de la méthode de synthèse par réseaux de neurones sur des ECG 12D sériels ou des ECG PEM enregistrés dans des conditions simulant celles d utilisation du PEM (c est à dire en ambulatoire ou à domicile, acquisition par le patient, son entourage ou une aide soignante, avec un positionnement d électrodes différent de celui de l ECG standard 12D), a montré une performance largement supérieure à celle de la littérature. Perspectives L approche de reconstruction que j ai développée a prouvé son efficacité. La prochaine étape consistera à procéder au déploiement de la méthode dans le PEM et à prévoir l infrastructure nécessaire pour réaliser l apprentissage neuronal à grande échelle, à savoir le recours aux technologies des services web et grilles de calcul. Le mot de la fin L objectif de cette thèse a été de contribuer à la conception et la réalisation d un moniteur personnel d ECG (PEM) capable de détecter les dysfonctionnements cardiaques, de gérer des alarmes et de transmettre les informations relatives à l utilisateur du système (citoyen/patient) aux services de santé concernés. L ensemble des travaux qui a été présenté dans cette thèse est motivé par la volonté de développer un outil efficace de prévention qui pourrait réduire la mortalité et la morbidité liées à la survenue d événements cardiovasculaires en réduisant le temps séparant l apparition des symptômes et le début des traitements. Nous espérons que cette étude servira à stimuler la recherche dans ce domaine.

136 Bibliographie [1] World health statistics 2006, World Health Organization, Tech. Rep., [2] Recommendations of a Task Force of the European Society of Cardiology and the European Resuscitation Council on The Pre-Hospital Management of Acute Heart Attacks, Eur Heart J, vol. 19, pp , [3] J. McMurray et al., Cardiology I : Treatment of myocardial infarction, unstable angina, and angina pectoris, BMJ, vol. 309, no. 6965, pp , [4] R. Luepker, Delay in acute myocardial infarction : why don t they come to the hospital more quickly and what can we do to reduce delay? Am Heart J, vol. 150, no. 3, pp , [5] A. McGinn, D. Goff, H. Taylor, et al., Trends in prehospital delay time and use of emergency medical services for acute myocardial infarction : experience in 4 US communities from , Am Heart J, vol. 150, no. 3, pp , [6] P. Rubel, J. Fayn, L. Simon-Chautemps, H. Atoui, et al., New paradigms in telemedicine : ambient intelligence, wearable, pervasive and personalized, Stud Health Technol Inform, vol. 108, pp , [7] P. Rubel, J. Fayn, S. Arod, H. Atoui, D. Telisson, et al., Intelligence Ambiante et Systèmes Pervasifs en Télémédecine. Exemples d Applications en Télécardiologie, La Revue des SAMU, vol. 26, pp , [8] Myocardial Infarction redefined - A concensus document of the joint European Society of Cardiology / American College of Cardiology Committee for the redefinition of myocardial Infarction, Eur Heart J, vol. 21, pp , [9] S. Smith, S. Blair, R. Bonow, L. Brass, et al., AHA/ACC Guidelines for Preventing Heart Attack and Death in Patients With Atherosclerotic Cardiovascular Disease : 2001 update. A statement for healthcare professionals from the American Heart Association and the American College of Cardiology, J Am Coll Cardiol, vol. 38, no. 5, pp , [10] H. McGill, C. McMahan, E. Herderick, et al., Obesity accelerates the progression of coronary atherosclerosis in young men, Circulation, vol. 105, no. 23, pp , 2002.

137 BIBLIOGRAPHIE 125 [11] L. Goldstein, R. Adams, M. Alberts, L. Appel, et al., Primary prevention of ischemic stroke : a guideline from the American Heart Association/American Stroke Association Stroke Council, Circulation, vol. 113, no. 4, pp , [12] J. Salonen, G. Alfthan, J. Huttunen, J. Pikkarainen, et al., Association between Cardiovascular Death and Myocardial Infarction and Serum Selenium in a Matchedpair Longitudinal Study, Lancet, vol. 24, pp , July [13] A. Kadish, A. Buxton, H. Kennedy, B. Knight, et al., ACC/AHA clinical competence statement on electrocardiography and ambulatory electrocardiography : A report of the ACC/AHA/ACP-ASIM task force on clinical competence (ACC/AHA committee to develop a clinical competence statement on electrocardiography and ambulatory electrocardiography) endorsed by the International Society for Holter and noninvasive electrocardiology, Circulation, vol. 104, no. 25, pp , [14] J. Alpert, K. Thygesen, E. Antman, et al., Myocardial infarction redefined a consensus document of The Joint European Society of Cardiology/American College of Cardiology Committee for the redefinition of myocardial infarction, J Am Coll Cardiol, vol. 36, no. 3, pp , [15] B. McCarthy, J. Beshansky, et al., Missed diagnoses of acute myocardial infarction in the emergency department : Results from a multicenter study, Ann Emerg Med, vol. 22, pp , [16] R. Puleo, D. Meyer, C. Wathen, C. Tawa, et al., Use of a rapid assay of subforms of creatine kinase MB to diagnose or rule out acute myocardial infarction, N Engl J Med, vol. 331, pp , [17] R. Roberts et al., Earlier diagnosis and treatment of acute myocardial infarction necessitates the need for a new diagnostic mind set, Circulation, vol. 89, pp , [18] J. Pope, T. Aufderheide, R. Ruthazer, R. Woolard, et al., Missed diagnoses of acute cardiac ischemia in the emergency department, N Engl J Med, vol. 342, no. 16, pp , [19] H. Koukkunen, K. Pyorala, et al., Low-risk patients with chest pain and without evidence of myocardial infarction may be safely discharged from emergency department, Eur Heart Journal, vol. 25, pp , [20] C. Swap et al., Value and Limitations of Chest Pain History in the Evaluation of Patients With Suspected Acute Coronary Syndromes, JAMA, vol. 294, pp , [21] J. Willems, P. Arnaud, J. van Bemmel, R. Degani, et al., Common standards for quantitative electrocardiography : goals and main results. CSE working party, Methods Inf Med, vol. 29, no. 4, pp , 1990.

138 BIBLIOGRAPHIE 126 [22] M. Ohlson, H. Öhlin, S. Wallerstedt, et al., Usefulness of Serial Electrocardiograms for Diagnosis of Acute Myocardial Infarction, Am J Cardiol, vol. 88, no. 5, pp , [23] P. Rubel, J. Fayn, et al., State of the art of automated and serial ECG analysis, Information Society Technologies Programme, Tech. Rep. D2.1, [24] P. Arnaud, P. Rubel, D. Morlet, J. Fayn, et al., Methodology of ECG Interpretation in the Lyon Program, Methods Inf Med, vol. 24, no. 4, pp , [25] J. Willems, C. Abreu-Lima, P. Arnaud, et al., The diagnostic performance of computer programs for the interpretation of electrocardiograms, N Engl J Med, vol. 325, no. 25, pp , [26] J. Fayn et al., Caviar, a Serial ECG Processing System for the Comparative Analysis of VCGs and their Interpretation with Auto-reference to the Patient, J Electrocardiol, no. 21, pp , [27] J. Fayn, L analyse séquentielle des électrocardiogrammes. une approche par comparaison optimale d images filaires spatio-temporelles, Ph.D. dissertation, INSA de Lyon, [28] P. Macfarlane, Computer Processing of the 12-Lead ECG, Cardiac Electrophysiology Review, vol. 1, no. 3, pp , [29] L. Dowdy, G. Wagner, Y. Birnbaum, P. Clemmensen, et al., Early repolarization : friend or foe? Am J Med, vol. 115, no. 3, pp , [30] J. Healy, Editorial of the special health and the Internet for all, Int J Med Inform, vol. 75, no. 1, [31] A. Bynum, C. Cranford, C. Irwin, et al., Effect of telemedicine on patients diagnosis and treatment, J Telemed Telecare, vol. 12, no. 1, pp , [32] J. Fayn, C. Ghedira, D. Telisson, et al., Towards New Integrated Information and Communication Infrastructures in ehealth. Examples from Cardiology, in IEEE Computers in Cardiology, A. Murray, Ed., vol. 30, 2003, pp [33] C. Massone, H. Soyer, R. Hofmann-Wellenhof, et al., Two years experience with Web-based teleconsulting in dermatology, J Telemed Telecare, vol. 12, no. 2, pp. 83 7, [34] J. Ameen, A. Coll, et al., Impact of tele-advice on community nurses knowledge of venous leg ulcer care, J Adv Nurs, vol. 50, no. 6, pp , [35] J. Fayn, F. Petitjean, et al., Macro-data : a new approach for the development of tele-expertise applications, in IEEE Computers in Cardiology, vol. 26, 1999, pp

139 BIBLIOGRAPHIE 127 [36] V. Rialle, N. Noury, et al., An experimental health smart home and its distributed internet-based information and communication system : first steps of a research project, in Medinfo, vol. 10, no. 2, 2001, pp [37] J. Thomesse, D. Belot, A. Boyer, et al., Integrated information technologies for patients remote follow up and homecare, in HealthCom, 2001, pp [38] P. Rubel, J. Willems, C. Zywietz, J. Fayn, et al., Health in the New Communications Age. IOS Press, 1995, vol. 24, ch. OEDIPE. Open European Data Interchange and Processing for Electrocardiography, pp [39] Health in the New Communications Age. IOS Press, Amsterdam, 1995, vol. 24. [40] J. van Bemmel, A. van Ginneken, H. Stam, et al., Integration and communication for the continuity of cardiac care (i4c), J Electrocardiol, vol. 31, pp. 60 8, [41] J. van Bemmel, Handbook of Medical Informatics. Springer, New York, [42] P. Rubel et al., Protocole de communications standard pour l électrocardiographie quantitative, Informatique et Santé, vol. 4, pp , [43] Medical informatics standard communication protocol-computer-assisted electrocardiography (SCP-ECG), ENV, Tech. Rep. 1064, [44] J. Willems, P. Rubel, et al., Standard interchange for computerized electrocardiography, Stud Health Technol Inform, vol. 6, pp , [45] P. Rubel, J. Willems, et al., Development of a conceptual reference model for digital ECG data storage, in IEEE Computers in Cardiology, vol. 18, 1991, pp [46] P. Rubel, J. Willems, C. Zywietz, et al., Towards open data interchange and processing of serial ECGs, in IEEE Computers in Cardiology, vol. 19, 1992, pp [47] P. Rubel, J. Fayn, G. Nollo, D. Assanelli, B. Li, et al., Toward personal ehealth in cardiology. Results from the EPI-MEDICS telemedicine project, J Electrocardiol, vol. 38, pp , [48] E. Harold et al., XML in a Nutshell, Third Edition. OReilly Media, Paris, [49] E. Berner, Clinical Decision Support Systems : Theory and Practice. Springer, NY, [50] J. Haton, N. Bouzid, F. Charpillet, et al., Le raisonnement en intelligence artificielle. InterEditions, Paris, [51] A. Jain, R. Duin, et al., Statistical Pattern Recognition : a review, IEEE Trans Pattern Anal Mach Intell, vol. 22, pp. 4 37, [52] C. Bishop, Neural Networks for Pattern Recognition. Oxford University Press, Oxford, 1996.

140 BIBLIOGRAPHIE 128 [53] B. Kirkwood et al., Essential Medical Statistics. Blackwell Science, UK, [54] G. McLachlan, Discriminant Analysis and Statistical Pattern Recognition. Wiley Interscience, Canada, [55] H. Bengtsson, Bayesian Networks : a Self-contained Introduction with Implementation Remarks, Mathematical Statistics, Lund Institute of Technology, Tech. Rep., [56] G. Luger, Artificial Intelligence : Structures and Strategies for Complex Problem Solving. Addison Wesley, [57] A. Sharkey et al., Diversity, Selection and Ensembles of Artificial Neural Nets, in Proceedings of Third International Conference on Neural Networks and their Applications, Marseille, France, March 1997, pp [58] J. Bailey, A. Berson, H. Handelsman, et al., Utility of Current Risk Stratification Tests for Predicting Major Arrhythmic Events After Myocardial Infarction, JACC, vol. 38, no. 7, pp , [59] A. D. Timmis, Early diagnosis of acute myocardial infarction, BMJ, vol. 301, pp , [60] A. Timmis, Will serum enzymes and other proteins find a clinical application in the early diagnosis of myocardial infarction? Br Heart J, vol. 71, pp , [61] H. Lee, S. Cross, P. Garthwaite, A. Dickie, I. Ross, et al., Comparison of the value of novel rapid measurement of myoglobin, creatine kinase, and creatine kinase-mb with the electrocardiogram for the diagnosis of acute myocardial infarction, Br Heart J, vol. 71, pp , [62] J. Mair, J. Smidt, P. Lechleitner, F. Dienstl, et al., A decision tree for the early diagnosis of acute myocardial infarction in nontraumatic chest pain patients at hospital admission, Chest, vol. 108, pp , [63] L. Jeanpierre et al., Automated medical diagnosis with fuzzy stochastic models : monitoring chronic diseases, Acta Biotheor, vol. 52, no. 4, pp , [64] D. Bellot, Fusion de données avec des réseaux bayésiens pour la modélisation des systèmes dynamiques et son application en télémédecine, Ph.D. dissertation, Université Nancy1, [65] P. Lisboa, Artificial neural networks in biomedicine. Springer-Verlag, London, [66] W. Baxt, Use of an artificial neural network for the diagnosis of myocardial infarction, Ann Intern Med, vol. 115, no. 11, pp , 1991.

141 BIBLIOGRAPHIE 129 [67] R. Harrison, S. Marshall, et al., The early diagnosis of heart attacks : a neurocomputational approach, in International Joint Conference on Neural Networks, vol. 1, 1991, pp [68] R. Kennedy, R. Harrison, A. Burtonc, et al., An artificial neural network system for diagnosis of acute myocardial infarction (AMI) in the accident and emergency department : evaluation and comparison with serum myoglobin measurements, Comput Methods Programs Biomed, vol. 52, pp , [69] W. Baxt, F. Shofer, F. Sites, et al., A neural computational aid to the automated diagnosis of acute myocardial infarction, Ann Emerg Med, vol. 34, pp , [70] B. Hedén, H. Öhlin, R. Rittner, et al., Acute myocardial infarction detected in the 12-lead ECG by artificial neural networks, Circulation, vol. 96, no. 6, pp , [71] K. Gurney, An Introduction to Neural Networks. 1st ed. UCL Press, London, [72] F. Rosenblatt, Principles of Neurodynamics. Spartan Press, Washington D.C., [73] L. Fausett, Fundamentals of Neural Networks. Prentice Hall, Englewood Cliffs, NJ, [74] T. Kohonen, Self-Organizing Maps. Springer, Berlin, [75] J. Hopfield, Neural networks and physical systems with emergent collective computational abilities, in National Academy of Sciences, vol. 79, 1982, pp [76] D. Rumelhart, G. Hinton, et al., Learning internal representations by error propagation, in Parallel Data Processing, vol. 1. The M.I.T. Press, Cambridge, MA, 1986, pp [77] L. Hansen et al., Neural network ensembles, IEEE Trans Pattern Anal Mach Intell, vol. 12, pp , [78] A. Krogh et al., Neural network ensembles, cross validation, and active learning, in Adv Neural Inf Process Syst, G. Tesauro, D. Touretzky, et al., Eds., vol. 2, 1995, pp [79] D. Opitz et al., Popular ensemble methods : An empirical study, Journal of Artificial Intelligence Research, vol. 11, pp , [80] A. Sharkey, On combining artificial neural nets, Connection Science, vol. 8, pp , [81] L. Breiman, Bagging predictors, Machine Learning, vol. 24, no. 2, pp , 1996.

142 BIBLIOGRAPHIE 130 [82] Y. Freund et al., Experiments with a new boosting algorithm, in International Conference on Machine Learning, 1996, pp [83] Y. Liu, X. Yao, et al., Evolutionary ensembles with negative correlation learning, IEEE Transactions on Evolutionary Computation, vol. 4, no. 3, pp , [84] B. Rosen, Ensemble learning using decorrelated neural networks, Connection Science, vol. 8, pp , [85] A. Sharkey, Combining Artificial Neural Nets : Ensemble and Modular Multi-Net Systems, in Multi-Net Systems. Springer-Verlag, 1999, pp [86] C. Papaloukas, D. Fotiadis, A. Likas, et al., An ischemia detection method based on artificial neural networks, Artif Intell Med, vol. 24, pp , [87] D. Marquardt, An algorithm for least-squares estimation of nonlinear parameters, Journal of the Society for Industrial and Applied Mathematics, vol. 11, no. 2, pp , [88] P. Gill, W. Murray, et al., The Levenberg-Marquardt Method, in Practical Optimization. Academic Press, 1981, pp [89] A. Jerebko, R. Summers, J. Malley, M. Franaszek, et al., Computer-assisted detection of colonic polyps with CT colonography using neural networks and binary classification trees, Med Phys, vol. 30, no. 1, pp , [90] A. Jerebko, J. Malley, M. Franaszek, et al., Multiple Neural Network Classification Scheme for Detection of Colonic Polyps in CT Colonography Data Sets, Acad Radiol, vol. 10, pp , [91] J. Ellenius, T. Groth, B. Lindahl, et al., Early assessment of patients with suspected acute myocardial infarction by biochemical monitoring and neural network analysis, Clin Chem, vol. 43, no. 10, pp , [92] P. Warrick, E. Hamilton, et al., Neural Network Based Detection of Fetal Heart Rate Patterns, in IEEE International Joint Conference on Neural Networks (IJCNN), vol. 4, 2005, pp [93] D. Bates et al., Improving safety with information technology, N Engl J Med, vol. 348, no. 25, pp , [94] E. Vonk, L. Jain, et al., Automatic Generation of Neural Network Architecture Using Evolutionary Computation. World Scientific Publishing Co., Singapore, [95] H. Haraldsson et al., A New Learning Scheme for Neural Network Ensembles, 2004, submitted to IEEE Trans Neural Netw. [96] Z. Zhou, J. Wu, W. Tang, et al., Selectively Ensembling Neural Classifiers, in International Joint Conference on Neural Networks, vol. 2, 2002, pp

143 BIBLIOGRAPHIE 131 [97] G. Diamond et al., Analysis of probability as an aid in the clinical diagnosis of coronary-artery disease, N Engl J Med, vol. 300, pp , [98] P. Szolovits, Uncertainty and decisions in medical informatics, Methods Inf Med, vol. 34, pp , [99] C. Kahn, Artificial intelligence in radiology : decision support systems, Radiographics, vol. 14, pp , [100] C. Lagor, D. Aronsky, M. Fiszman, et al., Automatic identification of patients eligible for a pneumonia guideline : comparing the diagnostic accuracy of two decision support models. in Medinfo, vol. 10, no. 1, 2001, pp [101] D. Luciani, M. Marchesi, et al., The role of Bayesian Networks in the diagnosis of pulmonary embolism, J Thromb Haemost, vol. 1, no. 4, pp , [102] C. Twardy, A. Nicholson, K. Korb, et al., Data mining cardiovascular Bayesian networks, Health Data Mining Workshop, Univ. of South Australia, [103] F. Gueyffier, F. Boutitie, J. Boissel, et al., INDANA : a meta-analysis on individual patient data in hypertension. Protocol and preliminary results, Therapie, vol. 50, no. 4, pp , [104] T. Stephenson, An Introduction to Bayesian Network Theory and Usage, IDIAP, Research Report 00-03, [105] F. Jensen et al., Optimal Junction Trees, in Proceedings of the 10th Conference on Uncertainty in Artificial Intelligence, July [106] F. Jensen, An Introduction to Bayesian Networks. UCL Press Ltd, London, [107] C. Huang et al., Inference in Belief Networks : A Procedural Guide, International Journal of Approximate Reasoning, vol. 15, pp , [108] J. Bilmes, A Gentle Tutorial of the E.M. Algorithm and its Application to Parameter Estimation for Gaussian Mixture and Hidden Markov Models, International Computer Science Institute, Berkeley California, Tech. Rep., [109] A. Dempster, N. Laird, et al., Maximum Likelihood from Incomplete Data via the E.M. Algorithm, J R Stat Soc, vol. Ser.B 39, no. 1, pp. 1 38, [110] I. Colombet, A. Ruelland, G. Chatellier, et al., Models to Predict Cardiovascular Risk : Comparison of CART, Multilayer Perceptron and Logistic Regression, in AMIA Symposium, 2000, pp [111] B. Wielinga, G. Schreiber, et al., KADS : a modelling approach to knowledge engineering. In Knowledge Acquisition, Knowledge Acquisition, vol. 4, pp , [112] C. Vogel, Génie Cognitif. Masson, Paris, 1988.

144 BIBLIOGRAPHIE 132 [113] J. Quinlan, P. Compton, et al., Inductive knowledge acquisition : A case study. Turing Institute Press, Glascow, [114] J. Ganascia, EKAW 90 Tutorial Notes : Machine Learning, in Proceedings of the 3rd European Workshop on Knowledge Acquisition for Knowledge-Based Systems (EKAW 89), 1989, pp [115] H. Atoui, J. Fayn, F. Gueyffier, et al., Cardiovascular Risk Stratification in Decision Support Systems, A Probabilistic Approach. Application to phealth, 2006, accepted for publication in IEEE Computers in Cardiology. [116] L. Zadeh, Fuzzy logic, neural networks, and soft computing, Communications of the ACM, vol. 37, pp , [117] B. Bouchon-Meunier, La logique floue. Presses Universitaires France, [118] F. Chevrie et al., La logique floue, Institut Schneider Formation, Cahier Technique Schneider n 191, [119] S. Nelwan, Evaluation of 12-Lead ECG Reconstruction Methods for Patient Monitoring, Ph.D. dissertation, Erasmus Universiteit Rotterdam, [120] J. Scherer, J. Jenkins, et al., Synthesis of the 12-lead electrocardiogram from a 3- lead subset using patient-specific transformation vectors. An algorithmic approach to computerized signal synthesis, J Electrocardiol, vol. 22, pp , [121] S. Nelwan, J. Kors, S. Meij, et al., Reconstruction of the 12-Lead ECG using Reduced Lead Sets for Patient Monitoring. Leiden : Einthoven Foundation, 2002, pp [122] R. Modre, M. Seger, G. Fischer, et al., Cardiac anisotropy : is it negligible regarding noninvasive activation time imaging? IEEE Trans Biomed Eng, vol. 53, no. 4, pp , [123] R. Gulrajani, The forward and inverse problems of electrocardiography, IEEE Eng Med Biol Mag, vol. 17, no. 5, pp , [124] J. Scherer et al., Evaluation of 12-Lead ECG Synthesis using Analysis Measurments in 240 Patients, in IEEE Computers in Cardiology, 1992, pp [125] S. Adami, D. Assanelli, F. Comba, J. Fayn, R. Gatta, et al., EPI-MEDICS System Specification and Design, Information Society Technologies Programme, Tech. Rep. D3.1, [126] S. Adami, J. Fayn, F. Gouaux, M. Ohlson, L. Simon-Chautemps, et al., EPI- MEDICS System Revisions, Information Society Technologies Programme, Tech. Rep. D7.1, 2003.

145 BIBLIOGRAPHIE 133 [127] J. Scherer et al., Synthesis of the 12-Lead Electrocardiogram from a 3-Lead Semiorthogonal Subset using Patient-specific Transformation Arrays, in IEEE Computers in Cardiology, 1988, pp [128] S. Nelwan, J. Kors, S. Meij, J. van Bemmel, et al., Reconstruction of the 12-lead electrocardiogram from reduced lead sets, J Electrocardiol, vol. 37, no. 1, pp , [129] R. Duin, Learned from Neural Networks, in ASCI 2000, Sixth Annual Conference of the Advanced School for Computing and Imaging, 2000, pp [130] S. Mitra, S. Pal, et al., Data Mining in Soft Computing Framework : A Survey, IEEE Trans Neural Netw, vol. 13, no. 1, pp. 3 14, [131] K. Hornik, M. Stinchcombe, et al., Multilayer feedforward networks are universal approximators, Neural Netw, vol. 2, no , [132] K. Funahashi, On the Approximate Realization of Continuous Mappings by Neural Networks, Neural Netw, vol. 2, pp , [133] J. Castro, C. Mantas, et al., Neural networks with a continuous squashing function in the output are universal approximators, Neural Netw, vol. 13, no. 6, pp , [134] P. Macfarlane, Age, sex, and the ST amplitude in health and disease, J Electrocardiol, vol. 34, pp , [135] M. Krucoff, Electrocardiographic monitoring and coronary occlusion. Fingerprint pattern analysis in dimensions of space, time, and mind, J Electrocardiol, vol. 22, pp , [136] G. Nollo, P. Rubel, J. Fayn, D. Assanelli, M. Crotti, et al., PEM device and EPI-MEDICS telemedical architecture final assessment report, Information Society Technologies Programme, Tech. Rep. D6.1, [137] The CSE Party : Recommendations for measurement standards in quantitative electrocardiography, Eur Heart J, vol. 6, pp , [138] M. Moller, A scaled conjugate gradient algorithm for fast supervised learning, Neural Netw, vol. 6, pp , [139] S. Orfanidis, Optimum Signal Processing. An Introduction. 2nd Edition. Prentice- Hall, Englewood Cliffs, NJ, [140] H. Atoui, J. Fayn, et al., A Neural Network Approach for Patient-Specific 12- Lead ECG Synthesis in Patient Monitoring Environments, in IEEE Computers in Cardiology, A. Murray, Ed., vol. 31, 2004, pp

146 BIBLIOGRAPHIE 134 [141] H. Atoui et al., A Novel Neural Network Model for Deriving Standard 12-lead ECGs from serial 3-lead ECGs. Application to Self Care, 2006, submitted to Methods Inf Med. [142] D. Telisson, J. Fayn, et al., Design of a Tele-Expertise Architecture Adapted to Pervasive Multi-Actor Environments. Application to ecardiology, in IEEE Computers in Cardiology, A. Murray, Ed., vol. 31, 2004, pp [143] L. Simon-Chautemps, S. Arod, S. Adami, J. Fayn, C. Malossi, et al., Final Prototype, Information Society Technologies Programme, Tech. Rep. D7.2, [144] P. Gouvas, G. Magiorkinis, A. Bouras, D. Paraskevis, et al., Web Service-Enabled Grid-Based Platform for Drug Resistance Management, in Panhellenic Conference on Informatics, vol. 3746, 2005, pp [145] H. Atoui, D. Télisson, et al., Détection précoce d événements cardiaques en selfcare. Architecture fonctionnelle de la plateforme d aide à la décision par réseaux de neurones du projet européen EPI-MEDICS. in Journées Sciences, Technologies et Imagerie pour la Médecine, Nancy, 2005, pp [146] M. Knuiman, H. Vu, et al., Multivariate risk estimation for coronary heart disease : the Busselton health study, New Zealand Journal of Public Health, vol. 22, pp , [147] The MRACS study. URL http ://

147 Cinquième partie Annexes 135

148 Annexe A Dossier Médical Personnel embarqué dans le PEM A.1 Contenu du dossier de santé du patient Ce dossier sera enregistré dans la Data Card du PEM (PEM Card) et sera consultable/modifiable au moyen d un navigateur Internet standard (connexion par RS232C ou Bluetooth à un PC, un MAC ou un Palmtop). Par défaut, une donnée non renseignée sera marquée Non Renseignée (NR). Lorsque l on remplit le dossier, et que l on ne sait pas renseigner la donnée, on pourra utiliser le terme : inconnu (I). Des exemples d items pour lequel on pourra utiliser le terme inconnu sont : le sexe, le diabète, la localisation des sténoses, etc. A.2 Données démographiques Cette section ne contient que les données utiles au professionnel de santé lorsqu il entreprend de visualiser et/ou de mettre à jour le dossier de santé du patient. Les données démographiques complètes (avec adresse, numéros de téléphone, description des contacts etc.) sont indiquées dans la section contacts. Nom Prénom Date de naissance : JJ/MM/AAA ou Age (ans) Poids (Kg) Taille (cm) Sexe : (M, F, I)

149 Annexe A. Dossier Médical Personnel embarqué dans le PEM 137 A.3 Résultats d analyses biologiques Cholestérol total (mg/dl) Cholestérol HDL (mg/dl) Cholestérol LDL (mg/dl) Fibrinogènes (mg/dl) Triglycérides (mg/dl) Glycémie (mg /dl) Nbre de leucocytes (10 9 /l) Créatinémie (µmol/l) Enzymes hépatiques ALAT (SGPT) (U/l) Enzymes hépatiques ASAT (SGOT) (U/l) Hormone thyroïdienne T3 (µg/dl) Hormone thyroïdienne T4 (Thyroxine) (µg/dl) Hormone thyroïdienne TSH (Thyroid-Stimulating Hormone) (mili U/l) Protéines C-réactives (mg/dl) A.4 Eléments du dossier cardiologique A.4.1 Données cliniques Tension artérielle systolique (mm Hg) Tension artérielle diastolique (mm Hg) Fréquence cardiaque au repos (battements/mn) Anémie : (O/N) Diabète : (Non, I, Insulo-dépendant (IDMM), Non-Insulo-dépendant (NIDMM)) Douleurs thoraciques : (Non, Angine de poitrine typique, Angine de poitrine atypique, autre) Dyspnée(s) : (Non, au repos, à l effort, au repos et à l effort) Sujet à des Syncope(s) : (O/N) Sujet à des Vertiges : (Non, au repos, à l effort, au repos et à l effort) A.4.2 Interprétation de l ECG au repos Cette interprétation concerne exclusivement l interprétation de synthèse qui figurera dans le dossier clinique du patient. Les interprétations des ECG enregistrés par le patient seront archivées dans la rubrique Rapport d interprétation des PEM ECG

150 Annexe A. Dossier Médical Personnel embarqué dans le PEM 138 Interprétation de l ECG standard à 12D : (Normal, probablement normal/non strictement normal, Anormal) Troubles de la conduction : (O/N) Instabilité électrique : (O/N) Altération(s) mineure(s) de l ECG : (O/N) A.4.3 Résultats des tests de l ECG d effort Ischémie à l effort : (O/N) Hypotension durant l effort : (O/N) A.4.4 Diagnostic cardiologique Hypertension artérielle : (O/N) Hypertrophie ventriculaire : (Non, gauche, droite, bi-ventriculaire) Tachycardie ventriculaire : (Non, Intermittente/Non-soutenue, Soutenue) Bloc auriculo-ventriculaire : (Non, 2ème degré (Mobitz type II), 3ème degré, autre) Autre(s) type(s) d arythmie(s) : (O/N) Si oui, et si vous estimez que c est important pour le suivi du patient, précisez le type d arythmie dans l historique clinique du patient. Sténose aortique : ( Non, I, LAD, LCX, RCA, autre) Infarctus ancien : (Non, I, Antérieur ou Antéro-Latéral, Inférieur ou Postéro- Inférieur, Mixte) Ischémie résiduelle : (O/N) Dysfonctionnement du ventricule gauche : (O/N) Insuffisance cardiaque : (Non, modérée, sévère) Fraction d éjection (%) : Cardiopathies arythmogènes congénitales ou acquises : (Non, QT long, Brugada, WPW, ARVD, autre) Cardiopathie valvulaire : (Non, prolapsus de valve mitrale, autre) Cardiomyopathie du ventricule gauche : (Non, I, dilatée, hypertrophique, infiltrative, autre) Cardiomyopathie du ventricule droit : (O/N) Autre type de cardiopathie congénitale : (O/N) Maladie des coronaires d origine anormale : (O/N) Autre cardiopathie : (0/N) Si oui, et si vous estimez que c est important pour le suivi du patient, précisez le type de cardiopathie dans l historique clinique du patient.

151 Annexe A. Dossier Médical Personnel embarqué dans le PEM 139 A.4.5 Procédures et traitements Thérapie interventionnelle : (Non, angioplastie, pontage coronarien, autre) Traitement anti-cholestérol : (Non, statines, autres) Traitement anti-hypertenseur : (O/N) Autre(s) traitement(s) en cours : (O/N) Si oui, et si vous estimez que c est important pour le suivi du patient, précisez le type de traitement dans l historique clinique du patient. A.5 Facteurs de risque cardiovasculaire A.5.1 Classe de Santé Indiquez ci-après la catégorie qui décrit le mieux possible l état général de santé du patient. Ce classement sera utilisé pour moduler l estimation du facteur de risque du sujet. Catégorie de santé : I, 1, 2, 3, 4, 5 Avec : 1. Sportif de niveau professionnel 2. Sujet normal 3. Suspicion d ischémie et/ou de troubles du rythme 4. Ischémie et/ou troubles du rythme avérés 5. Pathologie cardiaque documentée A.5.2 Facteurs de risque majeurs Sexe : (M, F, I) Age : Tabagie : (Non fumeur, Ex-Fumeur, Fumeur) Obésité : (O/N) Diabète : (Non, I, Insulo-dépendant (IDMM), Non-Insulo-dépendant (NIDMM)) Hypertension artérielle : (O/N) Fréquence cardiaque au repos (battements/mn) : Cholestérol total (mg/dl) : Fibrinogènes (mg/dl) :

152 Annexe A. Dossier Médical Personnel embarqué dans le PEM 140 Nbre de leucocytes (109/l) : Claudication intermittente : (O/N) A.5.3 Autres facteurs de risque Tension artérielle systolique (mm Hg) : Tension artérielle diastolique (mm Hg) : Anémie : (O/N) Maladie des coronaires d origine anormale : (O/N) Antécédents familiaux de maladie des coronaires : (O/N) Antécédents familiaux de mort subite : (O/N)

153 Annexe B La base de données INDANA La base de données INDANA (INdividual Data ANalysis of Antihypertensive drug interventions) réunit les données individuelles de 10 essais thérapeutiques (contrôlés randomisés) conduits pour évaluer l efficacité de traitements anti-hypertenseurs [103]. Les sujets faisant partie de cette base de données ont été suivis, en moyenne, sur une période de 5 ans et toute incidence d événements de nature cardiovasculaire a été relevé : accident vasculaire cérébral, infarctus du myocarde, décès par accident vasculaire cérébral, décès par infarctus du myocarde. Cette base de données a été mise en forme et est maintenue par l Unité de Pharmacologie Clinique de l Université Lyon 1 (chef de projet : François Gueyffier).

154 Annexe B. La base de données INDANA 142 Tab. B.1 Tableau descriptif des variables et labels de la base de données INDANA Nom Label Valeur SEX sexe 0 : femme, 1 : homme AGE age en années BL HEIGH taille en début d étude en cm BL WEIGH poids en début d étude en kg BL BLO U hématurie en début d étude BL NBCIG nombre de cigarettes en début d étude nbre/jour BL HR fréquence cardiaque en début d étude batt/mn BL SBP pression artérielle systolique en début d étude mmhg BL DBP pression artérielle diastolique en début d étude mmhg BL ECGM1 Q/QS Pattern ( 0 : pas d anomalie, 1 anomalie la moins significative, 2,...x anomalie la plus significative) BL ECGM3 Hypertrophie ventriculaire gauche /ECG - BL ECGM4 dépression du segment ST - BL ECGM5 inversion de l onde T - BL AF fibrillation atriale en début d étude 0 : non ; 1 : oui BL GLUC glycémie à jeun en début d étude mmol/l BL URIC uricémie en début d étude mmol/l BL CHOL cholestérol total en début d étude mmol/l BL CREAT créatinémie en début d étude mmol/l BL GLY U glycosurie 0 : non 1 :oui BL PRT U protéinurie 0 : non 1 :oui BL K kaliémie mmol/l BL SMOKE tabagisme en début d étude 0 : non ; 1 :oui BL CATSM tabagisme en début d étude 4 catégories BL UREA urée sanguine en début d étude mmol/l BL BMI index pondéral en début d étude kg/m2 HX DIAB antécédent de diabète 0 : non ; 1 : oui HX TTHBP antécédent de traitement antihypertenseur 0 : non ; 1 : oui HX HBP antécédent d hypertension 0 : non ; 1 : oui HX ANGIN antécédent d angor 0 : non ; 1 : oui HX MI antécédent d infarctus myocardique 0 : non ; 1 : oui HX ST antécédent d AVC 0 : non ; 1 : oui HX CLAUD antécédent de claudication 0 : non ; 1 : oui ST AVC (accident vasculaire cérébral) 0 : non ; 1 : oui MI IDM (infarctus du myocarde) 0 : non ; 1 : oui DEATH décès 0 : non ; 1 : oui DEATHMI décès par IDM 0 : non ; 1 : oui DEATHST décès par AVC 0 : non ; 1 : oui DEATHCV décès cardio-vasculaire 0 : non ; 1 : oui

155 Annexe C Architecture des réseaux de neurones utilisés pour la synthèse de l ECG La meilleure configuration en termes d architecture des réseaux de neurones utilisés pour la synthèse de l ECG standard est déterminée expérimentalement en effectuant l apprentissage de h n t structures obtenues en faisant varier le nombre de couches cachées (h=1, 2), le nombre de neurones par couche (n=3, 5, 8, 10, 15) et le type de fonction d activation (t=linéaire (purelin), sigmoïde : tangente sigmoïde (tansig), logarithme-sigmoïde (logsig)). Les résultats détaillés des performances des h n t structures en termes d erreur RMS sur les 100 ECG de la population d étude DS1 sont présentés dans les tableaux ci-après. Nb de couches cachées Nb de neurones par couche caché Fonctions d activation RMS 1 3 tansig tansig tansig tansig tansig logsig logsig logsig logsig logsig purelin purelin purelin purelin purelin 89.63

156 Annexe C. Architecture des réseaux de neurones utilisés pour la synthèse de l ECG 144 Nb de couches cachées Nb de neurones par couche caché Fonctions d activation RMS purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig 97.31

157 Annexe C. Architecture des réseaux de neurones utilisés pour la synthèse de l ECG 145 Nb de couches cachées Nb de neurones par couche caché Fonctions d activation RMS purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin tansig purelin 92.54

158 Annexe C. Architecture des réseaux de neurones utilisés pour la synthèse de l ECG 146 Nb de couches cachées Nb de neurones par couche caché Fonctions d activation RMS tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig 98.76

159 Annexe C. Architecture des réseaux de neurones utilisés pour la synthèse de l ECG 147 Nb de couches cachées Nb de neurones par couche caché Fonctions d activation RMS logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig purelin logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig logsig tansig 93.07

160 Annexe C. Architecture des réseaux de neurones utilisés pour la synthèse de l ECG 148 Nb de couches cachées Nb de neurones par couche caché Fonctions d activation RMS logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig logsig 98.71

161 Annexe D SCPECG Processor Description Pour faciliter le traitement des ECGs enregistrés au format SCP-ECG par les outils d aide à la décision développés dans le cadre d EPI-MEDICS, nous avons développé un logiciel autonome (stand-alone) intitulé SCP-ECG processor (Figure D.1). Ce logiciel permet d analyser les ECGs par le biais d une série de modules qui ont été développés. Il est également doté d un module d aide à la décision à base de comités de réseaux de neurones similaire à celui développé dans le chapitre 2 de ce rapport de thèse et d un module de synthèse de l ECG par régression générique et spécifique. De même ce logiciel est conçu pour intégrer tout autre module d analyse, d interprétation, ou d aide à la décision (les modules de réseaux bayésiens, de logique floue, etc.). Principaux modules intégrés BuildFake10sEcg Ce module simule un enregistrement d ECG de 10 secondes à partir du complexe médian et du rythme cardiaque. Ce module est utile pour analyser les fichiers SCP-ECP ne contenant que le complexe médian. PermuteFR Ce module a pour mission de corriger (ou simuler) une inversion des électrodes F et R. PermuteLF Ce module a pour mission de corriger (ou simuler) une inversion des électrodes L et F. PermuteLR Ce module a pour mission de corriger (ou simuler) une inversion des électrodes L et R. 12-Lead Synthesis Ce module permet à l utilisateur de choisir la méthode de synthèse à employer : No synthesis : aucune synthèse n est effectuée.

162 Annexe D. SCPECG Processor 150 Generic 12-Lead Synthesis : La matrice de synthèse générique est utilisée. Cette matrice est actuellement basée sur un modèle de régression générique. Patient Specific Regression : une matrice de synthèse spécifique au patient est calculée suivant un modèle de régression sur l ECG concerné. User Specific ANN Synthesis : une matrice de synthèse spécifique au patient est fournie. Compute Typical Beat and global measurements Ce module applique le programme de Lyon pour calculer les mesures globales de l ECG concerné. Compute Lead by Lead Measurements Ce module applique le programme de Lyon pour calculer les mesures, dérivation par dérivation, de l ECG concerné. Output File to Write Suivant la sélection effectuée par l utilisateur, le logiciel génère différents fichiers en sortie : un nouveau fichier SCP-ECG de l ECG, les mesures globales, les mesures dérivation par dérivation, les données après analyse en composantes principales de l ECG et le résultat de l interprétation de l ECG par comités de réseaux de neurones.

163 Annexe D. SCPECG Processor 151 Fig. D.1 Ecran de configuration du logiciel SCP-ECG processor.

164 Annexe E EPI-MEDICS : modèles de données globaux du PEM

165 Annexe E. EPI-MEDICS : modèles de données globaux du PEM 153

MONITORING PÉRI-OPÉRATOIRE DE L'ISCHÉMIE CARDIAQUE. Dary Croft 9 mai 2013

MONITORING PÉRI-OPÉRATOIRE DE L'ISCHÉMIE CARDIAQUE. Dary Croft 9 mai 2013 MONITORING PÉRI-OPÉRATOIRE DE L'ISCHÉMIE CARDIAQUE Dary Croft 9 mai 2013 Plan Épidémiologie en chir. non-cardiaque Aspects techniques de l ECG Rappel critères ECG de l'ischémie Principe de monitoring per-op

Plus en détail

LIRE UN E.C.G. Formation sur le langage et la lecture d un ECG destinée aux techniciens ambulanciers de la région Chaudière-Appalaches

LIRE UN E.C.G. Formation sur le langage et la lecture d un ECG destinée aux techniciens ambulanciers de la région Chaudière-Appalaches LIRE UN E.C.G. Formation sur le langage et la lecture d un ECG destinée aux techniciens ambulanciers de la région Chaudière-Appalaches Denise Hébert, chargée de projet UCCSPU Février 2006 Le langage et

Plus en détail

Télé-expertise et surveillance médicale à domicile au service de la médecine générale :

Télé-expertise et surveillance médicale à domicile au service de la médecine générale : Télé-expertise et surveillance médicale à domicile au service de la médecine générale : Docteur DARY Patrick, Cardiologue, Praticien Hospitalier Centre Hospitalier de St YRIEIX - Haute Vienne 87500 Situé

Plus en détail

La prise en charge de votre insuffisance cardiaque

La prise en charge de votre insuffisance cardiaque G U I D E - A F F E C T I O N D E L O N G U E D U R É E La prise en charge de votre insuffisance cardiaque Vivre avec une insuffisance cardiaque Décembre 2007 Pourquoi ce guide? Votre médecin traitant

Plus en détail

Épreuve d effort électrocardiographique

Épreuve d effort électrocardiographique Épreuve d effort électrocardiographique J. Valty Diagnostic des coronaropathies. Pronostic après infarctus du myocarde. Indications particulières. Risques de l épreuve d effort? 1- Épreuve positive : segment

Plus en détail

La Dysplasie Ventriculaire Droite Arythmogène

La Dysplasie Ventriculaire Droite Arythmogène 1 La Dysplasie Ventriculaire Droite Arythmogène Document rédigé par l équipe pluridisciplinaire du centre de référence pour les maladies cardiaques héréditaires (Paris), en collaboration avec des patients

Plus en détail

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES Enseignement du Deuxième Cycle des Etudes Médicales Faculté de Médecine de Toulouse Purpan et Toulouse Rangueil Module I «Apprentissage de l exercice médical» Coordonnateurs Pr Alain Grand Pr Daniel Rougé

Plus en détail

informations pratiques

informations pratiques COLLECTIVITÉS LOCALES Arrêt cardiaque informations pratiques avec le soutien de Arrêt cardiaque I Informations pratiques I 1 2 I L arrêt cardiaque L arrêt cardiaque est la première cause de mortalité des

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

Les grandes études de télémédecine en France

Les grandes études de télémédecine en France Les grandes études de télémédecine en France Optimisation de la Surveillance ambulatoire des Insuffisants CArdiaques par Télécardiologie De Midi-Pyrénées au Sud de la France M Galinier, A Pathak Pôle Cardio-Vasculaire

Plus en détail

Item 169 : Évaluation thérapeutique et niveau de preuve

Item 169 : Évaluation thérapeutique et niveau de preuve Item 169 : Évaluation thérapeutique et niveau de preuve COFER, Collège Français des Enseignants en Rhumatologie Date de création du document 2010-2011 Table des matières ENC :...3 SPECIFIQUE :...3 I Différentes

Plus en détail

L E.C.G. pour les nuls

L E.C.G. pour les nuls MODULE SOINS INTENSIFS PRISE EN CHARGE DU BDS EN SI Le monitoring cardiaque Ferron Fred version_3_2011 1 Saunders Nursing Survival Guide ECGs and the Heart Elsevier à consommer sans modération. L E.C.G.

Plus en détail

2 La chaîne de survie canadienne : espoir des patients cardiaques

2 La chaîne de survie canadienne : espoir des patients cardiaques 2 La chaîne de survie canadienne : espoir des patients cardiaques Les maladies cardiovasculaires sont la principale cause de décès au Canada. Bien que leur incidence ait diminué au cours des dernières

Plus en détail

Le VIH et votre cœur

Le VIH et votre cœur Le VIH et votre cœur Le VIH et votre cœur Que dois-je savoir au sujet de mon cœur? Les maladies cardiovasculaires représentent une des cause les plus courante de décès, elles incluent: les maladies coronariennes,

Plus en détail

La prise en charge de votre maladie, l accident vasculaire cérébral

La prise en charge de votre maladie, l accident vasculaire cérébral G U I D E - A F F E C T I O N D E L O N G U E D U R É E La prise en charge de votre maladie, l accident vasculaire cérébral Vivre avec un accident vasculaire cérébral Octobre 2007 Pourquoi ce guide? Votre

Plus en détail

PROJET DE TÉLÉMEDECINE

PROJET DE TÉLÉMEDECINE PROJET DE TÉLÉMEDECINE ISIFC 2 ème année Année universitaire 2011-2012 LA TÉLÉSURVEILLANCE Louis ACHA Rafaël MINACORI ISIFC Génie biomédical 23,rue Alain SAVARY 25000 Besançon Cedex Tél : 03 81 66 66 90

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

La prise en charge de votre artérite des membres inférieurs

La prise en charge de votre artérite des membres inférieurs G U I D E - A F F E C T I O N D E L O N G U E D U R É E La prise en charge de votre artérite des membres inférieurs Vivre avec une artérite des membres inférieurs Novembre 2007 Pourquoi ce guide? Votre

Plus en détail

ÉVALUATION DE LA PERSONNE ATTEINTE D HYPERTENSION ARTÉRIELLE

ÉVALUATION DE LA PERSONNE ATTEINTE D HYPERTENSION ARTÉRIELLE ÉVALUATION DE LA PERSONNE ATTEINTE D HYPERTENSION ARTÉRIELLE PRISE EN CHARGE SYSTÉMATISÉE DES PERSONNES ATTEINTES D HYPERTENSION ARTÉRIELLE SOCIÉTÉ QUÉBÉCOISE D HYPERTENSION ARTÉRIELLE 23 ÉVALUATION DE

Plus en détail

Votre guide des définitions des maladies graves de l Assurance maladies graves express

Votre guide des définitions des maladies graves de l Assurance maladies graves express Votre guide des définitions des maladies graves de l Assurance maladies graves express Votre guide des définitions des maladies graves de l Assurance maladies graves express Ce guide des définitions des

Plus en détail

compaction ventriculaire gauche sur la fonction ventriculaire chez l adulte

compaction ventriculaire gauche sur la fonction ventriculaire chez l adulte Influence des paramètres de non compaction ventriculaire gauche sur la fonction ventriculaire chez l adulte C. Defrance, K. Warin-Fresse, G. Fau, P. Guérin, B. Delasalle, P.D. Crochet La non compaction

Plus en détail

Ischémie myocardique silencieuse (IMS) et Diabète.

Ischémie myocardique silencieuse (IMS) et Diabète. Ischémie myocardique silencieuse (IMS) et Diabète. A propos d un cas clinique, sont rappelés: - les caractères cliniques et pronostiques de l IMS chez le diabétique, - la démarche de l identification de

Plus en détail

Insuffisance cardiaque et télémédecine: Exemple du Projet E care : prise en charge à domicile des insuffisants cardiaques en stade III

Insuffisance cardiaque et télémédecine: Exemple du Projet E care : prise en charge à domicile des insuffisants cardiaques en stade III Insuffisance cardiaque et télémédecine: Exemple du Projet E care : prise en charge à domicile des insuffisants cardiaques en stade III de la NYHA Emmanuel ANDRES et Samy TALHA Service de Médecine Interne,

Plus en détail

Thérapeutique anti-vhc et travail maritime. O. Farret HIA Bégin

Thérapeutique anti-vhc et travail maritime. O. Farret HIA Bégin Thérapeutique anti-vhc et travail maritime O. Farret HIA Bégin Introduction «L hépatite C est une maladie le plus souvent mineure, mais potentiellement cancérigène, qu on peut ne pas traiter et surveiller

Plus en détail

admission aux urgences

admission aux urgences Société française de neurologie RÉFÉRENTIEL D AUTO-ÉVALUATION DES PRATIQUES EN NEUROLOGIE Prise en charge hospitalière initiale des personnes ayant fait un accident vasculaire cérébral (AVC) : admission

Plus en détail

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1 Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe

Plus en détail

Télémédecine. F. Brunet 28 octobre 2010

Télémédecine. F. Brunet 28 octobre 2010 Télémédecine F. Brunet 28 octobre 2010 Définition Idée générale : Faire voyager les informations plutôt que les patients Selon le CNOM (Conseil National de l Ordre des Médecins) : La télémédecine est une

Plus en détail

S o m m a i r e 1. Sémiologie 2. Thérapeutique

S o m m a i r e 1. Sémiologie 2. Thérapeutique Sommaire 1. Sémiologie... 1 Auscultation cardiaque... 1 Foyers d auscultation cardiaque... 1 Bruits du cœur... 1 Souffles fonctionnels... 2 Souffles organiques... 2 Souffle cardiaque chez l enfant... 3

Plus en détail

Parcours du patient cardiaque

Parcours du patient cardiaque Parcours du patient cardiaque Une analyse HAS à partir de la base QualHAS, des Indicateurs Pour l Amélioration de la Qualité & Sécurité des Soins (IPAQSS)- Infarctus du myocarde Linda Banaei-Bouchareb,

Plus en détail

L approche populationnelle : une nouvelle façon de voir et d agir en santé

L approche populationnelle : une nouvelle façon de voir et d agir en santé Trousse d information L approche populationnelle : une nouvelle façon de voir et d agir en santé Novembre 2004 L approche populationnelle : une nouvelle façon de voir et d agir en santé L approche populationnelle

Plus en détail

Arthralgies persistantes après une infection à chikungunya: évolution après plus d un an chez 88 patients adultes

Arthralgies persistantes après une infection à chikungunya: évolution après plus d un an chez 88 patients adultes Arthralgies persistantes après une infection à chikungunya: évolution après plus d un an chez 88 patients adultes G Borgherini 1, A Gouix 1, F Paganin 1, A Jossaume 1, L Cotte 2, C Arvin-Berod 1, A Michault

Plus en détail

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

La survie nette actuelle à long terme Qualités de sept méthodes d estimation La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg

Plus en détail

23. Interprétation clinique des mesures de l effet traitement

23. Interprétation clinique des mesures de l effet traitement 23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d

Plus en détail

UN PATIENT QUI REVIENT DE LOIN. Abdelmalek AZZOUZ GRCI 29/11/2012 Service de Cardiologie A2 CHU Mustapha. Alger Centre. Algérie

UN PATIENT QUI REVIENT DE LOIN. Abdelmalek AZZOUZ GRCI 29/11/2012 Service de Cardiologie A2 CHU Mustapha. Alger Centre. Algérie Abdelmalek AZZOUZ GRCI 29/11/2012 Service de Cardiologie A2 CHU Mustapha. Alger Centre. Algérie Mr A.A. âgé de 55ans. Facteurs de risque: Diabétique depuis 5ans. Antécédents: aucun. Fumeur 15paquets/année.

Plus en détail

les télésoins à domicile

les télésoins à domicile Hiver 2013 Innovation en matière de prestation des soins de santé : les télésoins à domicile Innovation en matière de prestation des soins de santé : les télésoins à domicile Au Canada comme ailleurs dans

Plus en détail

Marchés des groupes à affinités

Marchés des groupes à affinités Marchés des groupes à affinités Guide du produit destiné aux conseillers Régime d assurance maladies graves Chèque-vie MD de base La Compagnie d Assurance-Vie Manufacturers Le produit en bref Nul n aime

Plus en détail

Annexe 2 Les expressions du HCAAM sur la coordination des interventions des professionnels autour du patient

Annexe 2 Les expressions du HCAAM sur la coordination des interventions des professionnels autour du patient Annexe 2 Les expressions du HCAAM sur la coordination des interventions des professionnels autour du patient Dans son avis de 2012 «L assurance maladie : les options du HCAAM» qui synthétise l ensemble

Plus en détail

Hôpital performant et soins de qualité. La rencontre des extrêmes estelle

Hôpital performant et soins de qualité. La rencontre des extrêmes estelle Hôpital performant et soins de qualité. La rencontre des extrêmes estelle possible? 18 octobre 2012 Professeur Philippe KOLH CIO, Directeur du Service des Informations Médico-Economiques CHU de LIEGE Plan

Plus en détail

4.2 Unités d enseignement du M1

4.2 Unités d enseignement du M1 88 CHAPITRE 4. DESCRIPTION DES UNITÉS D ENSEIGNEMENT 4.2 Unités d enseignement du M1 Tous les cours sont de 6 ECTS. Modélisation, optimisation et complexité des algorithmes (code RCP106) Objectif : Présenter

Plus en détail

4. Résultats et discussion

4. Résultats et discussion 17 4. Résultats et discussion La signification statistique des gains et des pertes bruts annualisés pondérés de superficie forestière et du changement net de superficie forestière a été testée pour les

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

Ensemble, soutenons la recherche française dans le domaine des maladies cardiovasculaires. Té léphone : 01 44 90 70 25

Ensemble, soutenons la recherche française dans le domaine des maladies cardiovasculaires. Té léphone : 01 44 90 70 25 Ensemble, soutenons la recherche française dans le domaine des maladies cardiovasculaires www.coeur-recherche.fr Té léphone : 01 44 90 70 25 La Fondation Cœur et Recherche a été fondée par la Société Française

Plus en détail

Analyse des incidents

Analyse des incidents Analyse des incidents Formation B-Quanum 26/06/2012 N. Jacques Coordinatrice Qualité CMSE Introduction Contexte Contrat SPF Coordinateur qualité Médecine nucléaire Hôpital = Entreprise à Haut Risque Efficacité

Plus en détail

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) 87 FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) Dans le cadre de la réforme pédagogique et de l intérêt que porte le Ministère de l Éducation

Plus en détail

LES MALADIES CARDIOVASCULAIRES

LES MALADIES CARDIOVASCULAIRES . LES MALADIES CHRONIQUES DANS LANAUDIÈRE LES MALADIES CARDIOVASCULAIRES Source : Istockphoto Marie Eve Simoneau collaboration Christine Garand et Josée Payette Service de surveillance, recherche et évaluation

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

Vous et votre traitement anticoagulant par AVK (antivitamine K)

Vous et votre traitement anticoagulant par AVK (antivitamine K) Ce carnet a été réalisé sous la coordination de l Agence française de sécurité sanitaire des produits de santé (Afssaps). Vous et votre traitement anticoagulant par AVK (antivitamine K) Carte à découper

Plus en détail

Défibrillateur Cardiaque Automatisé

Défibrillateur Cardiaque Automatisé Défibrillateur Cardiaque Automatisé Décret n 2007-705 du 4 mai 2007 : autorise toute personne, même non médecin, à utiliser un défibrillateur pour sauver des vies. Def-i Accessible au grand public, ce

Plus en détail

Prise en charge de l embolie pulmonaire

Prise en charge de l embolie pulmonaire Prise en charge de l embolie pulmonaire Dr Serge Motte Liège 06.12.14 - Laack TA et Goyal DG, Emerg Med Clin N Am 2004; 961-983 2 PLAN Diagnostic Prise en charge: Phase aiguë: analyse de gravité Choix

Plus en détail

L utilisation d un réseau de neurones pour optimiser la gestion d un firewall

L utilisation d un réseau de neurones pour optimiser la gestion d un firewall L utilisation d un réseau de neurones pour optimiser la gestion d un firewall Réza Assadi et Karim Khattar École Polytechnique de Montréal Le 1 mai 2002 Résumé Les réseaux de neurones sont utilisés dans

Plus en détail

SYSTEMES D INFORMATION EN SANTE Journée régionale du 12 janvier 2012 - Blois

SYSTEMES D INFORMATION EN SANTE Journée régionale du 12 janvier 2012 - Blois SYSTEMES D INFORMATION EN SANTE Journée régionale du 12 janvier 2012 - Blois La télémédecine au service des soins de 1 er recours et de l aménagement du territoire dominique.depinoy@acsantis.com Pourquoi

Plus en détail

admission directe du patient en UNV ou en USINV

admission directe du patient en UNV ou en USINV Société française de neurologie RÉFÉRENTIEL D AUTO-ÉVALUATION DES PRATIQUES EN NEUROLOGIE Prise en charge hospitalière initiale des personnes ayant fait un accident vasculaire cérébral (AVC) : admission

Plus en détail

Analyse de grandes bases de données en santé

Analyse de grandes bases de données en santé .. Analyse de grandes bases de données en santé Alain Duhamel Michaël Genin Mohamed Lemdani EA 2694 / CERIM Master 2 Recherche Biologie et Santé Journée Thématique Fouille de Données Plan. 1 Problématique.

Plus en détail

PRINTEMPS MEDICAL DE BOURGOGNE ASSOCIATIONS ANTIAGREGANTS ET ANTICOAGULANTS : INDICATIONS ET CONTRE INDICATIONS

PRINTEMPS MEDICAL DE BOURGOGNE ASSOCIATIONS ANTIAGREGANTS ET ANTICOAGULANTS : INDICATIONS ET CONTRE INDICATIONS PRINTEMPS MEDICAL DE BOURGOGNE ASSOCIATIONS ANTIAGREGANTS ET ANTICOAGULANTS : INDICATIONS ET CONTRE INDICATIONS Dr Mourot cardiologue Hôpital d Auxerre le 31 mars 2012 PLAN DE LA PRESENTATION ASSOCIATION

Plus en détail

LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE.

LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE. LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE. Synthèse des travaux réalisés 1. Problématique La question D7 du plan d exécution du Programme National de Recherches

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

MIEUX COMPRENDRE CE QU EST UN ACCIDENT VASCULAIRE CÉRÉBRAL AVC

MIEUX COMPRENDRE CE QU EST UN ACCIDENT VASCULAIRE CÉRÉBRAL AVC MIEUX COMPRENDRE CE QU EST UN ACCIDENT VASCULAIRE CÉRÉBRAL AVC SOMMAIRE UN QUIZ POUR FAIRE UN POINT SUR MES CONNAISSANCES Un quiz pour faire un point sur mes connaissances 3 Vrai Faux Qu est-ce que l on

Plus en détail

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines

Plus en détail

Docteur José LABARERE

Docteur José LABARERE UE7 - Santé Société Humanité Risques sanitaires Chapitre 3 : Epidémiologie étiologique Docteur José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail

La migraine. Foramen ovale perméable. Infarctus cérébral (surtout chez la femme)

La migraine. Foramen ovale perméable. Infarctus cérébral (surtout chez la femme) La migraine 1/Introduction : Céphalée primaire (sans lésion sous-jacente). Deux variétés principales: Migraine sans aura (migraine commune). Migraine avec aura (migraine accompagnée). Diagnostic: interrogatoire

Plus en détail

TITRE : «Information et consentement du patient en réadaptation cardiovasculaire»

TITRE : «Information et consentement du patient en réadaptation cardiovasculaire» TITRE : «Information et consentement du patient en réadaptation cardiovasculaire» MC Iliou, R Brion, C Monpère, B Pavy, B Vergès-Patois, G Bosser, F Claudot Au nom du bureau du GERS Un programme de réadaptation

Plus en détail

PROGRAMME (Susceptible de modifications)

PROGRAMME (Susceptible de modifications) Page 1 sur 8 PROGRAMME (Susceptible de modifications) Partie 1 : Méthodes des revues systématiques Mercredi 29 mai 2013 Introduction, présentation du cours et des participants Rappel des principes et des

Plus en détail

Vincent Péters. Président du GT TICS du SNITEM. Directeur Affaires Réglementaires de BIOTRONIK France

Vincent Péters. Président du GT TICS du SNITEM. Directeur Affaires Réglementaires de BIOTRONIK France Vincent Péters Directeur Affaires Réglementaires de BIOTRONIK France Président du GT TICS du SNITEM 5 juillet 2013 Colloque industries du numérique et Santé+ Autonomie Contexte Plus de 60 ans Cardiologues

Plus en détail

De meilleurs soins :

De meilleurs soins : De meilleurs soins : une analyse des soins infirmiers et des résultats du système de santé Série de rapports de l AIIC et de la FCRSS pour informer la Commission nationale d experts de l AIIC, La santé

Plus en détail

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane

Plus en détail

Migraine et mal de tête : des "casse-tête"

Migraine et mal de tête : des casse-tête Migraine et mal de tête : des "casse-tête" Tous concernés! De quoi s agit-il? Les migraines ne doivent pas être confondues avec les céphalées de tension, communément appelées les "maux de tête". En effet,

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

Title Text. Outil intégré de collecte, d'analyse et de visualisation de données de mobilité

Title Text. Outil intégré de collecte, d'analyse et de visualisation de données de mobilité Title Text Outil intégré de collecte, d'analyse et de visualisation de données de mobilité Contenu de la présentation Schéma général et avancement Suivi et administration Validation des entrevues Enrichissement

Plus en détail

Qu est-ce que la fibrillation auriculaire? (FA)

Qu est-ce que la fibrillation auriculaire? (FA) Qu est-ce que la fibrillation auriculaire? (FA) Qu est-ce que la fibrillation auriculaire? La fibrillation auriculaire (FA) est le trouble du rythme le plus répandu. Certains signaux du cœur deviennent

Plus en détail

INFORMATION À DESTINATION DES PROFESSIONNELS DE SANTÉ LE DON DU VIVANT

INFORMATION À DESTINATION DES PROFESSIONNELS DE SANTÉ LE DON DU VIVANT INFORMATION À DESTINATION DES PROFESSIONNELS DE SANTÉ LE DON DU VIVANT QUELS RÉSULTATS POUR LE RECEVEUR? QUELS RISQUES POUR LE DONNEUR? DONNER UN REIN DE SON VIVANT PEUT CONCERNER CHACUN /////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////

Plus en détail

Works like you work. La solution pour l accès public à la défibrillation. Le secourisme facile

Works like you work. La solution pour l accès public à la défibrillation. Le secourisme facile LIFEPAK CR Plus DEfibrillateur Works like you work. La solution pour l accès public à la défibrillation Le secourisme facile L arrêt cardiaque brutal frappe sans prévenir. LA MORT SUBITE Frappe sans prévenir.

Plus en détail

«Une bonne thèse répond à une question très précise!» : comment l enseigner?

«Une bonne thèse répond à une question très précise!» : comment l enseigner? «Une bonne thèse répond à une question très précise!» : comment l enseigner? Congrès du CNGE Angers Novembre 2008 Sébastien Cadier*, Isabelle Aubin**, Pierre Barraine* *Département de médecine générale

Plus en détail

1 La scintigraphie myocardique au Persantin ou Mibi Persantin

1 La scintigraphie myocardique au Persantin ou Mibi Persantin La scintigraphie myocardique au Persantin ou Mibi Persantin Pour mieux connaître l état de votre cœur, votre médecin vous a demandé de passer une scintigraphie myocardique au Persantin. Cette fiche explique

Plus en détail

Séquence maladie: insuffisance cardiaque. Mieux connaître l insuffisance cardiaque Vivre avec un DAI

Séquence maladie: insuffisance cardiaque. Mieux connaître l insuffisance cardiaque Vivre avec un DAI Séquence maladie: insuffisance cardiaque Mieux connaître l insuffisance cardiaque Vivre avec un DAI Janvier 2012 Finalité de l atelier: Présentation de la séance Cette séance a pour buts de vous permettre

Plus en détail

LISTE DES ACTES ET PRESTATIONS - AFFECTION DE LONGUE DURÉE HÉPATITE CHRONIQUE B

LISTE DES ACTES ET PRESTATIONS - AFFECTION DE LONGUE DURÉE HÉPATITE CHRONIQUE B LISTE DES ACTES ET PRESTATIONS - AFFECTION DE LONGUE DURÉE HÉPATITE CHRONIQUE B Actualisation février 2009 Ce document est téléchargeable sur www.has-sante.fr Haute Autorité de santé Service communication

Plus en détail

Diatélic DP : télémédecine pour la prévention des aggravations de santé des dialysés à domicile

Diatélic DP : télémédecine pour la prévention des aggravations de santé des dialysés à domicile DP : télémédecine pour la prévention des aggravations de santé des dialysés à domicile Jacques CHANLIAU, François CHARPILLET, Pierre-Yves DURAND, Robert HERVY, Jean-Pierre THOMESSE, Luis VEGA Résumé. DP

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Document d orientation sur les allégations issues d essais de non-infériorité

Document d orientation sur les allégations issues d essais de non-infériorité Document d orientation sur les allégations issues d essais de non-infériorité Février 2013 1 Liste de contrôle des essais de non-infériorité N o Liste de contrôle (les clients peuvent se servir de cette

Plus en détail

Farzin Beygui Institut de Cardiologie CHU Pitié-Salpêtrière Paris, France. Probability of cardiovascular events. Mortalité CV

Farzin Beygui Institut de Cardiologie CHU Pitié-Salpêtrière Paris, France. Probability of cardiovascular events. Mortalité CV Nouveautés dans le diagnostique et le traitement de la maladie coronaire du dialysé Farzin Beygui Institut de Cardiologie CHU Pitié-Salpêtrière Paris, France Probability of cardiovascular events Mortalité

Plus en détail

LASER DOPPLER. Cependant elle n est pas encore utilisée en routine mais reste du domaine de la recherche et de l évaluation.

LASER DOPPLER. Cependant elle n est pas encore utilisée en routine mais reste du domaine de la recherche et de l évaluation. LASER DOPPLER INTRODUCTION La technique qui utilise l effet Doppler à partir d un faisceau laser est l une des seules qui permette d enregistrer en continu le reflet de la perfusion superficielle de tissus

Plus en détail

SOMMAIRE I. INTRODUCTION 4 II. SOURCES D INFORMATION 5

SOMMAIRE I. INTRODUCTION 4 II. SOURCES D INFORMATION 5 SOMMAIRE I. INTRODUCTION 4 II. SOURCES D INFORMATION 5 2.1. ETUDES REALISEES PAR LES SERVICES DES CAISSES D ASSURANCE MALADIE 5 2.2. ANALYSE DE LA LITTERATURE 5 2.3. ANALYSE DES VENTES 6 2.4. COMPARAISONS

Plus en détail

DENSITOMÉTRIE OSSEUSE : CE QUE LE RADIOLOGUE DOIT SAVOIR

DENSITOMÉTRIE OSSEUSE : CE QUE LE RADIOLOGUE DOIT SAVOIR DENSITOMÉTRIE OSSEUSE : CE QUE LE RADIOLOGUE DOIT SAVOIR C Andreux et F L Huillier H Guerini, A Feydy, X Poittevin, F Thevenin, R Campagna, JL Drapé, A Chevrot Hôpital COCHIN, Paris, France OBJECTIF Proposer

Plus en détail

Marche à suivre pour importer votre base de données Guide santé CV MC ) (Réservé à l usage de Clinemetrica)

Marche à suivre pour importer votre base de données Guide santé CV MC ) (Réservé à l usage de Clinemetrica) December 1, 2010 Klick Inc. Marche à suivre pour importer votre base de données Guide santé CV MC ) (Réservé à l usage de Clinemetrica) Les utilisateurs de l application Guide santé CV MC qui souhaitent

Plus en détail

prise en charge paramédicale dans une unité de soins

prise en charge paramédicale dans une unité de soins Société française de neurologie RÉFÉRENTIEL D AUTO-ÉVALUATION DES PRATIQUES EN NEUROLOGIE Prise en charge hospitalière initiale des personnes ayant fait un accident vasculaire cérébral (AVC) : prise en

Plus en détail

ELABORATION DU PLAN DE MONITORING ADAPTE POUR UNE RECHERCHE BIOMEDICALE A PROMOTION INSTITUTIONNELLE

ELABORATION DU PLAN DE MONITORING ADAPTE POUR UNE RECHERCHE BIOMEDICALE A PROMOTION INSTITUTIONNELLE Référence HCL : Titre de l étude : ELABORATION DU PLAN DE MONITORING ADAPTE POUR UNE RECHERCHE BIOMEDICALE A PROMOTION INSTITUTIONNELLE Investigateur Coordonnateur : Méthode. Définition du niveau de risque

Plus en détail

Point d Information. Le PRAC a recommandé que le RCP soit modifié afin d inclure les informations suivantes:

Point d Information. Le PRAC a recommandé que le RCP soit modifié afin d inclure les informations suivantes: Point d Information Médicaments à base d ivabradine, de codéine, médicaments contenant du diméthyl fumarate, du mycophénolate mofétil/acide mycophénolique, de l octocog alpha, spécialité Eligard (contenant

Plus en détail

Séminaire du Pôle Santé

Séminaire du Pôle Santé 1 Séminaire du Pôle Santé Les télésoins à domicile au Québec représentent-ils une solution économiquement viable? Guy Paré, Ph.D., MSRC Titulaire de la Chaire de recherche du Canada en technologies de

Plus en détail

Qu est-ce que la maladie de Huntington?

Qu est-ce que la maladie de Huntington? Qu est-ce que la maladie de Huntington? Description sommaire Qu est-ce que la maladie de Huntington? La maladie de Huntington (MH) est une maladie neurodégénérative longtemps connue sous le nom de Chorée

Plus en détail

Le cœur et les artères des femmes sont en danger

Le cœur et les artères des femmes sont en danger Le cœur et les artères des femmes sont en danger Dossier de presse Contact Luc-Michel Gorre Association de Cardiologie Nord Pas de Calais Coordination et Communication 03 20 21 07 58 06 16 48 13 35 luc-michel.gorre@orange.fr

Plus en détail

Référentiel Officine

Référentiel Officine Référentiel Officine Inscrire la formation dans la réalité et les besoins de la pharmacie d officine de demain - Ce référentiel décrit dans le cadre des missions et des activités du pharmacien d officine

Plus en détail

BILAN projet DIABSAT 2010-2011. Diabétologie par Satellite

BILAN projet DIABSAT 2010-2011. Diabétologie par Satellite BILAN projet DIABSAT 2010-2011 Diabétologie par Satellite 1 OBJECTIFS Développer et évaluer 3 services de télémédecine assistés par satellite Volet 1 : Education à la nutrition et promotion de l activité

Plus en détail

Carte de soins et d urgence

Carte de soins et d urgence Direction Générale de la Santé Carte de soins et d urgence Emergency and Healthcare Card Porphyries Aiguës Hépatiques Acute Hepatic Porphyrias Type de Porphyrie* Déficit en Ala déhydrase Ala Dehydrase

Plus en détail

Capteurs pour la santé et l autonomie. Nouvelles approches technologiques. pour le suivi sur les lieux de vie

Capteurs pour la santé et l autonomie. Nouvelles approches technologiques. pour le suivi sur les lieux de vie Capteurs pour la santé et l autonomie Nouvelles approches technologiques pour le suivi sur les lieux de vie Santé : nécessité de nouvelles approches Le nouveau contexte créé par les technologies de l information

Plus en détail

Les personnes âgées et le système de santé : quelles sont les répercussions des multiples affections chroniques?

Les personnes âgées et le système de santé : quelles sont les répercussions des multiples affections chroniques? Janvier 2011 Les personnes âgées et le système de santé : quelles sont les répercussions des multiples affections chroniques? Introduction Les soins dispensés aux patients souffrant d affections chroniques

Plus en détail

GUIDE D INFORMATIONS A LA PREVENTION DE L INSUFFISANCE RENALE

GUIDE D INFORMATIONS A LA PREVENTION DE L INSUFFISANCE RENALE GUIDE D INFORMATIONS A LA PREVENTION DE L INSUFFISANCE RENALE SOURCES : ligues reins et santé A LA BASE, TOUT PART DES REINS Organes majeurs de l appareil urinaire, les reins permettent d extraire les

Plus en détail

BIOPSIE PAR ASPIRATION Sous stéréotaxie

BIOPSIE PAR ASPIRATION Sous stéréotaxie Vous avez appris qu une anomalie a été détectée lors de votre mammographie. Afin d investiguer cette anomalie, le radiologue a pris la décision d effectuer une biopsie par aspiration sous stéréotaxie.

Plus en détail

Migraine et Abus de Médicaments

Migraine et Abus de Médicaments Migraine et Abus de Médicaments Approches diagnostiques et thérapeutiques des Céphalées Chroniques Quotidiennes Pr D. DEPLANQUE Département de Pharmacologie médicale EA 1046, Institut de Médecine Prédictive

Plus en détail

Préambule, définitions, limites du sujet :

Préambule, définitions, limites du sujet : Télémédecine : Quel cadre, quels niveaux de preuves, quelles modalités de déploiement. XXIX èmes Rencontres Nationales de Pharmacologie et Recherche Clinique, Innovation et Evaluation des Technologies

Plus en détail

MEMOIRE DE MAGISTER. Télésurveillance : Transmission sans fil, par voie GSM, et traitement du signal électrocardiographie (ECG)

MEMOIRE DE MAGISTER. Télésurveillance : Transmission sans fil, par voie GSM, et traitement du signal électrocardiographie (ECG) MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE UNIVERSITE MOULOUD MAMMERI, TIZI-OUZOU FACULTE DE GENIE ELECTRIQUE ET DE L INFORMATIQUE DEPARTEMENT D ELECTRONIQUE MEMOIRE DE MAGISTER

Plus en détail