Traitement de l Information en Biologie Santé Novembre 2010 Thierry Lecroq thierry.lecroq@litislab.eu
2/29 Plan 1 Bilan 2 Projet
3/29 Effectifs (1) Membres permanents : 9 Saïd Abdeddaïm (MdC 27) Dominique Cellier (MdC 26) Hélène Dauchel (MdC 64) Stéfan J. Darmoni (PUPH 46 04) Jean-François Gehanno (PUPH 46 02) Thierry Lecroq (PU 27) Arnaud Lefebvre (MdC 27) Martine Léonard (MdC 27) Élise Prieur-Gaston (MdC 27) 3 PU, 6 MdC, 3 HDR, 2 PES/PEDR
4/29 Effectifs (2) Doctorants : 8 Saoussen Sakji (2007, projet européen PSIP) Ahmed Diouf Dirieh-Dibad (2008, co-tutelle Djibouti) Laetitia Rollin (2008, AH CHU Rouen) Heni Bouhamed (2008, co-tutelle Sfax) Tarek El Falah (2008, co-tutelle Tunis) Mounia Haddoud (2009, co-tutelle Alger) Zied Moalla (2009, co-tutelle Sfax) Nazek Mohammad (2010, bourse syrienne) Post-doctorant : 1 Tayeb Merabti (2010, PlaIR)
5/29 Effectifs (3) Associés : 11 Joël Alexandre (VP univ. Rouen) Badisse Dahamna (ingénieur CHU Rouen) Dominique Dutoit (Memodata, HDR) Julien Grosjean (ingénieur CHU Rouen) Gaëtan Kerdelhué (documentaliste CHU Rouen) Ivan Kergourlay (ingénieur CHU Rouen) Catherine Letord (pharma., document. scient. CHU Rouen) Suzanne Pereira (ingénieure Vidal) Louis Sibert (professeur associé CHU Rouen) Lina Soualmia (MdC, LIM&BIO, univ. Paris Nord) Benoît Thirion (conservateur CHU Rouen)
6/29 Verrou scientifique Rechercher, indexer et extraire des informations pertinentes dans des systèmes d information en santé (CISMeF, serveur multiterminologies de santé, dossier électronique du patient) des données biologiques (génomes et expression des génomes)
7/29 Angle d attaque Pluridisciplinarité Traitement de données textuelles et des séquences génomiques De la théorie à la valorisation en passant par les applications
8/29 Trois faits marquants Portail terminologique de santé : http://pts.chu-rouen.fr/ Algorithmes de recherche exacte de mot Analyse statistique de la toxicité des OGM
9/29 Principales collaborations internationales NIH - NLM aux USA (6 publications) Japan Institute of Public Health 2 entrées dans l Encyclopédie des Algorithmes et 2 entrées dans l Encyclopédie des Bases de Données rédigées avec M. Crochemore (King s College London et Université Paris Est) + 1 mois invité (UR) de C. Iliopoulos (KCL) en janvier 2011 Université de Catane en Italie (5 publications) Canadian Institutes for Health Research (projet de recherche en cours) Co-tutelles de thèse avec l Algérie, Djibouti et la Tunisie
Principaux logiciels Doc CISMeF, coopération avec l INSA de Rouen PIH (Portail Institutionnel du Handicap) financé par ANR 2005 TecSan Portail d Information sur le Médicament en collaboration avec le Vidal ECMT (Extracteur de Concept Multi-Terminologique) F-MTI (French Multi Terminology Indexer) en partenariat avec le Vidal PTS (Portail Terminologique de Santé), coopération avec l INSA Rouen CISMeF 10/29 Algorithmique du texte
11/29 Principales valorisations Outil d évaluation des risques professionnels et d aide à la mise en œuvre de leur prévention par les CHU financé par la CNRACL KISMeF : réalisation d un outil de recherche orienté en cancérologie avec l INCA (Institut National du Cancer) avec la société Vidal (depuis 2006) : recensement, description & indexation des principales recommandations pour la bonne pratique clinique disponibles en français sur l Internet Achat d un certain nombre de mots clés (maladies) du catalogue CISMeF par les laboratoires Lilly & GSK (2006-2008) SMTS (Serveur Multi-Terminologique en Santé) depuis 2009 : commercialisé par MONDECA et acheté par l APHP
12/29 Projets (1) Européens Patient Safety through Intelligent Procedures in medication, FP7-ICT-2007, 2007-2011 Orphanet (Rare Diseases Task Force), DG Sanco, 2009-2010 HOPES (Help and social interaction for elderly On a multimedia Platform with E-Social best practices and Solutions), AAL (Ambiant Assisted Living), 2010-2012 Régional + FEDER PlaIR (Plateforme d Indexation Régionale), 2009-2011
13/29 Projets (2) ANR INTERSTIS : Interopérabilité Sémantique des Terminologies dans les Systèmes d Information de Santé Français, 2007-2010 ALADIN-DTH : Assistant de Lutte Automatisé et de Détection des Infections Nosocomiales à partir de Documents Textuels Hospitaliers, 2008-2011 L3IM : Langage Iconique et Interfaces Interactives en Médecine, 2008-2011
14/29 Liens avec l enseignement Participation aux enseignements dans les masters du LITIS Administration de la spécialité bioinformatique (en alternance) de la mention Biologie Santé du master Sciences et techniques de l université de Rouen
15/29 Thèses & HDR Thèses : 7, durée moyenne 41 mois Narjiss Touyar, 2006, 53 mois, ingénieur SIG chez ErDF Filip Florea, 2007, 43 mois, trader à la Société Générale Céline Meslin, 2007, 39 mois, ingénieur formation à l EXIA-CESI Élise Prieur, 2007, 52 mois, MdC au LITIS, univ. Rouen Suzanne Pereira, 2008, 39 mois, ingénieure au Vidal Mikael Salson, 2009, 28 mois, MdC au LIFL, univ. Lille 1 Tayeb Merabti, 2010, 34 mois, post-doctorant au LITIS HDR : 2 Jean-François Gehanno, 2007 Dominique Dutoit, 2009
Principaux éléments de visibilité 16/29 D. Cellier S.J. Darmoni membre de la section 1 et de la CID 44 du CNRS de 2004 à 2008 membre du CNU 46-04 depuis 2005 président de l AIM (Association française d Informatique Médicale) depuis janvier 2006 membre du comité éditorial de Ingénierie et Recherche Biomédicale et BMC Medical Informatics and Decision Making J.-F. Gehanno T. Lecroq membre du CA de l EASOM membre du comité éditorial du Journal of Discrete Algorithms membre du comité de programme de conférences responsable du groupe de travail COMATEGE du GDR IM
17/29 Production scientifique sur 4,5 ans 142 ACL-int ACL-nat INV ACTI ACTN COM AFF OS DO AP Thèses Toutes 28 17 1 37 9 14 11 10 0 6 9 Maj. 28 7 8 43 majeures 76 % de co-auteurs hors LITIS, 48 % de co-auteurs internationaux Conférences cibles AIME, AMIA, CPM et RECOMB
8/29 CISMeF Catalogue et Index des Sites Médicaux de langue Française ensembles de ressources sûres en santé pour : les professionnels de santé les étudiants en médecine les patients initié en 1995 par S.J. Darmoni et B. Thirion historiquement fondé sur la terminologie MeSH (localement enrichi)
19/29 Médecine > 100 terminologies Nécessité de les faire inter-opérer
20/29 PTS
21/29 PTS
22/29 Réalisations Mise en place d un méta-modèle : 27 terminologies et ontologies (octobre 2010) Alignements entre les terminologies Concept UMLS TAL Statistiques respect des normes W3C, RDF (SKOS),... optimisation BD, utilisation de SPARQL (Oracle) Réalisation d un portail pour naviguer en intra ou inter-terminologies humain (site web) machine (services web)
23/29 SMTS
24/29 Finalités Outil unique audit pour évaluer la qualité d une terminologie aide à la traduction création de terminologies de novo indexation de documents appropriation de connaissances du domaine PTS évalué par des étudiants en médecine (14/20 pour l intérêt et 11/20 pour l ergonomie)... Voir Julien Grosjean pour la démo
25/29 Plan 1 Bilan 2 Projet
26/29 Auto-évaluation Points forts pluridisciplinarité activité contractuelle CISMeF master bioinfo reconnaissance internationale dans des domaines fondamentaux Points faibles départ retraite D. Cellier éparpillement des sites d enseignement précarité des associés
27/29 Auto-évaluation Opportunités CIC-IT de Lille dans le cadre du G4 équipe INSERM UMRS872 équipe 20, dirigée par Mme Marie-Christine Jaulent achats de matériel de SHD (Rouen et Caen) Risques concurrence internationale dans les domaines fondamentaux
28/29 Perspectives scientifiques 3 axes principaux Passage au multi-discipline multi-linguisme pour l indexation et la recherche dans les systèmes d information Recherche d information dans les dossiers de patients informatisés (échelon individuel, échelon épidémiologique) Développement de méthodes et d outils pour l analyse des données issues des nouveaux séquenceurs à très haut débit (voir Sophie Coutant pour la démo d EVA : Exome Variations Analyser)
29/29 Principaux éléments de mise en œuvre projets européens, ANR et accompagnement des projets liés au SHD (FRM, Equipex, Leverhulme Trust,...) projet PlaIR recrutements collaborations nationales et internationales