Information juridique et Web sémantique



Documents pareils
Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

Présentation générale du projet data.bnf.fr

Catalogue des formations Edition 2015

Compte-rendu re union Campus AAR 3 mars 2015

Le signalement des acquisitions numériques à l échelle nationale Le rôle du hub de métadonnées scénarios et prototype

Le Web de Données Dan VODISLAV Université de Cergy-Pontoise Master Informatique M2 Plan

Conférence des Cours constitutionnelles européennes XIIème Congrès

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

ISTEX, vers des services innovants d accès à la connaissance

Bigdata et Web sémantique. les données + l intelligence= la solution

Référentiels de représentation des contenus

Le bénéfice maximal de votre documentation

Semantic Web Inside Guillaume Érétéo Directeur R&D

Guide juris.doc. 3 e édition. soquij.qc.ca

Nouvelles d EUR-Lex. Juriconnexion. 6 Juin Pascale Berteloot Office des publications de l Union européenne. EUR-Lex où en sommes-nous?

CATALOGUE Formations courtes PARCOURS TRADUCTION

Vocabulaire juridique multilingue comparé. Caroline Reichling Direction générale de la Traduction Cour de justice de l Union européenne

7/26/2011. Analyse des besoins. Contextualisation. Univers de pensée et univers de croyance. Droit et interculturel. Les bases de connaissances

1 ère Université WEB. Courbevoie Samedi 21 octobre Votre site interactif sur internet.

LES TECHNOLOGIES DU WEB APPLIQUÉES AUX DONNÉES STRUCTURÉES

Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014

JDev Atelier Datalift

Service pénal Fiche contrevenant

TEXT MINING Tour d Horizon

Quel cadre légal pour l exploitation des «Big data»? Jean-François Forgeron

Documents complémentaires au PPN du DUT Carrières juridiques (CJ) Description des parcours de modules complémentaires destinés à la poursuite d étude

Projet base de connaissances Réseau UNAF / UDAF. Cahier des charges

Linked Data et description du produit automobile SemWeb Pro, Paris, 2 mai 2012

Datalift. + + Architecture Modularité Déploiements. d j = 09/04/2015 Laurent BIHANIC

Evolution des catalogues et des métiers: comment se préparer aux changements? Quelques échos de la BnF. CRFCB Université de Toulouse 29 mars 2013

Déjeuner EIM Enterprise Information Management. Mardi 16 novembre 2010 Restaurant l Amourette Montreuil Thomas Dechilly CTO Sollan

ACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES

LES DOSSIERS DOCUMENTAIRES ELECTRONIQUES. Clotilde VAISSAIRE CV CONSEIL SARL

Interaction entre réseaux sociaux et sites web

Décrets, arrêtés, circulaires

ARTICLE 90 DU DECRET DU 19 DECEMBRE 1991 MODIFIE

De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues

Assemblée des États Parties

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

Recherche bibliographique

Entreprises. Le portail juridique nouvelle génération. Informations et démonstrations

LE référentiel des métiers

THESE. Présentée devant. L Université Paul Sabatier de Toulouse. en vue de l obtention du

XML pour la mise en valeur des informations

BOOK REFERENCES ERGONOMIQUES Gfi Informatique

les GDT dans le Système d Information informatisé Muriel Pinel Laurent Tabourot

PROCEDURES DE DIVORCE

Le Manuel de la secrétaire juridique et du parajuriste Julie Tondreau TABLE DES MATIÈRES

CAHIER DES CLAUSES TECHNIQUES PARTICULIÈRES (CCTP) MISE EN PLACE ET MAINTENANCE D UN MOTEUR DE RECHERCHE

LES SOURCES DU DROIT

Chapitre 9 : Informatique décisionnelle

Présentation du programme Open Law Europa

Langage HTML (2 partie) <HyperText Markup Language> <tv>lt La Salle Avignon BTS IRIS</tv>

Consolidation et codification, simplifier et faciliter l accès au droit

Elaborer un «Référentiel d Organisation 2.0»

Conclusions de Madame l avocat général Gervaise TAFFALEAU

De la production collaborative à la capitalisation des connaissances Le rôle des documentalistes

TABLE DES MATIERES. Section 1 : Retrait Section 2 : Renonciation Section 3 : Nullité

Description de Produit Logiciel. AMI News Monitor v2.0. SPD-AMINM-10 v1.0

Infrastructure / réseau / sécurité /support utilisateur

Conseil de développement durable (C2D) Plénière d ouverture 17 décembre 2014

La Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1

Le pilotage des collaborations et l interopérabilité des systèmes d information Vers une démarche intégrée

15 ACTIONS POUR LA JUSTICE DU QUOTIDIEN

Étude nationale sur les besoins des clients

Journal de l OSGeo Le journal de la Fondation Open Source Geospatial Volume 3 / Décembre 2007

ResearcherID, ResearchGate, etc. Quels outils pour votre profil chercheur (page web, liste de publications, etc.)?

Knowledge Enabled Real-Time Recommendation System

Règle 63 DIVORCE ET DROIT DE LA FAMILLE

Les Ateliers Info Tonic

OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE

RAPPORT DE STAGE ET RÉSUMÉ

BULLETIN D ACTUALITES JURIDIQUES

Offre de formation. Travaux autour d'uniform. ESUP-Days # Paris

Documents et Applications : CMS nouvelle génération

Théories de la Business Intelligence

FORMULAIRE DE SOUMISSION DU PROJET PORTÉ DANS LE CADRE DU SYSTÈME D'ARCHIVAGE ÉLECTRONIQUE MUTUALISÉ (SAEM)

BULLETIN OFFICIEL DU MINISTÈRE DE LA JUSTICE

4. SERVICES WEB REST 46

La Faculté de Droit Virtuelle est la plate-forme pédagogique de la Faculté de Droit de Lyon

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

Formation «Système de gestion des documents d activité (SGDA)»

Mercredi 05/10/2011. Forges logicielles. Olivier Berger, Telecom SudParis. Introduction Avant-propos À propos de COCLICO. Panorama des forges

Au Bureau d'assistance judiciaire de la Cour de cassation, en application des articles 644 et suivants du Code judiciaire,

Drupal, pour quel usage? Comment se positionne Drupal? Les fonctionnalités de Drupal et de son écosystème. L'architecture technique et logicielle Le

LA DEONTOLOGIE FRANCAISE DU CONFLIT D INTERET

Datalift day 9 avril 2015

Institutions L'organisation de la Justice

Aide : publication de décisions VS

Une méthode d apprentissage pour la composition de services web

KONTRAST : création d un glossaire contrastif à partir d un corpus de normes internationales

DIVORCE l intérêt du consentement amiable

Vous divorcez, vous vous séparez?

Learning Object Metadata

REQUÊTE EN REGLEMENT COLLECTIF DE DETTES. ( article 1675 /4 du Code judiciaire) Au Juge des Saisies près le Tribunal de 1 ère Instance de Bruxelles.

Infrastructure de Données Spatiales

Solutions Exploitation de contenus

Quel cadre juridique pour les mesures d investigation informatique?

Rapport de TN10 : Développement D application Sémantique

Transcription:

Information juridique et Web sémantique Jamal Rezzouk Directeur de la technologie jrezzouk@viasema.com Journée d étude AFNOR/Bnf 27 mai 2011 Référentiels et données d autorité à l heure du Web sémantique

Contexte de la présentation On ne s intéresse ici qu à l information juridique directement produites par l état et à destination des professionnels du droit On ne s intéresse ni à l information juridique produite par les éditeurs juridiques ni à l information «juridique» produite dans le cadre des évolutions de comportement des usagers du web (blog, twitter, facebook ) ni à la vulgarisation de l information juridique à destination des non professionnels Néanmoins, l essentiel de cette présentation est transposable 2

L univers de l information juridique L information juridique est un univers de l écrit attachant une grande importance aux mots et au sens des mots dans le cadre d un processus de «création» imposé en perpétuelle évolution mais «nul n est censé ignorer la Loi» En quoi l approche «Web Sémantique» est elle particulièrement adaptée pour répondre aux enjeux de l'information juridique? 3

Un Univers de la connaissance écrite Notre système juridique s appuie avant tout sur l écrit. La gestion des multiples sources d information juridique est donc d abord considérée comme un projet d informatique documentaire (XML, XSD, ) Mais les contenus juridiques sont très riches en information : jusqu où va-t-on dans la prise en compte de cette information au sein d un document structuré? métadonnées balisage «inline» des citations grille de lecture données chiffrées et quoi d autre? Le Web sémantique distingue par principe la «ressource» (le texte de Loi, la décision de jurisprudence ) de la «connaissance» que l on peut en avoir La complémentarité des deux approches se retrouve au cœur d un certain nombre de projets : E-POWER - approche «documentaire» : MetaLex, une approche XML générique et extensible portant sur la structuration et les métadonnées des sources de la Loi et des sources du Droit ( http://www.metalex.eu/ ) ESTRELLA - approche «ontologie» : LKIF, une ontologie décrite sous la forme d un ensemble de modules utilisables dans un contexte juridique ( http://www.estrellaproject.org/lkif-core/ ) Lecture : «Proposed XML standards for Law : Metalex and LKIF» Boer, Winkels, Vitali Proceedings of Jurix 2007 4

www.arisem.com Content_Unit : Doc_ID : 0937632857 Type : Decision Jurisprudence URI : http://www.viasema.com/dtfr/0937632857 Matières principales : droit de la famille Concepts principaux : divorce, procedure Concepts secondaires : apourref Lien déc. antérieure Lien fondement 0937632857 ---------- ---------- ---------- Référence_DE_Jurisprudence : Juridiction : Cour de Cassation Siège : Formation : Chambre civile 1 N decision : [pourvoi] 04-16.502 Date : 23/12/2005 Parties : Mr Duran Référence_A_Jurisprudence Juridiction : Cour d appel Siège : Versailles Formation : Chambre 1 section B N decision : Date : 14/11/2004 Parties : Mme Dupon Référence_A_TexteCodifié : Code : Code civil Article : 279 chainage rapprochement? Contenu vs. Connaissances Content_Unit : Doc_ID : 0937632623 Type : Décision Jurisprudence URI : http://www.viasema.com/dtfr/0937632623 Matières principales : droit de la famille Concepts principaux : divorce, garde de l enfant Concepts secondaires : pension alimentaire Référence_DE_Jurisprudence : Juridiction : Cour d appel Siège : Versailles Formation : Chambre 1 section B N decision : [RG] 02/01222 Date : 14/11/2004 Parties : Mr Duran, Mme Dupon 0937632623 ---------- ---------- ---------- apourref KM Extraction / Enrichissement CMS 5

www.arisem.com Contenu vs. Connaissances contenus de la «source» nettoyé et «monitoré» ressources terminologiques et ontologiques contenus structurés + métadonnées base de connaissance du domaine contenus structurés + métadonnées + enrichissements taxonomies de publication base de connaissance publiée Lecture : «Improving Legal Publishing at LexisNexis in France with Ontology Driven Processes» J.Rezzouk & J.Delahousse - Semtech 2007 services de recherche et navigation 6

Un Univers de mots Un vocabulaire juridique d un très grande richesse, de multiples abréviations, des sigles, des formulations différentes en fonction du métier, tout cela entrainant son lot d ambiguïté, et d implicite : sigles et ambiguïtés : CA (Cour d Appel), CE (Conseil d Etat), JE (Juge des enfants), TA (Tribunal Administratif), TE (Tribunal pour enfants) C.C. abréviation possible de Conseil Constitutionnel, Cour de Cassation, Code Civil, Communauté de Communes, Chambre de commerce flexions : «vendeur» et ses 2 féminins «vendeuse» et «venderesse» de sens différents ; monosémique mais «savant» : synallagmatique, cofidéjusseur, dirimant, emphythéose, exhérédation, adminicule, anatocisme polysémique mais «cohérent» : conseil, dépôt, cause, matériel expressions : habitation légère de loisir (tente) école de pilotage de véhicule terrestre à moteur (auto-école), tatouage par effraction cutanée et perçage corporel (piercing), interceptions de correspondances émises par la voie des télécommunications (écoutes téléphoniques), participation des employeurs à l effort de construction-peec (1% logement) Lecture : «Linguistique Juridique» Gérard Cornu Edition Montchrestien 14 juin 2005 7

Un Univers de mots Le Web Sémantique propose une solution technique unifiée offrant un cadre formel standard skos : une représentation formelle de listes d autorités utiles à l identification des contenus juridiques (juridiction, siège de juridiction, type de décision, type de texte ) thésaurus (exemple d Eurovoc : http://eurovoc.europa.eu/drupal/?q=fr/ontology ) taxonomies de publication répondant aux besoins spécifiques des utilisateurs du droit (avocats, expert comptables, juristes d entreprises n accèdent pas au droit de la même manière) skos-xl : une distinction explicite de la notion de concept et de forme lexicale associée permettant aussi de créer un pont entre le TAL et le Web Sémantique Exemple : demo ainsi que des mécanismes de raisonnement permettant d aller au-delà de la simple gestion de terminologie : stratégie de désambiguïsation règle d explicitation contextuelle de l implicite 8

Un Univers organisé L ensemble du système juridique s appuie sur un cadre bien formalisé : des acteurs et des organisations, des règles de fonctionnement et des processus Code de l organisation judiciaire, Code Procédure Civile, Code de Procédure Pénale, Code de justice administrative des principes et des habitudes rédactionnelles "Guide de légistique" : http://www.legifrance.gouv.fr/html/guide_legistique_2/accueil_guide_leg.htm Le Web Sémantique propose un cadre formel (ontologie) permettant de prendre en compte et d'exploiter toutes ces informations : une ontologie de type «linguistique et terminologique» une ontologie de type «documentaire» prenant en compte les problématiques de versionnement juridique, de citation une ontologie de type «juridique» 9

Un Univers organisé 10

Un Univers en perpétuelle évolution Pour suivre les évolutions de la société, le système juridique évolue sans cesse : changement de dénomination d'un concept évolution du sens d'un concept évolution des relations entre concepts Exemples : l un des plus vieux texte encore en vigueur date de 1539 (l Ordonnance de Villers- Cotterêts) le calendrier révolutionnaire a remplacé le calendrier grégorien entre 1792 et 1806 «Code de procédure civile» partiellement refondu en 1976 en «Nouveau Code de procédure civile» refondu à nouveau en 2007 pour (re)devenir le «Code de procédure civile» le «divorce» avant 2004 n est pas le «divorce» d après 2004 La notion de «temps juridique» est liée au cycle de vie naturel des notions juridiques : évocation d'une ébauche de concept dans les débats au Parlement définition juridique du concept (date de signature) opposabilité (date de publication) entrée en vigueur (date d applicabilité) usage qui «renomme» cette notion Le tout, subtilement «pimenté» d exceptions, limitations, de conditions et autres contraintes de natures variées (temporelles, géographiques, sociétales ) 11

Un univers en perpétuelle évolution La problématique juridique «temporelle» est partiellement couverte par une approche «Web Sémantique» : Dublin-Core : un schéma de métadonnées offrant un cadre suffisant pour gérer le cycle de vie des listes d autorité, thésaurus OWL-Time : travaux du W3C ( http://www.w3.org/tr/owl-time/ ) Ontologie orientée «événement» : elle est nécessaire pour prendre en compte les spécificités du cycle de vie des concepts juridiques exemple : le «Tribunal de 1 ère instance» est le prédécesseur du «Tribunal de grande instance» (Ordonnance n 58-1273 du 22 décembre 1958 relative à l'organisation judiciaire, article 1er, publié au JO du 23 décembre 1958, entré en vigueur le 02 février 1959) Ontologie orientée «temps» : elle permet de représenter des concepts purement temporels autour desquels s organise le système juridique français : exemple : la 4 ème République (oct. 1946 => oct. 1958) a précédé la 5 ème République, la XIIIème Législature de la Vème République a commencé le 20 juin Z007 et doit s achever le 19 juin 2012. mais il n existe aucune solution «miracle» et en particulier pas de mécanisme de raisonnement temporel. 12

«Nul n est censé ignorer la Loi» Derrière ce vieil adage se cache bien sûr les problématiques de qualité, d accès à l information juridique et d'adaptation au "profil" de l'utilisateur final Le Web Sémantique apporte un cadre formel comme support de diffusion de l information et de ses moyens d accès : Une généralisation de la notion de métadonnées et des outils associés (lexiques, listes d autorité, thésaurus, taxonomies ) facilitant la mise en place de services d accès exploitant ces données (autocompletion, facettes, information contextuelle, aide à la (re)formulation d un requête ) Des graphes nommés («named graph») pour en particulier gérer la provenance des données, la notion de licence ou les problématiques de droit d accès. Une approche «Linked Data» parfaitement adaptée à la publication de données publiques juridiques : Tim Berners-Lee : http://www.w3.org/designissues/linkeddata.html Use URIs as names for things Use HTTP URIs so that people can look up those names. When someone looks up a URI, provide useful information, using the standards (RDF*, SPARQL) Include links to other URIs. so that they can discover more things. Exemple : site de référence : http://www.legislation.gov.uk/ lecture associée : http://blog.law.cornell.edu/voxpop/2010/08/15/legislationgovuk/ 13

Conclusion L information juridique est un cas d école idéal de mise en pratique d une approche de type «Web sémantique» Le Web sémantique apporte des réponses concrètes et formelles couvrant des besoins fondamentaux de modélisation, normalisation, interopérabilité, réutilisabilité et modalités d accès à l information juridique. L information juridique offre un cadre d application unique autour des grands enjeux du Web sémantique, en particulier pour ce qui concerne la gestion du cycle de vie de ses ressources, leur fiabilité, leurs modalités de publication, ainsi que la gestion des droits. 14