Quelques expressions régulières simples (1)

Documents pareils
Débuter avec Excel. Excel

Traitement de texte : Quelques rappels de quelques notions de base

Cours 1 : Introduction. Langages objets. but du module. contrôle des connaissances. Pourquoi Java? présentation du module. Présentation de Java

Les chaînes de caractères

PRESENTATION DES RECOMMANDATIONS DE VANCOUVER

Excel 2007 Niveau 3 Page 1

Gestion d'une billeterie défilé des talents

Chap 4: Analyse syntaxique. Prof. M.D. RAHMANI Compilation SMI- S5 2013/14 1

Chapitre 4 : Édition de fichiers texte - Vi

INSERER DES OBJETS - LE RUBAN INSERTION... 3 TABLEAUX


NORMES DE PRÉSENTATION DES MANUSCRITS

Le codage informatique

RACCOURCIS CLAVIERS. DEFINITION : Une «combinaison de touches» est un appui simultané sur plusieurs touches.

Observatoire des ressources numériques adaptées

Microsoft Excel. Tableur

Chap III : Les tableaux

R, Bonnes pratiques. Christophe Genolini

Date : juin 2009 AIDE SUR LES CERTIFICATS. Comment sauvegarder et installer son certificat

INTERNET & RESEAUX. Dino LOPEZ PACHECO lopezpac@i3s.unice.fr

Tout savoir sur le clavier

Salle de technologie

Plan. Exemple: Application bancaire. Introduction. OCL Object Constraint Language Le langage de contraintes d'uml

INSTRUCTION DE CRÉATION D UN COMPTE CLIENT

Initiation à la programmation en Python

Jeux de caracte res et encodage (par Michel Michaud 2014)

EBS 204 E C B S. Publication : Novembre 96

Instructions et spécifications pour la transmission en format XML de déclarations par lots. 30 mai 2015 MODULE 1

Netstorage et Netdrive pour accéder à ses données par Internet

Date M.P Libellé Catégorie S.Catégorie Crédit Débit Solde S.B

NOTICE SUR LES MEMOIRES DE MASTER 2

Alcatel OmniPCX Office

Connexion de Votre Imprimante Multifonction à votre Réseau pour la Première Fois

Découvrez Windows NetMeeting

PIXMA MG5500. series. Guide d'installation

GENERALITES II. ORGANISATION ET ORGANES DE L EXAMEN III. INSCRIPTION A L EXAMEN, FRAIS ET CONDITIONS D ADMISSION IV. CONTENU ET MATIERE DE L EXAMEN

[Contractant] [Agence spatiale européenne] Licence de propriété intellectuelle de l'esa pour les besoins propres de l'agence

GUIDE MEMBRE ESPACE COLLABORATIF. Février 2012

Ville et Eurométropole de Strasbourg - Service communication numérique. Mode d emploi

Programmation Internet Cours 4

IMPORTATION, CRÉATION, MANIPULATION, EXPORTATION DE DONNÉES STATISTIQUES

CAISSE ENREGISTREUSE ELECTRONIQUE SE-G1

Il s'agit d'un accident survenu dans l'exercice ou à l'occasion de l'exercice des fonctions (art de la loi n du 26 janvier 1984).

1 Introduction - Qu est-ce que le logiciel R?

CREATION D UNE EVALUATION AVEC JADE par Patrick RUER (

Chapitre 1: Introduction générale

Cours 420-KEG-LG, Gestion de réseaux et support technique. Atelier No5-1

7. Le Service de certification déchiffre le document avec sa clé privée de déchiffrement.

Importer un fichier CSV

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux.

M06/5/COMSC/SP1/FRE/TZ0/XX INFORMATIQUE NIVEAU MOYEN ÉPREUVE 1. Mardi 2 mai 2006 (après-midi) 1 heure 30 minutes INSTRUCTIONS DESTINÉES AUX CANDIDATS

Documentation Utilisateur

TRANSMETTEUR TELEPHONIQUE TTX = SINTEL X

OCL - Object Constraint Language

Mobyt Intégration HTTP TABLE DES MATIERES

Objet : Guide d'installation et de maintenance pour "My IC Phone 8082" connecté à un OmniPCX Office R810

Annotations manuelles et automatiques de corpus

GESTION CLIENTELE GESTION CLIENTELE V /05/2014 DOC HEITZ INDICE 1 Page 1/46

Gestion des cartes ristourne

2 Comment fonctionne un ordinateur, dans les grandes lignes

Python - introduction à la programmation et calcul scientifique

Création d un diaporama photo sur fond musical avec iphoto et itunes dans un contexte scolaire

INITIATION AU LANGAGE C SUR PIC DE MICROSHIP

EVALUATION DU PORTEFEUILLE

TIC INFORMATIQUE Ce que je dois retenir

1. Démarrage de l ordinateur

LA GESTION DE PROJET INFORMATIQUE

HiPath 3000 HiPath AllServe

LA GESTION DE PROJET INFORMATIQUE

Algorithmique et Programmation, IMA

GUIDE D INSTALLATION DU LOGICIEL ET RACCORDEMENT USB/i.LINK

Mallette Métrologie Contrôle des spectrophotomètres

NIGHT VISION STUDIOS GUIDE DU LOGICIEL. Produit Voyance. Version 1.5

De nombreuses bases de données, qui sont implantées dans des systèmes

Foire aux Questions Note: Les réponses aux questions correspondent à la version Mise en route

Intelligence Artificielle Planification

IAB Sales Guidelines Avril 2005

à l édition de textes

Domain Name Service (DNS)

Guide d usage du portail périscolaire de la Ville de Lorient

Modifications aux logiciels DCision ERP 11. Table des matières

L informatique en BCPST

Onglet sécurité de Windows XP Pro et XP Home

Règles de bonne conduite applicables à toutes les villes désireuses d obtenir l organisation des Jeux Olympiques. Article 1 : CHAMP D APPLICATION


WinTask x64 Le Planificateur de tâches sous Windows 7 64 bits, Windows 8/ bits, Windows 2008 R2 et Windows bits

Retrospect 7.7 Addendum au Guide d'utilisation

NEPTUNE Association déclarée selon la loi de Siège social : 32 boulevard Paul Vaillant Couturier MONTREUIL SOUS BOIS STATUTS

PROTEGER SA CLE USB AVEC ROHOS MINI-DRIVE

SOFI Gestion+ Version 5.4. Echanges de données informatiques Spicers Sofi gestion+ Groupements. SOFI Informatique. Actualisé le

L import massif introduit plusieurs nouvelles fonctionnalités, selon que l on importe un thésaurus, un ensemble de valeurs contrôlées ou un corpus.

1. Utilisation du logiciel Keepass

Gestion des documents avec ALFRESCO

Guide de formation avec cas pratiques. Programmation. Philippe Moreau Patrick Morié. Daniel-Jean David

La demande Du consommateur. Contrainte budgétaire Préférences Choix optimal

TP1 - Prise en main de l environnement Unix.

Manuel du logiciel PrestaTest.

Publipostage avec Calc

Transcription:

Quelques expressions régulières simples (1) Daniel Tschirhart : Programmation Java V1.34 Soit à rechercher dans un document le mot elvis. Spécifier l expression suivante : 1. elvis recherchera tous les mots contenant elvis soit : elvis, elvise, pelvis, 3

Quelques expressions régulières simples (2) Daniel Tschirhart : Programmation Java V1.34 L expression précédente peut être améliorée de façon suivante : 2. \belvis\b \b est un méta caractère qui signifie chercher le début ou la fin d un mot. En spécifiant cette expression on ne cherchera que le mot elvis. 4

Quelques expressions régulières simples (3) Daniel Tschirhart : Programmation Java V1.34 Supposons rechercher sur la même ligne le mot elvis suivi de tous les mots précédents le mot concert. Le «.»est un méta caractère signifiant n importe quel caractère excepté le caractère newline. Le caractère «*» répète le nombre de fois nécessaire le méta caractère ou le caractère précédent. Ainsi «.*» signifie les tous caractères excepté newline. L expression suivante effectue la recherche désirée: 3. \belvis\b.*\bconcert\b 5

Déterminer la validité du format d un numéro de téléphonet Soit à rechercher sur une page Web les numéros de téléphone ayant le format : xxx-xxxxxxxxxx (exemple 033-0546314755). L expression suivante permet de spécifier ce format: 4. \b\d\d\d-\d\d\d\d\d\d\d\d\d\d \d signifie tout digit, - n a pas de signification ici en tant que méta caractère et signifie ce qu il représente. Il est possible d éviter la répétition des caractères \d par l expression suivante : 5. \b\d{3}-\d{10} 6

Quelques méta m caractères res de base Nous connaissons déjà \b, \d,., *. Le caractère \s représente n importe quel séparateur (espace, tabulation, nouvelle ligne, ), de même \w représente n importe que caractère alphanumérique. Exemple : \ba\w*\b recherche tous les mots commençant par le lettre a \d+ recherche tous les mots ne contenant que des chiffres (+ est identique à * sauf qu il nécessite au moins une répétition). \b\w{6}\b trouve un mot de 6 lettres. 7

Syntaxe des motifs d expression régulir gulière Daniel Tschirhart : Programmation Java V1.34 La syntaxe des motifs est très riche. 1. Chaînes littérales 2. Méta caractères 3. Classes de caractères 4. Quantificateurs 5. Groupes de capture 6. Frontières de recherche 8

Liste des méta m caractères res 9

Méta caractères res : exemples [^x] [aeiou] [a-z,a-z] [^aeiou] Tous caractères sauf x Tous caractères aeiou Tous caractères majuscules et minuscules Tous caractères sauf aeiou 10

Séquence d éd échappement Il y a un problème lorsque que l on cherche un caractère représentant un méta caractère comme par exemple «^»ou«$». Le caractère «\»permet de supprimer la sémantique du méta caractère. Ainsi : «\^», «\.», et «\\», représentent les littéraux «^», «.», et «\». Dans une chaîne de caractère Java, le caractère «\» est considéré comme séquence d échappement. Ainsi : \b représente le caractère de contrôle bell et \\b le méta caractère \b 11

Répétitions * Répète un nombre de fois quelconque + Répète au moins une fois? Répète zéro ou une fois {n} Répète n fois {n,m} Répète entre n et m fois {n,} Répète au minimum n fois 12

Frontières res de recherche Il est souvent intéressant de forcer l emplacement des motifs recherchés : en début de ligne, en fin de mot Les «spécificateurs de frontière» sont résumés dans le tableau suivant : 13

Classes de caractères res 14

Règles de constructions des classes de caractères res personnalisées es 15

Groupe capturant Les parenthèses permettent de regrouper les expressions. Exemple : (\d{1,3}\.){3}\d{1,3} L expression précédente recherche 3 séquences de 1..3 digits terminés par un «.»suivi d une autre expression de 1..3 digits. Exemple 192.168.0.1 L expression précédente n est cependant pas complète puisqu elle autorise des nombres supérieurs à 255. L expression suivante permet de corriger ce défaut. \b((2[0-4]\d 25[0-5] [01]?\d\d?)\.){3}(2[0-4]\d 25[0-5] [01]?\d\d?)\b 16

Quantificateurs 17

Annexe 1 - les REGEX sous Perl Les regex Posix utilisée par exemple par Grep. Les regex Perl en sont une variante. (Il existe aussi les posixextended qui y sont similaire) Tout en restant des regex, ils offrent des possibilités différentes. La principale différence est que ( et { sont les caractères réels parenthèse et crochets en Posix, \( et \{ étant les caractères spéciaux, alors qu'en Perl ou posix-extended ( et { sont des caractères spéciaux, \( et \{ étant les caractères réels parenthèse et crochets Voyons-en les points les plus important, et donnons d'autres exemples. (pour l'examen, tout mélange de regex Perl Posix dans les réponse est accepté tant qu'il n'est pas ambigü, c'est à dire qu'il n'a qu'une seule interprétation possible ou que vous précisez s'il doit être interprêté Perl ou Posix)