L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :



Documents pareils
Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

Traitement bas-niveau

Géométrie discrète Chapitre V

Projet de Traitement du Signal Segmentation d images SAR

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies

Mesure agnostique de la qualité des images.

Les algorithmes de base du graphisme

Apprentissage Automatique

Analyse d images. Edmond.Boyer@imag.fr. Edmond Boyer UFRIMA 1

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007


Programme de formation Photoshop : Initiation 24 heures de formation (3 jours) 1/2

Chp. 4. Minimisation d une fonction d une variable

Master IMA - UMPC Paris 6 RDMM - Année Fiche de TP

Chapitre 2 : communications numériques.

Introduction au datamining

Introduction à MATLAB R

Hiver 2013 IMN 259. Introduction à l analyse d images. Par Pierre-Marc Jodoin

Introduction au Data-Mining

CAPTEURS - CHAINES DE MESURES

Détection des points d intérêt et Segmentation des images RGB-D. Présentée par : Bilal Tawbe. Semaine de la recherche de l UQO

Quantification Scalaire et Prédictive

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Echantillonnage Non uniforme

NON-LINEARITE ET RESEAUX NEURONAUX

Loi binomiale Lois normales

Algorithme des fourmis appliqué à la détection et au suivi de contours dans une image

Data Mining. Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

Projet Matlab/Octave : segmentation d'un ballon de couleur dans une image couleur et insertion d'un logo

Le modèle de Black et Scholes

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

R-ICP : une nouvelle approche d appariement 3D orientée régions pour la reconnaissance faciale

Limites finies en un point

TP SIN Traitement d image

Codage hiérarchique et multirésolution (JPEG 2000) Codage Vidéo. Représentation de la couleur. Codage canal et codes correcteurs d erreur

Image d un intervalle par une fonction continue

10ème Congrès Français d'acoustique Lyon, Avril 2010

Extraction et reconstruction de bâtiments en 3D à partir de relevés lidar aéroportés

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

de calibration Master 2: Calibration de modèles: présentation et simulation d

1. Vocabulaire : Introduction au tableau élémentaire

I Stabilité, Commandabilité et Observabilité Introduction Un exemple emprunté à la robotique Le plan Problème...

Les indices à surplus constant

données en connaissance et en actions?

Traitement des données avec Microsoft EXCEL 2010

1 Recherche en table par balayage

F210. Automate de vision hautes fonctionnalités. Caractèristiques. Algorithmes vectoriels

Comparaison de Relevés 3D issus de plusieurs Systèmes de Numérisation

MCMC et approximations en champ moyen pour les modèles de Markov

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier

I. Polynômes de Tchebychev

Franck VAUTIER, Jean-Pierre TOUMAZET, Erwan ROUSSEL, Marlène FAURE, Mohamed ABADI, Marta FLOREZ, Bertrand DOUSTEYSSIER

L apprentissage automatique

Chapitre XIV BASES PHYSIQUES QUANTITATIVES DES LOIS DE COMPORTEMENT MÉCANIQUE. par S. CANTOURNET 1 ELASTICITÉ

Le traitement du 5ème concours A.I.P. pour l objet SH2-155 de Franck JOBARD

3. Caractéristiques et fonctions d une v.a.

Résolution d équations non linéaires

ÉVALUATION FORMATIVE. On considère le circuit électrique RC représenté ci-dessous où R et C sont des constantes strictement positives.

Reconnaissance de visages 2.5D par fusion des indices de texture et de profondeur ICI 12/12/12

Groupe Eyrolles, 2006, ISBN :

Cours d Analyse. Fonctions de plusieurs variables

Programmes des classes préparatoires aux Grandes Ecoles

Intérêt du découpage en sous-bandes pour l analyse spectrale

Techniques d interaction dans la visualisation de l information Séminaire DIVA

Sillage Météo. Notion de sillage

Trépier avec règle, ressort à boudin, chronomètre, 5 masses de 50 g.

4 Distributions particulières de probabilités

Grandes lignes ASTRÉE. Logiciels critiques. Outils de certification classiques. Inspection manuelle. Definition. Test

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Développement décimal d un réel

3. Conditionnement P (B)

CHAPITRE 5. Stratégies Mixtes

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Économetrie non paramétrique I. Estimation d une densité

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

Recherche d'images par le contenu Application au monitoring Télévisuel à l'institut national de l'audiovisuel

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.

UE 503 L3 MIAGE. Initiation Réseau et Programmation Web La couche physique. A. Belaïd

ANALYSE GÉNÉRALE - PROPOSITION DE CORRIGÉ. Exercice 1

Attitude des ménages face au risque. M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2014

Simulation de variables aléatoires

Filtres passe-bas. On utilise les filtres passe-bas pour réduire l amplitude des composantes de fréquences supérieures à la celle de la coupure.

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Théorème du point fixe - Théorème de l inversion locale

SudoClick Reconnaissance de grilles de sudoku pour téléphones portables

INTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE

Projet audio. Analyse des Signaux ELE2700

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux.

Utilisation du logiciel ImageJ gratuit

Sujet de thèse : Suivi d objets en mouvement dans une séquence vidéo

Introduction au Data-Mining

Calculer avec Sage. Revision : 417 du 1 er juillet 2010

Paramétrisation adaptée de transitoires pour la reconnaissance d instruments de musique

PR OC E D U RE S D E B A S E

Projet L1, S2, 2015: Simulation de fourmis, Soutenance la semaine du 4 mai.

Modélisation et simulation

Object Removal by Exemplar-Based Inpainting

Transcription:

La vision nous permet de percevoir et d interpreter le monde qui nous entoure. La vision artificielle a pour but de reproduire certaines fonctionnalités de la vision humaine au travers de l analyse d images. C est un problème difficile en raison du fait que l information disponible : des images 2D fournies par des capteurs (CCD,...), correspond à une projection du monde 3D. La projection 3D-2D entraîne une perte d informations importante, de plus l information disponible n est pas parfaite (numérisation des capteurs, déformation des objectifs, bruitages). L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories : Les processus de bas-niveaux, qui nécessitent très peu d informations sur le contenu des images. Il s agit ici des processus de filtrage, d amélioration et de restauration d images, processus que nous regroupons sous le terme traitement d images, ainsi que d extraction d indices. Les processus de haut-niveaux, qui fonctionnent en aval de ceux de basniveaux, et qui peuvent nécessiter des informations sur le contenu des images. Il s agit de la reconstruction tri-dimensionnelle, la reconnaissance de formes, les processus cognitifs de façon générale. Acquisition d images prétraitement segmentation interprétation L analyse d images est une chaîne de traitement de l information. Edmond Boyer M2IICAO-UFRIMA 1

La théorie de Marr Les premières bases conceptuelles de l analyse d images furent proposées par Marr ( 1980), dans le contexte (restreint) de l interprétation tri-dimensionnelle d images décrivant une scène statique. Le modèle proposé repose sur une décomposition en trois niveaux de l analyse : 1. Un premier niveau qui a pour objectif d extraire les changements d intensité significatifs dans une image. Le résultat est un ensemble de primitives 2D constituant la première ébauche. 2. Le deuxième niveau qui calcule les distances de la scène au point de vue des primitives de la première ébauche. Il s agit d une carte de profondeur, et non d une reconstruction 3D, qui constitue l ébauche 2.5D. 3. Le troisième niveau qui met en correspondance l ébauche 2.5D avec des connaissances 3D sur la scène. Il s agit de construire une représentation centrée sur l objet et donc indépendante du point de vue. Le paradigme de Marr défend l idée de modules indépendants : un module de bas-niveau pour l extraction d informations significatives dans l image et un module de niveau-moyen basé sur ces informations pour la détermination de position dans l espace. Il peut se traduire en pratique par trois étapes de traitement : segmentation, reconstruction, reconnaissance. C est un cadre théorique séduisant, mais sans réelle application concrète (reconnaissance,...). Les processus de bas et moyen niveaux sont des problèmes mal-posés (pas de solution unique) dont la résolution nécessite l introduction de contraintes supplémentaires. D autres paradigmes furent énoncés par la suite. La vision active par exemple où l acquisition est contrôlée dynamiquement en fonction de l interprétation de la scène. Edmond Boyer M2IICAO-UFRIMA 2

Le traitement d images (ou pré-traitement) regroupe l ensemble des processus visant à améliorer les caractéristiques d une image. image prétraitement image Le lissage local : il s agit de supprimer le bruit, ou les petites variations, présent dans une image. L intensité d un pixel est transformé en fonction des intensités sur un petit voisinage du pixel. L amélioration d images consiste à modifier les caractéristiques visuelles de l image (contraste,...) pour faciliter son interprétation par l œil humain. La restauration d images a pour but de supprimer les dégradations subies par une image à l aide de connaissance a priori sur ces dégradations. 1 Lissage local Le lissage local (ou filtrage) consiste à supprimer le bruit présent dans une image en étudiant, pour chaque pixel, les valeurs d intensité sur son voisinage. 1.1 Moyennage Une première classe d approche est basée la redondance d informations. La nouvelle valeur d un pixel est calculée par moyennage des valeurs sur un voisinage. Cette opération linéaire peut être vue comme la convolution discrète de l image par un masque. I (i, j) = (m,n) V (m,n) V h(m, n) I(i m, j n), h(m, n) = 1, ou I est l intensité de l image d origine, I est l intensité de l image filtrée, V est le voisinage utilisé et h est le masque de convolution. Edmond Boyer M2IICAO-UFRIMA 3

pixel traité voisinage Le moyennage sur un voisinage 3x3 : h = 1/9 Le moyennage est un filtre passe-bas. 1 1 1 1 1 1 1 1 1 Rend l image floue, en particulier les contours. Élimine les dégradations locales de faibles dimensions. Valide lorsque les objets présents dans l image sont de dimensions supérieures aux dégradations. Une amélioration du filtre moyenne consiste à jouer sur les valeurs des coefficients du masque : 1 1 1 h 1 = 1/10 1 2 1 1 1 1 C est le cas des filtres binomiaux pour lesquels les valeurs des coefficients sont générés par le triangle de Pascal : 1 2 1 h 2 = 1/16 2 4 2 1 2 1 Edmond Boyer M2IICAO-UFRIMA 4

Approximation discrète d un filtre Gaussien adaptée au filtrage des bruits Gaussiens. 1.2 Filtres médians Les filtres de moyennage ont tendance à rendre l image floue et donc à perdre de l informations sur les contours caractérisés par des fortes variations d intensité. Pour diminuer cet effet, on ne moyenne plus sur le voisinage mais on prend la valeur médiane sur ce voisinage. C est le filtre médian. Exemple pour un voisinage 3x3 : La valeur médiane est ici 12. Filtre non-linéaire. I = Élimine le bruit impulsionnel. 2 12 12 2 12 60 2 2 12 Préserve l information de contour et peut être appliqué itérativement. Élimine les contours très fins. Un voisinage adapté permet de limiter cet effet. Edmond Boyer M2IICAO-UFRIMA 5

1.3 Autres filtres Toujours dans l objectif d améliorer les caractéristiques du filtre et en particulier la préservation des contours dans l image, on peut utiliser des filtres plus évolués. Il en existe un certain nombre. Nous donnons ici l exemple d un filtre faisant intervenir des variations d intensité. Soit d(i, j, k, l) la variations d intensité entre le pixel (i, j) et (k, l) : d(i, j, k, l) = { I(i, j) I(k, l) si I(i, j) I(k, l), 1/2 sinon, alors les coefficients du masque de convolution sont déterminés par : h(m, n) = 1/d(i, j, i + m, j + n) (m,n) V 1/d(i, j, i + m, j + n) La distance est plus importante sur un contour que dans une région homogène. Les points fortement bruités ont peu d influence (h(m,n) petit). Si le pixel est sur un contour, les pixels voisins de même région auront un poids important alors que les pixels voisins de région différente auront peu de poids. Le contour est de cette manière préservé. Edmond Boyer M2IICAO-UFRIMA 6

Figure 1: Filtrages par moyennage : 1 et 3 itétations. Figure 2: Filtrages médians : 1 et 3 itérations. Edmond Boyer M2IICAO-UFRIMA 7

2 Amélioration d images L amélioration d images consiste à modifier les caractéristiques visuelles de l image de manière à en faciliter son interpretation par l œil humain. Il peut s agir de rehausser les contrastes, d accentuer certaines intensités pour mettre en valeur une région,... Les histogrammes sont fréquemment utilisés pour effectuer ce type d opérations 2.1 Les histogrammes L histogramme d une image hist(i) est la fonction qui associe à une valeur d intensité i le nombre de pixels dans l image ayant cette valeur. hist() 0 255 intensité Pour une image couleur, il y a un histogramme par composante. L histogramme peut être normalisé pour donner une estimation de la densité de probabilité des pixels : p(i) = hist(i)/ j hist(j), p(i) = 1. i Un histogramme peut avoir un pic (unimodale), deux pics (bimodale) ou plusieurs pics (multimodale). Edmond Boyer M2IICAO-UFRIMA 8

Algorithme int row, col, rowmax, colmax; int count[greymax]; for(row = 0; row < rowmax; row++) for(col = 0; col < colmax; col++) hist[image[row][col]]++; 2.2 Modifications d histogrammes Pour modifier les caractéristiques de l image (accentuer les contrastes en géneral), une approche générale consiste à appliquer une fonction qui associe à chaque valeur d intensité dans l image une nouvelle valeur. Cette fonction va modifier l histogramme de l image. Soit i, i < MaxInt les valeurs d intensité de l image traitée, on considère alors les transformations du type : i = T (i), qui donne une nouvelle valeur d intensité i pour chaque valeur i de l image. On suppose que la fonction T () est telle que : T (i) est monotone (souvent croissante) sur l intervalle. Cette condition assurant que l ordre des intensités est préservé après transformation. 0 T (i) MaxInt pour 0 i MaxInt qui garantit que la nouvelle image est cohérente avec les niveaux d intensité autorisés. La transformation inverse satisfait les deux conditions précédentes. Quelques exemples représentatifs de modifications d histogrammes. 2.3 Transformations linéaires Les transformations linéaires d histogrammes sont nombreuses et variées. Elles permettent d accentuer une zone d intensité ou de modifier la répartition des valeurs d intensité. Un exemple de transformation linéaire est le recadrage. Le recadrage consiste à modifier l intervalle des valeurs d intensité (la dynamique) de façon à obtenir pour l image améliorée un intervalle de valeurs maximal. Si [i1, i2] est l intervalle de l image traitée, alors la transformation équivalente s écrit simplement : T (i) = MaxInt (i i1)/(i2 i1). Edmond Boyer M2IICAO-UFRIMA 9

MaxInt 0 i1 i2 MaxInt 2.4 Transformations non-linéaires Une modification d histogramme très répandue pour augmenter le contraste de manière automatique est la linéarisation d histogramme. Le principe est de transformer l image de manière à obtenir un histogramme plat, soit une distribution uniforme des intensités. Cela revient à maximiser l entropie de l image et donc à obtenir théoriquement une image présentant une information maximale. La fonction de distribution idéale après transformation est : p (i ) = 1/Maxint. Supposons tout d abord que l on soit dans le cas continu et que la transformation T soit strictement croissante. Alors : avec i = T (i). D où : soit : p (i ) = p(i) di di, di = MaxInt p(i) di, i = T (i) = MaxInt i Dans le cas discret, la transformation s écrit : 0 p(w) dw. T (i) = MaxInt i MaxInt hist(j)/ hist(j), j=0 j=0 Edmond Boyer M2IICAO-UFRIMA 10

A noter que dans le cas discret, et du fait que l histogramme soit une approximation d une fonction de densité de probabilité, l histogramme résultant est très rarement parfaitement plat. Pour une image majoritairement claire la linéarisation va augmenter la dynamique de la partie sombre de l histogramme au détriment de la partie claire. Permet de faire des comparaisons d images sur une même base. L opération peut s effectuer par régions : linéarisation adaptative. Edmond Boyer M2IICAO-UFRIMA 11

Edmond Boyer M2IICAO-UFRIMA 12

Edmond Boyer M2IICAO-UFRIMA 13