Reconstruction 3D géométrie épipolaire et stéréovision

Documents pareils
Reconnaissance de visages 2.5D par fusion des indices de texture et de profondeur ICI 12/12/12

Analyse d images. Edmond.Boyer@imag.fr. Edmond Boyer UFRIMA 1

Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

Exercices Corrigés Premières notions sur les espaces vectoriels

Synthèse d'images I. Venceslas BIRI IGM Université de Marne La

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies

La visio-conférence holographique : Pourquoi? Comment?

FUSION DE CARTES DE PROFONDEURS EN PHOTOGRAMMETRIE ARCHITECTURALE

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Reconnaissance de gestes : approches 2D & 3D

Simulation de point de vue pour la localisation d une caméra à partir d un modèle non structuré

VISUALISATION DE NUAGES DE POINTS

R-ICP : une nouvelle approche d appariement 3D orientée régions pour la reconnaissance faciale

Détection des points d intérêt et Segmentation des images RGB-D. Présentée par : Bilal Tawbe. Semaine de la recherche de l UQO

Fonctions de plusieurs variables

Master IMA - UMPC Paris 6 RDMM - Année Fiche de TP

Utilisation des Points d Intérêts Couleurs pour le Suivi d Objets

Comparaison de Relevés 3D issus de plusieurs Systèmes de Numérisation

Synthèse d images Edmond Boyer

Tutorial pour colorier les cheveux avec Photoshop

Intérêts et limites de la vidéo-surveillance intelligente pour la Sécurité Globale

Théorie et codage de l information

Le projet 3D de la Ville de Liège: réflexions sur l'exploitation des données. Bernard Lechanteur, Responsable Cellule cartographie Ville de Liège

Numérisation 3D de visages par une approche de super-résolution spatio-temporelle non-rigide

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

Groupe Eyrolles, 2006, ISBN :

Laboratoire 4 Développement d un système intelligent

Programmation linéaire

Modeling reality with the latest in 3D technology: Virtualisation. Aperçu

Plan du cours : électricité 1

Présentation du sujet de thèse Schémas temporels hybrides fondés sur les SVMs pour l analyse du comportement du conducteur

Calcul différentiel. Chapitre Différentiabilité

Table des matières. Avant-propos. Chapitre 2 L actualisation Chapitre 1 L intérêt Chapitre 3 Les annuités III. Entraînement...

Ensemble léger de prise de photo sous UV-A Tam Photo Kit n 1 pour appareil photo compact

Développements algorithmiques au LIAMA et àamap en vue de l'analyse d'une scène forestière

Traitement bas-niveau

Développement mobile MIDP 2.0 Mobile 3D Graphics API (M3G) JSR 184. Frédéric BERTIN

Extraction d informations stratégiques par Analyse en Composantes Principales

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :


Exo7. Matrice d une application linéaire. Corrections d Arnaud Bodin.

Sujet. calculatrice: autorisée durée: 4 heures

1 Complément sur la projection du nuage des individus

La création de vêtements, éléments de génétiques, et de maquillage.

3 Approximation de solutions d équations

Vérification audiovisuelle de l identité

IFT3355: Infographie Sujet 6: shading 7 (illumination globale 4)

Chapitre 5 : Flot maximal dans un graphe

Limitations of the Playstation 3 for High Performance Cluster Computing

Optimisation, traitement d image et éclipse de Soleil

Art Graphique & Patrimoine Savoir faire et technologie au service du patrimoine

7. Exemples de tests pour détecter les différents troubles de la vision.

TP SIN Traitement d image

Université des Sciences et Technologies de Lille 1 UFR Informatique. Projet scientifique de Master 2 Image, Vision, Interaction.

IFO. Soleil. Antoine COUSYN 29/07/ /02/2015. Vidéo. Manipur, Inde. Saturation du capteur CMOS. 19 Juin h11 heure locale.

Catalogue des connaissances de base en mathématiques dispensées dans les gymnases, lycées et collèges romands.

Programmes des classes préparatoires aux Grandes Ecoles

Chapitre 22 : (Cours) Numérisation, transmission, et stockage de l information

NOTATIONS PRÉLIMINAIRES

Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR

I. Polynômes de Tchebychev

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Ce cours introduit l'électrodynamique classique. Les chapitres principaux sont :

JPEG, PNG, PDF, CMJN, HTML, Préparez-vous à communiquer!

de calibration Master 2: Calibration de modèles: présentation et simulation d

Master IAD Module PS. Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique. Gaël RICHARD Février 2008

CNAM UE MVA 210 Ph. Durand Algèbre et analyse tensorielle Cours 4: Calcul dierentiel 2

Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons

6.4. Les Ombres Raytracées (Raytraced Shadows) Shading Lamp Shadow and Spot Hemi Spot Sun Sun Scene F10 Shadow Render Ray Ray Shadow Shadow and Spot

Ligne Dentaire. Système Dentaire Panoramique et 3D

Chapitre 18 : Transmettre et stocker de l information

ANALYSE DU MOUVEMENT HUMAIN PAR VISION ARTIFICIELLE POUR CONSOLES DE JEUX VIDÉOS

05/09/2015. M Ponctualité : CM TD TP & Projet Æ En cas d absence : récupérer!!! 3 05/09/2015

Première partie. Préliminaires : noyaux itérés. MPSI B 6 juin 2015

Master de Recherche première année. Programme de cours

FONCTIONS DE PLUSIEURS VARIABLES (Outils Mathématiques 4)

MEGA ITSM Accelerator. Guide de démarrage

I - PUISSANCE D UN POINT PAR RAPPORT A UN CERCLE CERCLES ORTHOGONAUX POLES ET POLAIRES

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

Territoire3D. Descriptif de contenu. Institut Géographique National. Date du Document : Mars 2011

LES TYPES DE DONNÉES DU LANGAGE PASCAL

Chapitre 1: Introduction générale

Le traitement du 5ème concours A.I.P. pour l objet SH2-155 de Franck JOBARD

Planche n o 22. Fonctions de plusieurs variables. Corrigé

IMAGES NUMÉRIQUES MATRICIELLES EN SCILAB

Optimisation et programmation mathématique. Professeur Michel de Mathelin. Cours intégré : 20 h

Nombre dérivé et tangente

swisstlm 3D Version 1.3 Publication 2015 Généralités sur swisstlm 3D

Une réponse (très) partielle à la deuxième question : Calcul des exposants critiques en champ moyen

Calculer avec Sage. Revision : 417 du 1 er juillet 2010

Les algorithmes de base du graphisme

Chapitre 6 La lumière des étoiles Physique

Cours Fonctions de deux variables

Extraction de caractéristiques visuelles d'images médicales pour la recherche par similitude et l'aide au diagnostic

Sommaire. Bertrand PECUCHET

Différentiabilité ; Fonctions de plusieurs variables réelles

La révolution SaaS au service de la valorisation de la recherche

Université Bordeaux 1 MIS 103 OPTIQUE GÉOMÉTRIQUE

Usage des photos pour Internet et pour la presse

Transcription:

Reconstruction 3D géométrie épipolaire et stéréovision François Cabestaing Master ASE et Informatique, spécialité Image Vision Interaction

reconstruction 3D Objectif : tenter de reconstituer la troisième dimension qui a été perdue du fait de la projection sur le plan image. Mono-caméra Vision active Shape from shading, from focus Lumière structurée Stéréo-photométrie Laser Multi-caméra et Vision passive Stéréovision et reconstruction stéréoscopique Space carving, cones généralisés et silhouettes

vue unique : shape from focus (from defocus) Utilisation de l effet de flou de défocalisation pour estimer la distance ou la forme des objets. les propriétés du système optique d acquisition d image sont connues : ouverture de l objectif, profondeur de champ si la profondeur de champ est finie, le flou dépend de la distance entre l objet et la caméra image réelle image avec flou simulé

vue unique : shape from focus (from defocus) mise au point distante mise au point proche reconstruction 3D carte des distances http://homepages.inf.ed.ac.uk/rbf/cvonline/local_copies/favaro1/dfdtutorial.html

vue unique : shape from shading Utilisation des variations d intensité dans l image pour estimer la distance ou la forme des objets. les conditions d éclairage de la scène sont parfaitement connues les surfaces sont lambertiennes : l intensité de la lumière réfléchie dépend de son incidence image initiale carte de profondeur E. Trucco, A. Verri : Introductory Techniques for 3-D Computer Vision. Prentice Hall, 1998

vue unique : lumière structurée On contrôle la structure de la source lumineuse pour faire apparaître le relief des objets. nécessite une source de lumière dont les propriétés sont parfaitement connues (ex : faisceau laser) l analyse des lignes de transition noir/blanc permet de reconstituer la forme visage http://en.wikipedia.org/wiki/structured-light_3d_scanner objets divers

reconstruction à partir de vues multiples On exploite les différences existant entre les images acquises depuis différents points de vue. objets mobiles : on doit acquérir les images à partir de plusieurs caméras donc les paramètres sont connus objets fixes : on peut acquérir les images au moyen d une caméra qui se déplace dans la scène

reconstruction par intersection de cones On calcule l intersection entre les cones généralisés reconstruits à partir des silhouettes des objets. ne permet de reconstruire que l enveloppe convexe de l objet la reconstruction est d autant plus précise qu on dispose de nombreux points de vue reconstruction à partir de 6 vues

reconstruction par space carving On reconstruit la forme 3D en éliminant des voxels qui ne se projettent pas sur la silhouette de l objet. possibilité d associer aux voxels des propriétés comme la couleur inconvénient : la qualité du modèle reconstitué est directement liée au pas de discrétisation 3D principe du space carving exemple d objet reconstruit

stéréovision Reconstruction 3D de certains points de la scène à partir de deux images obtenues à partir de points de vue différents. recherche des points homologues dans les deux images par mise en correspondance reconstruction 3D à partir des propriétés des points homologues Suite du cours : géométrie épipolaire : étude des propriétés des transformations projectives impliquant deux projections perspectives techniques de mise en correspondance stéréoscopique

deux projections perspectives Un point M de P 3 est transféré sur deux plans projectifs π 1 et π 2 : M 1 2 m 1 m 2 O 1 O 2 Connaissant les matrices des projections P 1 et P 2, on peut calculer les coordonnées des points m 1 et m 2 à partir de celles de M : m 1 P 1 M = A 1 (R 1 t 1 )M m 2 P 2 M = A 2 (R 2 t 2 )M où A i et (R i t i ) désigneront les matrices intrinsèque et extrinsèque de la caméra i quand la formation de l image est modélisée par une transformation projective.

droites épipolaires Connaissant un point projeté sur l un des plans, que peut-on déduire du point projeté dans l autre? M m 1 1 2 O 1 O 2 le point m 1 peut être la projection de n importe quel point de l espace situé sur la droite O 1 m 1. la projection de cette droite O 1 m 1 dans le plan projectif π 2 est également une droite. cette droite est appelée droite épipolaire de π 2 associée à m 1.

épipoles ou points épipolaires M m 1 m 2 1 2 O 1 e O 1 e 2 2 le centre de projection O 1 appartient à toutes les droites joignant un point M de l espace à sa projection m 1 dans π 1. la projection e 2 de O 1 dans π 2 appartient donc à toutes les droites épipolaires d un point de π 1. les points e 1 et e 2 sont appelés épipoles ou points épipolaires. la droite joignant les centres optiques (donc passant par les épipoles) est appelée droite de base.

plan épipolaire et faisceau épipolaire M M m 1 m 2 1 2 O 1 e O 1 e 2 2 le plan épipolaire π M associé à M est le plan de l espace projectif défini par M et les deux centres de projection. les deux droites épipolaires associées aux deux projections de M sont les intersections de π M avec les plans de projection. le faisceau épipolaire est l ensemble de tous les plans épipolaires.

produit vectoriel, notation matricielle Rappel : pour calculer le point d intersection de deux droites, ou la droite passant par deux points, on utilise un produit vectoriel des coordonnées homogènes. Le produit vectoriel peut être considéré comme une homographie : p q = p q, avec : 0 p z p y p = p z 0 p x p y p x 0 la matrice de l homographie p est de rang 2 (l un de ses vecteurs propres est nul). p est le vecteur propre de p associé à cette valeur propre nulle car : p p = p p = 0

matrice fondamentale M M m 1 m 2 1 2 H O 1 e O 1 e 2 2 Il existe une homographie H π du plan π M qui transforme m 1 en m 2. La droite épipolaire associée à m 1 est déterminée par le produit vectoriel de e 2 et de m 2, qui est donné par : e 2 m 2 = e 2 m 2 = e 2 Hπm 1 = (e 2 Hπ) m 1 La matrice F = e 2 Hπ est appelée matrice fondamentale.

propriétés de la matrice fondamentale F est une matrice homogène de rang 2 définie par 7 degrés de liberté. Quand m 1 et m 2 sont les projections d un même point M de l espace sur π 1 et π 2 alors m T 2Fm 1 = 0. Droites épipolaires : la droite épipolaire de π 2 associée à m 1 est d 2 = Fm 1 la droite épipolaire de π 1 associée à m 2 est d 1 = F T m 2 Les épipoles vérifient : Fe 1 = 0 et F T e 2 = 0. Calcul à partir des matrices de projection P 1 et P 2 H π = P 2 P + 1, où P+ désigne la pseudo-inverse d une matrice P, donc : F = (P 2 O 1 ) P 2 P + 1, où P 2O 1 est la projection de O 1 sur π 2

formation des images stéréoscopiques Dans le cas de la géométrie projective, une infinité de points de l espace se trouvent projetés sur un unique point du plan. Dans le cas de la formation d une image, en général chaque point d une image correspond à la projection d un seul point de la scène visible par la caméra. Dans le cas de la stéréovision, un point de la scène peut être : visible par les deux caméras masqué pour les deux caméras visible pour une seule caméra et masqué pour l autre Dans ce dernier cas, on dit que le point est occulté pour l une des deux caméras. Attention : on parle d occultation en français, le terme occlusion est un anglicisme incorrect.

points homologues Deux points image m 1 et m 2 sont dits homologues s ils correspondent aux deux projections d un même point M de la scène sur les deux images. Un point d une image correspondant à un point de la scène qui est visible par sa caméra, mais qui est invisible pour l autre caméra, ne possède pas d homologue. 1 2 O 1 O 2

reconstruction stéréoscopique La recontruction stéréoscopique est le procédé qui permet, en déterminant des paires de points homologues dans les deux images, d estimer par triangulation la troisième dimension. Étapes de la reconstruction stéréoscopique : 1 identification de points ou de primitives d intérêt (features) 2 recherche de correspondance entre les primitives 3 reconstruction 3D par triangulation On distingue les méthodes de reconstruction : éparses, dans lesquelles uniquement quelques points sont utilisés pour la mise en correspondance denses, dans lesquelles on recherche l homologue de tous les points des images et on identifie les zones occultées

exemple de méthode éparse (TP) Détection de points d intérêt détection de points particuliers dans les images : les coins détecteur de Shi & Tomasi qui recherche les pixels pour lesquels la fonction image a une forte courbure locale. Mise en correspondance estimation d une distance généralisée entre chaque paire possible de points (gauche, droite) la distance généralisée comprend : un terme de distance euclidienne entre ce point et la droite épipolaire de son correspondant potentiel un terme lié à la similarité des niveaux de gris dans les deux voisinages des images centrés sur ces deux points recherche de correspondance par traitement du tableau des distances généralisées

bibliographie Éléments de cours Séance tutorial de Richard Hartley and Andrew Zisserman lors de la conférence CVPR 99. http://users.cecs.anu.edu.au/~hartley/papers/cvpr99-tutorial/tutorial.pdf Frédéric Devernay, INRIA Grenoble, cours Vision par ordinateur 3-D. http://devernay.free.fr/cours/vision/ Cours de Sébastien Roy sur la vision 3D, Université de Montréal. http://www.iro.umontreal.ca/~roys/fr_ift6145h07.shtml Articles de chercheurs C. Harris and M. Stephens, A combined corner and edge detector. Proceedings of the 4th Alvey Vision Conference, 1988. J. Shi and C. Tomasi, Good Features to Track. 9th IEEE Conference on Computer Vision and Pattern Recognition, 1994.