Projet IA54-IN54: Mise en correspondance d images stéréoscopiques par une approche multi-agents

Documents pareils
L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :

Traitement bas-niveau

Algorithme des fourmis appliqué à la détection et au suivi de contours dans une image

Limitations of the Playstation 3 for High Performance Cluster Computing

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Pentaho Business Analytics Intégrer > Explorer > Prévoir

µrv : Realité Virtuelle

L apprentissage automatique

Hiver 2013 IMN 259. Introduction à l analyse d images. Par Pierre-Marc Jodoin

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies

Master IMA - UMPC Paris 6 RDMM - Année Fiche de TP

Initiation au HPC - Généralités


LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN

Introduction au Data-Mining

Chapitre 22 Optimisation pour diffusion à l'écran, pour le web

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA

Business Intelligence avec Excel, Power BI et Office 365

Aménager. son point de vente

ORACLE 10g Découvrez les nouveautés. Jeudi 17 Mars Séminaire DELL/INTEL/ORACLE

Documentation Technique du programme HYDRONDE_LN

TD : Codage des images

Introduction au datamining

Université du Québec à Chicoutimi. Département d informatique et de mathématique. Plan de cours. Titre : Élément de programmation.

Les technologies du Big Data

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Modélisation multi-agents - Agents réactifs

M2-Images. Rendu Temps Réel - OpenGL 4 et compute shaders. J.C. Iehl. December 18, 2013

Encryptions, compression et partitionnement des données

Manuel d utilisation de la plate-forme de gestion de parc UCOPIA. La mobilité à la hauteur des exigences professionnelles

Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

Business Intelligence

La visio-conférence holographique : Pourquoi? Comment?

Dense Reconstruction Method s for Active Vision

Openmoko, free your phone!

Formation Symantec Veritas Cluster Server 6.x pour Unix

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

Programme scientifique Majeure INTELLIGENCE NUMERIQUE. Mentions Image et Réalité Virtuelle Intelligence Artificielle et Robotique

Fouillez facilement dans votre système Big Data. Olivier TAVARD

Retour d expérience, portage de code Promes dans le cadre de l appel à projets CAPS-GENCI

Segmentation d'images à l'aide d'agents sociaux : applications GPU

Vérifier la qualité de vos applications logicielle de manière continue

Technologie SDS (Software-Defined Storage) de DataCore

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

TangibleData. Manipulation tangible et multitouch de bases de données

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

MOBILITE. Datasheet version 3.0

epages 6.16 Automne 2013 Inès de La Ruffie, Channel Marketing Manager

données en connaissance et en actions?

Ouvrir le compte UQÀM

Intérêt du découpage en sous-bandes pour l analyse spectrale

Comparaison de Relevés 3D issus de plusieurs Systèmes de Numérisation

Formats d images. 1 Introduction

Retour d expérience RATP. Intégrer le test de performance au cœur du processus de développement agile. Challenges, techniques, résultats.

But du papier : Paramétrer WSUS pour récupérer les mises à jour et administrer le serveur WSUS

LANGAGUE JAVA. Public Développeurs souhaitant étendre leur panel de langages de programmation

TP SIN Traitement d image

Techniques d interaction dans la visualisation de l information Séminaire DIVA

Marketing 1 to 1. Gilles Enguehard. DG société Atenys - Conseil & Management. Le marketing one to one. 1. Bref historique

2014/2015. Rapport 4 REALISE PAR : ISMAIL NAIT ABDELLAH OUALI SOUFIANE HOURRI MOHAMED OUSSAFI ENCADRE PAR : MME L.LAMRINI ANOUAR OUFQIR SMARTSIR

Institut Universitaire Professionnalisé Génie Mathématiques et Informatique

كر اس الشروط الفني ة اخلاص ة

Infrastructure de calcul du CRRI

Art Graphique & Patrimoine Savoir faire et technologie au service du patrimoine

Introduction à MapReduce/Hadoop et Spark

3. SPÉCIFICATIONS DU LOGICIEL. de l'expression des besoins à la conception. Spécifications fonctionnelles Analyse fonctionnelle et méthodes

Les algorithmes de base du graphisme

Pourquoi superviser?

Samuel Bassetto 04/2010

Libérez votre intuition

DUT. Informatique, orientation Imagerie Numérique. Domaine : Sciences, Technologies, Santé. Mention : Informatique

Plan d études. Traitement visuel 2D. Techniques d intégration multimédia HU. legault/2d/ 1-2-2

Description des pratiques à adopter pour la mise à jour du layout en utilisant le gestionnaire de conception de Sharepoint 2013

Résumé CONCEPTEUR, INTEGRATEUR, OPERATEUR DE SYSTEMES CRITIQUES

Le programme d examens du Bureau canadien des conditions d admission en génie d Ingénieurs Canada englobe 19 domaines du génie.

Rapports d activités et financiers par Internet. Manuel Utilisateur

Extraction de caractéristiques visuelles d'images médicales pour la recherche par similitude et l'aide au diagnostic

Surveiller et contrôler vos applications à travers le Web

Perspectives en matière de portails géographiques et de 3D

Initiation à LabView : Les exemples d applications :

Rapport de Projet Béatrice Frey et Cyril Crassin Printemps Projet Fourmis. Université de Technologie de Belfort-Montbéliard

Transmission d informations sur le réseau électrique

MOTORISATION DIRECTDRIVE POUR NOS TELESCOPES. Par C.CAVADORE ALCOR-SYSTEM WETAL Nov

Programme «Analyste Programmeur» Diplôme d état : «Développeur Informatique» Homologué au niveau III (Bac+2) (JO N 176 du 1 août 2003) (34 semaines)

4 Exemples de problèmes MapReduce incrémentaux

Les outils actuels permettent-ils d automatiser la production de cartes? De quels outils dispose-t-on?

Présentation du PL/SQL

UNE SOLUTION MOBILE POUR LES CONTROLES EN USINE

La nouvelle dimension de l analyse acoustique et vibratoire

Exposition. VLR plongée e commission photo

TP Bases de données réparties

Reconnaissance de visages 2.5D par fusion des indices de texture et de profondeur ICI 12/12/12

Chaine de transmission

Ajouter un cache SSD à son ordinateur

Change the game with smart innovation

Freeway 7. Nouvelles fonctionnalités

INFORMATIQUE : LOGICIELS TABLEUR ET GESTIONNAIRE DE BASES DE DONNEES

Utilisation du Cloud StratusLab dans le cadre d application astroparticule à l APC

Transcription:

Projet IA54-IN54: Mise en correspondance d images stéréoscopiques par une approche multi-agents Béatrice Frey 1 Audrey Cholewka 2 Cyril Crassin 1 Université de Technologie de Belfort-Montbéliard. 1 UVs IA54 et IN54. 2 UV IN54. Soutenance de projet, Janvier 2006

Contexte Problématique 1 Contexte Problématique 2 Traitements graphiques Appariement multi-agents Modèle ASI Modèle ASM 3 Contexte de travail, Outils et choix techniques Architecture générale Accélération matérielle Plateforme Multi-Agents Architecture objet 4 Résultats Bilan Limites et Perspectives

Contexte Contexte Problématique Contexte global Laboratoire SET de l UTBM: Projet "Véhicule Intelligent". But: concevoir des systèmes embarqués pour l aide à la navigation d un véhicule en environnement urbain.

Contexte Contexte Problématique Contexte global Laboratoire SET de l UTBM: Projet "Véhicule Intelligent". But: concevoir des systèmes embarqués pour l aide à la navigation d un véhicule en environnement urbain. Contexte technique Élément important: dispositif de vision artificielle. Utilisation d un dispositif de vision stéréo. Besoins en moyens de traitement temps réels des données de vision. Reconstruction 3D de la scène observée.

Problématique Contexte Problématique Reconstruction 3D Déterminer la profondeur des éléments d une scène à partir du décalage observé entre leur position dans les images droites et gauches acquises (disparité) et les paramètres du capteur stéréoscopique (longueur focale et distance inter-oculaire). Identitifier les points homologues dans les deux images, représentant le même point de la scène. Problème: algorithmes de mise en correspondance extrêmement coûteux (spécialement en 2D)

Problématique Contexte Problématique Reconstruction 3D Déterminer la profondeur des éléments d une scène à partir du décalage observé entre leur position dans les images droites et gauches acquises (disparité) et les paramètres du capteur stéréoscopique (longueur focale et distance inter-oculaire). Identitifier les points homologues dans les deux images, représentant le même point de la scène. Problème: algorithmes de mise en correspondance extrêmement coûteux (spécialement en 2D) Idée Mettre en oeuvre un système basé sur le paradigme multi-agents pour traiter ce problème.

Traitements graphiques Appariement multi-agents Modèle ASI Modèle ASM 1 Contexte Problématique 2 Traitements graphiques Appariement multi-agents Modèle ASI Modèle ASM 3 Contexte de travail, Outils et choix techniques Architecture générale Accélération matérielle Plateforme Multi-Agents Architecture objet 4 Résultats Bilan Limites et Perspectives

général Traitements graphiques Appariement multi-agents Modèle ASI Modèle ASM Contraintes du problème Traitement d images matricielles 2D. Capteur stéréo idéal. Contraintes épipolaires.

général Traitements graphiques Appariement multi-agents Modèle ASI Modèle ASM Contraintes du problème Traitement d images matricielles 2D. Capteur stéréo idéal. Contraintes épipolaires. 3 étapes Traitements graphiques: Extraire les éléments caractéristiques (primitives ou features) des images. Appariement: Associer les primitives de l image gauche avec celles de l image droite afin d en calculer la disparité. Reconstruction 3D et Visualisation: En déduire la profondeur de chaque primitive et la visualiser.

Traitements graphiques Appariement multi-agents Modèle ASI Modèle ASM Étapes de traitement pour l extraction de primitives Chargement des images gauche et droite Chargement au format jpeg.

Traitements graphiques Appariement multi-agents Modèle ASI Modèle ASM Étapes de traitement pour l extraction de primitives Chargement des images gauche et droite Chargement au format jpeg. Lissage gaussien Filtre de convolution. Permet la réduction du bruit parasite.

Étapes de traitement suite... Traitements graphiques Appariement multi-agents Modèle ASI Modèle ASM Détection de contours Extraction de gradients (Vecteurs 2D) pour la détection de caractéristiques. Filtres de Roberts, Prewitt et Sobel testés. Compromis qualité/temps de calcul à trouver. Résultat: image RGBA avec encodage dans les pixels. Stockage composantes X et Y du vecteur, norme et intensité lumineuse d origine.

Étapes de traitement suite... Traitements graphiques Appariement multi-agents Modèle ASI Modèle ASM Détection de contours Extraction de gradients (Vecteurs 2D) pour la détection de caractéristiques. Filtres de Roberts, Prewitt et Sobel testés. Compromis qualité/temps de calcul à trouver. Résultat: image RGBA avec encodage dans les pixels. Stockage composantes X et Y du vecteur, norme et intensité lumineuse d origine. Seuillage Elimination des gradients non significatifs. Les gradients restants constituent des primitives prêtes à être appareillées.

Appariement multi-agents Traitements graphiques Appariement multi-agents Modèle ASI Modèle ASM Idée Développer un modèle basé sur des agents réactifs. Faire émerger une configuration correcte d appariement des primitives à partir du comportement individuel d un ensemble d agents.

Appariement multi-agents Traitements graphiques Appariement multi-agents Modèle ASI Modèle ASM Idée Développer un modèle basé sur des agents réactifs. Faire émerger une configuration correcte d appariement des primitives à partir du comportement individuel d un ensemble d agents. Associer un agent à chaque primitive de l image gauche. Chaque agent recherche dans l image droite la primitive correspondant à celle à laquelle il est associé dans l image gauche.

Appariement multi-agents Traitements graphiques Appariement multi-agents Modèle ASI Modèle ASM Idée Développer un modèle basé sur des agents réactifs. Faire émerger une configuration correcte d appariement des primitives à partir du comportement individuel d un ensemble d agents. Associer un agent à chaque primitive de l image gauche. Chaque agent recherche dans l image droite la primitive correspondant à celle à laquelle il est associé dans l image gauche. Modèles proposés Prise en compte de 5 contraintes locales et globales: contraintes géométriques, d orientation, d unicité, d ordre et de continuité de la disparité. 2 Modèles: Modèle ASI: Agents Sur Image. Modèle ASM: Agents Sur Matrice.

Modèle ASI: Agents Sur Image Traitements graphiques Appariement multi-agents Modèle ASI Modèle ASM Initialisation Environnement géographique discret (grille 2D) constitué des primitives de l image droite. Utilisation directe de l image contenant les gradients. Chaque case est constituée d une primitive (éventuellement nulle) et peut contenir un seul agent. Un agent est créé par primitive non nulle de l image gauche qui lui est associée. Chaque agent est ensuite placé dans l environnement (image droite) à la position de sa primitive.

ASI Traitements graphiques Appariement multi-agents Modèle ASI Modèle ASM Inspiration de l éco-résolution et du modèle satisfaction-altruisme L agent recherche par déplacement le meilleur appariement avec sa primitive de base. Déplacement par lignes: configuration idéale du capteur stéréo (contraintes épipolaires). Calcul de satisfaction: basé sur la distance euclidienne entre les 2 primitives + prise en compte de la différence de disparité. Mécanisme d attaque: création d une force globale.

Modèle Agent ASI Traitements graphiques Appariement multi-agents Modèle ASI Modèle ASM Comportement Initialisation : calcul de satisfaction sur la case courante -> cursat. Live(): Test de la case à gauche de l agent (contrainte d ordre) -> testsat. Si (testsat + altcoef*oppgain) >= cursat : Si un agent O est présent sur la case, Si EstAttaqué ET O.curSat > SEUIL-SAT, Pop(); Sinon Attaquer(O, abs(cursat-testsat)+oppgain); (contrainte d unicité). Sinon aller sur case. EstAttaqué=Faux, oppgain=0; Sinon, Si EstAttaqué, Pop(); Attaquer(Agent, Gain): EstAttaqué=Vrai, oppgain=gain;

Modèle ASM: Agents Sur Matrice Traitements graphiques Appariement multi-agents Modèle ASI Modèle ASM Après obtention du champ de primitives, une étape de pré-traitement est effectuée pour générer une matrice de mise en correspondance permettant d éliminer les appariements invalides (contraintes géométrique et d angle). Expression différente du problème, se ramène à une méthode similaire. Les agents sont positionnés sur le premier appariement valide à droite de chaque ligne de la matrice. Ils se déplacent par lignes de la matrice et attaquent les agents sur leur colonne (contrainte d ordre). Permet une optimisation des calculs de satisfaction.

Contexte de travail, Outils et choix techniques Architecture générale Accélération matérielle Plateforme Multi-Agents Architecture objet 1 Contexte Problématique 2 Traitements graphiques Appariement multi-agents Modèle ASI Modèle ASM 3 Contexte de travail, Outils et choix techniques Architecture générale Accélération matérielle Plateforme Multi-Agents Architecture objet 4 Résultats Bilan Limites et Perspectives

Contexte de travail Contexte de travail, Outils et choix techniques Architecture générale Accélération matérielle Plateforme Multi-Agents Architecture objet Outils Développement C++. Bibliothèque graphique OpenGL pour la visualisation et l accélération matérielle.

Contexte de travail Contexte de travail, Outils et choix techniques Architecture générale Accélération matérielle Plateforme Multi-Agents Architecture objet Outils Développement C++. Bibliothèque graphique OpenGL pour la visualisation et l accélération matérielle. Contraintes Portabilité du développement. Optimisation maximale des algorithmes pour permettre un traitement temps réel. Développements des algorithmes au sein d une architecture objet générique et extensible afin de garantir leur réutilisabilité.

Architecture de traitement Contexte de travail, Outils et choix techniques Architecture générale Accélération matérielle Plateforme Multi-Agents Architecture objet Pipeline de visualisation Mise en oeuvre sous la forme d un pipeline de traitement graphique. Ensemble de modules indépendants inter-connectés. Traitement de données de type image 1D, 2D ou 3D et framework générique.

Architecture de traitement Contexte de travail, Outils et choix techniques Architecture générale Accélération matérielle Plateforme Multi-Agents Architecture objet Pipeline de visualisation Mise en oeuvre sous la forme d un pipeline de traitement graphique. Ensemble de modules indépendants inter-connectés. Traitement de données de type image 1D, 2D ou 3D et framework générique. 3 Familles de modules Extraction de primitives: chargement et traitement d images. Algorithmes multi-agents pour la mise en correspondance. Visualisation et interaction.

Contexte de travail, Outils et choix techniques Architecture générale Accélération matérielle Plateforme Multi-Agents Architecture objet Accélération Matérielle par GPU Idée Utiliser la puissance de calcul vectorielle des GPU modernes pour le traitement d images. Unité programmable de traitement de fragments. Conçu pour les opérations vectorielles. Jusqu à 40GFlops sur NV40, 2x plus puissant que les derniers modèles de CPU. Mais dédié normalement à des opérations d affichage. Utilisation comme noyau d application de filtre sur des images 1D, 2D ou 3D. Implémentation Module générique de filtrage GPU Intégration dans le framework graphique générique. Adaptation des types Images pour la localisation en mémoire graphique. Utilisé pour les opérations de pré-traitement graphique (lissage, extraction de contours, seuillage).

Plateforme Multi-Agents Contexte de travail, Outils et choix techniques Architecture générale Accélération matérielle Plateforme Multi-Agents Architecture objet Plateforme Framework générique de plateforme pour agents localisés. Ordonnanceur et noyau d exécution pour l éco-résolution.

Plateforme Multi-Agents Contexte de travail, Outils et choix techniques Architecture générale Accélération matérielle Plateforme Multi-Agents Architecture objet Plateforme Framework générique de plateforme pour agents localisés. Ordonnanceur et noyau d exécution pour l éco-résolution. Architecture des Agents Mécanismes d attaque non procéduraux (garantie l équilibrage de l ordonnancement). Utilisation d états interne (Recherche, Attaqué) et de valeurs partageables (passage de message trop coûteux).

Contexte de travail, Outils et choix techniques Architecture générale Accélération matérielle Plateforme Multi-Agents Architecture objet Diagramme de classes

Résultats Bilan Limites et Perspectives 1 Contexte Problématique 2 Traitements graphiques Appariement multi-agents Modèle ASI Modèle ASM 3 Contexte de travail, Outils et choix techniques Architecture générale Accélération matérielle Plateforme Multi-Agents Architecture objet 4 Résultats Bilan Limites et Perspectives

Performance comparée des méthodes Résultats Bilan Limites et Perspectives Temps moyens, scène réelle, 400x300, 7880 Agents Méthode Initialisation Itération Temps stabilisation ASI 68ms 6.5ms 3000ms ASM 250ms 4.1ms 400ms

Performance comparée des méthodes Résultats Bilan Limites et Perspectives Temps moyens, scène réelle, 400x300, 7880 Agents Méthode Initialisation Itération Temps stabilisation ASI 68ms 6.5ms 3000ms ASM 250ms 4.1ms 400ms Temps moyens, scène artificielle, 300x200, 1553 Agents Méthode Initialisation Itération Temps stabilisation ASI 22ms 2.3ms 400ms ASM 47ms 1.7ms 180ms

Bilan Résultats Bilan Limites et Perspectives Apports 2 Méthodes agents pour la résolution du problème de l appariement stéréo. Utilisation du GPU: gain de 50% sur les étapes de traitement graphique. Illustration de l applicabilité du paradigme agent pour le traitements d images. Essai et test de divers critères et fonctions de satisfaction, ouverture sur des développements futurs. Base d un framework ouvert pour le développement d applications de traitements graphiques orientées agent.

Bilan Résultats Bilan Limites et Perspectives Apports 2 Méthodes agents pour la résolution du problème de l appariement stéréo. Utilisation du GPU: gain de 50% sur les étapes de traitement graphique. Illustration de l applicabilité du paradigme agent pour le traitements d images. Essai et test de divers critères et fonctions de satisfaction, ouverture sur des développements futurs. Base d un framework ouvert pour le développement d applications de traitements graphiques orientées agent. Bilan humain Investissement fort sur un sujet de recherche novateur et encore très ouvert. Mise en application des méthodes multi-agent et des principes de traitement d images abordés en cours.

Limites et Perspectives Résultats Bilan Limites et Perspectives Limites de l approche Configuration idéale du capteur stéréo (alignement et parallélisme des droites épipolaires). Convergence encore trop lente pour le traitement temps réel d un flux d images. Résultats perfectibles de la méthode ASM.

Limites et Perspectives Résultats Bilan Limites et Perspectives Limites de l approche Configuration idéale du capteur stéréo (alignement et parallélisme des droites épipolaires). Convergence encore trop lente pour le traitement temps réel d un flux d images. Résultats perfectibles de la méthode ASM. Perspectives d évolution Extension au traitement d un flux d images: Pour profiter de l adaptabilité des agents. Mais problème complexe. Extension à un capteur stéréo non idéal (sans contraintes épipolaires). Mise en oeuvre en environnement parallèle (cluster de traitement graphique orienté agent?).

Traitements graphiques Résultats Bilan Limites et Perspectives Filtres de convolution Traitement d une image (matrice de pixels) par une matrice (généralement 3x3) appelée Noyau via un produit de convolution. Permet d appliquer divers traitements sur les images de manière extrêmement flexible.

Traitements graphiques Résultats Bilan Limites et Perspectives Filtres de convolution Traitement d une image (matrice de pixels) par une matrice (généralement 3x3) appelée Noyau via un produit de convolution. Permet d appliquer divers traitements sur les images de manière extrêmement flexible. Implémentations Élimination du bruit parasite: filtre de lissage gaussien. Filtres de détection de contour par extraction de gradient. Filtres de Roberts, Prewitt et Sobel testés. Compromis qualité/temps de calcul à trouver.

Traitements graphiques Résultats Bilan Limites et Perspectives Filtres de convolution Traitement d une image (matrice de pixels) par une matrice (généralement 3x3) appelée Noyau via un produit de convolution. Permet d appliquer divers traitements sur les images de manière extrêmement flexible. Implémentations Élimination du bruit parasite: filtre de lissage gaussien. Filtres de détection de contour par extraction de gradient. Filtres de Roberts, Prewitt et Sobel testés. Compromis qualité/temps de calcul à trouver.