CALCULS PARALLÈLES ET APPLICATIONS LA VISION PAR ORDINATEUR AU CEA LIST, QUELS CHOIX ARCHITECTURAUX?



Documents pareils
Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

Programme scientifique Majeure INTELLIGENCE NUMERIQUE. Mentions Image et Réalité Virtuelle Intelligence Artificielle et Robotique

Détection des points d intérêt et Segmentation des images RGB-D. Présentée par : Bilal Tawbe. Semaine de la recherche de l UQO

Initiation au HPC - Généralités

N. Paparoditis, Laboratoire MATIS

Relever les défis des véhicules autonomes

Segmentation d'images à l'aide d'agents sociaux : applications GPU

Reconnaissance de visages 2.5D par fusion des indices de texture et de profondeur ICI 12/12/12

Contrôle Non Destructif : Implantation d'algorithmes sur GPU et multi-coeurs. Gilles Rougeron CEA/LIST Département Imagerie Simulation et Contrôle

un nouvel œil pour l analyse de mouvement

Monitoring elderly People by Means of Cameras

Art Graphique & Patrimoine Savoir faire et technologie au service du patrimoine

SLAM Visuel 3D pour robot mobile autonome

Communications immersives : Enjeux et perspectives

Traitement bas-niveau

LOT N 1 : ORDINATEURS BORDEREAU DE PRIX IDENTIFICATION DU FOURNISSEUR. Code DESIGNATION QTE PU HT EN EURO MONTANT TOTAL HT EN EURO MONTANT TTC EN EURO

Info0804. Cours 6. Optimisation combinatoire : Applications et compléments

Quoi de neuf en contrôle/commande et systèmes embarqués (RIO, WSN...)?

Logiciel MAXPRO NVR SOLUTION D ENREGISTREMENT VIDÉO RÉSEAU

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :

Utilisation des Points d Intérêts Couleurs pour le Suivi d Objets

victor Logiciel de gestion pour une sécurité unifiée

Plan présentation RATP

Analyse d images. Edmond.Boyer@imag.fr. Edmond Boyer UFRIMA 1

MARCHE DE FOURNITURE D EQUIPEMENTS INFORMATIQUES ET RESEAU POUR LE PROJET D APPUI A LA NAVIGABILITE DES VOIES FLUVIALES ET LACUSTRES EN R.D.

Robot WIFIBOT Lab V3. 4 roues motrices

Intel Corporation Nicolas Biguet Business Development Manager Intel France

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier

Poste de travail d enregistreur vidéo en réseau

Cartographie Mobile à MINES ParisTech

Comprenant Windows 7 Édition Professionel Authentique et/ou d'autres systèmes d'exploitation

Architecture des ordinateurs

Comparaison de Relevés 3D issus de plusieurs Systèmes de Numérisation

Caractéristiques principales:

FICHE PRODUIT PRELIMINAIRE

Programme détaillé des enseignements

Réalité virtuelle au service de la maintenance

Acquisition de matériels informatiques

II-Solution technique pour le développement du site de l'urma

Ordinateur portable Latitude E5410

Ocularis. NOVADIS 14 place Marie Jeanne Bassot Levallois Perret Tel : +(33) Fax : +(33)

Hiérarchie matériel dans le monde informatique. Architecture d ordinateur : introduction. Hiérarchie matériel dans le monde informatique

Choix d'un serveur. Choix 1 : HP ProLiant DL380 G7 Base - Xeon E GHz

Monitoring continu et gestion optimale des performances énergétiques des bâtiments

Retour d expérience, portage de code Promes dans le cadre de l appel à projets CAPS-GENCI

Performance et usage. La différence NETGEAR - R7000. Streaming HD illimitée

Sommaire. Systèmes d Exploitation Intégration Sage 100 Sage CRM Disponibilité Client Bases de données... 3

Institut National Polytechnique de Toulouse (INP Toulouse) Systèmes informatiques. Younès RAOUI. samedi 29 avril 2011

Programme de la 1ère année

Détection des deux roues motorisés par télémétrie laser à balayage

MULTITEL, votre partenaire en R&D et innovation

Analyse Sémantique de Nuages de Points 3D et d Images dans les Milieux Urbains

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Présentation d HyperV

Potentiels de la technologie FPGA dans la conception des systèmes. Avantages des FPGAs pour la conception de systèmes optimisés

Comparatif entre Matrox RT.X2 et Adobe Premiere Pro CS3 (logiciel seul)

Console de supervision en temps réel du réseau de capteurs sans fil Beanair

Architecture des calculateurs

SIG EIFFAGE N O U V E L L E S O F F R E S I N T E R N E S

Métriques de performance pour les algorithmes et programmes parallèles

Spécifications détaillées

Structure de base d un ordinateur

Préparé au Laboratoire d Analyse et d Architecture des Systèmes du CNRS

Editeur de solutions innovantes C 3. Solution globale managée de communication et de téléphonie sur IP

& collaborative workspace. the new multitouch CONNECT & SHARE COLLABORATE BETTER & DECIDE FASTER CREATE & INNOVATE SAVE & TAKE THE DATA WITH YOU

AOMS : UN NOUVEL OUTIL DE PHOTOGRAMMÉTRIE

Module : Virtualisation à l aide du rôle Hyper-V

de calibration Master 2: Calibration de modèles: présentation et simulation d

ZOOM SUR 10 DEMONSTRATIONS

PDF created with pdffactory Pro trial version

«Innovation Intelligence» La valorisation des données massives au service des partenariats R&D. Expernova Université d été GFII

T. Gasc 1,2,3, F. De Vuyst 1, R. Motte 3, M. Peybernes 4, R. Poncet 5

HP 600PD TWR i G 4.0G 39 PC

neotechpro catalogue neotechpro NeoTechPro International

C a t a l o g u e P r o d u i t s

BORDEREAU DE PRIX UNITAIRE 1. Ordinateurs de Bureau

TABLETTE MPMAN MP724 : EMPORTEZ LE MONDE AVEC VOUS

Séminaire RGE REIMS 17 février 2011

Robot WIFIBOT Lab V4. Lab V4.

Masses de données et calcul : à l IRIT. 8 octobre 2013

Vidéo Haute définition pour Station Service

Dentiste Numérique Zfx. Un cabinet dentaire certifié avec la technologie innovante signée Zfx

Exigences système Edition & Imprimeries de labeur

AXIS Camera Station Logiciel de gestion vidéo complet pour la surveillance, l enregistrement, la lecture et la gestion d événements

CLIENTS LÉGERS. Remote Desktop Services Linux Terminal Server Project

Rapport 2014 et demande pour Portage de Méso-NH sur Machines Massivement Parallèles du GENCI Projet 2015 : GENCI GEN1605 & CALMIP-P0121

Spécifications détaillées

Cahier des Clauses Techniques Particulières


Soirée Interactives 30 Juin 2011

1 LE L S S ERV R EURS Si 5

Les systèmes embarqués Introduction. Richard Grisel Professeur des Universités Université de Rouen Nacer Abouchi Professeur ESCPE Lyon

AXES DE RECHERCHE - DOMAINE D'INTERET MAJEUR LOGICIELS ET SYSTEMES COMPLEXES

Architecture des Ordinateurs. Partie II:

Conception et Intégration de Systèmes Critiques

INTRODUCTION AUX TECHNOLOGIES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES

Exécution des instructions machine

Mesure agnostique de la qualité des images.

des outils disponibles et des performances possibles

TVTools Cloud Edition

Transcription:

CALCULS PARALLÈLES ET APPLICATIONS LA VISION PAR ORDINATEUR AU CEA LIST, QUELS CHOIX ARCHITECTURAUX?

LABORATOIRE DE VISION ET INGÉNIERIE DES CONTENUS (LVIC) Fusion multimedia : extraction multimodale d informations et recherche à travers de larges bases de données, ainsi que pour des applications mobiles reconnaissance d image recherche rapide dans une base de données, partiellement locale pour de meilleures performances sur plateforme mobile besoin d une puissance de calcul importante Text mining: analyse sémantique de documents multilingue besoin d une puissance de calcul importante

LABORATOIRE DE VISION ET INGÉNIERIE DES CONTENUS (LVIC) Analyse vidéo : applications de vidéo-surveillance système d assistance vidéo ordinateur embarqué en voiture ou caméra CCTV : détection / mesure de position 3D / suivi multimarqueur analyse d évènements partage d informations entre caméras besoin d une puissance de calcul importante

LABORATOIRE DE VISION ET INGÉNIERIE DES CONTENUS (LVIC) PERCEPTION 3D ET MOBILITÉ Technologies : traitement d image précis modélisation 3D et photogrammétrie localisation 3D calibration de capteur d image fusion de capteurs Équipe : 9 chercheurs permanents 7 thésards et CDD

LABORATOIRE DE VISION ET INGÉNIERIE DES CONTENUS (LVIC) PERCEPTION 3D ET MOBILITÉ reconstruction 3D basée vision par ordinateur pour le contrôle dimensionnel localisation 3D pour les applications de réalité augmentée (RA) et la géolocalisation basée image analyse 2D multicaméra reconstruction 3D robustesse aux mouvements rapides avec des algorithmes rapides distinction des mouvements de caméra et d objet relocalisation pour la robustesse et l initialisation d applications fusion de capteurs pour la stabilité des applications besoin d une puissance de calcul importante

LABORATOIRE DE VISION ET INGÉNIERIE DES CONTENUS (LVIC) PERCEPTION 3D ET MOBILITÉ reconstruction 3D basée vision par ordinateur pour le contrôle dimensionnel localisation 3D pour les applications de réalité augmentée (RA) et la géolocalisation basée image analyse 2D multicaméra reconstruction 3D robustesse aux mouvements rapides avec des algorithmes rapides distinction des mouvements de caméra et d objet relocalisation pour la robustesse et l initialisation d applications fusion de capteurs pour la stabilité des applications besoin d une puissance de calcul importante Nous avons besoin d algorithmes optimisés et/ou parallélisés

APPLICATION COMPLEXE DE VISION EMBARQUÉE Filtres linéaires Convolution Filtres gaussiens FFT Ondelettes d Haar LUT Gradients

APPLICATION COMPLEXE DE VISION EMBARQUÉE Filtres linéaires Convolution Filtres gaussiens FFT Ondelettes d Haar LUT Gradients

APPLICATION COMPLEXE DE VISION EMBARQUÉE Canny- Deriche Détecteur de Harris SURF SIFT Sobel Transformée de Hough Ajustement de faisceaux LoG Traitement d image

APPLICATION COMPLEXE DE VISION EMBARQUÉE Canny- Deriche Harris detector SURF SIFT Sobel Transformée de Hough Ajustement de faisceaux LoG Traitement d image

APPLICATION COMPLEXE DE VISION EMBARQUÉE Reconstruction 3D Ajustement Relocalisation contraint Segmentation Recalage modèle CAO Analyse de l image Traitement d image

APPLICATION COMPLEXE DE VISION EMBARQUÉE Reconstruction 3D CAD Relocalization constrained Segmentation Recalage bundle Image analysis Traitement d image

APPLICATION COMPLEXE DE VISION EMBARQUÉE Reconnaissance d image Vérification sans contact Suivi Localisation Relocalisation SLAM Algorithmes haut-niveau de vision par ordinateur Analyse de l image Traitement d image

APPLICATION COMPLEXE DE VISION EMBARQUÉE Reconnaissance d image Contactless verification Tracking Localization Relocalization SLAM High-level computer vision algorithms Image analysis Traitement d image

APPLICATION COMPLEXE DE VISION EMBARQUÉE Photogrammétrie Réalité augmentée (navigation / formation / maintenance) Métrologie Traitements de vision par ordinateur Algorithmes haut-niveau de vision par ordinateur Analyse de l image Traitement d image

APPLICATION COMPLEXE DE VISION EMBARQUÉE Photogrammétrie Réalité augmentée (navigation / formation / maintenance) Métrologie Computer vision processing High-level computer vision algorithms Image analysis Image processing

SIMULTEANEOUS LOCALIZATION AND MAPPING Le SLAM traite un flux vidéo et suit le mouvement de la caméra dans l espace Le SLAM effectue simultanément une cartographie de l environnement couvert par la caméra Incrustation dans la scène réelle d objets 3D en réalité augmentée (RA) Suivi de trajectoire en temps réel (cartographie) Modélisation3D

SIMULTEANEOUS LOCALIZATION AND MAPPING Basé caméra monoculaire Pas de marqueur utilisé Environnement inconnu Peut être contraint par modèle CAO 3D Extraction de caractéristiques 2D Reconstruction 3D

EXTRACTION DE CARACTÉRISTIQUES 2D Extraction des points d intérêt (PIs) de Harris Flou / gradients / gradients au carré Cornerness (score de Harris) On conserve les points avec le meilleur score Caractérisation des PIs par description Pour identifier les PIs dans des images différentes Similaire à SURF (Speeded Up Robust Features) Invariant à l échelle et à l orientation Appariemment des points de différentes images Pour suivre les PIs Pas compatible avec le dataflow

RECONSTRUCTION 3D Calcul de pose pour connaître la position de la caméra dans l espace au cours du temps Triangulation modélisation 3D de l environnement (reconstruction 3D) Ajustement de faisceaux Améliore les résultats du calcul de pose et de la triangulation Élimine des points incorrects

EXEMPLE D UNE EXÉCUTION DE SLAM

CONTRAINTES D UNE APPLICATION DE TYPE SLAM SLAM effectue un grand nombre de calcul impliquant une puissance de calcul importante SLAM requiert une quantité de mémoire non négligeable SLAM requiert une exécution temps réelle Plus de points caractéristiques implique une meilleure qualité Le temps d exécution du calcul des descripteurs dépend du nombre de PIs Le temps d exécution de la reconstruction 3D dépend du nombre de PIs Plus grande résolution, meilleure qualité Le temps d exécution du détecteur de Harris dépend de la résolution de l image en entrée de l applciation

CONTRAINTES D UNE APPLICATION DE TYPE SLAM SLAM effectue un grand nombre de calcul impliquant une puissance de calcul importante => SSE/NEON, assembleur, multicoeur, multiprocesseur, GPU, Intel Xeon Phi, MPPA, FPGA, ASIC,

CONTRAINTES D UNE APPLICATION DE TYPE SLAM SLAM effectue un grand nombre de calcul impliquant une puissance de calcul importante => SSE/NEON, assembleur, multicoeur, multiprocesseur, GPU, Intel Xeon Phi, MPPA, FPGA, ASIC,?

CONTRAINTES D UNE APPLICATION DE TYPE SLAM SLAM effectue un grand nombre de calcul impliquant une puissance de calcul importante => SSE/NEON, assembleur, multicoeur, multiprocesseur, GPU, Intel Xeon Phi, MPPA, FPGA, ASIC, Multicoeur / multiprocesseur Programmation +++ Portablilité +++ Performance ++ Consommation - -

CONTRAINTES D UNE APPLICATION DE TYPE SLAM SLAM effectue un grand nombre de calcul impliquant une puissance de calcul importante => SSE/NEON, assembleur, multicoeur, multiprocesseur, GPU, Intel Xeon Phi, MPPA, FPGA, ASIC, Multicoeur / multiprocesseur GPU Programmation +++ Portablilité +++ Performance ++ Programmation + Performance +++ Consommation - - Portabilité - - Consommation - - -

CONTRAINTES D UNE APPLICATION DE TYPE SLAM SLAM effectue un grand nombre de calcul impliquant une puissance de calcul importante => SSE/NEON, assembleur, multicoeur, multiprocesseur, GPU, Intel Xeon Phi, MPPA, FPGA, ASIC, Multicoeur / multiprocesseur GPU Intel Xeon Phi Programmation +++ Portablilité +++ Performance ++ Programmation + Performance +++ Programmation ++ Peformance + Consommation - - Portabilité - - Consommation - - - Consommation - -

CONTRAINTES D UNE APPLICATION DE TYPE SLAM SLAM effectue un grand nombre de calcul impliquant une puissance de calcul importante => SSE/NEON, assembleur, multicoeur, multiprocesseur, GPU, Intel Xeon Phi, MPPA, FPGA, ASIC, Multicoeur / multiprocesseur GPU Intel Xeon Phi MPPA Programmation +++ Portablilité +++ Performance ++ Programmation + Performance +++ Programmation ++ Peformance + Performance ++ Consommation +++ Consommation - - Portabilité - - Consommation - - - Consommation - - Programmation - - Portabilité - -

Processeur MPPA 256 coeurs de Kalray MPPA (Multi-Purpose Processor Array) 256 VLIW coeurs, 16 clusters de 16 coeurs, interconnectés par un NoC à bande-passante élevée 32 Mo de mémoire on-chip Transferts en PCIe GEN3 avec l hôte Programmation dataflow Programmation C/C++ POSIX

IMPLÉMENTATION DU SLAM Extraction des caractéristiques 2D implémentée sur le MPPA La reconstruction 3D est exécutée sur la station hôte Communication entre les 2 pour la synchronisation L application est décrite sous forme de tasks and communications graph (TCG) Exécution simultanée de toutes les tâches Traitement ligne par ligne minimise l empreinte mémoire autorise un pipeline logiciel exploite le parallélisme de l architecture MPPA

GRAPHE DE TÂCHES DU DÉTECTEUR DE HARRIS

GRAPHE DE TÂCHES DU DÉTECTEUR DE HARRIS

GRAPHE DE TÂCHES DU DÉTECTEUR DE HARRIS

GRAPHE DE TÂCHES DU DÉTECTEUR DE HARRIS

GRAPHE DE TÂCHES DU DÉTECTEUR DE HARRIS

GRAPHE DE TÂCHES DU DÉTECTEUR DE HARRIS

CO-EXÉCUTION MPPA / WORKSTATION Workstation MPPA

EXÉCUTION MPPA STANDALONE MPPA

DÉPLOIEMENT MPPA HARRIS / SURF / MATCHING 400 Points d Intérêt (PIs) Image FPS Parallélisation Nombre de tâches Harris / Surf / Match Mémoire Clusters VGA @ 60 VGA @ 120 HD 1080 HD 1080 @ 30 @ 60 pipeline pas de parallélisme de données pipeline parallélisme de données pipeline parallélisme de données pipeline parallélisme de données 15 /10 / 4 1.60 MB 2 16 / 20 / 6 5.44 MB 4 32 / 5 / 4 2.65 MB 4 54 / 10 / 4 7.39 MB 8

DÉPLOIEMENT MPPA HARRIS / SURF / MATCHING 400 Points d Intérêt (PIs) Image FPS Parallélisation Nombre de tâches Harris / Surf / Match Mémoire Clusters VGA @ 60 VGA @ 120 HD 1080 HD 1080 @ 30 @ 60 pipeline pas de parallélisme de données pipeline parallélisme de données pipeline parallélisme de données pipeline parallélisme de données 15 /10 / 4 1.60 MB 2 16 / 20 / 6 5.44 MB 4 8 clusters => 93 / 256 coeurs utilisés 32 / 5 / 4 2.65 MB 4 Consommation inférieure à 5 W 54 / 10 / 4 7.39 MB 8

DÉPLOIEMENT MPPA HARRIS / SURF / MATCHING 60 images par seconde pour des images en 1920 * 1080 et 400 points d intérêts avec une consommation inférieure à 5 W Permet d exécuter une extraction de caractéristiques 2D pour un flux stéréo HD 1080 Intel Xeon CPU X5650 @ 2.67GHz, 6 cores HT, 12 MB L3 Intel SSE + implémentation Intel Threading Building Blocks parallel_for Harris-Surf-Matching sur des images en 1920x1080 : 20 ms => 50 fps implementation avec Intel TBB data-flow =>? consommation : 95 W

Merci mathieu.carrier@cea.fr