Segmentation de séquences vidéo en temps réel



Documents pareils
Traitement bas-niveau

Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :

Opérations de base sur ImageJ

Fête de la science Initiation au traitement des images

Master IMA - UMPC Paris 6 RDMM - Année Fiche de TP

Géométrie discrète Chapitre V

Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier

Transmission d informations sur le réseau électrique


Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Comparatif entre Matrox RT.X2 et Adobe Premiere Pro CS3 (logiciel seul)

Projet : Recalage par maximisation de l information mutuelle

Les algorithmes de base du graphisme

Comment optimiser dans ImageReady?

Mesure agnostique de la qualité des images.

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Hiver 2013 IMN 259. Introduction à l analyse d images. Par Pierre-Marc Jodoin

Détection et suivi d'objets dans une séquence d'images par contours actifs

TP SIN Traitement d image

Les bases de l étalonnage avec Adobe Premiere Pro Formation de Duduf

L évaluation d algorithmes d analyse vidéo Quelques pistes

Dossier table tactile - 11/04/2010

Algorithme des fourmis appliqué à la détection et au suivi de contours dans une image

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies

Projet de Traitement du Signal Segmentation d images SAR

TP : Gestion d une image au format PGM

Détection des points d intérêt et Segmentation des images RGB-D. Présentée par : Bilal Tawbe. Semaine de la recherche de l UQO

Pop-Art façon Roy Liechtenstein

Utilisation du logiciel ImageJ gratuit

Projet Matlab/Octave : segmentation d'un ballon de couleur dans une image couleur et insertion d'un logo

Merci de suivre les indications suivantes afin de créer votre compte membre :

SilverFast SE Plus 8 - Le meilleur logiciel de scanner... beaucoup plus qu un simple logiciel pour des scanners.

Optimisation de la compression fractale D images basée sur les réseaux de neurones

RIE LE RENDU THEO. 2 e trim ÉTAPE DE FINITION BOÎTE DE DIALOGUE. remarques

Apprentissage Automatique

MCMC et approximations en champ moyen pour les modèles de Markov

Freeway 7. Nouvelles fonctionnalités

Démarches d urbanisation : réorganiser le Système d Information en structurant ses fonctions dans des blocs fonctionnels communicants.

Traitement numérique de l'image. Raphaël Isdant

Corrigé du baccalauréat S Asie 21 juin 2010

Urbanisation des Systèmes d Information Architecture d Entreprise. 04 Architecture du SI : identifier et décrire les services, structurer le SI

Cours de Génie Logiciel

NON-LINEARITE ET RESEAUX NEURONAUX

Création de maquette web

Créer une maquette de site Internet

IMMUNOLOGIE. La spécificité des immunoglobulines et des récepteurs T. Informations scientifiques


COMMUNICATION ENTRE DEUX ORDINATEURS PAR LASER MODULE EN CODE MORSE OU BINAIRE.

La visio-conférence holographique : Pourquoi? Comment?

La classification automatique de données quantitatives

Programmation linéaire

Livre blanc. Au cœur de Diskeeper 2010 avec IntelliWrite

Les atouts et faiblesses des caméras TEP dédiées, TEP corps entier, TEP-CT, TEMP pour la quantification

TD de supervision. J.P. Chemla. Polytech Tours Département productique 2ème année

Compression et Transmission des Signaux. Samson LASAULCE Laboratoire des Signaux et Systèmes, Gif/Yvette

Analyse d images. Edmond.Boyer@imag.fr. Edmond Boyer UFRIMA 1

Modules Multimédia PAO (Adobe)

Probabilités sur un univers fini

Recherche De Coalescences Binaires Étalonnage Du Détecteur

W 12-2 : haute performance et savoir-faire compact

Echantillonnage Non uniforme

FAG Detector II le collecteur et l analyseur de données portatif. Information Technique Produit

Plus courts chemins, programmation dynamique

Introduction au Data-Mining

Risques d accès non autorisés : les atouts d une solution IAM

Compte-rendu Réunion générale. Grenoble, le 29 juin 2011 URBASIS

F7n COUP DE BOURSE, NOMBRE DÉRIVÉ

F210. Automate de vision hautes fonctionnalités. Caractèristiques. Algorithmes vectoriels

L'astrophotographie au Cercle

SudoClick Reconnaissance de grilles de sudoku pour téléphones portables

Scanner de film numérique

2013 Pearson France Adobe Illustrator CC Adobe Press

Coup de Projecteur sur les Réseaux de Neurones

Initiation à LabView : Les exemples d applications :

ActoPalm 1.0 b. Logiciel d'aide au relevé d'observation in situ sur Organiseurs PalmOS Compatibles. Alain Kerguelen, mai 2002

Intérêt du découpage en sous-bandes pour l analyse spectrale

Limitations of the Playstation 3 for High Performance Cluster Computing

Recherche d'images par le contenu Application au monitoring Télévisuel à l'institut national de l'audiovisuel

Ebauche Rapport finale

choisir H 1 quand H 0 est vraie - fausse alarme

Lightroom. Chambre noire numérique. Organisation. Lightroom Catalog.lrcat. Lightroom Catalog Previews.lrdata 2005, 2006, 2007

Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons

Quantification Scalaire et Prédictive

Sauvegarde collaborative entre pairs Ludovic Courtès LAAS-CNRS

Introduction au Data-Mining

La solution à vos mesures de pression

Notice d Utilisation du logiciel Finite Element Method Magnetics version 3.4 auteur: David Meeker

Maintenir un service de traitement de son ou d image d ordinateur

Premiers Pas avec OneNote 2013

ITAS Escaliers industriels et plate-formes de travail

Disparités entre les cantons dans tous les domaines examinés

DÉCOUVERTE DE CAPTURE ONE

Utilisation du visualiseur Avermedia

LIDAR LAUSANNE Nouvelles données altimétriques sur l agglomération lausannoise par technologie laser aéroporté et ses produits dérivés

Adobe Illustrator Logiciel de dessin vectoriel et de Cartographie Assistée par Ordinateur

Transcription:

MVA-2011 p. 2 Segmentation de séquences vidéo en temps réel G. Koepfler MVA-2011 p. 1 Introduction But: Détecter des objets en mouvement dans une séquence d images. Motivations: Extraire l information des vidéos : Détecter/extraire/éditer... les objets en mouvement. Première étape vers des détections de plus haut niveau : compter les personnes, déterminer le mouvement, détecter des événements. La position des objets dans l image permet d approcher leur position dans l espace.

MVA-2011 p. 4 Approches existantes Deux groupes : méthodes temps réel, traitement en ligne, image par image ; méthodes (plus) lentes, permettant l utilisation de parties entières d une séquence. Large spectre de techniques en fonction des objectifs et contraintes. Nécessité d évaluer les résultats : précision temporelle et spatiale de la segmentation et du suivi, détection d événements,... MVA-2011 p. 3 Approche présentée Simplification: caméra fixe (e.g. vidéosurveillance). Contraintes: temps réel ; traitement en ligne ; peu de paramètres. Principales difficultés: Les changements dus aux bruits (ombres, reflets, etc) ne doivent pas être détectés comme objets en mouvement. Exemple: Film webcam.

MVA-2011 p. 6 Modélisation du mouvement Différence entre deux images successives : I(x, t) I(x, t + 1). Flot optique, champ de vecteurs v tel que : I(x, t) I(x + v, t + 1). Comparaison à un fond donné : I(x, t) B(x). Pas de fréquence temporelle minimale, on détecte aussi des objets qui bougent lentement ; Estimation robuste du fond. MVA-2011 p. 5 Modélisation des objets Méthodes basées pixels, les pixels sont classés statiques/fond ou dynamiques/objet. Exemples : algorithme W4 (film), modèle gaussien et mélange de gaussiennes. Méthodes région, on part d une région initiale que l on adapte en minimisant une énergie. Contours actifs, minimisation par graph-cuts ou level sets.

MVA-2011 p. 8 Plan Données Une image I et le fond B, Étape 1: Image de différences. Étape 2: Régions significatives. MVA-2011 p. 7 Image de différences

MVA-2011 p. 10 Principe : déterminer où le fond B et l image courante I diffèrent, ceci en étant robuste aux changements de luminosité ; on utilise les lignes de niveau : les lignes de niveau représentent la structure dans les images : les bords des objets correspondent aux lignes de niveau avec un contraste suffisant, ; si un objet occulte le fond, alors il va rompre les lignes de niveau ; MVA-2011 p. 9 Seuils En chaque point x, on calcule n I (x) = I (x), n B (x) = B (x), angle(x) = angle( I(x), B(x)). Trois seuils : e, si n I (x) e on a existence locale de structure ; E, si n B (x) < e et n I (x) E on a apparition d une structure, E > e garantit la stabilité ; φ, si angle(x) φ on a un changement de la structure locale.

Calcul de l image de différences symétrique - s il y a changement au pixel x, on pose D(x) = blanc : [n I (x) e et n B (x) e et angle(x) φ] ou [n I (x) E et n B (x) < e] ou [n B (x) E et n I (x) < e] Changement de ligne de niveau ou apparition / disparition d une ligne de niveau contrastée - s il n y a pas de changement, on a D(x) = noir : [n I (x) e et n B (x) e et angle(x) < φ] MVA-2011 p. 11 Exemple d images de différences Les points blancs sont placés sur les objets en mouvement, mais sont aussi répartis un peu partout dans l image. En variant le paramètre φ : MVA-2011 p. 12

MVA-2011 p. 14 Commentaires bien que l on va utiliser une méthode a contrario pour détecter des groupements de pixels blancs, on fixe les paramètres afin de diminuer la complexité de la méthode ; la valeur de E influence le comportement en cas de changements de contraste : Si Ω = i Ω i et Ω i, α i > 0, β i > 0, x Ω i : I(x) = α i B(x) + β i alors si e E α i E e : x Ω i, D(x)= pixel noir ou pixel gris ; des ombres ne perturbent pas l image de différences ; des objets présents dans B et disparus dans I sont détectés, ce sont des fantômes : il faut rendre non symétrique le calcul de D ; la disparition de structure [n B (x) E et n I (x) < e] donnera des pixels gris. MVA-2011 p. 13 Ombres

MVA-2011 p. 16 Ombres MVA-2011 p. 15 Fantômes B D sym. D non sym. I seg. sym. seg. non sym.

MVA-2011 p. 18 Segmentation par détection de groupements Objet en mouvement = groupements de pixels blancs parmi les pixels observables. Il faut donc détecter et localiser les groupements. Pour cela on utilise une détection a contrario. MVA-2011 p. 17 Régions significatives

MVA-2011 p. 20 Détection a contrario On détecte des évènements qui ne peuvent pas apparaître dans une image de bruit. Beaucoup d applications en images : Détection d alignements, de segments, de points de fuite, de contours contrastés... Avantages de cette méthode : sans paramètres ; robuste au bruit ; rapidité. cours A. Desolneux et J. Delon MVA-2011 p. 19 Modèle a priori On mesure la densité moyenne de pixels blancs parmi les pixels observables (blancs ou noirs) : p = P (pixel blanc observable ) = #pixels blancs dans l image #pixels observables dans l image Dans le modèle a priori, un pixel observable est blanc avec une probabilité p et noir avec une probabilité 1 p. Pour une région W contenant n pixels observables, la probabilité qu elle contienne plus de k pixels blancs est donnée par la queue de la binomiale : B(p, n, k) = ( n i=k n i ) p i (1 p) (n i).

MVA-2011 p. 22 Significativité d une région Si on se donne un ensemble de N régions de l image, et un seuil ǫ, on dit que W est ǫ-significative si NF A(W ) = N B(p, n, k) < ǫ et si k n > p. On calcule la significativité de W par : S(W ) = log(nf A(W )). On considère les fenêtres comme ǫ-significatives si S(W ) > T où T = log(ǫ) > 0 On détecte un groupement de pixels blancs dans W, si S(W ) > T. On détecte un objet en mouvement, s il existe une fenêtre W avec S(W ) > T. MVA-2011 p. 21 Calcul du NFA L approximation de HOEFFDING donne [ S(W ) n p l log( p l p ) + (1 p l) log( 1 p ] l 1 p ) log(n). avec p l = k n = densité locale de pixels blancs. Interprétation en terme de distance de KULLBACK-LEIBLER : pour chaque fenêtre W, on calcule la distance entre p l et p, si cette distance est supérieure au seuil T + log(n), alors la fenêtre est significative. On fait un seuillage adaptatif de la distance entre la densité locale et la densité globale de pixels blancs.

MVA-2011 p. 24 Critère de maximalité À cause de la redondance des fenêtres significatives on détermine des fenêtres maximales significatives. Une fenêtre W est maximale ǫ-significative si (a) S(W ) > T, c.-à-d. W est ǫ-significative ; (b) pour toute fenêtre significative W, avec W W, soit S(W ) > S(W ), donc W approxime mieux l objet que W, soit il existe W, avec W W et S(W ) > S(W ) > S(W ), donc W correspond à un autre objet, localisé sur W. MVA-2011 p. 23 Maximalité - Algorithme Object Object 1 Object 2 W W W W W Algorithme: 1. Dans la liste initiale, trouver la fenêtre la plus significative W max, l ajouter à la liste des fenêtres maximales ǫ-significatives et l enlever de la liste initiale ; 2. effacer toutes les fenêtres W avec W W max ; 3. répéter ces deux étapes tant qu il reste des fenêtres ǫ-significatives dans la liste initiale.

MVA-2011 p. 26 Significativité S(W) 120 60 Selected threshold 20 0 1 2 3 4 5 6 7 8 9 10 11 12 13 Label of W Boundary Noise Well placed MVA-2011 p. 25 Choix de l ensemble de fenêtres de tests On considère une grille spatiale de blocs de K K pixels. Les fenêtres sont des rectangles construits à partir de ces blocs. La position des fenêtres est aussi déterminée par la grille. Exemple: deux tailles des rectangles 20 20 et 30 30 pixels, et une précision spatiale de taille K = 10. les tailles des rectangles correspondent à une estimation de la taille des objets. Ce choix d ensemble de tests permet de faire un algorithme rapide.

MVA-2011 p. 28 Résultats Les fenêtres maximales significatives donnent une segmentation approchée des objets en mouvement. Séquence caviar 1. Séquence caviar 2. Séquence métro 1. Séquence métro 2. Comparaison W4 et AWD. MVA-2011 p. 27 Améliorer la segmentation

MVA-2011 p. 30 Amélioration de la segmentation Une fois les régions maximales significatives détectées, on peut améliorer la résolution. On part de l union disjointe des fenêtres significatives, O = W, et on applique un algorithme de croissance de régions : on enlève les blocs B O, situés aux bords de O, si S(O \ B) > S(O) ; on ajoute les blocs B O, situés aux bords de O, si S(O B) > S(O), et si B a une densité de pixels observables plus élevée que l image de différences D ; répéter ces deux étapes tant qu il reste des blocs à ajouter ou enlever. On utilise S(O) comme une fonctionnelle à maximiser. MVA-2011 p. 29 Résultats Améliore la segmentation. Critère non symétrique, sinon on ajoute à l objet des blocs de pixels situés dans les zones homogènes, où il y a peu de pixels observables. Séquence caviar 2.

MVA-2011 p. 32 Suivi d objets MVA-2011 p. 31 Suivi d objets A ce stade, on a ni une connectivité spatiale, deux fenêtres voisines peuvent indiquer le même objet, ni une connectivité temporelle, les images sont traitées indépendamment. Un algorithme simple permet de numéroter les composantes connexes : 1 1 1 1 1 2 3 2 1 2 2 2 1 1 1 1 4 4 5 5 4 4 5 5 Le barycentre de chaque composante connexe permet de la relier à la région la plus proche dans l image précédente.

MVA-2011 p. 34 Résultats suivi Séquence CAVIAR. Séquence ETISEO. Séquence APRON. MVA-2011 p. 33 Références Ces notes sont basées sur les documents suivants : S. Pelletier, PhD dissertation, Modèle multi-couches pour l analyse de séquences vidéo, Université Paris Dauphine, November 2007. F. Dibos, G. Koepfler et S. Pelletier, Adapted Windows Detection of Moving Objects in Video Scenes, in SIAM Journal on Imaging Sciences, 2-1, pp. 1-19, 2009.