Détection de têtes dans un nuage de points 3D à l aide d un modèle de mélange sphérique



Documents pareils
Principe de symétrisation pour la construction d un test adaptatif

Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

NON-LINEARITE ET RESEAUX NEURONAUX

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Classification non supervisée

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier

TABLE DES MATIERES. C Exercices complémentaires 42

Optimisation, traitement d image et éclipse de Soleil

Probabilités III Introduction à l évaluation d options

Modélisation géostatistique des débits le long des cours d eau.

Méthodes de Simulation

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

La classification automatique de données quantitatives

Correction du baccalauréat ES/L Métropole 20 juin 2014

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

Equation LIDAR : exp 2 Equation RADAR :

Reconnaissance de visages 2.5D par fusion des indices de texture et de profondeur ICI 12/12/12

Synthèse d'images I. Venceslas BIRI IGM Université de Marne La

INF6304 Interfaces Intelligentes

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Une comparaison de méthodes de discrimination des masses de véhicules automobiles

PROBABILITES ET STATISTIQUE I&II

Mesure agnostique de la qualité des images.

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

ÉTUDE DE L EFFICACITÉ DE GÉOGRILLES POUR PRÉVENIR L EFFONDREMENT LOCAL D UNE CHAUSSÉE

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Soutenance de stage Laboratoire des Signaux et Systèmes

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

Évaluation de la régression bornée

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

MCMC et approximations en champ moyen pour les modèles de Markov

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Quantification Scalaire et Prédictive

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Résolution d équations non linéaires

intelligence artificielle et cognitique"

Correction du baccalauréat STMG Polynésie 17 juin 2014

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

GEOLOCALISATION ET NAVIGATION A L AIDE DES SIGNAUX GNSS

Agrégation des portefeuilles de contrats d assurance vie

3 Approximation de solutions d équations

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

Programmation linéaire

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

Séminaire TEST. 1 Présentation du sujet. October 18th, 2013

Rappels sur les suites - Algorithme

Une méthode d apprentissage pour la composition de services web

Simulation de variables aléatoires

Texte Agrégation limitée par diffusion interne

Moments des variables aléatoires réelles

La Recherche du Point Optimum de Fonctionnement d un Générateur Photovoltaïque en Utilisant les Réseaux NEURO-FLOUS

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Classification Automatique de messages : une approche hybride

Echantillonnage Non uniforme

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Probabilités conditionnelles Loi binomiale

Exemple PLS avec SAS

FIMA, 7 juillet 2005

Introduction au Data-Mining

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

CHAPITRE 5. Stratégies Mixtes

La programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique

SARM: Simulation of Absorption Refrigeration Machine

Territoire3D. Descriptif de contenu. Institut Géographique National. Date du Document : Mars 2011

Application de K-means à la définition du nombre de VM optimal dans un cloud

Leçon N 4 : Statistiques à deux variables

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

AICp. Vincent Vandewalle. To cite this version: HAL Id: inria

Détection en environnement non-gaussien Cas du fouillis de mer et extension aux milieux

(51) Int Cl.: H04L 29/06 ( ) G06F 21/55 ( )

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

IFT3355: Infographie Sujet 6: shading 7 (illumination globale 4)

Gestion du niveau de la franchise d un contrat avec bonus-malus. Pierre THEROND & Stéphane BONCHE

BILAN du projet PEPS 1 EOLIN (Eolien LMI INSA)

Image d un intervalle par une fonction continue

Modélisation et simulation


Correction du Baccalauréat S Amérique du Nord mai 2007

Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR

Ressources pour le lycée général et technologique

Détection des points d intérêt et Segmentation des images RGB-D. Présentée par : Bilal Tawbe. Semaine de la recherche de l UQO

Une méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données

De la mesure à l analyse des risques

Transcription:

Détection de têtes dans un nuage de points 3D à l aide d un modèle de mélange sphérique Denis Brazey & Bruno Portier 2 Société Prynɛl, RD974 290 Corpeau, France denis.brazey@insa-rouen.fr 2 Normandie Université, INSA de Rouen, LMI - EA 3226 685 Avenue de l Université - BP 08 7680 St Etienne du Rouvray cedex, France bruno.portier@insa-rouen.fr Résumé. L objectif de ce travail est la détection de têtes dans un nuage de points 3D représentant un groupe de personnes. L emploi d un seul capteur conduit à une grande quantité de données manquantes puisque seule une face des objets est visible. Notre méthode est basée sur un nouveau modèle de mélange sphérique. La forme des objets est considérée de part la distribution statistique des points dans l espace. La densité utilisée appartient à la famille des distributions elliptiques et modélise des points repartis autour d une surface sphérique. Les paramètres inconnus sont estimés par un algorithme Espérance-Maximisation. Le nombre de composantes est déterminé par une approche ascendante et les têtes sont détectées par des règles heuristiques. L application de la méthode sur des jeux de données réels permet de modéliser et de détecter correctement les têtes. Mots-clés. Détection de tête, Modèle de mélange, Algorithme EM Abstract. The objective of this work is the detection of heads in a 3D point cloud representing a group of people. The use of a single sensor implies a lot of missing data since only one side of objects is visible. Our method is based on a new spherical mixture model. The shape of objects is considered through the statistical distribution of points in 3D space. The probability density function models points spread around a spherical surface and is elliptically distributed. Unknown parameters are estimated with the Expectation- Maximization algorithm. The number of components is determined by a step by step ascending strategy and heads are detected with heuristic rules. The use of the method on real data sets enables to correctly detect and model heads. Keywords. Head detection, Mixture model, EM algorithm Introduction La détection de têtes est une problématique centrale pour de nombreuses applications de vision par ordinateur comme par exemple la biométrie, les interfaces homme-machine, la réalité augmentée et la vidéo conférence.

Les capteurs 3D fournissent une information de distance pour chacun des pixels de l image. Cette information peut être convertie en un nuage de points 3D représentant la scène. Récemment, le capteur Kinect commercialisé avec la plateforme de jeu Microsoft Xbox a permis de démocratiser l utilisation de tels capteurs. Le système fournit une information géométrique en plus de l information colorimétrique. Dans ce travail, seule la composante de distance est considérée lors des traitements. L acquisition de données 3D permet d analyser la forme des objets. Le problème d ajustement d ellipsoïdes sur des têtes est présenté par Grammalidis et Strintzis (2000. Un algorithme d extraction des maxima locaux a été proposé par Zhang, Yan et al (202 pour segmenter les têtes. Les travaux de Zhang, He et al (202 se basent sur un ensemble de zones positives et négatives afin de déterminer la position des têtes. Notons que dans la plupart des approches, la forme ellipsoïdale de la tête a été exploitée. Les modèles de mélange, généralement gaussiens, ont été beaucoup utilisés en statistiques pour modéliser et classifier des données (voir par exemple le livre de McLachlan et Peel (2000. Ils ont été appliqués à des problèmes variés dans le domaine du traitement d images comme la soustraction de fond (Stauffer, 999, la segmentation d images (Zhang, He et al, 202 ou la modélisation d environnements 3D (Núñez et al, 2009. Dans ce travail, nous considérons le problème de détection de têtes dans un nuage de points 3D représentant un groupe de personnes. Pour cela nous nous appuyons sur un modèle de mélange sphérique introduit par Brazey et Portier (204 dont la densité de probabilité permet de modéliser des points répartis autour d une surface sphérique. Les images étant acquises avec un seul capteur 3D, une grande partie des données sont manquantes et les observations sont non-uniformément réparties sur la surface des objets. 2 Le modèle de mélange sphérique Un modèle de mélange fini est un modèle probabiliste utilisé pour estimer paramétriquement la distribution d une variable aléatoire en la modélisant par une somme pondérée de K distributions. La densité de probabilité h du mélange est une combinaison convexe de K densités. Généralement, ces densités appartiennent à une famille de densités paramétriques et chaque composante se différencie par la valeur de ses paramètres. La densité du mélange est de la forme K h(x Θ = π k f(x θ k ( k= où les (π k sont les proportions du mélange satisfaisant π k 0 et K k= π k = et Θ = (π,..., π K, θ,..., θ K est le vecteur des paramètres inconnus du modèle. La particularité de ce type de modélisation est qu elle permet d expliquer les données par un ensemble de composantes pouvant se chevaucher. Dans notre application, nous choisissons d utiliser un 2

tel modèle dans lequel chaque composante est une primitive géométrique. Les observations retournées par le capteur étant localisées sur la surface des objets, il est clair que la distribution gaussienne n est pas adaptée. Puisque la forme de la tête peut s apparenter à celle d une sphère, nous proposons d utiliser la densité introduite par Brazey et Portier (204 modélisant des points répartis autour d une surface sphérique de centre µ R 3, de rayon r > 0 et de variance σ 2 > 0. La densité f décrivant la kème composante du mélange s écrit ( f(x, θ k = C exp ( x µ 2σk 2 k r k 2 (2 où C est une constante de normalisation et θ k = (µ k, r k, σ k le vecteur des paramètres de la composante k. Sous l hypothèse que r k >>σ k, la constante C peut être approchée par C = 2 (2π 3/2 σ k (r 2 k + σ2 k (3 L hypothèse introduite ci-dessus est raisonnable dans notre cadre d application puisque le rayon d une tête est grand comparé à la variance des points autour de la surface. Notons enfin que cette distribution appartient à la famille des distributions elliptiques. On trouvera en Figure un échantillon de points simulés selon la densité f. Figure : Un échantillon de 000 réalisations de densité f de paramètres ((0, 0, 0 T, 50,. 3 Estimation des paramètres On s intéresse dans cette partie à l estimation du vecteur de paramètres Θ du modèle de mélange sphérique (, à partir de n observations x = (x,..., x n. On suppose que chaque observation x i R 3 provient de l une des K composantes du modèle. Pour estimer Θ, nous choisissons l estimateur du maximum de vraisemblance Θ défini par Θ = arg max L (x; Θ (4 Θ où L désigne la fonction de log-vraisemblance donnée par ( K L (x; Θ = log π k f (x i θ k 3 k= (5

L algorithme EM (voir par exemple McLachlan et Thriyambakam (2008 est la méthode la plus utilisée pour maximiser la log-vraisemblance dans le cas des modèles de mélange. L algorithme consiste en deux étapes E et M itérées jusqu à convergence. Étape E : Calcul des probabilités d appartenance t il ( des points {x i } n aux classes {C l } K l= avec l estimation courante des paramètres Θ(j = π (j,..., π (j K, θ(j,..., θ (j K ( π (j l f x i θ (j l t il = ( (6 K k= π(j k f x i θ (j k Étape M : Déterminer Θ (j+ maximisant l espérance conditionnelle de la log-vraisemblance complétée étant donné l observation x et l estimation courante Θ (j. Pour l =,..., K, µ l = n t il ( t il x i r l (x i µ l t il x i µ l r l = n t il t il x i µ l (7 σ l 2 = π l = n n t il t il ( x i µ l r l 2 Le processus est initialisé par un vecteur de paramètres Θ (0 obtenu par un algorithme K-Means. Les estimateurs (7 ont été obtenus par dérivation de la log-vraisemblance complétée par rapport à chacun des paramètres. Les estimations du centre µ l et du rayon r l ne sont pas directement calculables puisqu elles dépendent l une de l autre. Nous proposons donc d employer une méthode de backfitting. Le centre est d abord estimé par µ (0 l = n n x i et le rayon par r (0 l = n n X i µ (0 l. Ces estimations sont ensuite améliorées en réévaluant récursivement les équations (7. Les équations des estimations sont donc évaluées plusieurs fois à chaque étape M. Ce processus itératif est stoppé lorsque la différence entre deux estimations successives est suffisamment faible (seuils ɛ µ et ɛ r. Notons enfin que l estimateur µ ( l est particulièrement bien adapté à l estimation de µ l lorsque les données ne sont pas uniformément réparties sur la surface (demi-sphère par exemple. La performance des estimateurs sur des données simulées et l étude de leur convergence sont discutées par Brazey et Portier (204. 4

4 Application à la détection de têtes Dans cette partie, nous utilisons le modèle de mélange sphérique décrit en section 2 pour détecter et modéliser des têtes dans un nuage de points 3D représentant un groupe de personnes. Les images proviennent d un seul capteur 3D dont la hauteur et l orientation par rapport au sol sont supposées connues. Les images ont été segmentées par un seuillage des valeurs de profondeur. Les nuages de points sont non-organisés et la structure 2D des images n est pas prise en compte. Les expérimentations ont montré que les valeurs initiales des variances ont un impact important sur les résultats. Si la variance initiale est élevée, des observations appartenant à d autres composantes participeront à l estimation des paramètres. Par conséquent, nous préférons fixer les variances plutôt que de les ré-estimer à chaque itération de EM. Le nombre de composantes K du modèle n est pas connu à priori et doit être déterminé. S il est choisi trop faible, le modèle ne sera pas assez complexe pour modéliser correctement les données. Si au contraire il est trop élevé, les données seront sur-segmentées. Nous adoptons donc une approche ascendante. Le paramètre K est initialisé à K min et incrémenté jusqu à K max. Une incrémentation est validée si la log-vraisemblance a été améliorée d un coefficient au moins égal à β. Sinon la valeur de K est considérée comme optimale. (a (b (c (d Figure 2: (a images de profondeur, (b nuages de points et modèles, (c têtes détectées et (d pourcentages de détection pour chaque nombre de têtes dans l image. Après l estimation du modèle, nous analysons les sphères obtenues pour décider lesquelles représentent des têtes. Nous définissons pour cela des règles heuristiques. Dans un premier temps, une sphère est considérée comme une tête potentielle si son rayon appartient à l intervalle [r min, r max ] et sa distance au sol supérieure à z min. Nous prenons également 5

en compte la classification obtenue via EM. Chaque observation x i est associée à la composante la plus probable C k définie par k = arg max l {t il 0.5}. La distance au carré moyenne entre la surface d une sphère et les points y étant associés doit être inférieure à ɛ erreur. Dans un second temps, une tête potentielle est classée comme tête si aucune autre tête n est située au dessus et si au moins une composante représentant le corps est située en dessous. La méthode est appliquée sur un ensemble de 430 images. Les résultats obtenus sont représentés Figure 2. Le processus de backfitting est limité par ɛ µ = ɛ r = 0.5 et un maximum de 50 itérations. L algorithme EM est limité à 0 itérations. Les paramètres K min et K max ont été respectivement fixés à 2 et 5, le seuil β à 0.0 et les σ k à 5. Les critères de détection ont été fixés à r min = 80, r max = 20, z min = 000 mm et ɛ erreur = 300. Les surfaces des composantes optimisées sont proches des observations malgré le grand nombre de données manquantes et la répartition inégale des points. On constate que les sphères convergent vers les zones du nuage présentant une forme sphérique comme la tête et les épaules. Les règles de détection proposées permettent de détecter et modéliser correctement les têtes dans plus de 96 % des cas. Le temps de traitement est de l ordre plusieurs secondes par images. Une amélioration de la méthode consisterait à mettre en place une accélération de la méthode d estimation (McLachlan et Thriyambakam, 2008 et à complexifier les règles de détection. Bibliographie [] D. Brazey et B. Portier (204, A new spherical mixture model for head detection in depth images, Submitted. [2] N. Grammalidis et M. G. Strintzis (2000, Head Detection and Tracking by 2-D and 3-D Ellipsoid Fitting, Proc. CGI, 22-226. [3] G. J. McLachlan et D. Peel (2000, Finite Mixture Models, Wiley Series in Probability and Statistics. [4] G. J. McLachlan et K. Thriyambakam (2008, The EM Algorithm and Extensions, WILEY-Interscience. [5] P. Núñez, P. Drews Jr, R. Rocha, M. Campos et J. Dias (2009, Novelty detection and 3D shape retrieval based on gaussian mixture models for autonomous surveillance robotics, IROS, 4724-4730. [6] T. van Oosterhout, S. Bakkes et B. Kröse (20, Head Detection in Stereo Data for People Counting and Segmentation, VISAPP, 620-625. [7] C. Stauffer (999, Adaptive background mixture models for real-time tracking, CVPR. [8] X. Zhang, R. He, M. Yao et F. Zhu (202, The Elliptical Contoured Mixture Model for Image Segmentation, Journal of Computational Information Systems, 7847-7855. [9] X. Zhang, J. Yan, S. Feng, Z. Lei, D. Yi et S.Z. Li (202, Water Filling : Unsupervised People Counting via Vertical Kinect Sensor, AVSS. 6