Emotional Photo Shooting

Documents pareils

F.A.Q 1.0 Designer 3D Atex System

Visio Kit. Mode d'emploi

Utilisation de l éditeur.

Notice d'utilisation Site Internet administrable à distance

Notice d Utilisation du logiciel Finite Element Method Magnetics version 3.4 auteur: David Meeker

PRECAUTIONS DESCRIPTION DU PRODUIT

NIGHT VISION STUDIOS GUIDE DU LOGICIEL. Produit Voyance. Version 1.5

Augmenter la portée de votre WiFi avec un répéteur

Utilisation de l outil lié à MBKSTR 9

SCL LOGICIEL DE CONTROL

ENVOI EN NOMBRE DE SMS

Séquence de découverte de SparkAngels Logiciel d entraide numérique

Utilisation du logiciel GALAAD

Manuel de l'utilisateur

Manuel Utilisateur Chariot odys.sante-lorraine.fr

SAGESSE. Système Automatisé GEStion Santé Etablissement. Version 5.0. Manuel Utilisateur

ENVOI EN NOMBRE DE SMS

HERAKLES Page 1 sur 11 PARAMETRAGE DE GSI FICHE PARAMETRAGE DE GSI

NovoSIP manuel de mise en service

Comment sélectionner des sommets, des arêtes et des faces avec Blender?

Documentation utilisateur. [EIP] TransLSF

Virtualisation de Windows dans Ubuntu Linux

Réaliser un PUBLIPOSTAGE

C f tracée ci- contre est la représentation graphique d une

Dans l idéal, ceci devrait être fait en amont pour chaque image envoyée sur l espace de stockage de votre site internet.

ENVOI EN NOMBRE DE MESSAGES AUDIO

Logiciel SCRATCH FICHE 02

Guide de l'administrateur Citrix Personal vdisk 5.6.5

PARTAGE DE DOCUMENTS EN LIGNE AVEC ONEDRIVE

La téléphonie via Internet..(VoIP) Une solution économique et versatile

Page Paragraphe Modification Mise en page du document Le bouton "Format de page" est maintenant "Page"

Installation d'une galerie photos Piwigo sous Microsoft Windows.

À propos de votre liseuse... 4

COPY. Picture Style Editor Ver. 1.4 MODE D EMPLOI. Logiciel de création de fichiers de style d image. Contenu de ce mode d emploi

1 Comment faire un document Open Office /writer de façon intelligente?

Création d articles sur le site web du GSP

Comment configurer X-Lite 4 pour se connecter au serveur Voip de Kavkom?

Windows 8 : une petite révolution? 9. Démarrer Windows Accéder au Bureau à la connexion 13. Ouvrir ou activer une nouvelle session 13

DOSSIER D'ACTIVITES SUR TUXPAINT Dessiner avec Tuxpaint. Objectifs :

Projet MDMA - Rapport L2

Traitement par lot redimensionner des images

Bien travailler sur plusieurs écrans

Rapport projet MMI. Luis Domingues, I3 Naomi Favre, I3 Tiago De Deus, I3. Luis Domingues, Tiago De Deus, Naomi Favre SP Interfaces Multimodales

Introduction à Windows 8

Utilisation du visualiseur Avermedia

DOSSIER D'ACTIVITES SUR LE PHP N 03 Créer une base de données MySQL avec PHPMyAdmin

Sécurité des Systèmes d Information. TD1: Principes Fondamentaux

Guide de prise en main rapide

Module Communication - Messagerie V6. Infostance. Messagerie

Gérer, stocker et partager vos photos grâce à Picasa. Janvier 2015

Utilisation de l'outil «Open Office TEXTE»

GROUPE DE TRAVAIL «ARTICLE 29» SUR LA PROTECTION DES DONNÉES

Premiers Pas avec OneNote 2013

C.F.A.O. : Conception et Fabrication Assistées par Ordinateur.

Tutoriels. 01 Utiliser Praat. 02 Transcrire sous Praat en utilisant les conventions VALIBEL. Sylviane Bachy. Rédaction octobre 2005

Comment utiliser sa messagerie laposte.net

Club informatique Mont-Bruno Séances du 05 octobre et du 24 octobre 2012 Présentateurs : Réjean Côté

Introduction à l informatique en BCPST

«Dire et écrire» pour réaliser une composition en travail collaboratif en géographie. Agnès Dullin, lycée J. Racine 20 rue du Rocher, Paris

Avertissement : Nos logiciels évoluent rendant parfois les nouvelles versions incompatibles avec les anciennes.

italc supervision de salle

À propos de votre liseuse... 5

TABLEAU CROISE DYNAMIQUE

La C.A.O (Conception Assistée par Ordinateur). Le logiciel de C.A.O.

COURS AUTOCAD. Création et utilisation des blocs. b leclerc. ERP Jean Moulin METZ

Les Tutoriaux Utilisez Foxmail comme client de messagerie

MODE D EMPLOI DU LOGICIEL LIGNES DE TEMPS A partir du film La Mort aux trousses d Alfred Hitchcock

NOTICE D'UTILISATION POUR TIROIRS-CAISSES À OUVERTURE PAR PRESSION TIROIRS-CAISSES ENCASTRÉS CAISSES SOUS COMPTOIR CAISSES SUR COMPTOIR

à l édition de textes

Adaptateur secteur Manuel Boîtier (Optionnel) CD du pilote Carte de garantie mondiale Stylet (Optionnel)

Environnements de développement (intégrés)

Emporter Windows XP sur une clé USB

Procédure de sauvegarde pour AB Magique

Procédure : Sauvegarder un Windows 7 sur un disque réseau

Premiers pas avec NetSupport SCHOOL

Français Table des Matières

VOS PREMIERS PAS AVEC TRACENPOCHE

Créer son questionnaire en ligne avec Google Documents

Utilisation de la plateforme VIA ecollaboration

Système clients serveur Kwartz Vulgarisation, identification, dossier personnel

Le GéoPortail du Jura Présentation des fonctionnalités de la version mobile

IMAGES NUMÉRIQUES MATRICIELLES EN SCILAB

Micro-ordinateurs, informations, idées, trucs et astuces utiliser le Bureau à distance

Manuel d utilisation

Utilisation d une tablette numérique

MODE D EMPLOI LOGICIEL DE PILOTAGE CROIX SMART 5.0

Les règles de base du poker :

Créer son compte del.icio.us

Téléphone de Secours Memcom

Manuel d'utilisation avec le superviseur ISCANSERVER et le client VEHICLE Network System

Examen Médian - 1 heure 30

Créer une trace, obtenir son fichier gpx et sa carte Ou Afficher un fichier trace GPX

Travaux pratiques avec RapidMiner

TPS 4 Objectifs du programme aide à la lecture et à l'écriture Les fonctions principales lecture à haute voix

Cours de Management des Systèmes d Information

Inspiration 7.5. Brève description d Inspiration. Avantages d Inspiration. Inconvénients d Inspiration

Université Ferhat ABBAS -Sétif

Transcription:

Université de Fribourg Département d Informatique Interfaces Multimodales Emotional Photo Shooting Projet réalisé par : Said Mechkour, Raphael Boesch et Razvan Oprea 1

Table des matières 1. Introduction...3 2. Librairies utilisées...3 2.1. OpenCV...3 2.2. Sphinx...3 3. Présentation du système...4 3.1. Algorithme utilisé...5 3.2. Fonctionnement du système...5 4. Conclusions...6 2

1. Introduction Le projet «Emotional Photo Shooting» a été réalisé dans le cadre du cours d approfondissement Interfaces Multimodales. Le but du cours est de donner une connaissance théorique et pratique sur les méthodes de conception, réalisation et d'évaluation des interfaces multimodales. L idée de départ du projet a été de réaliser un système d interaction multimodale qui permet de prendre une photo dès qu il détecte une émotion. Les modes d entrée naturels, la voix et l expression faciale seront captés à l aide d une camera respectivement d un micro. Le système fournira en sortie une photo. Suite aux consultations avec l'enseignant Denis Lalanne on a ajouté une autre fonctionnalité à notre système. Celle-ci permet de diriger un avatar à l'aide des gestes de l'utilisateur. Plus précisément quand l'utilisateur fait un certain geste celui-ci est répété par l'avatar. En ce moment les gestes reconnues par l'avatar sont: sourire, tête en haut, tête en bas, tourner la tête à gauche, tourner la tête à droite, ouvrir la bouche et rester en position libre. 2.1. OpenCV 2. Librairies utilisées Pour la détection faciale et émotionnelle on a utilisé OpenCV qui est une librairie open source et multiplateforme, développée par Intel. La librairie est divisée en quatre grandes parties qui contiennent plus que 500 algorithmes écrits en C/C++ permettant le traitement d images en temps réel. Le grand avantage d'opencv est donné par sa vitesse de calcul et le fait que les implémentations tiennent compte des résultats de recherche le plus récents. 2.2. Sphinx Pour la partie d interaction vocale on a choisi de travailler avec Sphinx-4 qui est un logiciel de reconnaissance vocale open source implémenté en Java. L idée de départ était de commander le système par les commandes vocales suivantes : Start débuter la détection de l émotion Accept sauvegarder la photo Repeat prendre une nouvelle photo sans sauvegarde de la photo actuelle Après l installation de Sphinx et les premiers tests on c est rendu compte que le taux de reconnaissance des ordres était très faible et que le risque de confusion concernant une commande est élevé. Une autre observation est celle de la nécessité d un microphone de haute qualité. On a observé que le premier ordre donné est dans la plus part des cas reconnu et que le problème intervient après. Pour contourner ce problème on aurait pu utiliser un bouton qui bloque l interaction avec Sphinx après le premier ordre. Plus précisément quand on veut donner un ordre au système on va appuyer le bouton. De cette façon on sera toujours dans la situation d un premier ordre donné qui a des fortes chances d être reconnu.pour ces raisons on a décidé de ne plus utiliser dans notre système la reconnaissance vocale et à la place des ordres vocaux on a opté pour l utilisation des boutons (le clavier de l ordinateur dans notre cas). 3

1. 3. Présentation du système 3.1.Algorithme utilisé Pour notre implémentation on a utilisé l'algorithme de Lucas-Kanade qui est un des algorithmes de tracking le plus populaires. L idée de base de l algorithme Lucas-Kanade repose sur trois hypothèses : 1. Luminosité constante l'intensité lumineuse se conserve entre deux images successives. 2. Persistance temporelle ou «petits mouvements» - le mouvement d un cadre à l autre doit être «petit» 3. Cohérence spatiale les voisins d un point doivent rester les mêmes. Un des problèmes de l'algorithme est du à l'utilisation des fenêtres de petite taille. Si les mouvements sont grands on risque de déplacer les points à l'extérieur de la fenêtre locale et d'ici l'impossibilité pour l'algorithme de les retrouver. L'utilisation des fenêtres de grande taille n'est pas une solution pour résoudre le problème soulevé par le paragraphe précédent. Ainsi l'utilisation des fenêtres larges est contraire à une des trois hypothèses de l'algorithme plus précisément la «Coherence spatialle». La solution est donnée par l'approche hiérarchique ou pyramidale(figure 1). Cette méthode respecte toutes les hypothèses de l'algorithme de Lucas-Kanade. La première fenêtre située dans la partie supérieure de la pyramide est d'une taille inférieure aux suivantes et mais fournira moins de détails que les suivantes. En effet plus on va vers la base de la pyramide plus le niveau de détail fournit augmente. Figure 1 4

3.2. Fonctionnement du système La figure suivante présente l'enchainement des phases nécessaires pour arriver à obtenir une photo ou commander l'avatar. Une fois le programme exécuté des images seront capturées et affichées dans une fenêtre sans qu'aucun traitement soit appliqué. A ce stade le programme est en attente,en effet il doit être «informé» que l'utilisateur est prêt (il ne doit pas bouger et son visage est encadré par le cercle). Pour transmettre au système qu'il est prêt l'utilisateur doit presser la touche «p» du clavier. Une fois pressée cette touche, la détection du visage ainsi que de la bouche et des yeux commence. Cette action permet d extraire les points qui seront utilisé par l algorithme de Lucas-Kanade. Le processus de traitement ne fait que la suivie des points d une image à une autre. La détection des émotions se réalise en se basant sur les variations entre ces points. Par exemple afin de détecter un sourire on utilise le modèle suivant: On peut observer que par rapport à la position de la bouche avant le sourire, la variation horizontale dx augmente significativement alors que la variation verticale dy diminue. Une fois une émotion détectée le système va sauvegarder une photo. Comme on a déjà mentionné le système permet aussi de commander un avatar. En effet les gestes captés par le système seront répétés par l'avatar. 5

4. Conclusions La réalisation de ce projet nous a permis de mieux comprendre des notions qui ont été traitée dans la partie théorique du cours et aussi de se familiariser avec la conception des systèmes d'interactions multimodales et aussi avec les difficultés qui peuvent être rencontrées. 6