Normalisation et validation d images de documents capturées en mobilité

Dimension: px
Commencer à balayer dès la page:

Download "Normalisation et validation d images de documents capturées en mobilité"

Transcription

1 Normalisation et validation d images de documents capturées en mobilité Marçal Rusiñol * Joseph Chazalon Jean-Marc Ogier Laboratoire L3i, Université de La Rochelle Avenue Michel Crépeau, La Rochelle Cédex 1, France * Computer Vision Center, Dept. Ciències de la Computació Edifici O, Universitat Autònoma de Barcelona, Bellaterra (Barcelona), Spain RÉSUMÉ. La numérisation de documents à l aide des smartphones introduit un nombre important de dégradations qui doivent être corrigées ou détectées sur le mobile, avant l envoi de données sur un réseau payant ou la perte de disponibilité du document. Dans cet article, nous proposons un système permettant de corriger les problèmes de perspective et d illumination avant d estimer la netteté de l image pour un traitement OCR. L étape corrective repose sur une détection des contours, suivie d une normalisation de l illumination. Son évaluation sur un jeu de données privé montre une amélioration franche des résultats OCR. L étape de contrôle repose sur une combinaison de mesures de focus. Son évaluation sur un jeu de données public montre que cette approche simple donne des performances comparables à celles des meilleures méthodes basées sur des traitements lourds, et surpasse les méthodes basées sur des métriques. ABSTRACT. Mobile document image acquisition integrates many distortions which must be corrected or detected on the device, before the document becomes unavailable or paying data transmission fees. In this paper, we propose a system to correct perspective and illumination issues, and estimate the sharpness of the image for OCR recognition. The correction step relies on fast and accurate border detection followed by illumination normalization. Its evaluation on a private dataset shows a clear improvement on OCR accuracy. The quality assessment step relies on a combination of focus measures. Its evaluation on a public dataset shows that this simple method compares well to state of the art, learning-based methods which cannot be embedded on a mobile, and outperforms metric-based methods. MOTS-CLÉS : acquisition d image de document avec mobile ; correction de perspective ; correction d illumination ; estimation de qualité ; mesure de focus ; prédiction de la fiabilité OCR KEYWORDS: mobile document image acquisition; perspective correction; illumination correction; quality assessment; focus measure; OCR accuracy prediction CIFED 2014, pp , Nancy, mars 2014

2 110 M. Rusiñol, J. Chazalon, J.-M. Ogier 1. Introduction L acquisition d images de documents avec des périphériques mobiles, les smartphones en particulier, est devenu un point d entrée essentiel dans les chaînes de traitement documentaires industrielles. Malgré l attrait évident de la numérisation à la volée et le transfert quasi instantané des images de documents, trois défis majeurs restent à surmonter pour libérer le potentiel de la capture mobile d images de documents. Les distorsions de numérisation sont, dans le cas d images de documents capturées avec un dispositif mobile, la principale cause de perturbation du signal de l image. Parmi les distorsions les plus courantes, le flou provoqué par un mauvais focus est particulièrement délicat. Il modifie sérieusement la lisibilité, à la fois pour les humains et les systèmes OCR, et l utilisateur a peu de contrôle sur lui car il est lié au comportement interne de l appareil, contrairement au flou de mouvement, à la distorsion de perspective ou aux conditions d éclairage. Pour éviter de mauvaises performances dans le traitement des documents, la lisibilité d une image de document capturée avec un mobile doit donc être optimisée et contrôlée le plus tôt possible dans le processus. Les frais de communication des réseaux mobiles imposent une sélection rigoureuse sur les images à transférer. Par conséquent, le contrôle de la lisibilité doit être effectué sur le dispositif mobile, avant l envoi de données. La mobilité change la façon dont les utilisateurs capturent les documents : l opportunité de numériser un document peut être temporaire. Tout contrôle sur les images capturées doit donc être effectué pendant ou juste après la capture, pour éviter de manquer l occasion d une autre capture. Il est alors nécessaire de viser un contrôle aussi rapide que possible, en temps réel idéalement, pour débloquer progressivement différents niveaux d assistance à la capture tels que : 1) la notification à l utilisateur d une mauvaise capture, ainsi que l - explication de cette évaluation ; 2) le déclenchement automatique de la capture lorsque les conditions de capture sont optimales ; 3) le guidage de l utilisateur lors de la capture à l aide d indications précises telles que «rapprochez l appareil du document», ou «l éclairage est trop faible», comme suggéré dans (Chen et al., 2013a). Dans cet article, nous présentons un prototype de système d acquisition d images de documents destinés à un traitement OCR. Ce système permet la productions d images où les distorsions liées à la perspective, à l éclairage et au flou sont maîtrisées. Une première étape corrective, présentée en section 2, permet de corriger la perspective de l image et son illumination afin d optimiser de la qualité de l image avant l évaluation de cette dernière. Les résultats en terme de performance OCR montrent le gain apporté par cette étape. Une seconde étape de contrôle, présentée en section 3, permet prédire la fiabilité attendue d un système OCR à l aide d une analyse du focus de l image et donc, indirectement, des conditions de capture (on fait l hypothèse que la qualité intrinsèque du document est suffisante). La technique proposée dans cette étape se base sur évaluation de mesures de focus jamais testées (à notre connaissance) sur des images de documents. Elle présente des performances comparables aux

3 Normalisation et validation d images de documents capturées en mobilité 111 meilleures techniques basées sur des algorithmes lourds, tout en étant rapide et simple à calculer. 2. Correction de la perspective et de l illumination Les images de documents capturées avec un dispositif mobile contiennent, en plus d une région représentant la page, une portion du fonds. De plus, si le dispositif de capture n est pas orthogonal au plan de la page, une déformation liée à la perspective sera visible. Ces deux perturbations peuvent dégrader très sérieusement la performance d un système OCR. Par ailleurs, l éclairage de la scène peut être affecté par l utilisation d un illuminant «non standard» qui provoquera, après une capture avec un mobile, des teintes bleuâtres ou verdâtres à la place de la teinte blanche attendue du papier. Ce changement dans l espace de couleur peut, lui aussi, avoir un effet négatif sur la performance des systèmes OCR conçus pour traiter des images numérisées à l aide de scanners avec lesquels ces artéfacts sont négligeables. Cette section présente les deux solutions proposées afin de faire face à ces défauts de perspective et d illumination Correction de la perspective Depuis quelques années, on peut trouver dans la littérature un bon nombre de publications qui traitent de la segmentation des pages acquises avec des dispositifs mobiles et de la correction des effets de perspective, comme par exemple (Clark et Mirmehdi, 2001 ; Lu et al., 2005 ; Jagannathan et Jawahar, 2005 ; Rodríguez-Piñeiro et al., 2011). La plupart de ces travaux visent soit à détecter les points de fuite horizontaux et verticaux en se basant sur les lignes horizontales du texte et les éléments verticaux des glyphes du texte, soit à détecter les quatre coins de la page pour essayer ensuite de transformer le quadrilatère trouvé en un rectangle parfait. Puisque la numérisation de pages A4 complètes est un scénario courant, nous avons décidé d attaquer le problème en essayant d extraire la page (supposée complète) en détectant ses bords et ses quatre coins. Pour détecter les bords de la page, on utilise un détecteur de contours classique comme la méthode de Canny. Au préalable, on traite l image avec un filtre médian, avec un élément structurant assez large afin d éliminer le texte imprimé et ne conserver que le fond. La figure 1 illustre ce processus. Une fois la détection des contours de la page réalisée, on procède à la détection de ses quatre coins. Au lieu d utiliser directement un détecteur de coins comme celui de Harris, nous cherchons d abord à identifier les bords de la page à l aide la transformée de Hough (Ballard, 1981). Ceci a l avantage de permettre une détection des coins même lorsque ceux-ci ne sont pas visibles dans l image, dès lors qu une partie de chacun des quatre bords est présente dans l image.

4 112 M. Rusiñol, J. Chazalon, J.-M. Ogier a) b) c) Figure 1. Exemple d extraction des contours. a) Image originale, b) image traitée avec le filtre médian, c) image des contours détectés par la méthode de Canny. Lors de la sélection des paramètresρetθ de la transformée de Hough, il faut tenir compte de l influence du facteur de quantification dans l espace de vote : une quantification grossière aura tendance à provoquer davantage d erreurs dans la détection des lignes, tandis qu en diminuant la taille des bins on fait progressivement apparaître plusieurs lignes candidates pour une même zone de l image. Dans notre cas, on favorise la sur-segmentation des lignes. Une fois ces lignes détectées, on les analyse deux à deux pour calculer l angle qu elles forment entre elles. Si l angle entre deux lignes est extrêmement aigu ou grave, on écarte cette paire qui correspond à des lignes presque parallèles qui se croisent. Dans tous les autres cas, on génère l ensemble des points d intersection pour former les candidats à la représentation de chacun des quatre coins de la page. Le résultat de ce processus d extraction de lignes est illustré par la figure 2. Une fois l ensemble des points candidats identifiés, il faut commencer par les affecter à un quadrant de la page, afin de déterminer s il s agit d un candidat pour le coin haut gauche, haut droit, etc. Il suffit pour cela de calculer les coordonnées du centre de gravité du nuage de points candidats pour ensuite changer de repère et identifier le cadran de chaque point. Pour chacun de ces points, suivant leur cadran, on construit des couples associant leurs coordonnées dans l image d origine et celles dans l image cible : par exemple, si on cherche à numériser des pages A4 à 300 dpi, tous les points correspondant au quadrant haut gauche auraient comme point modèle le ; ceux du quadrant haut droit auraient le point ; et ainsi de suite. Finalement, on applique la méthode de RANSAC (Fischler et Bolles, 1981) aux couples ainsi formés afin de trouver la transformation à appliquer à l image acquise pour rectifier l effet de perspective, tout en éliminant les aberrations liées aux points détectés par erreur et ne correspondant à aucun coin. La figure 3 illustre quelques exemples de corrections de perspective à laquelle notre méthode aboutit.

5 Normalisation et validation d images de documents capturées en mobilité 113 a) b) c) Figure 2. Détection des bords et de coins de la page avec la transformée de Hough. a) Image originale, b) image des contours, c) lignes et croisements détectés. Figure 3. Exemples d images acquises avec un dispositif mobile avec des effets de perspective en haut, et les corrections correspondantes en bas Correction de l illumination Afin de corriger l illumination de l image, on adapte la méthode classique dite du monde gris (gray world assumption) au domaine de la numérisation de documents. Notre hypothèse de base est que le document à numériser consiste en une page idéalement blanche sur laquelle est imprimé un texte noir. Dans l algorithme original du monde gris, la couleur grise moyenne est calculée en prenant la moyenne de la valeur moyenne de chaque composante couleur. La valeur de chaque composante de l image est ensuite multipliée par la valeur de couleur grise

6 114 M. Rusiñol, J. Chazalon, J.-M. Ogier Image Image acquise Correction Correction scannée avec mobile perspective illumination Taux OCR 96.2% 66.29% 94.62% 95.23% Tableau 1. Taux de précision de l OCR en fonction du traitement. moyenne divisée par l intensité de cette composante de couleur. Ceci empêche une composante de contribuer beaucoup plus à l image qu une autre. Dans notre cas, au lieu d appliquer une translation de chaque composante couleur vers le gris moyen, on propose de réaliser cette translation vers une intensitéldonnée. On calculera donc le nouveau triplet(r,g,b ) à partir de R = R l R, G = G l Ḡ, B = B l B. Dans un second temps, on procède à un étirement de l histogramme de luminance de l image pour garantir que les valeurs les plus claires de l image sont bien représentées par un blanc pur, et que les valeurs les plus sombres correspondent bien à un noir parfait. Il faut commencer par convertir l image depuis l espace RGB vers un espace possédant une composante de luminance : Lab, LCH, LSV, etc. Ensuite, on applique une méthode d augmentation de contraste seulement dans le canal de luminance avec deux seuils de coupure pour les valeurs basses et hautes, respectivement l et h. L image est finalement retransformée à l espace RGB. En portant les paramètres l et h à la limite, on obtient des images qui semblent binaires, bien qu elles soient représentées dans un espace RGB. La figure 4 donne quelques exemples de résultats de cette méthode Résultats : effets des corrections sur la performance de l OCR Pour évaluer l effet des corrections proposées sur la performance d outils OCR, nous avons réalisé 35 captures d une même page, à l aide d un smartphone, avec plusieurs degrés de perspective et sous différentes illuminations. Pour disposer d une référence, nous avons également scanné cette page, et nous disposons de la vérité terrain pour le texte. Pour cette expérience, nous avons utilisé l OCR commercial AB- BYY FineReader. On peut apprécier, dans le tableau 1, l impact des corrections proposées sur le comportement de l OCR. FineReader montre en effet de faible performance pour les images acquises avec le smartphone qui présentent des déformations de perspective. Dans la plupart des cas, les erreurs sont dues à un échec de l étape de segmentation de la page ; les zones de texte étant considérées comme des images. Cependant, après correction de la perspective, on constate un fort gain en précision. Finalement, la cor-

7 Normalisation et validation d images de documents capturées en mobilité 115 Figure 4. Correction de l illumination des images. Pour chaque image, la vignette du haut est la version après correction de perspective, et celle du bas la version après correction de l illumination. rection de l illumination aide également FineReader et permet d obtenir des résultats très proches de ceux obtenus à partir de la version scannée du document. 3. Estimation de la qualité Dans cette section, nous décrivons la méthode d estimation de qualité (dans un objectif de traitement OCR) que nous proposons d appliquer aux images de documents capturées à l aide d un téléphone mobile, ainsi que les évaluations que nous avons réalisées. Cette méthode garantie que l image produite dispose d une netteté suffisante, et limite donc le risque de flou de focus délicat à maîtriser par l utilisateur. Cette estimation de la qualité a lieu, dans le scénario que nous considérons, après le pré-traitement de l image pour ne conserver que la partie concernant la page de document, où la perspective et l illumination ont été corrigées. Cette étape fait alors

8 116 M. Rusiñol, J. Chazalon, J.-M. Ogier office de barrière avant l envoi (souvent via un réseau payant) des images vers un service centralisé. Notons que si, dans sa version actuelle, notre méthode d estimation de la qualité intervient après la capture, il est possible d imaginer un fonctionnement plus interactif où des conseils pour l amélioration de la prise de vue pourraient être fournis une fois l image capturée, voire même pendant la capture comme proposé par (Chen et al., 2013b). Si le temps de traitement est suffisamment court, ce qui est ici une condition indispensable, il pourrait même être possible, à terme, de déclencher automatiquement la capture lorsqu un optimum est détecté dans la configuration de prise de vue. Il s agit donc d une estimation de qualité s intéressant spécifiquement aux conditions de capture, et non à la qualité intrinsèque d un document pour laquelle d autres méthodes existent depuis un certain temps à présent (Gonzalez et al., 1998). L estimation de la qualité d images de documents peut-être entendu de différentes façons, selon qu on dispose ou non d une référence pour comparaison. (Ye et Doermann, 2013) proposent ainsi de distinguer trois formes. Estimation de qualité avec référence complète Cette méthode est possible lorsque l image de référence est disponible, par exemple lors du contrôle du résultat d une compression. Estimation de qualité avec référence partielle Cette méthode repose sur la présence de marqueurs ou de mires de calibration, par exemple, dans l image capturée qui permet d estimer précisément les paramètres de la capture. Estimation de qualité sans référence Ce cas plus général est celui où la qualité de l image doit être estimée «à l aveugle», en se basant sur une connaissance à priori des propriétés attendues de l image. Dans notre cas, la capture d un document inconnu impose une estimation de qualité sans référence, afin de prédire le niveau de fiabilité d un système OCR État de l art Comme montré par (Ye et Doermann, 2013), peu de travaux ont été menés sur la prédiction du niveau de fiabilité des systèmes OCR pour des images de documents capturées avec appareil photo, caméras ou encore smartphones. La gestion spécifique du flou du focus n a fait l objet que de quelques études à notre connaissance. Une étude récente menée par (Kumar et al., 2013) compare les résultats de différentes méthodes à l aide d un jeu d images de documents spécifique. Le jeu de test utilisé par ces auteurs comporte, pour 25 documents différents, une série de captures faisant varier la distance focale de l appareil, et ainsi le flou de focus. Cette base est accessible publiquement, et nous l avons utilisée pour l évaluation de notre méthode. Parmi les trois méthodes comparées par les précédents auteurs, la méthode COR- NIA présentée par (Ye et Doermann, 2012 ; Ye et al., 2012), présente les meilleurs résultats. Elle est cependant basée sur une représentation éparse et une sélection automatique des caractéristiques, imposant des apprentissages lourds et des traitements

9 Normalisation et validation d images de documents capturées en mobilité 117 coûteux difficilement intégrables dans des smartphones. Les méthodes Q (proposée par (Zhu et Milanfar, 2010) et basée sur une décomposition en valeurs singulières) et DoM (proposée par (Kumar et al., 2012) et basée sur une métrique plus simple à base de gradients) présentent quant à elles des résultats plus modestes. Il ressort de cette étude que les méthodes adaptées au traitements de documents inconnus sont actuellement soit trop lourde pour être intégrées dans les smartphones, soit trop peu performantes. Une autre méthode, ne figurant pas dans l évaluation précédente, a été proposée par (Peng et al., 2011). Bien que l information produite par cette approche, destinée à faciliter la prise de décision relative à l image courante, soit particulièrement intéressante, la méthode proposée se base sur des caractéristiques définies manuellement considérant la forme du contour des caractères, ainsi que des rapports hauteur-largeur pour les mots et caractères. Ce type de caractéristiques limite, selon nous, le champs d application de cette méthode à une classe de documents textuels bien connus, et ne semble pas adaptée au traitement de documents inconnus. Il est donc nécessaire de rechercher d autres méthodes basées sur des métriques simples et rapides à calculer permettant d estimer efficacement la netteté d une image de document inconnu sans être spécifique à une classe de contenu particulière. Des travaux dans cette direction existent dans d autres communautés scientifiques, en particulier pour la mise au point d algorithmes d auto-focus (travaillant en temps réel). (Pertuz et al., 2013) proposent ainsi une comparaison de 36 mesures de focus classées en 6 familles présentant un comportement homogène selon le type de perturbation considéré. Le comportement de ces mesures sur des images de documents n a, à notre connaissance, jamais été étudié. Par ailleurs, ces mesures étant généralement très rapides à calculer, nous avons souhaité étudier la possibilité de les combiner pour aboutir à une méthode globale restant rapide à calculer, mais permettant de compenser les défauts des méthodes isolées, et ainsi mieux modéliser l évolution de la fiabilité d un système OCR Mesures de focus étudiées Dans (Pertuz et al., 2013), les auteurs distinguent 6 familles de mesures de focus aux comportements homogènes. Famille des méthodes «à base de gradients» Abrégée GRA pour «gradientbased», cette famille estime la netteté des contours du contenu de l image grâce à une analyse des gradients de cette dernière. Famille des méthodes «à base de laplacien» Abrégée LAP pour «Laplacianbased», cette famille vise le même objectif que la précédente, mais en utilisant la dérivée seconde ou le laplacien de l image. Famille des méthodes «à base d ondelettes» Abrégée WAV pour «waveletbased», cette famille construit des indicateurs grâce à une transformée en ondelettes de l image.

10 118 M. Rusiñol, J. Chazalon, J.-M. Ogier Mesure Abrév. Mesure Abrév. Gaussian derivative GRA1 Ratio of wavelet coefficients WAV3 Gradient energy GRA2 Gray-level variance STA3 Thresholded absolute gradient GRA3 Gray-level local variance STA4 Squared gradient GRA4 Normalized gray-level variance STA5 Tenengrad GRA6 Histogram entropy STA7 Tenengrad variance GRA7 Histogram range STA8 Energy of Laplacian LAP1 Brenner s measure MIS2 Modified Laplacian LAP2 Image curvature MIS4 Diagonal Laplacian LAP3 Helmli and Scherer s mean MIS5 Variance of Laplacian LAP4 Steerable filters-based MIS7 Sum of wavelet coefficients WAV1 Spatial frequency measure MIS8 Variance of wavelet coefficients WAV2 Vollath s autocorrelation MIS9 Tableau 2. Noms et abréviations des 24 mesures de focus extraites de (Pertuz et al., 2013) pour lesquelles nous avons recherché la combinaison optimale. Famille des méthodes «à base de transformée en cosinus discrète» Abrégée DCT pour «discrete cosine transform-based», cette famille, à l instar de la précédente, utilise l espace de représentation induit par la transformée en cosinus discrète pour extraire des indicateurs. Famille des méthodes «à base d indicateurs statistiques» Abrégée STA pour «statistic-based», cette famille utilise des analyses statistiques (moments, variance, etc.) pour extraire des indicateurs. Famille des méthodes «diverses» Abrégée MISC pour «miscellaneous-based», cette famille regroupe les méthodes qui ne rentrent dans aucune des catégories précédentes. Parmi les 36 mesures proposées par ces auteurs, nous en avons sélectionné 24, indiquées dans le tableau 2, pour lesquelles le temps de calcul était raisonnable au regard de notre scénario. Cette sélection a notamment provoqué l élimination des méthodes à base de transformée en cosinus discrète, trop coûteuses Combinaison des mesures Parmi les mesures présentées précédemment, il est difficile de savoir à priori quelles sont celles qui présenteront la meilleure corrélation avec la mesure de la fiabilité de l OCR, tout comme il est délicat de choisir comment combiner ces mesures pour palier leurs défauts respectifs. Pour résoudre ce problème, nous avons testé toutes les combinaisons possibles de ces 24 mesures. Soit n = 24 et S = {FM 1,FM 2,...,FM n } l ensemble de toutes les mesures de focus FM appliquées à une image de test donnée. Nous avons évalué toutes les

11 Normalisation et validation d images de documents capturées en mobilité 119 combinaisonst possibles de cet ensemble. On notet m, oùm [1, n], tous les sousensembles possibles de mesures formés en choisissant m éléments de S. En particulier,tm j (avecj [ 1, ( n m)] ), dénote lej-ième sous-ensemble possédant exactement m éléments. Ces combinaisons représentent plus de 16 millions de configurations différentes. Une fois un sous-ensemble de mesures de focus à combiner choisi, un double problème se pose alors : 1) comment normaliser les mesures pour qu elles produisent des valeurs dans un domaine cohérent ; et 2) comment fusionner ces valeurs pour produire un résultat unique Méthodes de normalisation Comme noté par (Kittler et al., 1998), il est nécessaire de normaliser les mesures pour que les domaines de valeurs de ces dernières soient comparables. Nous avons utilisé des techniques usuelles, présentées ci-après, dans nos expérimentations. Pour un ensemble de mesurest j m, nous notonst j m leur variante normalisée. Min-max Cette technique applique un facture de mise à l échelle et transforme la mesure pour qu elle renvoie des valeurs dans le domaine[0,1]. Soientmin(T j m) etmax(t j m) les minimum et maximum, respectivement, des scores. Tm j T j = m min(tm) j max(tm) min(t j m) j Cette méthode est très sensible aux points aberrants dans les données. Z-score Cette technique est une des plus couramment utilisées. Elle utilise la moyenne arithmétiqueµet l écart-typeσ des données considérées. Tm j T j = m µ σ L utilisation de la moyenne arithmétique et de l écart-type rend également cette méthode sensible aux points aberrants. Tanh Cette technique robuste et efficace est elle aussi basée sur la moyenne arithmétique et l écart-type. { [ Tm j 1 = tanh ( T j m µ σ )] } +1 MAD Les écarts médians et médians absolus utilisés par cette méthode sont insensibles aux points aberrants et aux extremums de la distribution. T j m = T j m median(t j m) median( T j m median(t j m) )

12 120 M. Rusiñol, J. Chazalon, J.-M. Ogier Stratégies de fusion Après la normalisation des valeurs renvoyées par chacune des mesures de focus, plusieurs stratégies de fusion des mesures normalisée contenues dans un sousensemble Tm j : il est possible de choisir le minimum, le maximum, la somme, le produit, la moyenne ou encore la médiane de ces valeurs. Plus formellement, on définit les stratégies de fusion suivantes : ( ) ( ) combmax = max Tm j, combmin = min Tm j, ( m) n ( ) combsum = Tm j, combprod = j=1 combavg = mean ( m) n j=1 ( T j m ), ( ) ( ) Tm j, combmed = median Tm j. Notre choix d utiliser, dans un premier temps, ces techniques de fusion au lieu de techniques de régression se justifie par la nécessité, dans l application finale, de privilégier la détection et le refus de mauvaises captures à une prédiction exacte de la qualité des résultats OCR. Une combinaison linéaire aurait pour effet de rendre certaines mesures plus importantes que les autres, et notre approche vise au contraire à permettre de tirer profit des «doutes» de chacune des mesures. Les résultats expérimentaux présentés ci-après indiquent les performances obtenues pour chaque méthode de normalisation et chaque stratégie de fusion Validation expérimentale Nous avons utilisé la base publique proposée par (Kumar et al., 2013) pour évaluer notre approche, et la comparer à celles évaluées dans cet article. Cette base comporte 175 images qui représentent les différentes captures (entre 6 et 8) réalisées avec différentes distances focales pour chacun des 25 documents. Pour chacun des documents, certaines captures sont parfaitement nettes, et d autres présentent des niveaux de flou variables. La vérité terrain ainsi que les réponses de trois systèmes OCR (FineReader, Omnipage et Tesseract) pour chacune des images est fournie. La fiabilité de l OCR pour chacune des images est également disponible. La figure 5 illustre le contenu de ces documents. Dans la mesure où la base publique de (Kumar et al., 2013) est la seule à proposer une variation du focus dans des images de documents, mais qu elle ne contient pas de déformation de perspective, nous avons évalué séparément l étape d estimation de la qualité des images basée sur une mesure de focus et celle de normalisation de la perspective et de l illumination présentées en section 2. Pour simuler une étape de correction de perspective idéale, nous nous sommes contentés de détecter automatiquement la zone de l image contenant le document avec une version simplifiée de la

13 Normalisation et validation d images de documents capturées en mobilité 121

14 122 M. Rusiñol, J. Chazalon, J.-M. Ogier Méthode Principe LCC médian SROCC médian Q Métrique DOM Métrique CORNIA Apprentissage Proposée Métrique Tableau 4. Comparaison avec l état de l art (Kumar et al., 2013). Méthode FineReader Omnipage Tesseract CombMIN+Z-score Tableau 5. Médiane des coefficients de la corrélation de Pearson pour les différents systèmes OCR. D une manière générale, les mesures ayant donné les meilleurs résultats sont celles à base de gradient. La meilleure configuration était, quant à elle, formé du sousensemble de 4 mesures T j 4 = {GRA1,GRA2,GRA4,STA8}. Le temps moyen pour le calcul et la normalisation de ces quatre mesures 0,61 secondes sur une machine récente avec un code Matlab séquentiel et non optimisé. Le tableau 4 compare nos résultats avec deux recensés dans (Kumar et al., 2013). On remarque que notre méthode est meilleure que Q (Zhu et Milanfar, 2010) et DOM (Kumar et al., 2012) pour les deux mesures. Cependant, la méthode COR- NIA (Ye et al., 2012), basée sur un apprentissage plus lourd, reste plus performante selon ces critères. Pour terminer, le tableau 5 synthétise les médianes des coefficients de la corrélation de Pearson obtenus pour les différents systèmes OCR. Le fait qu on observe une très faible différence entre les systèmes FineReader et Tesseract, malgré leur très grande disparité en terme de performance réelle (voir (Kumar et al., 2013), figures 4 et 6), laisse penser que la méthode d évaluation proposée par (Kumar et al., 2013) présente un biais optimiste. En effet, le calcul de la corrélation de Pearson sur l ensemble des images (en intégrant donc les résultats moins avantageux) donne des résultats plus modestes. Pour les 175 images de la base, le coefficient global (LLC) que nous obtenons est de 0,6467, ce qui est bien inférieur au coefficient de 0,9378 donné par la méthode d évaluation de l état de l art. 4. Conclusion Pour faire face aux distorsions spécifiques contenues dans les images de documents numérisées avec des périphérique mobiles, nous avons proposé un prototype de

15 Normalisation et validation d images de documents capturées en mobilité 123 système d acquisition permettant d améliorer puis contrôler la qualité des images sur le mobile, avant leur transfert ou la perte de disponibilité du document. La correction de la perspective est réalisée grâce à une détection des contours de la page, ce qui permet à la méthode de fonctionner même si la page contient peu de texte, ou si les coins ne sont pas visibles. La correction de l illumination est réalisée grâce à une translation des composantes couleurs vers une illumination cible selon une hypothèse de monde gris, puis grâce à un étirement de l histogramme pour la composante de luminance. L évaluation de chacune de ces étapes sur des images réelles montre qu elles apportent chacune un gain de terme de performance pour l OCR. L estimation de la qualité de l image est réalisée grâce à combinaison optimale de mesures de focus évaluées pour la première fois sur ce type de données. La validation de cette seconde étape sur une base publique montre que cette méthode surpasse les autres méthodes à base de métriques, et donne de bons résultats par rapport aux méthodes à base d algorithmes plus lourds. Le système résultant proposé est basé sur une combinaison de méthodes légères pouvant facilement être mise en œuvre sur un smartphone. Remerciements Ce projet a été financé par le consortium Valconum ( tt r). This project has been funded by the People Program (Marie Curie Actions) of the 7th Framework Program of the EU (FP7/ ) under the grant agreement number of the REA. 5. Bibliographie Ballard D., «Generalizing the Hough transform to detect arbitrary shapes», Pattern Recognition, vol. 13, no 2, p , Chen F., Carter S., Denoue L., Kumar J., «SmartDCap : Semi-Automatic Capture of Higher Quality Document Images from a Smartphone», Proceedings of the International Conference on Intelligent User Interfaces, p , 2013a. Chen F., Carter S., Denoue L., Kumar J., «SmartDCap : Semi-Automatic Capture of Higher Quality Document Images from a Smartphone», Proceedings of the 2013 international conference on Intelligent user interfaces (IUI 13), p , March, 2013b. Clark P., Mirmehdi M., «Estimating the Orientation and Recovery of Text Planes in a Single Image», Proceedings of the 12th British Machine Vision Conference, p , Fischler M., Bolles R., «Random sample consensus : a paradigm for model fitting with applications to image analysis and automated cartography», Communications of the ACM, vol. 24, no 6, p , Gonzalez J., Kanai J., Nartker T. A., «Prediction of OCR Accuracy Using a Neural Network», in S. L. Taylor, J. J. Hull (eds), Document Analysis Systems II, vol. 29, World Scientific, p , 1998.

16 124 M. Rusiñol, J. Chazalon, J.-M. Ogier Jagannathan L., Jawahar C., «Perspective correction methods for camera based document analysis», Proceedings of the First International Workshop on Camera-based Document Analysis and Recognition, p , Kittler J., Hatef M., Duin R., Matas J., «On combining classifiers», IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 20, no 3, p , March, Kumar J., Chen F., Doermann D., «Sharpness estimation for document and scene images», 21st International Conference on Pattern Recognition (ICPR), p , Kumar J., Ye P., Doermann D., «A Dataset for Quality Assessment of Camera Captured Document Images», International Workshop on Camera-Based Document Analysis and Recognition (CBDAR), Lu S., Chen B., Ko C., «Perspective rectification of document images using fuzzy set and morphological operations», Image and Vision Computing, vol. 23, p , Peng X., Cao H., Subramanian K., Prasad R., Natarajan P., «Automated image quality assessment for camera-captured OCR», 18th IEEE International Conference on Image Processing (ICIP), p , Pertuz S., Puig D., Angel Garcia M., «Analysis of focus measure operators for shape-fromfocus», Pattern Recognition, vol. 46, no 5, p , May, Rodríguez-Piñeiro J., Comesaña-Alfaro P., Pérez-González F., Malvido-Garc ía A., «A new method for perspective correction of document images», Proceedings of the Document Recognition and Retrieval XVIII, p , Ye P., Doermann D., «Learning features for predicting OCR accuracy», 21st International Conference on Pattern Recognition (ICPR), p , Ye P., Doermann D., «Document Image Quality Assessment : A Brief Survey», 12th International Conference on Document Analysis and Recognition (ICDAR), p , Ye P., Kumar J., Kang L., Doermann D., «Unsupervised feature learning framework for noreference image quality assessment», IEEE Conference on Computer Vision and Pattern Recognition (CVPR), p , Zhu X., Milanfar P., «Automatic parameter selection for denoising algorithms using a noreference measure of image content», IEEE Transactions on Image Processing, vol. 19, no 12, p , 2010.

Normalisation et validation d images de documents capturées en mobilité

Normalisation et validation d images de documents capturées en mobilité Normalisation et validation d images de documents capturées en mobilité Marçal Rusiñol * Joseph Chazalon Jean-Marc Ogier Laboratoire L3i, Université de La Rochelle Avenue Michel Crépeau, 17042 La Rochelle

Plus en détail

Approche hybride de reconstruction de facettes planes 3D

Approche hybride de reconstruction de facettes planes 3D Cari 2004 7/10/04 14:50 Page 67 Approche hybride de reconstruction de facettes planes 3D Ezzeddine ZAGROUBA F. S.T, Dept. Informatique. Lab. d Informatique, Parallélisme et Productique. Campus Universitaire.

Plus en détail

Mesure agnostique de la qualité des images.

Mesure agnostique de la qualité des images. Mesure agnostique de la qualité des images. Application en biométrie Christophe Charrier Université de Caen Basse-Normandie GREYC, UMR CNRS 6072 Caen, France 8 avril, 2013 C. Charrier NR-IQA 1 / 34 Sommaire

Plus en détail

L ANALYSE DU RISQUE DE FAILLITE PAR LE BIAIS DES SYSTÈMES DE L INTELLIGENCE ARTIFICIELLE

L ANALYSE DU RISQUE DE FAILLITE PAR LE BIAIS DES SYSTÈMES DE L INTELLIGENCE ARTIFICIELLE L ANALYSE DU RISQUE DE FAILLITE PAR LE BIAIS DES SYSTÈMES DE L INTELLIGENCE ARTIFICIELLE Paul Pașcu, Assist Prof, PhD, Ștefan cel Mare University of Suceava Abstract: This article aims to present a number

Plus en détail

Sélection de variables groupées avec les forêts aléatoires. Application à l analyse des données fonctionnelles multivariées.

Sélection de variables groupées avec les forêts aléatoires. Application à l analyse des données fonctionnelles multivariées. Sélection de variables groupées avec les forêts aléatoires. Application à l analyse des données fonctionnelles multivariées. Baptiste Gregorutti 12, Bertrand Michel 2 & Philippe Saint Pierre 2 1 Safety

Plus en détail

Propriétés des images numériques Contraintes sur l interprétation

Propriétés des images numériques Contraintes sur l interprétation Propriétés des images numériques Contraintes sur l interprétation M.LOUYS, Traitement d images et problèmes inverses Master Astrophysique, Observatoire de Strasbourg, 2013 Propriétés générales d une image

Plus en détail

Analyse d images en vidéosurveillance embarquée dans les véhicules de transport en commun

Analyse d images en vidéosurveillance embarquée dans les véhicules de transport en commun des s Analyse d images en vidéosurveillance embarquée dans les véhicules de transport en commun Sébastien Harasse thèse Cifre LIS INPG/Duhamel le 7 décembre 2006 1 Système de surveillance des s Enregistreur

Plus en détail

Introduction à la Vision 3D

Introduction à la Vision 3D à la Vision 3D David Fofi Le2i UMR CNRS 6306 IUT Le Creusot Les applications présentées sont le fruit d une collaboration entre le Le2i et le laboratoire VICOROB de l Université de Gérone (Espagne). Les

Plus en détail

Analyse d images introduction

Analyse d images introduction L3, option Image Analyse d images introduction http ://perception.inrialpes.fr/people/boyer/teaching/l3/ Elise Arnaud - Edmond Boyer Université Joseph Fourier / INRIA Rhône-Alpes elise.arnaud@inrialpes.fr

Plus en détail

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57 Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation

Plus en détail

ÉTUDE DE L EFFICACITÉ DE GÉOGRILLES POUR PRÉVENIR L EFFONDREMENT LOCAL D UNE CHAUSSÉE

ÉTUDE DE L EFFICACITÉ DE GÉOGRILLES POUR PRÉVENIR L EFFONDREMENT LOCAL D UNE CHAUSSÉE ÉTUDE DE L EFFICACITÉ DE GÉOGRILLES POUR PRÉVENIR L EFFONDREMENT LOCAL D UNE CHAUSSÉE ANALYSIS OF THE EFFICIENCY OF GEOGRIDS TO PREVENT A LOCAL COLLAPSE OF A ROAD Céline BOURDEAU et Daniel BILLAUX Itasca

Plus en détail

Cours IFT6266, Exemple d application: Data-Mining

Cours IFT6266, Exemple d application: Data-Mining Cours IFT6266, Exemple d application: Data-Mining Voici un exemple du processus d application des algorithmes d apprentissage statistique dans un contexte d affaire, qu on appelle aussi data-mining. 1.

Plus en détail

Calibration automatique

Calibration automatique ÉC O L E P O L Y T E C H N I Q U E FÉ DÉR A L E D E L A U S A N N E Calibration automatique d une caméra Fanny Gilliéron Projet supervisé par François Fleuret et Jérôme Berclaz Juillet 2007 2 Table des

Plus en détail

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services 69 Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services M. Bakhouya, J. Gaber et A. Koukam Laboratoire Systèmes et Transports SeT Université de Technologie de Belfort-Montbéliard

Plus en détail

Traitement bas-niveau

Traitement bas-niveau Plan Introduction L approche contour (frontière) Introduction Objectifs Les traitements ont pour but d extraire l information utile et pertinente contenue dans l image en regard de l application considérée.

Plus en détail

Cours de Traitement de l Image Licence 3

Cours de Traitement de l Image Licence 3 Cours de Traitement de l Image Licence 3 Jean-Luc Baril Université de Bourgogne - Dépt IEM Laboratoire LE2I - http://vision.u-bourgogne.fr barjl@u-bourgogne.fr http://www.u-bourgogne.fr/jl.baril Lena :

Plus en détail

Introduction. Photoshop Elements 12 pour les photographes du numérique. Introduction

Introduction. Photoshop Elements 12 pour les photographes du numérique. Introduction Introduction Le fait d avoir choisi Photoshop Elements parmi la multitude de logiciels existants dont certains totalement gratuits pour traiter et retoucher vos images signifie deux choses : vous souhaitez

Plus en détail

Scanners d images. Mode d emploi. Table des matières. Logiciel de commande du scanner. Page 3 Quelle résolution pour mon image?

Scanners d images. Mode d emploi. Table des matières. Logiciel de commande du scanner. Page 3 Quelle résolution pour mon image? Scanners d images Mode d emploi Table des matières Page 1 Page 2 Choisir un scanner de bureau Logiciel de commande du scanner Page 3 Quelle résolution pour mon image? Page 4 Page 5 Page 6 Page 7 Ajuster

Plus en détail

- Mobiliser les résultats sur le second degré dans le cadre de la résolution d un problème.

- Mobiliser les résultats sur le second degré dans le cadre de la résolution d un problème. Mathématiques - classe de 1ère des séries STI2D et STL. 1. Analyse On dote les élèves d outils mathématiques permettant de traiter des problèmes relevant de la modélisation de phénomènes continus ou discrets.

Plus en détail

IVRG Image and Visual Representation Group

IVRG Image and Visual Representation Group IVRG Image and Visual Representation Group Projet en Digital Photography Responsable : Patrick Vandewalle Sylvain PASINI Bertrand GRANDGEORGE le 2 juin 2003 Table des matières Table des matières 2 1. Introduction

Plus en détail

Décomposition de domaine pour un milieu poreux fracturé

Décomposition de domaine pour un milieu poreux fracturé Décomposition de domaine pour un milieu poreux fracturé Laila AMIR 1, Michel KERN 2, Vincent MARTIN 3, Jean E ROBERTS 4 1 INRIA-Rocquencourt, B.P. 105, F-78153 Le Chesnay Cedex Email: laila.amir@inria.fr

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

Projet de Traitement du Signal Segmentation d images SAR

Projet de Traitement du Signal Segmentation d images SAR Projet de Traitement du Signal Segmentation d images SAR Introduction En analyse d images, la segmentation est une étape essentielle, préliminaire à des traitements de haut niveau tels que la classification,

Plus en détail

Apprentissage par méthodes à noyaux en reconnaissance d images

Apprentissage par méthodes à noyaux en reconnaissance d images Apprentissage par méthodes à noyaux en reconnaissance d images Alberto Bietti Table des matières Introduction 2 1 Apprentissage par méthodes à noyaux 2 1.1 Position du problème et motivation..........................

Plus en détail

Leçon N 8 Traitement des photos 4 ème

Leçon N 8 Traitement des photos 4 ème Leçon N 8 Traitement des photos 4 ème Partie Voyons maintenant quelques applications de GIMP 10 Renforcement de la netteté Aucun logiciel de retouche ne peut restituer une photo dont la netteté est très

Plus en détail

TP2 Opérations et filtres

TP2 Opérations et filtres TP2 Opérations et filtres 1. Opérations arithmétiques Mettre en place les fonctions Min et Max sur 2 images en niveaux de gris. Min() conserve entre 2 images les pixels de luminance minimum, Max() conserve

Plus en détail

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences

Plus en détail

11. Evaluation de la qualité des essais

11. Evaluation de la qualité des essais 11. Evaluation de la qualité des essais L évaluation de la qualité méthodologique d un essai thérapeutique est une tâche difficile [117]. L essai thérapeutique contrôlé randomisé est considéré comme étant

Plus en détail

Indexation de sous-collections pour l amélioration de la haute précision

Indexation de sous-collections pour l amélioration de la haute précision Indexation de sous-collections pour l amélioration de la haute précision Joëlson Randriamparany *,** *IRIT, Institut de Recherche Informatique de Toulouse Université Paul Sabatier Toulouse III 118 Route

Plus en détail

Calculatrice vocale basée sur les SVM

Calculatrice vocale basée sur les SVM Calculatrice vocale basée sur les SVM Zaïz Fouzi *, Djeffal Abdelhamid *, Babahenini MohamedChaouki*, Taleb Ahmed Abdelmalik**, * Laboratoire LESIA, Département d Informatique, Université Mohamed Kheider

Plus en détail

PRÉSENTATION TRAVAIL EN COURS - APPRENTISSAGE INTERACTIF. Ianis Lallemand, 21 janvier 2013

PRÉSENTATION TRAVAIL EN COURS - APPRENTISSAGE INTERACTIF. Ianis Lallemand, 21 janvier 2013 PRÉSENTATION TRAVAIL EN COURS - APPRENTISSAGE INTERACTIF Ianis Lallemand, 21 janvier 2013 APPRENTISSAGE INTERACTIF definition Contours encore assez flous dans le champ de l apprentissage automatique. Néanmoins,

Plus en détail

Utilisation des procédures SAS dans l enseignement des sondages

Utilisation des procédures SAS dans l enseignement des sondages Utilisation des procédures SAS dans l enseignement des sondages Yves Aragon Anne Ruiz-Gazen e-mail: aragon@cict.fr, ruiz@cict.fr 1. Introduction Depuis la version 8, SAS [6] propose trois procédures pour

Plus en détail

Bases du traitement des images. Détection de contours. Nicolas Thome. 19 octobre 2009. Plan Modélisation Filtrage Approches continues Post-Traitements

Bases du traitement des images. Détection de contours. Nicolas Thome. 19 octobre 2009. Plan Modélisation Filtrage Approches continues Post-Traitements Détection de contours Nicolas Thome 19 octobre 2009 1 / 61 Introduction Rôle primordial de la détection de contours en vision 1 Réduction d'information Information de toute l'image résumée dans le contours

Plus en détail

Vision industrielle Dispositif optique

Vision industrielle Dispositif optique Vision industrielle Dispositif optique Plan du cours L objectif La focale L ouverture La mise au point Qualité d image Choix de l objectif Cours de Vision Industrielle Nicolas Vandenbroucke 2 Constitution

Plus en détail

Aide à la gestion des processus de numérisation en vue de l OCRisation des ouvrages

Aide à la gestion des processus de numérisation en vue de l OCRisation des ouvrages Aide à la gestion des processus de numérisation en vue de l OCRisation des ouvrages Ahmed Ben Salah LITIS Laboratoire d informatique, du traitement de l information et des systèmes Bibliothèque nationale

Plus en détail

IMN459 - Fondements de la vision par ordinateur

IMN459 - Fondements de la vision par ordinateur IMN459 - Fondements de la vision par ordinateur Chapitre 1 Introduction 1. Acquisition IMN117 2. Traitement IMN259 Scène 3D Caméra optique Une ou plusieurs images 2D Caractéristiques bas niveaux (contours,

Plus en détail

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies Régis Boulet Charlie Demené Alexis Guyot Balthazar Neveu Guillaume Tartavel Sommaire Sommaire... 1 Structure

Plus en détail

Discrétisation et génération de hiérarchies de concepts

Discrétisation et génération de hiérarchies de concepts Prétraitement des données 1 Pourquoi prétraiter les données? Nettoyage des données Intégration et transformation Réduction des données Discrétisation et génération de hiérarchies de g concepts Pourquoi

Plus en détail

Etude expérimentale des modes d onde de surface piégés

Etude expérimentale des modes d onde de surface piégés Etude expérimentale des modes d onde de surface piégés P. J. COBELLI a, P. PETITJEANS a, A. MAUREL b, V. PAGNEUX b,c a. Laboratoire de Physique et Mécanique des Milieux Hétérogènes, UMR CNRS 7636 Ecole

Plus en détail

Vision par ordinateur : Un tour d horizon. Adrien Bartoli LASMEA CNRS/UBP Clermont-Ferrand

Vision par ordinateur : Un tour d horizon. Adrien Bartoli LASMEA CNRS/UBP Clermont-Ferrand Vision par ordinateur : Un tour d horizon Adrien Bartoli LASMEA CNRS/UBP Clermont-Ferrand Séance II : Panoramas en environnement déformable Panoramas en environnement rigide Représentation minimale d un

Plus en détail

Statistique en grande dimension pour la génomique Projets 2014-2015 L. Jacob, F. Picard, N. Pustelnik, V. Viallon

Statistique en grande dimension pour la génomique Projets 2014-2015 L. Jacob, F. Picard, N. Pustelnik, V. Viallon Statistique en grande dimension pour la génomique Projets 2014-2015 L. Jacob, F. Picard, N. Pustelnik, V. Viallon Table des matières 1 Graph Kernels for Molecular Structure-Activity Relationship Analysis

Plus en détail

Comparaison d images binaires reposant sur une mesure locale des dissimilarités Application à la classification

Comparaison d images binaires reposant sur une mesure locale des dissimilarités Application à la classification 1/54 Comparaison d images binaires reposant sur une mesure locale des dissimilarités Application à la classification Étienne Baudrier CReSTIC vendredi 9 décembre 2005 2/54 Contexte programme national de

Plus en détail

Laboratoire 4 Développement d un système intelligent

Laboratoire 4 Développement d un système intelligent DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI LOG770 - SYSTÈMES INTELLIGENTS ÉTÉ 2012 Laboratoire 4 Développement d un système intelligent 1 Introduction Ce quatrième et dernier laboratoire porte sur le développement

Plus en détail

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007 Vision industrielle et télédétection - Détection d ellipses Guillaume Martinez 17 décembre 2007 1 Table des matières 1 Le projet 3 1.1 Objectif................................ 3 1.2 Les choix techniques.........................

Plus en détail

Systèmes de représentation multi-échelles pour l indexation et la restauration d archives médiévales couleur

Systèmes de représentation multi-échelles pour l indexation et la restauration d archives médiévales couleur 18/12/2003 p.1/50 Systèmes de représentation multi-échelles pour l indexation et la restauration d archives médiévales couleur Julien DOMBRE Laboratoire IRCOM-SIC, UMR-CNRS 6615. En partenariat avec le

Plus en détail

MATHÉMATIQUES CYCLE TERMINAL DE LA SÉRIE ÉCONOMIQUE ET SOCIALE ET DE LA SÉRIE LITTERAIRE CLASSE DE PREMIÈRE

MATHÉMATIQUES CYCLE TERMINAL DE LA SÉRIE ÉCONOMIQUE ET SOCIALE ET DE LA SÉRIE LITTERAIRE CLASSE DE PREMIÈRE Annexe MATHÉMATIQUES CYCLE TERMINAL DE LA SÉRIE ÉCONOMIQUE ET SOCIALE ET DE LA SÉRIE LITTERAIRE CLASSE DE PREMIÈRE L enseignement des mathématiques au collège et au lycée a pour but de donner à chaque

Plus en détail

Vectorisation du modèle d appariement pour la recherche d images par le contenu

Vectorisation du modèle d appariement pour la recherche d images par le contenu - Vectorisation du modèle d appariement pour la recherche d images par le contenu Hanen Karamti 1 MIRACL, Université de Sfax Route de Tunis Km 10 B.P. 242, 3021, Sfax, Tunisie karamti.hanen@gmail.com RÉSUMÉ.

Plus en détail

Optimisation de la géométrie du voisinage pour la segmentation d images texturées

Optimisation de la géométrie du voisinage pour la segmentation d images texturées Optimisation de la géométrie du voisinage pour la segmentation d images texturées Pierre Beauseroy & André Smolarz Institut des Sciences et Technologies de l Information de Troyes (FRE 73) Université de

Plus en détail

TATOUAGE D IMAGES PAR MODIFICATION DU CODE FRACTAL

TATOUAGE D IMAGES PAR MODIFICATION DU CODE FRACTAL TATOUAGE D IMAGES PAR MODIFICATION DU CODE FRACTAL Patrick Bas, Jean-Marc Chassery, Franck Davoine Laboratoire TIMC-IMAG, Institut Albert Bonniot, 38706 LA TRONCHE Cedex France, e-mail: Patrick.Bas, Jean-Marc.Chassery

Plus en détail

Extraction de règles d association pour la prédiction de valeurs manquantes

Extraction de règles d association pour la prédiction de valeurs manquantes Cari 2004 7/10/04 12:00 Page 487 Extraction de règles d association pour la prédiction de valeurs manquantes Sylvie Jami 1, Tao-Yan Jen 2, Dominique Laurent 3, George Loizou 1, Oumar Sy 3,4 1. Birkbeck

Plus en détail

«Vers une méthode rapide de l évaluation de la tendreté»

«Vers une méthode rapide de l évaluation de la tendreté» Matthieu ALRIC - matthieu.alric@adiv.fr Chargé d Etudes en Génie Mécanique et Robotique «Vers une méthode rapide de l évaluation de la tendreté» Développement d un système robotique équipé de capteurs

Plus en détail

Reconnaissance de visages 2.5D par fusion des indices de texture et de profondeur ICI 12/12/12

Reconnaissance de visages 2.5D par fusion des indices de texture et de profondeur ICI 12/12/12 Reconnaissance de visages 2.5D par fusion des indices de texture et de profondeur ICI 12/12/12 2 Discrimination Invariance Expressions faciales Age Pose Eclairage 11/12/2012 3 Personne Inconnue Identité

Plus en détail

Détecteurs et descripteurs

Détecteurs et descripteurs Détecteurs et descripteurs GIF-4105/7105 Photographie Algorithmique Jean-François Lalonde Merci à D. Hoiem et A. Efros pour les slides Comment aligner deux images? Déterminer une transformation globale

Plus en détail

RECONNAISSANCE DE LA MAIN POUR LES INTERFACES GESTUELLES

RECONNAISSANCE DE LA MAIN POUR LES INTERFACES GESTUELLES RECONNAISSANCE DE LA MAIN POUR LES INTERFACES GESTUELLES Sébastien Marcel Olivier Bernier Daniel Collobert France Telecom - CNET DTL / DLI / TNT 2 avenue Pierre Marzin 22307 Lannion FRANCE Les interfaces

Plus en détail

GVF (Gradient Vector Flow) et ses applications. Introduction au. Antonio Moreno Ingelmo. par

GVF (Gradient Vector Flow) et ses applications. Introduction au. Antonio Moreno Ingelmo. par Introduction au GVF (Gradient Vector Flow) et ses applications par Antonio Moreno Ingelmo Plan Introduction Les contours actifs Définition de GVF Force externe traditionnelle vs. GVF Limites du GVF Un

Plus en détail

Application de la logique floue à un modèle de recherche d information basé sur la proximité

Application de la logique floue à un modèle de recherche d information basé sur la proximité Application de la logique floue à un modèle de recherche d information basé sur la proximité Fuzzy set theory applied to a proximity model for information retrieval Michel BEIGBEDER 1 Annabelle MERCIER

Plus en détail

arxiv:1211.6851v1 [cs.lg] 29 Nov 2012

arxiv:1211.6851v1 [cs.lg] 29 Nov 2012 Classification Recouvrante Basée sur les Méthodes à Noyau arxiv:1211.6851v1 [cs.lg] 29 Nov 2012 Chiheb-Eddine Ben N Cir & Nadia Essoussi LARODEC,Institut Supérieur de Gestion de Tunis, Université de Tunis

Plus en détail

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories : La vision nous permet de percevoir et d interpreter le monde qui nous entoure. La vision artificielle a pour but de reproduire certaines fonctionnalités de la vision humaine au travers de l analyse d images.

Plus en détail

Le traitement numérique des images

Le traitement numérique des images Le traitement numérique des images Gabriel Peyré To cite this version: Gabriel Peyré. Le traitement numérique des images. Publication en ligne sur le site Images des Mathématiques, CNRS. 2011.

Plus en détail

Chapitre 1 Introduction

Chapitre 1 Introduction Chapitre 1 Introduction La réalité augmentée assistée par ordinateur est un domaine émergeant, qui progresse rapidement. Son principe est de mélanger le monde réel et le monde virtuel. De nombreuses applications

Plus en détail

Estimation du Quantile conditionnel par les Réseaux de neurones à fonction radiale de base

Estimation du Quantile conditionnel par les Réseaux de neurones à fonction radiale de base Estimation du Quantile conditionnel par les Réseaux de neurones à fonction radiale de base M.A. Knefati 1 & A. Oulidi 2 & P.Chauvet 1 & M. Delecroix 3 1 LUNAM Université, Université Catholique de l Ouest,

Plus en détail

Une extension pour RDF/RDFS utilisant des relations procédurales

Une extension pour RDF/RDFS utilisant des relations procédurales Une extension pour RDF/RDFS utilisant des relations procédurales Jean-François Baget * * INRIA Sophia-Antipolis & LIRMM(CNRS - UM2) LIRMM, 161 rue Ada, 34392 Montpellier Cedex 5 baget@lirmm.fr RÉSUMÉ.

Plus en détail

Testing : A Roadmap. Mary Jean Harrold. Présentation de Olivier Tissot

Testing : A Roadmap. Mary Jean Harrold. Présentation de Olivier Tissot Testing : A Roadmap Mary Jean Harrold Présentation de Olivier Tissot Testing : A Roadmap I. L auteur II. Introduction sur les test : les enjeux, la problématique III. Les tests : roadmap IV. Conclusion

Plus en détail

ENSEIRB-MATMECA PG-113 2014. TP6: Optimisation au sens des moindres carrés

ENSEIRB-MATMECA PG-113 2014. TP6: Optimisation au sens des moindres carrés ENSEIRB-MATMECA PG-113 014 TP6: Optimisation au sens des moindres carrés Le but de ce TP est d implémenter une technique de recalage d images qui utilise une méthode vue en cours d analyse numérique :

Plus en détail

Cartographie multirisques : une méthode semi-automatique

Cartographie multirisques : une méthode semi-automatique Cartographie multirisques : une méthode semi-automatique Yannick Manche Ingénieries EAT 1998 Risques naturels p 115 à 119 L étude des risques naturels est devenue une préoccupation majeure en France avec

Plus en détail

Traitement d images. Chapitre I Prétraitements

Traitement d images. Chapitre I Prétraitements Traitement d images Chapitre I Prétraitements 1 2 Introduction Les prétraitements d une image consiste à effectuer des opérations visant à : améliorer sa qualité visuelle restaurer l image en éliminant

Plus en détail

Apprentissage du filtre de Kalman couple avec application à la poursuite de l iris

Apprentissage du filtre de Kalman couple avec application à la poursuite de l iris Apprentissage du filtre de Kalman couple avec application à la poursuite de l iris Valérian Némesin, Stéphane Derrode, Institut Fresnel (UMR 7249) Ecole Centrale Marseille, Vidéo de l oeil 2 Sommaire 1.

Plus en détail

Regime Switching Model : une approche «pseudo» multivarie e

Regime Switching Model : une approche «pseudo» multivarie e Regime Switching Model : une approche «pseudo» multivarie e A. Zerrad 1, R&D, Nexialog Consulting, Juin 2015 azerrad@nexialog.com Les crises financières survenues dans les trente dernières années et les

Plus en détail

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU $SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU Fabien FIGUERES fabien.figueres@mpsa.com 0RWVFOpV : Krigeage, plans d expériences space-filling, points de validations, calibration moteur. 5pVXPp Dans le

Plus en détail

Rapport de ANRT. Hongliu CAO Salah GHAMIZI Matthias LLOYD. Candidat(s) Seul ou en équipe. Nom(s) et prénom(s)

Rapport de ANRT. Hongliu CAO Salah GHAMIZI Matthias LLOYD. Candidat(s) Seul ou en équipe. Nom(s) et prénom(s) Rapport de ANRT Candidat(s) Seul ou en équipe Nom(s) et prénom(s) Hongliu CAO Salah GHAMIZI Matthias LLOYD Résumé du projet... 1 Introduction... 2 1. Agrandir l'image... 3 2. Caculer le moyenne... 3 3.Détection

Plus en détail

Projet ESINSA 5 TRAITEMENT D IMAGE. Active Contours without Edges for Vector-Valued Images. Par Nicolas Brossier et Cyril Cassisa

Projet ESINSA 5 TRAITEMENT D IMAGE. Active Contours without Edges for Vector-Valued Images. Par Nicolas Brossier et Cyril Cassisa Projet ESINSA 5 TRAITEMENT D IMAGE Active Contours without Edges for Vector-Valued Images Par Nicolas Brossier et Cyril Cassisa Page 1 sur 14 Abstract Pour ce projet, nous implémentons un algorithme de

Plus en détail

Calibration de systèmes de levé mobiles

Calibration de systèmes de levé mobiles 1/30 Calibration de systèmes de levé mobiles S. Levilly, N. Seube ENSTA Bretagne Brest, FRANCE et CIDCO Rimouski Qc, CANADA Journées AFHy, Juin 2014 Les systèmes mobiles Ils sont généralement constitués

Plus en détail

Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons

Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons Ahmad OSMAN 1a, Valérie KAFTANDJIAN b, Ulf HASSLER a a Fraunhofer Development Center

Plus en détail

Principe de symétrisation pour la construction d un test adaptatif

Principe de symétrisation pour la construction d un test adaptatif Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université

Plus en détail

Parcours Ingénieur Polytech. Mini-projets. Banque d images. Auteur : Encadrant : Jonathan Courtois

Parcours Ingénieur Polytech. Mini-projets. Banque d images. Auteur : Encadrant : Jonathan Courtois École Polytechnique de l Université de Tours 64, Avenue Jean Portalis 37200 TOURS, FRANCE Tél. (33)2-47-36-14-14 Fax (33)2-47-36-14-22 www.polytech.univ-tours.fr Parcours Ingénieur Polytech Mini-projets

Plus en détail

À PROPOS D IMAGES : Fiche professeur

À PROPOS D IMAGES : Fiche professeur À PROPOS D IMAGES : Fiche professeur Damier Assiette Danseuse Eventail Danseuse 1 FICHE ÉLÈVE (1) Que devient une image lorsqu on la grossit? Ouvrir (par exemple avec l application «Aperçu»), les deux

Plus en détail

Compression des images hyperspectrales et son impact sur la qualité des données

Compression des images hyperspectrales et son impact sur la qualité des données Hyperspectral QI Compression Flexibilité Conclusion Compression des images hyperspectrales et son impact sur la qualité des données Emmanuel CHRISTOPHE Corinne Mailhes, Co-directrice de thèse, TéSA/IRIT

Plus en détail

Programme de Première

Programme de Première BAC TECHNO STAV 66 I. Algèbre Programme de Première Objectif 1 - Effectuer de manière autonome des calculs numériques ou algébriques, résoudre des équations ou inéquations en vue de résoudre des problèmes

Plus en détail

Eclairage structuré et vision active pour le contrôle qualité de surfaces métalliques réfléchissantes

Eclairage structuré et vision active pour le contrôle qualité de surfaces métalliques réfléchissantes Eclairage structuré et vision active pour le contrôle qualité de surfaces métalliques réfléchissantes Olivier Morel, Ralph Seulin, Christophe Stolz, Patrick Gorria Laboratoire Le2i - UMR CNRS 5158 IUT

Plus en détail

Acquisition terminologique pour identifier les mots clés d articles scientifiques

Acquisition terminologique pour identifier les mots clés d articles scientifiques Actes du huitième défi fouille de texte, DEFT2012, Grenoble, France, 8 juin 2012. Pages 29-35. Proceedings of the Eight DEFT Workshop, DEFT2012, Grenoble, France, 8th July 2012. Pages 29-35. Acquisition

Plus en détail

Chapitre 3 RÉGRESSION ET CORRÉLATION

Chapitre 3 RÉGRESSION ET CORRÉLATION Statistique appliquée à la gestion et au marketing http://foucart.thierry.free.fr/statpc Chapitre 3 RÉGRESSION ET CORRÉLATION La corrélation est une notion couramment utilisée dans toutes les applications

Plus en détail

Travaux pratiques de traitement d images

Travaux pratiques de traitement d images Travaux pratiques de traitement d images EI3 année 2009-2010 TP n 1 : Segmentation d images en régions p. 3 TP n 2 : Reconnaissance des formes p. 15 Vandenbroucke Nicolas R11 TP n 1 Segmentation d images

Plus en détail

Vérification du bâti à partir de la disparité de points de contour

Vérification du bâti à partir de la disparité de points de contour Vérification du bâti à partir de la disparité de points de contour Charles Beumier Signal and Image Centre (Prof. Marc Acheroy) Ecole royale militaire Bruxelles, Belgique 8 Jan 29, Paris-Tech 1 Vérification

Plus en détail

Clustering par quantification en présence de censure

Clustering par quantification en présence de censure Clustering par quantification en présence de censure Svetlana Gribkova 1 Laboratoire de Statistique Théorique et Appliquée, Université Pierre et Marie Curie Paris 6, 4 place Jussieu, 75005 Paris Résumé.

Plus en détail

TEST DE MONTE CARLO DE DETECTION DE MODIFICATIONS CLIMATIQUES

TEST DE MONTE CARLO DE DETECTION DE MODIFICATIONS CLIMATIQUES TEST DE MONTE CARLO DE DETECTION DE MODIFICATIONS CLIMATIQUES Jean-Cléophas ONDO (*) (*) Institut Sous-régional de Statistique et d Economie Appliquée (ISSEA) Résumé Les procédures couramment utilisées

Plus en détail

Analyse d images, vision par ordinateur. Partie 6: Segmentation d images. Segmentation? Segmentation?

Analyse d images, vision par ordinateur. Partie 6: Segmentation d images. Segmentation? Segmentation? Analyse d images, vision par ordinateur Traitement d images Segmentation : partitionner l image en ses différentes parties. Reconnaissance : étiqueter les différentes parties Partie 6: Segmentation d images

Plus en détail

Audition candidature thèse IFSTTAR début Septembre 2013 Christophe CONIGLIO

Audition candidature thèse IFSTTAR début Septembre 2013 Christophe CONIGLIO Sujet de thèse : «Détection, suivi et ré-identification de passagers dans un réseau de cameras. Application à la gestion des flux de voyageurs en contexte multimodal». Audition candidature thèse IFSTTAR

Plus en détail

Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6

Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6 Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6 Ludovic Denoyer 21 septembre 2015 Ludovic Denoyer () FDMS 21 septembre 2015 1 / 1 Contexte Observation La plupart des bonnes

Plus en détail

Open Bee TM e-fact PRO

Open Bee TM e-fact PRO Open Bee TM e-fact PRO SOLUTION GLOBALE D AUTOMATISATION DU TRAITEMENT DES FACTURES FOURNISSEURS 80 % des factures fournisseurs sont encore actuellement reçues au format papier. 13,8 est le coût moyen

Plus en détail

Opérations de base sur ImageJ

Opérations de base sur ImageJ Opérations de base sur ImageJ TPs d hydrodynamique de l ESPCI, J. Bico, M. Reyssat, M. Fermigier ImageJ est un logiciel libre, qui fonctionne aussi bien sous plate-forme Windows, Mac ou Linux. Initialement

Plus en détail

largeur x hauteur en pixels, par exemple 640 x 480 ou 1920 x 1080

largeur x hauteur en pixels, par exemple 640 x 480 ou 1920 x 1080 Capteurs Cours #1 : Capteurs 2D CCD Par : Bernard Besserer Terminologie Dimensions / Taille de l image largeur x hauteur en pixels, par exemple 640 x 480 ou 1920 x 1080 Résolution points par pouce (dpi

Plus en détail

Vers la conception interactive d une hiérarchie sémantique de descripteurs d images

Vers la conception interactive d une hiérarchie sémantique de descripteurs d images PROPOSITION DE STAGE Année 2016 Laboratoire L3i Sujet de stage : Vers la conception interactive d une hiérarchie sémantique de descripteurs d images Résumé du travail proposé : Ce travail s intéresse à

Plus en détail

Gel Documentation DRAGONFLY 140. Présentation :

Gel Documentation DRAGONFLY 140. Présentation : Gel Documentation DRAGONFLY 140 Présentation : Notre imageur DRAGONFLY 140 est un système unique et autonome de gel documentation d une extrème convivialité, d un maniement et d un entretien simple. DRAGONFLY

Plus en détail

Corrections chromatiques de l image

Corrections chromatiques de l image Corrections chromatiques de l image 1. Réglages en amont 2. Utilisation d un histogramme et de la palette infos 3. Réglage du point blanc - point noir 4. Réglage du gamma, correction tonale Pour quadri

Plus en détail

SERVICE DE PHOTOGRAMMETRIE EN LIGNE

SERVICE DE PHOTOGRAMMETRIE EN LIGNE 1 SERVICE DE PHOTOGRAMMETRIE EN LIGNE Principes et fonctions Introduction p.2 Avantages du service p.3 Le matériel de base p.4 Prise de vue d un planum p.5 Le relevé d un planum p.6 Le relevé de façades

Plus en détail

Informatique visuelle - Vision par ordinateur. Pré-traitement d images

Informatique visuelle - Vision par ordinateur. Pré-traitement d images Informatique visuelle - Vision par ordinateur Pré-traitement d images Elise Arnaud elise.arnaud@imag.fr cours inspiré par X. Descombes, J. Ros, A. Boucher, A. Manzanera, E. Boyer, M Black, V. Gouet-Brunet

Plus en détail

Outils Mathématiques pour l informatique

Outils Mathématiques pour l informatique Outils Math. pour l info. - Licence 3 - IEM - Année 2015/2016 Université de Bourgogne Labo. Le2i, UMR-CNRS 5158 http://jl.baril.u-bourgogne.fr September 10, 2015 Cours outils Math. pour l info. - Licence

Plus en détail

SONDY : une plateforme open-source d analyse et de fouille pour les réseaux sociaux en ligne

SONDY : une plateforme open-source d analyse et de fouille pour les réseaux sociaux en ligne SONDY : une plateforme open-source d analyse et de fouille pour les réseaux sociaux en ligne Adrien GUILLE, C. Favre, Djamel Abdelkader Zighed To cite this version: Adrien GUILLE, C. Favre, Djamel Abdelkader

Plus en détail

Une méthode d apprentissage pour la composition de services web

Une méthode d apprentissage pour la composition de services web Une méthode d apprentissage pour la composition de services web Soufiene Lajmi * Chirine Ghedira ** Khaled Ghedira * * Laboratoire SOIE (ENSI) University of Manouba, Manouba 2010, Tunisia Soufiene.lajmi@ensi.rnu.tn,

Plus en détail

Comment optimiser l utilisation des ressources Cloud et de virtualisation, aujourd hui et demain?

Comment optimiser l utilisation des ressources Cloud et de virtualisation, aujourd hui et demain? DOSSIER SOLUTION Solution CA Virtual Placement and Balancing Comment optimiser l utilisation des ressources Cloud et de virtualisation, aujourd hui et demain? agility made possible La solution automatisée

Plus en détail