Normalisation et validation d images de documents capturées en mobilité

Dimension: px
Commencer à balayer dès la page:

Download "Normalisation et validation d images de documents capturées en mobilité"

Transcription

1 Normalisation et validation d images de documents capturées en mobilité Marçal Rusiñol * Joseph Chazalon Jean-Marc Ogier Laboratoire L3i, Université de La Rochelle Avenue Michel Crépeau, La Rochelle Cédex 1, France * Computer Vision Center, Dept. Ciències de la Computació Edifici O, Universitat Autònoma de Barcelona, Bellaterra (Barcelona), Spain RÉSUMÉ. La numérisation de documents à l aide des smartphones introduit un nombre important de dégradations qui doivent être corrigées ou détectées sur le mobile, avant l envoi de données sur un réseau payant ou la perte de disponibilité du document. Dans cet article, nous proposons un système permettant de corriger les problèmes de perspective et d illumination avant d estimer la netteté de l image pour un traitement OCR. L étape corrective repose sur une détection des contours, suivie d une normalisation de l illumination. Son évaluation sur un jeu de données privé montre une amélioration franche des résultats OCR. L étape de contrôle repose sur une combinaison de mesures de focus. Son évaluation sur un jeu de données public montre que cette approche simple donne des performances comparables à celles des meilleures méthodes basées sur des traitements lourds, et surpasse les méthodes basées sur des métriques. ABSTRACT. Mobile document image acquisition integrates many distortions which must be corrected or detected on the device, before the document becomes unavailable or paying data transmission fees. In this paper, we propose a system to correct perspective and illumination issues, and estimate the sharpness of the image for OCR recognition. The correction step relies on fast and accurate border detection followed by illumination normalization. Its evaluation on a private dataset shows a clear improvement on OCR accuracy. The quality assessment step relies on a combination of focus measures. Its evaluation on a public dataset shows that this simple method compares well to state of the art, learning-based methods which cannot be embedded on a mobile, and outperforms metric-based methods. MOTS-CLÉS : acquisition d image de document avec mobile ; correction de perspective ; correction d illumination ; estimation de qualité ; mesure de focus ; prédiction de la fiabilité OCR KEYWORDS: mobile document image acquisition; perspective correction; illumination correction; quality assessment; focus measure; OCR accuracy prediction CIFED 2014, pp , Nancy, mars 2014

2 110 M. Rusiñol, J. Chazalon, J.-M. Ogier 1. Introduction L acquisition d images de documents avec des périphériques mobiles, les smartphones en particulier, est devenu un point d entrée essentiel dans les chaînes de traitement documentaires industrielles. Malgré l attrait évident de la numérisation à la volée et le transfert quasi instantané des images de documents, trois défis majeurs restent à surmonter pour libérer le potentiel de la capture mobile d images de documents. Les distorsions de numérisation sont, dans le cas d images de documents capturées avec un dispositif mobile, la principale cause de perturbation du signal de l image. Parmi les distorsions les plus courantes, le flou provoqué par un mauvais focus est particulièrement délicat. Il modifie sérieusement la lisibilité, à la fois pour les humains et les systèmes OCR, et l utilisateur a peu de contrôle sur lui car il est lié au comportement interne de l appareil, contrairement au flou de mouvement, à la distorsion de perspective ou aux conditions d éclairage. Pour éviter de mauvaises performances dans le traitement des documents, la lisibilité d une image de document capturée avec un mobile doit donc être optimisée et contrôlée le plus tôt possible dans le processus. Les frais de communication des réseaux mobiles imposent une sélection rigoureuse sur les images à transférer. Par conséquent, le contrôle de la lisibilité doit être effectué sur le dispositif mobile, avant l envoi de données. La mobilité change la façon dont les utilisateurs capturent les documents : l opportunité de numériser un document peut être temporaire. Tout contrôle sur les images capturées doit donc être effectué pendant ou juste après la capture, pour éviter de manquer l occasion d une autre capture. Il est alors nécessaire de viser un contrôle aussi rapide que possible, en temps réel idéalement, pour débloquer progressivement différents niveaux d assistance à la capture tels que : 1) la notification à l utilisateur d une mauvaise capture, ainsi que l - explication de cette évaluation ; 2) le déclenchement automatique de la capture lorsque les conditions de capture sont optimales ; 3) le guidage de l utilisateur lors de la capture à l aide d indications précises telles que «rapprochez l appareil du document», ou «l éclairage est trop faible», comme suggéré dans (Chen et al., 2013a). Dans cet article, nous présentons un prototype de système d acquisition d images de documents destinés à un traitement OCR. Ce système permet la productions d images où les distorsions liées à la perspective, à l éclairage et au flou sont maîtrisées. Une première étape corrective, présentée en section 2, permet de corriger la perspective de l image et son illumination afin d optimiser de la qualité de l image avant l évaluation de cette dernière. Les résultats en terme de performance OCR montrent le gain apporté par cette étape. Une seconde étape de contrôle, présentée en section 3, permet prédire la fiabilité attendue d un système OCR à l aide d une analyse du focus de l image et donc, indirectement, des conditions de capture (on fait l hypothèse que la qualité intrinsèque du document est suffisante). La technique proposée dans cette étape se base sur évaluation de mesures de focus jamais testées (à notre connaissance) sur des images de documents. Elle présente des performances comparables aux

3 Normalisation et validation d images de documents capturées en mobilité 111 meilleures techniques basées sur des algorithmes lourds, tout en étant rapide et simple à calculer. 2. Correction de la perspective et de l illumination Les images de documents capturées avec un dispositif mobile contiennent, en plus d une région représentant la page, une portion du fonds. De plus, si le dispositif de capture n est pas orthogonal au plan de la page, une déformation liée à la perspective sera visible. Ces deux perturbations peuvent dégrader très sérieusement la performance d un système OCR. Par ailleurs, l éclairage de la scène peut être affecté par l utilisation d un illuminant «non standard» qui provoquera, après une capture avec un mobile, des teintes bleuâtres ou verdâtres à la place de la teinte blanche attendue du papier. Ce changement dans l espace de couleur peut, lui aussi, avoir un effet négatif sur la performance des systèmes OCR conçus pour traiter des images numérisées à l aide de scanners avec lesquels ces artéfacts sont négligeables. Cette section présente les deux solutions proposées afin de faire face à ces défauts de perspective et d illumination Correction de la perspective Depuis quelques années, on peut trouver dans la littérature un bon nombre de publications qui traitent de la segmentation des pages acquises avec des dispositifs mobiles et de la correction des effets de perspective, comme par exemple (Clark et Mirmehdi, 2001 ; Lu et al., 2005 ; Jagannathan et Jawahar, 2005 ; Rodríguez-Piñeiro et al., 2011). La plupart de ces travaux visent soit à détecter les points de fuite horizontaux et verticaux en se basant sur les lignes horizontales du texte et les éléments verticaux des glyphes du texte, soit à détecter les quatre coins de la page pour essayer ensuite de transformer le quadrilatère trouvé en un rectangle parfait. Puisque la numérisation de pages A4 complètes est un scénario courant, nous avons décidé d attaquer le problème en essayant d extraire la page (supposée complète) en détectant ses bords et ses quatre coins. Pour détecter les bords de la page, on utilise un détecteur de contours classique comme la méthode de Canny. Au préalable, on traite l image avec un filtre médian, avec un élément structurant assez large afin d éliminer le texte imprimé et ne conserver que le fond. La figure 1 illustre ce processus. Une fois la détection des contours de la page réalisée, on procède à la détection de ses quatre coins. Au lieu d utiliser directement un détecteur de coins comme celui de Harris, nous cherchons d abord à identifier les bords de la page à l aide la transformée de Hough (Ballard, 1981). Ceci a l avantage de permettre une détection des coins même lorsque ceux-ci ne sont pas visibles dans l image, dès lors qu une partie de chacun des quatre bords est présente dans l image.

4 112 M. Rusiñol, J. Chazalon, J.-M. Ogier a) b) c) Figure 1. Exemple d extraction des contours. a) Image originale, b) image traitée avec le filtre médian, c) image des contours détectés par la méthode de Canny. Lors de la sélection des paramètresρetθ de la transformée de Hough, il faut tenir compte de l influence du facteur de quantification dans l espace de vote : une quantification grossière aura tendance à provoquer davantage d erreurs dans la détection des lignes, tandis qu en diminuant la taille des bins on fait progressivement apparaître plusieurs lignes candidates pour une même zone de l image. Dans notre cas, on favorise la sur-segmentation des lignes. Une fois ces lignes détectées, on les analyse deux à deux pour calculer l angle qu elles forment entre elles. Si l angle entre deux lignes est extrêmement aigu ou grave, on écarte cette paire qui correspond à des lignes presque parallèles qui se croisent. Dans tous les autres cas, on génère l ensemble des points d intersection pour former les candidats à la représentation de chacun des quatre coins de la page. Le résultat de ce processus d extraction de lignes est illustré par la figure 2. Une fois l ensemble des points candidats identifiés, il faut commencer par les affecter à un quadrant de la page, afin de déterminer s il s agit d un candidat pour le coin haut gauche, haut droit, etc. Il suffit pour cela de calculer les coordonnées du centre de gravité du nuage de points candidats pour ensuite changer de repère et identifier le cadran de chaque point. Pour chacun de ces points, suivant leur cadran, on construit des couples associant leurs coordonnées dans l image d origine et celles dans l image cible : par exemple, si on cherche à numériser des pages A4 à 300 dpi, tous les points correspondant au quadrant haut gauche auraient comme point modèle le ; ceux du quadrant haut droit auraient le point ; et ainsi de suite. Finalement, on applique la méthode de RANSAC (Fischler et Bolles, 1981) aux couples ainsi formés afin de trouver la transformation à appliquer à l image acquise pour rectifier l effet de perspective, tout en éliminant les aberrations liées aux points détectés par erreur et ne correspondant à aucun coin. La figure 3 illustre quelques exemples de corrections de perspective à laquelle notre méthode aboutit.

5 Normalisation et validation d images de documents capturées en mobilité 113 a) b) c) Figure 2. Détection des bords et de coins de la page avec la transformée de Hough. a) Image originale, b) image des contours, c) lignes et croisements détectés. Figure 3. Exemples d images acquises avec un dispositif mobile avec des effets de perspective en haut, et les corrections correspondantes en bas Correction de l illumination Afin de corriger l illumination de l image, on adapte la méthode classique dite du monde gris (gray world assumption) au domaine de la numérisation de documents. Notre hypothèse de base est que le document à numériser consiste en une page idéalement blanche sur laquelle est imprimé un texte noir. Dans l algorithme original du monde gris, la couleur grise moyenne est calculée en prenant la moyenne de la valeur moyenne de chaque composante couleur. La valeur de chaque composante de l image est ensuite multipliée par la valeur de couleur grise

6 114 M. Rusiñol, J. Chazalon, J.-M. Ogier Image Image acquise Correction Correction scannée avec mobile perspective illumination Taux OCR 96.2% 66.29% 94.62% 95.23% Tableau 1. Taux de précision de l OCR en fonction du traitement. moyenne divisée par l intensité de cette composante de couleur. Ceci empêche une composante de contribuer beaucoup plus à l image qu une autre. Dans notre cas, au lieu d appliquer une translation de chaque composante couleur vers le gris moyen, on propose de réaliser cette translation vers une intensitéldonnée. On calculera donc le nouveau triplet(r,g,b ) à partir de R = R l R, G = G l Ḡ, B = B l B. Dans un second temps, on procède à un étirement de l histogramme de luminance de l image pour garantir que les valeurs les plus claires de l image sont bien représentées par un blanc pur, et que les valeurs les plus sombres correspondent bien à un noir parfait. Il faut commencer par convertir l image depuis l espace RGB vers un espace possédant une composante de luminance : Lab, LCH, LSV, etc. Ensuite, on applique une méthode d augmentation de contraste seulement dans le canal de luminance avec deux seuils de coupure pour les valeurs basses et hautes, respectivement l et h. L image est finalement retransformée à l espace RGB. En portant les paramètres l et h à la limite, on obtient des images qui semblent binaires, bien qu elles soient représentées dans un espace RGB. La figure 4 donne quelques exemples de résultats de cette méthode Résultats : effets des corrections sur la performance de l OCR Pour évaluer l effet des corrections proposées sur la performance d outils OCR, nous avons réalisé 35 captures d une même page, à l aide d un smartphone, avec plusieurs degrés de perspective et sous différentes illuminations. Pour disposer d une référence, nous avons également scanné cette page, et nous disposons de la vérité terrain pour le texte. Pour cette expérience, nous avons utilisé l OCR commercial AB- BYY FineReader. On peut apprécier, dans le tableau 1, l impact des corrections proposées sur le comportement de l OCR. FineReader montre en effet de faible performance pour les images acquises avec le smartphone qui présentent des déformations de perspective. Dans la plupart des cas, les erreurs sont dues à un échec de l étape de segmentation de la page ; les zones de texte étant considérées comme des images. Cependant, après correction de la perspective, on constate un fort gain en précision. Finalement, la cor-

7 Normalisation et validation d images de documents capturées en mobilité 115 Figure 4. Correction de l illumination des images. Pour chaque image, la vignette du haut est la version après correction de perspective, et celle du bas la version après correction de l illumination. rection de l illumination aide également FineReader et permet d obtenir des résultats très proches de ceux obtenus à partir de la version scannée du document. 3. Estimation de la qualité Dans cette section, nous décrivons la méthode d estimation de qualité (dans un objectif de traitement OCR) que nous proposons d appliquer aux images de documents capturées à l aide d un téléphone mobile, ainsi que les évaluations que nous avons réalisées. Cette méthode garantie que l image produite dispose d une netteté suffisante, et limite donc le risque de flou de focus délicat à maîtriser par l utilisateur. Cette estimation de la qualité a lieu, dans le scénario que nous considérons, après le pré-traitement de l image pour ne conserver que la partie concernant la page de document, où la perspective et l illumination ont été corrigées. Cette étape fait alors

8 116 M. Rusiñol, J. Chazalon, J.-M. Ogier office de barrière avant l envoi (souvent via un réseau payant) des images vers un service centralisé. Notons que si, dans sa version actuelle, notre méthode d estimation de la qualité intervient après la capture, il est possible d imaginer un fonctionnement plus interactif où des conseils pour l amélioration de la prise de vue pourraient être fournis une fois l image capturée, voire même pendant la capture comme proposé par (Chen et al., 2013b). Si le temps de traitement est suffisamment court, ce qui est ici une condition indispensable, il pourrait même être possible, à terme, de déclencher automatiquement la capture lorsqu un optimum est détecté dans la configuration de prise de vue. Il s agit donc d une estimation de qualité s intéressant spécifiquement aux conditions de capture, et non à la qualité intrinsèque d un document pour laquelle d autres méthodes existent depuis un certain temps à présent (Gonzalez et al., 1998). L estimation de la qualité d images de documents peut-être entendu de différentes façons, selon qu on dispose ou non d une référence pour comparaison. (Ye et Doermann, 2013) proposent ainsi de distinguer trois formes. Estimation de qualité avec référence complète Cette méthode est possible lorsque l image de référence est disponible, par exemple lors du contrôle du résultat d une compression. Estimation de qualité avec référence partielle Cette méthode repose sur la présence de marqueurs ou de mires de calibration, par exemple, dans l image capturée qui permet d estimer précisément les paramètres de la capture. Estimation de qualité sans référence Ce cas plus général est celui où la qualité de l image doit être estimée «à l aveugle», en se basant sur une connaissance à priori des propriétés attendues de l image. Dans notre cas, la capture d un document inconnu impose une estimation de qualité sans référence, afin de prédire le niveau de fiabilité d un système OCR État de l art Comme montré par (Ye et Doermann, 2013), peu de travaux ont été menés sur la prédiction du niveau de fiabilité des systèmes OCR pour des images de documents capturées avec appareil photo, caméras ou encore smartphones. La gestion spécifique du flou du focus n a fait l objet que de quelques études à notre connaissance. Une étude récente menée par (Kumar et al., 2013) compare les résultats de différentes méthodes à l aide d un jeu d images de documents spécifique. Le jeu de test utilisé par ces auteurs comporte, pour 25 documents différents, une série de captures faisant varier la distance focale de l appareil, et ainsi le flou de focus. Cette base est accessible publiquement, et nous l avons utilisée pour l évaluation de notre méthode. Parmi les trois méthodes comparées par les précédents auteurs, la méthode COR- NIA présentée par (Ye et Doermann, 2012 ; Ye et al., 2012), présente les meilleurs résultats. Elle est cependant basée sur une représentation éparse et une sélection automatique des caractéristiques, imposant des apprentissages lourds et des traitements

9 Normalisation et validation d images de documents capturées en mobilité 117 coûteux difficilement intégrables dans des smartphones. Les méthodes Q (proposée par (Zhu et Milanfar, 2010) et basée sur une décomposition en valeurs singulières) et DoM (proposée par (Kumar et al., 2012) et basée sur une métrique plus simple à base de gradients) présentent quant à elles des résultats plus modestes. Il ressort de cette étude que les méthodes adaptées au traitements de documents inconnus sont actuellement soit trop lourde pour être intégrées dans les smartphones, soit trop peu performantes. Une autre méthode, ne figurant pas dans l évaluation précédente, a été proposée par (Peng et al., 2011). Bien que l information produite par cette approche, destinée à faciliter la prise de décision relative à l image courante, soit particulièrement intéressante, la méthode proposée se base sur des caractéristiques définies manuellement considérant la forme du contour des caractères, ainsi que des rapports hauteur-largeur pour les mots et caractères. Ce type de caractéristiques limite, selon nous, le champs d application de cette méthode à une classe de documents textuels bien connus, et ne semble pas adaptée au traitement de documents inconnus. Il est donc nécessaire de rechercher d autres méthodes basées sur des métriques simples et rapides à calculer permettant d estimer efficacement la netteté d une image de document inconnu sans être spécifique à une classe de contenu particulière. Des travaux dans cette direction existent dans d autres communautés scientifiques, en particulier pour la mise au point d algorithmes d auto-focus (travaillant en temps réel). (Pertuz et al., 2013) proposent ainsi une comparaison de 36 mesures de focus classées en 6 familles présentant un comportement homogène selon le type de perturbation considéré. Le comportement de ces mesures sur des images de documents n a, à notre connaissance, jamais été étudié. Par ailleurs, ces mesures étant généralement très rapides à calculer, nous avons souhaité étudier la possibilité de les combiner pour aboutir à une méthode globale restant rapide à calculer, mais permettant de compenser les défauts des méthodes isolées, et ainsi mieux modéliser l évolution de la fiabilité d un système OCR Mesures de focus étudiées Dans (Pertuz et al., 2013), les auteurs distinguent 6 familles de mesures de focus aux comportements homogènes. Famille des méthodes «à base de gradients» Abrégée GRA pour «gradientbased», cette famille estime la netteté des contours du contenu de l image grâce à une analyse des gradients de cette dernière. Famille des méthodes «à base de laplacien» Abrégée LAP pour «Laplacianbased», cette famille vise le même objectif que la précédente, mais en utilisant la dérivée seconde ou le laplacien de l image. Famille des méthodes «à base d ondelettes» Abrégée WAV pour «waveletbased», cette famille construit des indicateurs grâce à une transformée en ondelettes de l image.

10 118 M. Rusiñol, J. Chazalon, J.-M. Ogier Mesure Abrév. Mesure Abrév. Gaussian derivative GRA1 Ratio of wavelet coefficients WAV3 Gradient energy GRA2 Gray-level variance STA3 Thresholded absolute gradient GRA3 Gray-level local variance STA4 Squared gradient GRA4 Normalized gray-level variance STA5 Tenengrad GRA6 Histogram entropy STA7 Tenengrad variance GRA7 Histogram range STA8 Energy of Laplacian LAP1 Brenner s measure MIS2 Modified Laplacian LAP2 Image curvature MIS4 Diagonal Laplacian LAP3 Helmli and Scherer s mean MIS5 Variance of Laplacian LAP4 Steerable filters-based MIS7 Sum of wavelet coefficients WAV1 Spatial frequency measure MIS8 Variance of wavelet coefficients WAV2 Vollath s autocorrelation MIS9 Tableau 2. Noms et abréviations des 24 mesures de focus extraites de (Pertuz et al., 2013) pour lesquelles nous avons recherché la combinaison optimale. Famille des méthodes «à base de transformée en cosinus discrète» Abrégée DCT pour «discrete cosine transform-based», cette famille, à l instar de la précédente, utilise l espace de représentation induit par la transformée en cosinus discrète pour extraire des indicateurs. Famille des méthodes «à base d indicateurs statistiques» Abrégée STA pour «statistic-based», cette famille utilise des analyses statistiques (moments, variance, etc.) pour extraire des indicateurs. Famille des méthodes «diverses» Abrégée MISC pour «miscellaneous-based», cette famille regroupe les méthodes qui ne rentrent dans aucune des catégories précédentes. Parmi les 36 mesures proposées par ces auteurs, nous en avons sélectionné 24, indiquées dans le tableau 2, pour lesquelles le temps de calcul était raisonnable au regard de notre scénario. Cette sélection a notamment provoqué l élimination des méthodes à base de transformée en cosinus discrète, trop coûteuses Combinaison des mesures Parmi les mesures présentées précédemment, il est difficile de savoir à priori quelles sont celles qui présenteront la meilleure corrélation avec la mesure de la fiabilité de l OCR, tout comme il est délicat de choisir comment combiner ces mesures pour palier leurs défauts respectifs. Pour résoudre ce problème, nous avons testé toutes les combinaisons possibles de ces 24 mesures. Soit n = 24 et S = {FM 1,FM 2,...,FM n } l ensemble de toutes les mesures de focus FM appliquées à une image de test donnée. Nous avons évalué toutes les

11 Normalisation et validation d images de documents capturées en mobilité 119 combinaisonst possibles de cet ensemble. On notet m, oùm [1, n], tous les sousensembles possibles de mesures formés en choisissant m éléments de S. En particulier,tm j (avecj [ 1, ( n m)] ), dénote lej-ième sous-ensemble possédant exactement m éléments. Ces combinaisons représentent plus de 16 millions de configurations différentes. Une fois un sous-ensemble de mesures de focus à combiner choisi, un double problème se pose alors : 1) comment normaliser les mesures pour qu elles produisent des valeurs dans un domaine cohérent ; et 2) comment fusionner ces valeurs pour produire un résultat unique Méthodes de normalisation Comme noté par (Kittler et al., 1998), il est nécessaire de normaliser les mesures pour que les domaines de valeurs de ces dernières soient comparables. Nous avons utilisé des techniques usuelles, présentées ci-après, dans nos expérimentations. Pour un ensemble de mesurest j m, nous notonst j m leur variante normalisée. Min-max Cette technique applique un facture de mise à l échelle et transforme la mesure pour qu elle renvoie des valeurs dans le domaine[0,1]. Soientmin(T j m) etmax(t j m) les minimum et maximum, respectivement, des scores. Tm j T j = m min(tm) j max(tm) min(t j m) j Cette méthode est très sensible aux points aberrants dans les données. Z-score Cette technique est une des plus couramment utilisées. Elle utilise la moyenne arithmétiqueµet l écart-typeσ des données considérées. Tm j T j = m µ σ L utilisation de la moyenne arithmétique et de l écart-type rend également cette méthode sensible aux points aberrants. Tanh Cette technique robuste et efficace est elle aussi basée sur la moyenne arithmétique et l écart-type. { [ Tm j 1 = tanh ( T j m µ σ )] } +1 MAD Les écarts médians et médians absolus utilisés par cette méthode sont insensibles aux points aberrants et aux extremums de la distribution. T j m = T j m median(t j m) median( T j m median(t j m) )

12 120 M. Rusiñol, J. Chazalon, J.-M. Ogier Stratégies de fusion Après la normalisation des valeurs renvoyées par chacune des mesures de focus, plusieurs stratégies de fusion des mesures normalisée contenues dans un sousensemble Tm j : il est possible de choisir le minimum, le maximum, la somme, le produit, la moyenne ou encore la médiane de ces valeurs. Plus formellement, on définit les stratégies de fusion suivantes : ( ) ( ) combmax = max Tm j, combmin = min Tm j, ( m) n ( ) combsum = Tm j, combprod = j=1 combavg = mean ( m) n j=1 ( T j m ), ( ) ( ) Tm j, combmed = median Tm j. Notre choix d utiliser, dans un premier temps, ces techniques de fusion au lieu de techniques de régression se justifie par la nécessité, dans l application finale, de privilégier la détection et le refus de mauvaises captures à une prédiction exacte de la qualité des résultats OCR. Une combinaison linéaire aurait pour effet de rendre certaines mesures plus importantes que les autres, et notre approche vise au contraire à permettre de tirer profit des «doutes» de chacune des mesures. Les résultats expérimentaux présentés ci-après indiquent les performances obtenues pour chaque méthode de normalisation et chaque stratégie de fusion Validation expérimentale Nous avons utilisé la base publique proposée par (Kumar et al., 2013) pour évaluer notre approche, et la comparer à celles évaluées dans cet article. Cette base comporte 175 images qui représentent les différentes captures (entre 6 et 8) réalisées avec différentes distances focales pour chacun des 25 documents. Pour chacun des documents, certaines captures sont parfaitement nettes, et d autres présentent des niveaux de flou variables. La vérité terrain ainsi que les réponses de trois systèmes OCR (FineReader, Omnipage et Tesseract) pour chacune des images est fournie. La fiabilité de l OCR pour chacune des images est également disponible. La figure 5 illustre le contenu de ces documents. Dans la mesure où la base publique de (Kumar et al., 2013) est la seule à proposer une variation du focus dans des images de documents, mais qu elle ne contient pas de déformation de perspective, nous avons évalué séparément l étape d estimation de la qualité des images basée sur une mesure de focus et celle de normalisation de la perspective et de l illumination présentées en section 2. Pour simuler une étape de correction de perspective idéale, nous nous sommes contentés de détecter automatiquement la zone de l image contenant le document avec une version simplifiée de la

13 Normalisation et validation d images de documents capturées en mobilité 121

14 122 M. Rusiñol, J. Chazalon, J.-M. Ogier Méthode Principe LCC médian SROCC médian Q Métrique DOM Métrique CORNIA Apprentissage Proposée Métrique Tableau 4. Comparaison avec l état de l art (Kumar et al., 2013). Méthode FineReader Omnipage Tesseract CombMIN+Z-score Tableau 5. Médiane des coefficients de la corrélation de Pearson pour les différents systèmes OCR. D une manière générale, les mesures ayant donné les meilleurs résultats sont celles à base de gradient. La meilleure configuration était, quant à elle, formé du sousensemble de 4 mesures T j 4 = {GRA1,GRA2,GRA4,STA8}. Le temps moyen pour le calcul et la normalisation de ces quatre mesures 0,61 secondes sur une machine récente avec un code Matlab séquentiel et non optimisé. Le tableau 4 compare nos résultats avec deux recensés dans (Kumar et al., 2013). On remarque que notre méthode est meilleure que Q (Zhu et Milanfar, 2010) et DOM (Kumar et al., 2012) pour les deux mesures. Cependant, la méthode COR- NIA (Ye et al., 2012), basée sur un apprentissage plus lourd, reste plus performante selon ces critères. Pour terminer, le tableau 5 synthétise les médianes des coefficients de la corrélation de Pearson obtenus pour les différents systèmes OCR. Le fait qu on observe une très faible différence entre les systèmes FineReader et Tesseract, malgré leur très grande disparité en terme de performance réelle (voir (Kumar et al., 2013), figures 4 et 6), laisse penser que la méthode d évaluation proposée par (Kumar et al., 2013) présente un biais optimiste. En effet, le calcul de la corrélation de Pearson sur l ensemble des images (en intégrant donc les résultats moins avantageux) donne des résultats plus modestes. Pour les 175 images de la base, le coefficient global (LLC) que nous obtenons est de 0,6467, ce qui est bien inférieur au coefficient de 0,9378 donné par la méthode d évaluation de l état de l art. 4. Conclusion Pour faire face aux distorsions spécifiques contenues dans les images de documents numérisées avec des périphérique mobiles, nous avons proposé un prototype de

15 Normalisation et validation d images de documents capturées en mobilité 123 système d acquisition permettant d améliorer puis contrôler la qualité des images sur le mobile, avant leur transfert ou la perte de disponibilité du document. La correction de la perspective est réalisée grâce à une détection des contours de la page, ce qui permet à la méthode de fonctionner même si la page contient peu de texte, ou si les coins ne sont pas visibles. La correction de l illumination est réalisée grâce à une translation des composantes couleurs vers une illumination cible selon une hypothèse de monde gris, puis grâce à un étirement de l histogramme pour la composante de luminance. L évaluation de chacune de ces étapes sur des images réelles montre qu elles apportent chacune un gain de terme de performance pour l OCR. L estimation de la qualité de l image est réalisée grâce à combinaison optimale de mesures de focus évaluées pour la première fois sur ce type de données. La validation de cette seconde étape sur une base publique montre que cette méthode surpasse les autres méthodes à base de métriques, et donne de bons résultats par rapport aux méthodes à base d algorithmes plus lourds. Le système résultant proposé est basé sur une combinaison de méthodes légères pouvant facilement être mise en œuvre sur un smartphone. Remerciements Ce projet a été financé par le consortium Valconum ( tt r). This project has been funded by the People Program (Marie Curie Actions) of the 7th Framework Program of the EU (FP7/ ) under the grant agreement number of the REA. 5. Bibliographie Ballard D., «Generalizing the Hough transform to detect arbitrary shapes», Pattern Recognition, vol. 13, no 2, p , Chen F., Carter S., Denoue L., Kumar J., «SmartDCap : Semi-Automatic Capture of Higher Quality Document Images from a Smartphone», Proceedings of the International Conference on Intelligent User Interfaces, p , 2013a. Chen F., Carter S., Denoue L., Kumar J., «SmartDCap : Semi-Automatic Capture of Higher Quality Document Images from a Smartphone», Proceedings of the 2013 international conference on Intelligent user interfaces (IUI 13), p , March, 2013b. Clark P., Mirmehdi M., «Estimating the Orientation and Recovery of Text Planes in a Single Image», Proceedings of the 12th British Machine Vision Conference, p , Fischler M., Bolles R., «Random sample consensus : a paradigm for model fitting with applications to image analysis and automated cartography», Communications of the ACM, vol. 24, no 6, p , Gonzalez J., Kanai J., Nartker T. A., «Prediction of OCR Accuracy Using a Neural Network», in S. L. Taylor, J. J. Hull (eds), Document Analysis Systems II, vol. 29, World Scientific, p , 1998.

16 124 M. Rusiñol, J. Chazalon, J.-M. Ogier Jagannathan L., Jawahar C., «Perspective correction methods for camera based document analysis», Proceedings of the First International Workshop on Camera-based Document Analysis and Recognition, p , Kittler J., Hatef M., Duin R., Matas J., «On combining classifiers», IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 20, no 3, p , March, Kumar J., Chen F., Doermann D., «Sharpness estimation for document and scene images», 21st International Conference on Pattern Recognition (ICPR), p , Kumar J., Ye P., Doermann D., «A Dataset for Quality Assessment of Camera Captured Document Images», International Workshop on Camera-Based Document Analysis and Recognition (CBDAR), Lu S., Chen B., Ko C., «Perspective rectification of document images using fuzzy set and morphological operations», Image and Vision Computing, vol. 23, p , Peng X., Cao H., Subramanian K., Prasad R., Natarajan P., «Automated image quality assessment for camera-captured OCR», 18th IEEE International Conference on Image Processing (ICIP), p , Pertuz S., Puig D., Angel Garcia M., «Analysis of focus measure operators for shape-fromfocus», Pattern Recognition, vol. 46, no 5, p , May, Rodríguez-Piñeiro J., Comesaña-Alfaro P., Pérez-González F., Malvido-Garc ía A., «A new method for perspective correction of document images», Proceedings of the Document Recognition and Retrieval XVIII, p , Ye P., Doermann D., «Learning features for predicting OCR accuracy», 21st International Conference on Pattern Recognition (ICPR), p , Ye P., Doermann D., «Document Image Quality Assessment : A Brief Survey», 12th International Conference on Document Analysis and Recognition (ICDAR), p , Ye P., Kumar J., Kang L., Doermann D., «Unsupervised feature learning framework for noreference image quality assessment», IEEE Conference on Computer Vision and Pattern Recognition (CVPR), p , Zhu X., Milanfar P., «Automatic parameter selection for denoising algorithms using a noreference measure of image content», IEEE Transactions on Image Processing, vol. 19, no 12, p , 2010.

Normalisation et validation d images de documents capturées en mobilité

Normalisation et validation d images de documents capturées en mobilité Normalisation et validation d images de documents capturées en mobilité Marçal Rusiñol * Joseph Chazalon Jean-Marc Ogier Laboratoire L3i, Université de La Rochelle Avenue Michel Crépeau, 17042 La Rochelle

Plus en détail

Approche hybride de reconstruction de facettes planes 3D

Approche hybride de reconstruction de facettes planes 3D Cari 2004 7/10/04 14:50 Page 67 Approche hybride de reconstruction de facettes planes 3D Ezzeddine ZAGROUBA F. S.T, Dept. Informatique. Lab. d Informatique, Parallélisme et Productique. Campus Universitaire.

Plus en détail

Mesure agnostique de la qualité des images.

Mesure agnostique de la qualité des images. Mesure agnostique de la qualité des images. Application en biométrie Christophe Charrier Université de Caen Basse-Normandie GREYC, UMR CNRS 6072 Caen, France 8 avril, 2013 C. Charrier NR-IQA 1 / 34 Sommaire

Plus en détail

Propriétés des images numériques Contraintes sur l interprétation

Propriétés des images numériques Contraintes sur l interprétation Propriétés des images numériques Contraintes sur l interprétation M.LOUYS, Traitement d images et problèmes inverses Master Astrophysique, Observatoire de Strasbourg, 2013 Propriétés générales d une image

Plus en détail

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57 Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation

Plus en détail

ÉTUDE DE L EFFICACITÉ DE GÉOGRILLES POUR PRÉVENIR L EFFONDREMENT LOCAL D UNE CHAUSSÉE

ÉTUDE DE L EFFICACITÉ DE GÉOGRILLES POUR PRÉVENIR L EFFONDREMENT LOCAL D UNE CHAUSSÉE ÉTUDE DE L EFFICACITÉ DE GÉOGRILLES POUR PRÉVENIR L EFFONDREMENT LOCAL D UNE CHAUSSÉE ANALYSIS OF THE EFFICIENCY OF GEOGRIDS TO PREVENT A LOCAL COLLAPSE OF A ROAD Céline BOURDEAU et Daniel BILLAUX Itasca

Plus en détail

Traitement bas-niveau

Traitement bas-niveau Plan Introduction L approche contour (frontière) Introduction Objectifs Les traitements ont pour but d extraire l information utile et pertinente contenue dans l image en regard de l application considérée.

Plus en détail

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services 69 Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services M. Bakhouya, J. Gaber et A. Koukam Laboratoire Systèmes et Transports SeT Université de Technologie de Belfort-Montbéliard

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

Projet de Traitement du Signal Segmentation d images SAR

Projet de Traitement du Signal Segmentation d images SAR Projet de Traitement du Signal Segmentation d images SAR Introduction En analyse d images, la segmentation est une étape essentielle, préliminaire à des traitements de haut niveau tels que la classification,

Plus en détail

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU $SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU Fabien FIGUERES fabien.figueres@mpsa.com 0RWVFOpV : Krigeage, plans d expériences space-filling, points de validations, calibration moteur. 5pVXPp Dans le

Plus en détail

Principe de symétrisation pour la construction d un test adaptatif

Principe de symétrisation pour la construction d un test adaptatif Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université

Plus en détail

Calculatrice vocale basée sur les SVM

Calculatrice vocale basée sur les SVM Calculatrice vocale basée sur les SVM Zaïz Fouzi *, Djeffal Abdelhamid *, Babahenini MohamedChaouki*, Taleb Ahmed Abdelmalik**, * Laboratoire LESIA, Département d Informatique, Université Mohamed Kheider

Plus en détail

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences

Plus en détail

Reconnaissance de visages 2.5D par fusion des indices de texture et de profondeur ICI 12/12/12

Reconnaissance de visages 2.5D par fusion des indices de texture et de profondeur ICI 12/12/12 Reconnaissance de visages 2.5D par fusion des indices de texture et de profondeur ICI 12/12/12 2 Discrimination Invariance Expressions faciales Age Pose Eclairage 11/12/2012 3 Personne Inconnue Identité

Plus en détail

Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons

Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons Ahmad OSMAN 1a, Valérie KAFTANDJIAN b, Ulf HASSLER a a Fraunhofer Development Center

Plus en détail

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories : La vision nous permet de percevoir et d interpreter le monde qui nous entoure. La vision artificielle a pour but de reproduire certaines fonctionnalités de la vision humaine au travers de l analyse d images.

Plus en détail

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007 Vision industrielle et télédétection - Détection d ellipses Guillaume Martinez 17 décembre 2007 1 Table des matières 1 Le projet 3 1.1 Objectif................................ 3 1.2 Les choix techniques.........................

Plus en détail

Estimation du Quantile conditionnel par les Réseaux de neurones à fonction radiale de base

Estimation du Quantile conditionnel par les Réseaux de neurones à fonction radiale de base Estimation du Quantile conditionnel par les Réseaux de neurones à fonction radiale de base M.A. Knefati 1 & A. Oulidi 2 & P.Chauvet 1 & M. Delecroix 3 1 LUNAM Université, Université Catholique de l Ouest,

Plus en détail

Laboratoire 4 Développement d un système intelligent

Laboratoire 4 Développement d un système intelligent DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI LOG770 - SYSTÈMES INTELLIGENTS ÉTÉ 2012 Laboratoire 4 Développement d un système intelligent 1 Introduction Ce quatrième et dernier laboratoire porte sur le développement

Plus en détail

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production Revue des Sciences et de la Technologie RST- Volume 4 N 1 /janvier 2013 Etude d un cas industriel : Optimisation de la modélisation de paramètre de production A.F. Bernate Lara 1, F. Entzmann 2, F. Yalaoui

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

Opérations de base sur ImageJ

Opérations de base sur ImageJ Opérations de base sur ImageJ TPs d hydrodynamique de l ESPCI, J. Bico, M. Reyssat, M. Fermigier ImageJ est un logiciel libre, qui fonctionne aussi bien sous plate-forme Windows, Mac ou Linux. Initialement

Plus en détail

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies Régis Boulet Charlie Demené Alexis Guyot Balthazar Neveu Guillaume Tartavel Sommaire Sommaire... 1 Structure

Plus en détail

Discrétisation et génération de hiérarchies de concepts

Discrétisation et génération de hiérarchies de concepts Prétraitement des données 1 Pourquoi prétraiter les données? Nettoyage des données Intégration et transformation Réduction des données Discrétisation et génération de hiérarchies de g concepts Pourquoi

Plus en détail

R-ICP : une nouvelle approche d appariement 3D orientée régions pour la reconnaissance faciale

R-ICP : une nouvelle approche d appariement 3D orientée régions pour la reconnaissance faciale R-ICP : une nouvelle approche d appariement 3D orientée régions pour la reconnaissance faciale Boulbaba BEN AMOR, Karima OUJI, Mohsen ARDABILIAN, et Liming CHEN Laboratoire d InfoRmatique en Images et

Plus en détail

La Recherche du Point Optimum de Fonctionnement d un Générateur Photovoltaïque en Utilisant les Réseaux NEURO-FLOUS

La Recherche du Point Optimum de Fonctionnement d un Générateur Photovoltaïque en Utilisant les Réseaux NEURO-FLOUS Rev. Energ. Ren. : Chemss 2000 39-44 La Recherche du Point Optimum de Fonctionnement d un Générateur Photovoltaïque en Utilisant les Réseaux NEURO-FLOUS D.K. Mohamed, A. Midoun et F. Safia Département

Plus en détail

Open Bee TM e-fact PRO

Open Bee TM e-fact PRO Open Bee TM e-fact PRO SOLUTION GLOBALE D AUTOMATISATION DU TRAITEMENT DES FACTURES FOURNISSEURS 80 % des factures fournisseurs sont encore actuellement reçues au format papier. 13,8 est le coût moyen

Plus en détail

Localisation de caméra par recalage 2D-3D

Localisation de caméra par recalage 2D-3D Localisation de caméra par recalage 2D-3D Perception pour le Véhicule Intelligent (PVI 2014) Lundi 30 juin 2014 Dandi Pandi Paudel Cédric Demonceaux Le2i UMR CNRS 6306 Pascal Vasseur Litis EA 4108 In So

Plus en détail

Optimisation, traitement d image et éclipse de Soleil

Optimisation, traitement d image et éclipse de Soleil Kléber, PCSI1&3 014-015 I. Introduction 1/8 Optimisation, traitement d image et éclipse de Soleil Partie I Introduction Le 0 mars 015 a eu lieu en France une éclipse partielle de Soleil qu il était particulièrement

Plus en détail

5.1.1 Histogrammes : définition et utilité

5.1.1 Histogrammes : définition et utilité PLAN 5.1.1 Histogrammes : définition et utilité 5.1.2 Histogrammes des images en niveaux de gris 5.1.3 Histogramme des images couleurs 5.1.4 Courbes de modification des histogrammes 5.1.5 Applications

Plus en détail

Une méthode d apprentissage pour la composition de services web

Une méthode d apprentissage pour la composition de services web Une méthode d apprentissage pour la composition de services web Soufiene Lajmi * Chirine Ghedira ** Khaled Ghedira * * Laboratoire SOIE (ENSI) University of Manouba, Manouba 2010, Tunisia Soufiene.lajmi@ensi.rnu.tn,

Plus en détail

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines

Plus en détail

Objectif du groupe GT1.1 Fusion de Données

Objectif du groupe GT1.1 Fusion de Données Objectif du groupe GT1.1 Fusion de Données Le groupe travaille dans trois directions Le vocabulaire (piloté par ADVITAM et l aide de SITE) L état de l art (piloté par SYROKKO) Deux applications illustratives

Plus en détail

Numérisation de grands documents

Numérisation de grands documents Numérisation de grands documents Objectif Numériser plusieurs segments d image, les assembler en photoshop, puis harmoniser les couleurs. Nous partons d un document A3 numérisé en 2 fois. Pourquoi constatons-nous

Plus en détail

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes. Promotion X 004 COURS D ANALYSE DES STRUCTURES MÉCANIQUES PAR LA MÉTHODE DES ELEMENTS FINIS (MEC 568) contrôle non classant (7 mars 007, heures) Documents autorisés : polycopié ; documents et notes de

Plus en détail

CALCULS PARALLÈLES ET APPLICATIONS LA VISION PAR ORDINATEUR AU CEA LIST, QUELS CHOIX ARCHITECTURAUX?

CALCULS PARALLÈLES ET APPLICATIONS LA VISION PAR ORDINATEUR AU CEA LIST, QUELS CHOIX ARCHITECTURAUX? CALCULS PARALLÈLES ET APPLICATIONS LA VISION PAR ORDINATEUR AU CEA LIST, QUELS CHOIX ARCHITECTURAUX? LABORATOIRE DE VISION ET INGÉNIERIE DES CONTENUS (LVIC) Fusion multimedia : extraction multimodale d

Plus en détail

Differential Synchronization

Differential Synchronization Differential Synchronization Neil Fraser Google 2009 BENA Pierrick CLEMENT Lucien DIARRA Thiemoko 2 Plan Introduction Stratégies de synchronisation Synchronisation différentielle Vue d ensemble Dual Shadow

Plus en détail

SERVICE DE PHOTOGRAMMETRIE EN LIGNE

SERVICE DE PHOTOGRAMMETRIE EN LIGNE 1 SERVICE DE PHOTOGRAMMETRIE EN LIGNE Principes et fonctions Introduction p.2 Avantages du service p.3 Le matériel de base p.4 Prise de vue d un planum p.5 Le relevé d un planum p.6 Le relevé de façades

Plus en détail

Modélisation 3D par le modèle de turbulence k-ε standard de la position de la tête sur la force de résistance rencontrée par les nageurs.

Modélisation 3D par le modèle de turbulence k-ε standard de la position de la tête sur la force de résistance rencontrée par les nageurs. Modélisation 3D par le modèle de turbulence k-ε standard de la position de la tête sur la force de résistance rencontrée par les nageurs. H. ZAÏDI a, S. FOHANNO a, R. TAÏAR b, G. POLIDORI a a Laboratoire

Plus en détail

Formats d images. 1 Introduction

Formats d images. 1 Introduction Formats d images 1 Introduction Lorsque nous utilisons un ordinateur ou un smartphone l écran constitue un élément principal de l interaction avec la machine. Les images sont donc au cœur de l utilisation

Plus en détail

Détection des points d intérêt et Segmentation des images RGB-D. Présentée par : Bilal Tawbe. Semaine de la recherche de l UQO

Détection des points d intérêt et Segmentation des images RGB-D. Présentée par : Bilal Tawbe. Semaine de la recherche de l UQO Détection des points d intérêt et Segmentation des images RGB-D Présentée par : Bilal Tawbe Semaine de la recherche de l UQO 25 Mars 2015 1. Introduction Les méthodes de détection de points d intérêt ont

Plus en détail

Analyse d images. Edmond.Boyer@imag.fr. Edmond Boyer UFRIMA 1

Analyse d images. Edmond.Boyer@imag.fr. Edmond Boyer UFRIMA 1 Analyse d images Edmond.Boyer@imag.fr Edmond Boyer UFRIMA 1 1 Généralités Analyse d images (Image Analysis) : utiliser un ordinateur pour interpréter le monde extérieur au travers d images. Images Objets

Plus en détail

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Filtrage stochastique non linéaire par la théorie de représentation des martingales Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de

Plus en détail

AGROBASE : un système de gestion de données expérimentales

AGROBASE : un système de gestion de données expérimentales AGROBASE : un système de gestion de données expérimentales Daniel Wallach, Jean-Pierre RELLIER To cite this version: Daniel Wallach, Jean-Pierre RELLIER. AGROBASE : un système de gestion de données expérimentales.

Plus en détail

L informatique des entrepôts de données

L informatique des entrepôts de données L informatique des entrepôts de données Daniel Lemire SEMAINE 13 L exploration des données 13.1. Présentation de la semaine L exploration de données (ou data mining) est souvent associée à l intelligence

Plus en détail

Comparaison de Relevés 3D issus de plusieurs Systèmes de Numérisation

Comparaison de Relevés 3D issus de plusieurs Systèmes de Numérisation Laboratoire Vision & Robotique Comparaison de Relevés 3D issus de plusieurs Systèmes de Numérisation Emilie KOENIG, Benjamin ALBOUY, Sylvie TREUILLET, Yves Lucas Contact : Sylvie Treuillet Polytech'Orléans

Plus en détail

Simulations de Monte Carlo en finance : Pricer d option

Simulations de Monte Carlo en finance : Pricer d option Emma Alfonsi, Xavier Milhaud - M2R SAF Simulations de Monte Carlo en finance : Pricer d option Sous la direction de M. Pierre Alain Patard ISFA - Mars 2008 . 1 Table des matières 1 Introduction 4 2 Un

Plus en détail

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Table des matières. Introduction....3 Mesures et incertitudes en sciences physiques

Plus en détail

TP5 - Morphologie mathématique

TP5 - Morphologie mathématique TP5 - Morphologie mathématique Vincent Barra - Christophe Tilmant 5 novembre 2007 1 Partie théorique 1.1 Introduction La morphologie mathématique [1] est un outil mathématique permettant au départ d explorer

Plus en détail

Comment optimiser l utilisation des ressources Cloud et de virtualisation, aujourd hui et demain?

Comment optimiser l utilisation des ressources Cloud et de virtualisation, aujourd hui et demain? DOSSIER SOLUTION Solution CA Virtual Placement and Balancing Comment optimiser l utilisation des ressources Cloud et de virtualisation, aujourd hui et demain? agility made possible La solution automatisée

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

K. Ammar, F. Bachoc, JM. Martinez. Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau

K. Ammar, F. Bachoc, JM. Martinez. Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau Apport des modèles de krigeage à la simulation numérique K Ammar, F Bachoc, JM Martinez CEA-Saclay, DEN, DM2S, F-91191 Gif-sur-Yvette, France Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau Apport des

Plus en détail

T. Gasc 1,2,3, F. De Vuyst 1, R. Motte 3, M. Peybernes 4, R. Poncet 5

T. Gasc 1,2,3, F. De Vuyst 1, R. Motte 3, M. Peybernes 4, R. Poncet 5 Modélisation de la performance et optimisation d un algorithme hydrodynamique de type Lagrange-Projection sur processeurs multi-cœurs T. Gasc 1,2,3, F. De Vuyst 1, R. Motte 3, M. Peybernes 4, R. Poncet

Plus en détail

TECH. INFOTECH # 34 Solvabilité 2 : Le calcul du capital économique dans le cadre d un modèle interne. Introduction

TECH. INFOTECH # 34 Solvabilité 2 : Le calcul du capital économique dans le cadre d un modèle interne. Introduction INFO # 34 dans le cadre d un modèle interne Comment les méthodes d apprentissage statistique peuvent-elles optimiser les calculs? David MARIUZZA Actuaire Qualifié IA Responsable Modélisation et Solvabilité

Plus en détail

WEB DATA BASES ENGINEERING EMAIL BROKERS 2015

WEB DATA BASES ENGINEERING EMAIL BROKERS 2015 WEB DATA BASES ENGINEERING EMAIL BROKERS 2015 4.000.000 DE SITES INTERNET PROFESSIONNELS AUSCULTÉS MENSUELLEMENT EN FRANCE ET EN BELGIQUE DES DONNÉES DE NOUVELLE GÉNÉRATION, VOUS DONNENT ACCÈS AUX ENTREPRISES

Plus en détail

Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA

Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA RÉCITAL 2005, Dourdan, 6-10 juin 2005 Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA Siham Boulaknadel (1,2), Fadoua Ataa-Allah (2) (1) LINA FRE

Plus en détail

Modélisation de la relation entre le comportement au volant et la consommation de carburant

Modélisation de la relation entre le comportement au volant et la consommation de carburant ÉTUDE TECHNIQUE Modélisation de la relation entre le comportement au volant et la consommation de carburant De nombreuses entreprises investissent dans des services d accompagnement destinés aux conducteurs

Plus en détail

Vision par Ordinateur

Vision par Ordinateur Vision par Ordinateur James L. Crowley DEA IVR Premier Bimestre 2005/2006 Séance 6 23 novembre 2005 Détection et Description de Contraste Plan de la Séance : Description de Contraste...2 Le Détecteur de

Plus en détail

Fouille de données orientée motifs, méthodes et usages.

Fouille de données orientée motifs, méthodes et usages. Fouille de données orientée motifs, méthodes et usages. François RIOULT GREYC - Équipe Données-Documents-Langues CNRS UMR 6072 Université de Caen Basse-Normandie France Résumé La fouille de données orientée

Plus en détail

Approche bayésienne des modèles à équations structurelles

Approche bayésienne des modèles à équations structurelles Manuscrit auteur, publié dans "42èmes Journées de Statistique (2010)" Approche bayésienne des modèles à équations structurelles Séverine Demeyer 1,2 & Nicolas Fischer 1 & Gilbert Saporta 2 1 LNE, Laboratoire

Plus en détail

Codage MPEG-4 de dessins animés

Codage MPEG-4 de dessins animés Codage MPEG-4 de dessins animés Jean-Claude Moissinac Cyril Concolato Jean-Claude Dufourd Ecole Nationale Supérieure des Télécommunications 46 rue Barrault 75013 Paris cyril.concolato@enst.fr, dufourd@enst.fr,

Plus en détail

BIG Data et R: opportunités et perspectives

BIG Data et R: opportunités et perspectives BIG Data et R: opportunités et perspectives Guati Rizlane 1 & Hicham Hajji 2 1 Ecole Nationale de Commerce et de Gestion de Casablanca, Maroc, rguati@gmail.com 2 Ecole des Sciences Géomatiques, IAV Rabat,

Plus en détail

Galerie de photos échantillons SB-910

Galerie de photos échantillons SB-910 Galerie de photos échantillons SB-910 Ce livret présente différentes techniques du flash SB-910 et des exemples de photographies. 1 Fr Franchissez un cap dans l univers de l éclairage créatif Révélez les

Plus en détail

Extraction d informations stratégiques par Analyse en Composantes Principales

Extraction d informations stratégiques par Analyse en Composantes Principales Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction

Plus en détail

RI sociale : intégration de propriétés sociales dans un modèle de recherche

RI sociale : intégration de propriétés sociales dans un modèle de recherche RI sociale : intégration de propriétés sociales dans un modèle de recherche Ismail Badache 1 Institut de Recherche en Informatique de Toulouse, UMR 5505 CNRS, SIG 118 Route de Narbonne F-31062 Toulouse

Plus en détail

II. Conversions. I. Initialisation. III. Méthode point. TD Python Traitement d images MP*

II. Conversions. I. Initialisation. III. Méthode point. TD Python Traitement d images MP* Le but de ce TD est d utiliser les procédures et fonctions Python pour traiter des fichiers images. II. Conversions I. Initialisation Importer le module numpy sous l appellation np. On utilise le module

Plus en détail

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Karima Dhouib, Sylvie Després Faiez Gargouri ISET - Sfax Tunisie, BP : 88A Elbustan ; Sfax karima.dhouib@isets.rnu.tn,

Plus en détail

ASSURER LA QUALITE DES RESULTATS D ESSAI ET D ETALONNAGE Assuring the quality of test and calibration results

ASSURER LA QUALITE DES RESULTATS D ESSAI ET D ETALONNAGE Assuring the quality of test and calibration results ASSURER LA QUALITE DES RESULTATS D ESSAI ET D ETALONNAGE Assuring the quality of test and calibration results Soraya Amarouche Armelle Picau Olivier Pierson Raphaël Deal Laboratoire National de Métrologie

Plus en détail

Méthode d extraction des signaux faibles

Méthode d extraction des signaux faibles Méthode d extraction des signaux faibles Cristelle ROUX GFI Bénélux, Luxembourg cristelle.roux@gfi.be 1. Introduction Au début d une analyse stratégique, la première question posée est très souvent la

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

Eléments pratiques de test des Hiérarchies et Frameworks

Eléments pratiques de test des Hiérarchies et Frameworks Eléments pratiques de test des Hiérarchies et Frameworks Notes de cours Christophe Dony Master Info Pro - Université Montpellier-II 1 Introduction 1.1 Définitions Génie Logiciel No 18, Mars 1990. EC2.

Plus en détail

Entreposage de données complexes pour la médecine d anticipation personnalisée

Entreposage de données complexes pour la médecine d anticipation personnalisée Manuscrit auteur, publié dans "9th International Conference on System Science in Health Care (ICSSHC 08), Lyon : France (2008)" Entreposage de données complexes pour la médecine d anticipation personnalisée

Plus en détail

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels Etab=MK3, Timbre=G430, TimbreDansAdresse=Vrai, Version=W2000/Charte7, VersionTravail=W2000/Charte7 Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Plus en détail

Scanner laser HDS7000 Ultra rapide, à portée étendue

Scanner laser HDS7000 Ultra rapide, à portée étendue > 1 million de points / sec Scanner laser HDS7000 Ultra rapide, à portée étendue > 180 m de portée HDS7000 Scanner laser ultra rapide pour les professionnels exigeants Les scanners à mesure de phase sont

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

Correction de l épreuve intermédiaire de mai 2009.

Correction de l épreuve intermédiaire de mai 2009. Licence de Gestion. 3ème Année Année universitaire 8-9 Optimisation Appliquée C. Léonard Correction de l épreuve intermédiaire de mai 9. Exercice 1 Avec les notations du cours démontrer que la solution

Plus en détail

Cours de numérisation sur Epson Perfection

Cours de numérisation sur Epson Perfection Cours de numérisation sur Epson Perfection 1- Vérifiez la propreté de la vitre, placez l original sur celle-ci. À savoir, on peut numériser des transparents avec ce scanner ; il a un capteur CCD dans le

Plus en détail

REMOTE DATA ACQUISITION OF EMBEDDED SYSTEMS USING INTERNET TECHNOLOGIES: A ROLE-BASED GENERIC SYSTEM SPECIFICATION

REMOTE DATA ACQUISITION OF EMBEDDED SYSTEMS USING INTERNET TECHNOLOGIES: A ROLE-BASED GENERIC SYSTEM SPECIFICATION REMOTE DATA ACQUISITION OF EMBEDDED SYSTEMS USING INTERNET TECHNOLOGIES: A ROLE-BASED GENERIC SYSTEM SPECIFICATION THÈSE N O 2388 (2001) PRÉSENTÉE AU DÉPARTEMENT D'INFORMATIQUE ÉCOLE POLYTECHNIQUE FÉDÉRALE

Plus en détail

SudoClick Reconnaissance de grilles de sudoku pour téléphones portables

SudoClick Reconnaissance de grilles de sudoku pour téléphones portables SudoClick Reconnaissance de grilles de sudoku pour téléphones portables Patrick Anagnostaras 1 24 mai 2008 Department of Informatics - Master Project Report Département d Informatique - Departement für

Plus en détail

Laboratoire d Automatique et Productique Université de Batna, Algérie

Laboratoire d Automatique et Productique Université de Batna, Algérie Anale. Seria Informatică. Vol. IX fasc. 2 Annals. Computer Science Series. 9 th Tome st Fasc. 2 La sélection de paramètres d un système industriel par les colonies de fourmis Ouahab Kadri, L. Hayet Mouss,

Plus en détail

Analyse des erreurs de mesure lors d une opération de soudage ; Définition d une instrumentation optimale.

Analyse des erreurs de mesure lors d une opération de soudage ; Définition d une instrumentation optimale. Analyse des erreurs de mesure lors d une opération de soudage ; Définition d une instrumentation optimale. Morgan DAL 1, Philippe LE MASSON 1, Michel DUMONS 1, Didier LAWRJANIEC 2 1 LIMATB, Université

Plus en détail

Vision par ordinateur

Vision par ordinateur Vision par ordinateur Vision 3D (deuxième partie) Alain Boucher IFI Mise en correspondance (appariement) Approche basée sur la corrélation 2 Approche basée sur la corrélation Il faut des régions texturées

Plus en détail

Master IMA - UMPC Paris 6 RDMM - Année 2009-2010 Fiche de TP

Master IMA - UMPC Paris 6 RDMM - Année 2009-2010 Fiche de TP Master IMA - UMPC Paris 6 RDMM - Année 2009-200 Fiche de TP Préliminaires. Récupérez l archive du logiciel de TP à partir du lien suivant : http://www.ensta.fr/~manzaner/cours/ima/tp2009.tar 2. Développez

Plus en détail

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7 Table des matières Préface Public 1 Structure de l ouvrage 1 Caractéristiques de l ouvrage 3 Contenu 3 Pédagogie 4 Remarques sur l adaptation française 4 Ressources numériques 5 Biographie 6 PREMIÈRE PARTIE

Plus en détail

Détecteurs de mouvement Blue Line

Détecteurs de mouvement Blue Line Détecteurs de mouvement Blue Line 2 Blue Line : 5 détecteurs certifiés NF&A2P Type II pour des applications multiples La gamme de détecteurs de mouvement Blue Line conçus par les bureaux d études de Bosch

Plus en détail

Fête de la science Initiation au traitement des images

Fête de la science Initiation au traitement des images Fête de la science Initiation au traitement des images Détection automatique de plaques minéralogiques à partir d'un téléphone portable et atelier propose de créer un programme informatique pour un téléphone

Plus en détail

Classification Automatique de messages : une approche hybride

Classification Automatique de messages : une approche hybride RECIAL 2002, Nancy, 24-27 juin 2002 Classification Automatique de messages : une approche hybride O. Nouali (1) Laboratoire des Logiciels de base, CE.R.I.S., Rue des 3 frères Aïssiou, Ben Aknoun, Alger,

Plus en détail

BI = Business Intelligence Master Data-ScienceCours 7 - Data

BI = Business Intelligence Master Data-ScienceCours 7 - Data BI = Business Intelligence Master Data-Science Cours 7 - Data Mining Ludovic DENOYER - UPMC 30 mars 2015 Ludovic DENOYER - Typologie des méthodes de Data Mining Différents types de méthodes : Méthodes

Plus en détail

Validité prédictive des questionnaires Cebir. Etude 1 : validité critérielle dans le secteur du gardiennage

Validité prédictive des questionnaires Cebir. Etude 1 : validité critérielle dans le secteur du gardiennage Validité prédictive des questionnaires Cebir Introduction Dans le domaine de la sélection, il est particulièrement intéressant de déterminer la validité prédictive d un test. Malheureusement, les occasions

Plus en détail

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Collection de photos échantillons

Collection de photos échantillons Collection de photos échantillons SB-800/600 Entrez dans le monde passionnant du Système d Eclairage Créatif de Nikon avec le SB-800/600. Les numéros de page se rapportent aux explications dans le manuel

Plus en détail

Détection de têtes dans un nuage de points 3D à l aide d un modèle de mélange sphérique

Détection de têtes dans un nuage de points 3D à l aide d un modèle de mélange sphérique Détection de têtes dans un nuage de points 3D à l aide d un modèle de mélange sphérique Denis Brazey & Bruno Portier 2 Société Prynɛl, RD974 290 Corpeau, France denis.brazey@insa-rouen.fr 2 Normandie Université,

Plus en détail

Christelle REYNES EA 2415 Epidémiologie, Biostatistique et Santé Publique Université Montpellier 1. 8 Juin 2012

Christelle REYNES EA 2415 Epidémiologie, Biostatistique et Santé Publique Université Montpellier 1. 8 Juin 2012 Extraction et analyse des mesures haut-débit pour l identification de biomarqueurs : problèmes méthodologiques liés à la dimension et solutions envisagées EA 2415 Epidémiologie, Biostatistique et Santé

Plus en détail

Dossier de Presse Leica Nova

Dossier de Presse Leica Nova Dossier de Presse Leica Nova Leica Geosystems SARL Date : Juillet 2013 Parc des Grillons Bâtiment N 2 60 Route de Sartrouville - 78230 Le Pecq Tel : 01 30 09 17 00 - Fax : 01 30 09 17 01 www.leica-geosystems.fr

Plus en détail

Exemple PLS avec SAS

Exemple PLS avec SAS Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that

Plus en détail

Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto. des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le

Plus en détail

Glossaire technique Veditec

Glossaire technique Veditec Glossaire technique Veditec 3D/2D DNR (digital noise réduction) La technologie DNR est un système de réduction numérique de bruit ayant pour but de réduire le bruit sur l image. Elle permet d obtenir des

Plus en détail

Localisation des points d accès sans fil non autorisés

Localisation des points d accès sans fil non autorisés Localisation des points d accès sans fil non autorisés Un point d accès non autorisé peut compromettre la sécurité du réseau de l entreprise en l exposant au monde extérieur. Pour remédier à cette menace,

Plus en détail