of 17

Étude comparative de trois ensembles de descripteurs de texture pour la segmentation de documents anciens

0 views
All materials on our website are shared by users. If you have any questions about copyright issues, please report us to resolve them. We are always happy to assist you.
Share
Description
Étude comparative de trois ensembles de descripteurs de texture pour la segmentation de documents anciens Maroua Mehri, Mohamed Mhiri, Petra Gomez-Krämer, Pierre Héroux, Mohamed Ali Mahjoub, Rémy Mullot
Transcript
Étude comparative de trois ensembles de descripteurs de texture pour la segmentation de documents anciens Maroua Mehri, Mohamed Mhiri, Petra Gomez-Krämer, Pierre Héroux, Mohamed Ali Mahjoub, Rémy Mullot To cite this version: Maroua Mehri, Mohamed Mhiri, Petra Gomez-Krämer, Pierre Héroux, Mohamed Ali Mahjoub, et al.. Étude comparative de trois ensembles de descripteurs de texture pour la segmentation de documents anciens. CIFED Actes du treizième Colloque International Francophone sur l Écrit et le Document, Mar 2014, Nancy, France. pp hal HAL Id: hal Submitted on 24 Mar 2014 HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d enseignement et de recherche français ou étrangers, des laboratoires publics ou privés. Étude comparative de trois ensembles de descripteurs de texture pour la segmentation de documents anciens Maroua Mehri *, ** Mohamed Mhiri *** Petra Gomez-Krämer * Pierre Héroux ** Mohamed Ali Mahjoub *** Rémy Mullot * * Laboratoire Informatique, Image et Interaction - L3i, Université de Rochelle, France {maroua.mehri, petra.gomez, ** Laboratoire d Informatique, du Traitement de l Information et des Systèmes - LI- TIS, Université de Rouen, France *** Systèmes Avancés en Génie Électrique - SAGE, Université de Sousse, Tunisie RÉSUMÉ. Récemment, des approches basées sur l analyse des descripteurs de texture ont été largement explorées pour la segmentation d images de documents anciens numérisés. Il a été prouvé que ces méthodes fonctionnent efficacement en n ayant pas de connaissances préalables. En outre, il a été démontré qu elles sont robustes lorsqu elles sont appliquées sur des documents dégradés ou bruités. Dans cet article, une approche d évaluation de trois différents ensembles de descripteurs texturaux est présentée pour la segmentation de documents anciens. Sur un vaste corpus expérimental de documents anciens, nous visons tout d abord à déterminer quels descripteurs de texture pourraient être les mieux appropriés pour séparer les illustrations des régions textuelles d une part et d autre part pour discriminer les blocs du texte de différentes tailles et polices de caractères. C est dans ce but que nous étudions différents descripteurs de texture, extraits de trois outils du traitement d image, les plus répandus et largement utilisés (la fonction d auto-corrélation, les matrices de co-occurrence des niveaux de gris et les filtres de Gabor). Un aperçu sur le temps de calcul et la complexité de chaque ensemble de descripteurs de texture est également présenté dans ce travail. Sur une base d images de plus de 300 documents, une étude expérimentale avec des observations qualitatives et numériques, est proposée pour montrer les performances de chaque ensemble de descripteurs de texture. ABSTRACT. Recently, texture-based features have been used for digitized historical document image segmentation. It has been proven that these methods work effectively with no a priori knowledge. Moreover, it has been shown that they are robust when they are applied on degraded documents under different noise levels and kinds. In this paper an approach of evaluating 2 texture-based feature sets for segmenting historical documents is presented in order to compare several texture-based feature sets. We aim to determine which texture features could be better adequate for segmenting on the one hand graphical regions from textual ones and on the other hand for discriminating text in a variety of situations of different fonts and scales. For this purpose, three well-known and widely used texture-based feature sets (autocorrelation function, Grey Level Co-occurrence Matrix (GLCM) and Gabor filters) are evaluated and compared. An additional insight into the computation time and complexity of each texture-based feature set is given. On more than 300 historical documents, qualitative and numerical experiments are given to demonstrate each texture-based approach performance. MOTS-CLÉS : Documents historiques numérisés, segmentation, texture, multi-résolution. KEYWORDS: Historical digitized document images, Segmentation, Texture, Multi-scale approach. 3 1. Introduction Le développement d Internet et l usage fréquent des formats électroniques ont augmenté le besoin des systèmes efficaces et robustes d analyse et d interprétation de documents. En outre, la nécessité de garantir une conservation durable et de fournir un accès plus large aux documents, ont généré un intérêt à l analyse d image de document. L analyse d image de document est devenu un important sujet d intérêt de nombreux chercheurs et l un des domaines les plus étudiés, émergents et prospères dans l analyse et traitement d images (Nagy, 2000). Dans cet article, nous nous intéressons aux outils non-paramétriques et techniques automatiques de segmentation et caractérisation d images de documents anciens numérisés. La littérature montre que divers problèmes peuvent survenir, liés aux particularités des documents anciens, comme une grande variabilité de la mise en page : bruit et dégradations (causés par la copie, la numérisation et le vieillissement), le défaut d orientation, la complexité de la mise en page, des alignements non-conventionnels, les polices de caractères spécifiques, la présence d ornement, les variations de l espacement entre les caractères, mots, lignes, paragraphes et marges, la superposition de plusieurs couches d information (tampons, notes manuscrites, bruits, interférences recto-verso,... ) (Agam et al., 2007). Ainsi, le traitement de ce type de documents n est pas une tâche facile en raison du nombre et des niveaux de dégradations, et ce, sans connaissances a priori sur la structure physique ou logique des documents. Crasson et Fekete (Crasson et Fekete, 2004) soulignent la nécessité réelle d outils et techniques de traitement automatique et non-paramétrique de documents anciens (par exemple des outils pour l analyse de la mise en page et la séparation texte/illustration) afin de faciliter l analyse, l indexation et la navigation dans les corpus de manuscrits anciens. Il a été prouvé dans la littérature que l analyse de descripteurs de texture est efficace pour de nombreuses applications, y compris la vision artificielle, la segmentation d images médicales, la cartographie urbaine, l analyse d images satellitaires, la télédétection... En outre, les techniques d analyse de texture ont été largement utilisées au cours des deux dernières décennies, de sorte qu elles sont devenues les choix les plus appropriés pour l analyse de nombreux types d images, en particulier les images de synthèse, médicales et naturelles (Ro, 1998 ; Tuceryan et Jain, 1998). Plus récemment, les approches basées sur l analyse de texture ont été étudiées pour le traitement d images de documents, par exemple pour l identification du script/langue (Busch et al., 2005). L objectif de notre travail est d identifier, sur des images de documents anciens, les régions homogènes, c est-à-dire des zones contenant des pixels disposant de caractéristiques visuelles communes. Ainsi, nous explorons les différents aspects des descripteurs de texture pour la segmentation des images de documents anciens. Dans notre étude, nous supposons que les régions textuelles et non-textuelles disposent des caractéristiques de texture différentes. En outre, les blocs de texte disposant de polices de caractères différentes sont supposés avoir des apparences visuelles et propriétés de texture distinctes (Julesz, 1962). Dans une approche ascendante de segmentation, 4 l analyse des propriétés de texture dans le contenu des documents permet de s abstraire du manque d information à disposition (la mise en page, la police de caractère du texte... ) en utilisant une approche multi-résolution pour segmenter et caractériser les images de documents anciens (Journet et al., 2008 ; Mehri et al., 2013a). Par ailleurs, pour la caractérisation d images de documents anciens, les méthodes basées sur des approches d analyse de texture ont prouvé leur efficacité pour la segmentation d images affectées de divers types de dégradations, d intensité différente, et ce, sans connaissances a priori (Eglin et al., 2007 ; Journet et al., 2008 ; Grana et al., 2011 ; Ouji et al., 2011 ; Mehri et al., 2013b ; Mehri et al., 2013c). Dans le cadre de nos travaux présentés dans (Mehri et al., 2013a), nous avons étudié trois ensembles de descripteurs de texture respectivement extraits à partir de la fonction d auto-corrélation (Petrou et Sevilla, 2006), des matrices de co-occurrence des niveaux de gris (Haralick et al., 1973) et des filtres de Gabor (Gabor, 1946). Ces trois ensembles de descripteurs de texture sont détaillés et évalués sur 25 images de documents anciens simplifiés. Dans ce papier, nous étendons notre travail pour étudier ces trois descripteurs de texture sur plus de 300 documents anciens. Nous analysons en outre la contribution d une étape de post-traitement dans l approche à base de texture en intégrant les informations relatives au voisinage des pixels analysés. Nous proposons dans cette étude d évaluer et de comparer les différents ensembles de descripteurs de texture, extraits de la fonction d auto-corrélation, des matrices de co-occurrence des niveaux de gris et des filtres de Gabor. Nos tests sont élaborés pour segmenter 314 documents anciens sans connaissances a priori ni sur la mise en page de document scanné, ni son contenu. Cette étude est structurée de la façon suivante. Tout d abord, la section 2 présente un bref aperçu des différents ensembles de descripteurs de texture étudiés. Par la suite, un bref aperçu de l approche proposée pour le segmentation basée sur l analyse de texture est décrite dans la section 3. Ensuite, le protocole expérimental et les résultats des tests effectués sont détaillés dans les sections 4 et 5 respectivement. Enfin, les conclusions de cette étude et nos perspectives sont présentées dans la section Descripteurs de texture De nombreux algorithmes d extraction de descripteurs ont été proposés dans la littérature du traitement d images. Reed et DuBuf (Reed et DuBuf, 1993) les catégorisent en des approches à base de descripteurs, de modèles et de structures. Feddaoui et Hamrouni (Feddaoui et Hamrouni, 2006), quant à eux, les classifient en trois approches : structurelles, statistiques et spatio-fréquentielles. Toyoda et Hasegawa (Toyoda et Hasegawa, 2005) les classent en deux types : locales (par exemple, motif binaire local (LBP) (Ojala et al., 2002)) et fréquentielles (les transformées en ondelettes (Mallat, 1989), filtres de Gabor (Manjunath et Ma, 1996),... ). Les méthodes d extraction et d analyse à base de texture peuvent être divisées en quatre classes (Chen et al., 1998 ; Tuceryan et Jain, 1998) : 5 Les méthodes statistiques analysent la distribution spatiale des valeurs de niveaux de gris par le calcul des indices locaux dans l image et déduisent par la suite un ensemble de statistiques. GLCM (Haralick et al., 1973) est l une des méthodes statistiques de segmentation à base de texture fréquemment citée. Les méthodes géométriques sont utilisées pour décrire les motifs complexes et déduire les propriétés des textures. Les descripteurs de texture peuvent être extraits, par exemple, par une différence de gaussiennes (Tuceryan et Jain, 1990). Ces méthodes permettent de caractériser les propriétés géométriques des textures et trouver les règles qui régissent leur organisation spatiale. Les méthodes à base de modèle estiment un modèle paramétrique en fonction de la distribution d intensité des descripteurs de texture calculés. Les méthodes à base de modèles probabilistes sont largement utilisées telles que les champs aléatoires conditionnels (CRF) (Lafferty et al., 2001), les champs aléatoires Markoviens (MRF) (Nicolas et al., 2005), les champs aléatoires Markoviens gaussiens (GMRF) (Chellappa et Chatterjee, 1984), les fractales (Ferrell et al., 2003), LBP,... Les méthodes fréquentielles analysent les fréquences de l image. Les méthodes fréquentielles les plus utilisées sont les filtres de Gabor (Jain et al., 1992), la transformée de Fourier (Sabharwal et Subramanya, 2001), les transformées en ondelettes (Mallat, 1989) et les méthodes de segmentation à base de calcul de moments (Tuceryan, 1994). Certaines approches étudient les propriétés locales de l image analysée (GMRF, LBP,... ). D autres méthodes sont basées sur des représentations statistiques et/ou spatiales et/ou fréquentielles (les transformées en ondelettes, les filtres de Gabor,... ). Un aperçu complet des dernières techniques d extraction d indices de texture pour la segmentation d images est présentée dans (Reed et DuBuf, 1993) incluant les filtres de Gabor, GLCM, fractales,... Qiao et al. (Qiao et al., 2006) combinent les filtres de Gabor, les ondelettes et les méthodes à base de noyau pour la segmentation d images de documents. Nourbakhsh et al. (Nourbakhsh et al., 2006) évaluent deux catégories de descripteurs de texture extraits des filtres de Gabor et des ondelettes pour séparer les zones textuelles des régions non-textuelles dans des images de documents. Dans cet article, trois catégories de descripteurs de texture sont extraites : la fonction d autocorrélation, les matrices de co-occurrence des niveaux de gris et les filtres de Gabor. Dans notre travail, nous avons choisi d analyser ces trois ensembles de descripteurs de texture pour les raisons suivantes. Tout d abord, nous avons fait une étude comparative pour avoir le meilleur choix des descripteurs de texture à analyser. Ce choix est déterminé en visant le meilleur compromis entre les meilleures performances obtenues dans la littérature, un nombre réduit de paramètres et seuils à fixer et un temps de calcul des indices de texture raisonnable (Mehri et al., 2013a). D autre part, l extraction des indices de texture devrait être faite avec le moins possible de paramètres à fixer. En effet, sans aucune information sur la structure du document (le modèle de document, la mise en page, son contenu,... ), le choix de nombreux seuils et paramètres appropriés est une tâche très difficile à gérer. En outre, la pertinence des expériences de segmentation réalisées dans le domaine d analyse d image de document basées sur la fonction 6 d auto-corrélation (Journet et al., 2008), les matrices de co-occurrence des niveaux de gris (Busch et al., 2005) et les filtres de Gabor (Jain et Farrokhnia, 1991), nous amène à évaluer et comparer ces trois exemples de descripteurs de texture dans l objectif de segmenter les documents anciens. Enfin, les descripteurs de texture sont principalement étudiés séparément dans le domaine de l analyse d images de documents. À notre connaissance, il n existe pas d étude comparative des descripteurs de texture pour la segmentation de documents anciens. Le présent article propose une contribution dans cette direction en évaluant, sur une tâche de segmentation des images de documents anciens, ces trois ensembles de descripteurs largement utilisés et répandus. Tous les tests sont élaborés sans aucune connaissance a priori ni sur la mise en page du document analysé, ni sur son contenu. Nous présentons dans la suite de cet article, l évaluation de ces trois ensembles de descripteurs de texture dans une tâche de segmentation sur plus de 300 images de documents. Ces descripteurs issus de la fonction d auto-corrélation, de la matrice de co-occurrence des niveaux de gris et des filtres de Gabor sont détaillés dans (Mehri et al., 2013a). 3. Approche proposée de segmentation Afin d évaluer et de comparer les trois ensembles de descripteurs de texture, une approche de segmentation de documents anciens basée sur l analyse de texture est proposée dans cet article. Notre système de segmentation basée sur l analyse de texture est composé de quatre modules : une phase de pré-traitement, l étape d extraction de descripteurs de texture, le processus de segmentation en régions homogènes sur la base des valeurs d indices de texture extraits en utilisant une technique de regroupement de pixels classification non-supervisée des pixels et une étape de post-traitement. Figure 1. Approche proposée de segmentation de documents anciens basée sur l analyse de descripteurs de texture. Tout d abord, les descripteurs de texture sont extraits uniquement sur les pixels de forme des documents en niveaux de gris. En effet, nous considérons qu il n est pas 7 nécessaire de caractériser les pixels représentant le fond du document. Par ailleurs, le fait de n extraire les descripteurs que sur les pixels associés au tracé permet de réduire drastiquement le volume de pixel traités et par conséquent l occupation mémoire et le temps de traitement des algorithmes d extraction. La sélection des pixels de forme (bruits, champs de texte, illustrations... ) est effectuée en utilisant une approche classique non-paramétrique de binarisation : la méthode d Otsu (Otsu, 1979). Même si d autres choix auraient pu être opérés, l utilisation d une approche globale de seuillage, comme celle proposée par Otsu, offre un moyen rapide de sélection de pixels de forme de document. Par ailleurs, la méthode proposée par Otsu s est avérée donner de bons résultats dans (Busch et al., 2005). Suite à la sélection des pixels de forme, afin d adopter une approche multirésolution permettant de s abstraire de la résolution des images, les descripteurs sont calculés sur quatre fenêtres d analyse de tailles différentes et centrées sur les pixels à caractériser. Un algorithme de classification non-supervisée est ensuite exécuté sur les vecteurs d indices de texture normalisés en fixant le nombre maximum de régions homogènes égal à celui défini dans notre vérité terrain (Mehri et al., 2013a). La vérité terrain utilisée dans ce travail a été saisie manuellement à l aide de l environnement GEDI 1. L extraction des différents indices de texture : auto-corrélation, co-occurrence et Gabor à l aide de 4 tailles différentes de fenêtres d analyse donne un total de 20 (5 auto-corrélation indices 4 fenêtres glissantes pour la multi-résolution), 72 (18 co-occurrence indices 4tailles de fenêtres glissantes) et 192 (48 Gabor indices 4 tailles de fenêtres glissantes) indices extraits respectivement (cf. Table 2). Deux algorithmes classiques de classification non-supervisée (k-moyennes (MacQueen, 1967) et classification ascendante hiérarchique (CAH) (Lance et Williams, 1967)) ont été utilisés pour la segmentation du document analysé en régions homogènes sur la base des valeurs d indices de texture extraits. La phase de classification non-supervisée de pixels est exécutée sur les vecteurs de textures calculés afin de partitionner l espace des vecteurs de texture en des regroupements compacts et dont les caractéristiques de texture sont distinctes d un regroupement de pixels à l autre. Il est à noter que cette étape de segmentation n intègre pas d information spatiale. Seuls les descripteurs de texture sont extraits sur des fenêtres d analyse centrées et intègrent donc une partie d information contextuelle. Dans ce travail, nous introduisons une technique de vote majoritaire postérieure à la classification des pixels en tant que post-traitement. La technique de vote mise en place met en œuvre la multi-résolution en pondérant le vote des pixels voisins en fonction de leur appartenance ou non à des fenêtres de voisinage de tailles différentes. Pour affiner les résultats de segmentation, de nombreux chercheurs ont mis en place une étape de post-traitement afin de prendre en considération les informations liées à la localisation ou au voisinage des pixels. Chang e
Related Search
Advertisements
Related Docs
View more...
We Need Your Support
Thank you for visiting our website and your interest in our free products and services. We are nonprofit website to share and download documents. To the running of this website, we need your help to support us.

Thanks to everyone for your continued support.

No, Thanks