Traitement et reconnaissance des caractères
No Thumbnail Available
Date
2016
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Un système de reconnaissance optique des caractères analyse optiquement un texte
et en produit une version informatique, sous forme d'un _chier texte, comme s'il avait
été saisi sur un ordinateur. On utilise également l'acronyme OCR du terme anglais Optical Character Recognition. L'OCR est évidemment une technique utile, mais il faut en connaître les limites et en tenir compte, en prévoyant une ou plusieurs lectures personnelles du document. Parfois les documents à traiter peuvent être dégradé physiquement ou lors de leurs acquisition pour cela l'étape de prétraitement est donc indispensable afin de rendre faible l'étape de conversion de l'image vers un texte, Les filtres linéaires pour le traitement du bruit, tel que le filtre gaussien, moyen ...etc. permettent de lisser l'image et ainsi diminuer le bruit qui pourrait impacter négativement sur le résultat de reconnaissance sans garantir la conversion des contours. Pour améliorer les résultats de l'OCR, nous allons utiliser quelques prétraitements pour améliorer la performance de l'OCR.
Description
76 p. : ill. ; 30 cm
Keywords
Prétraitement des images, Binarisation, Filtres, Tesseract
