Il est parfois nécessaire d’extraire le texte d’une image scannée. Si vous possédez un logiciel de reconnaissance de caractères, il suffit de l’utiliser. Dans le cas contraire, je vais vous montrer comment vous en passer.
Dans cet article, nous allons extraire le texte d’un document publicitaire sur le vieux Lille :
Ouvrez votre navigateur Web et connectez-vous sur la page http://www.free-ocr.com/ :
Cliquez sur Parcourir et désignez le fichier dont vous voulez extraire le texte. Sous Language, nous cochons les cases French et English car le document utilise ces deux langues. Cliquez sur Start pour lancer la reconnaissance.
Lorsque la reconnaissance est terminée, le texte est directement accessible dans une zone de liste et sous la forme d’un document texte téléchargeable :
Ce texte peut alors être copié/collé depuis le navigateur Web dans une application quelconque. Ici, le texte est collé dans Word 2016. Pas si mal pour un service gratuit :
J’ai toujours eu accès à vos vidéos très intéressantes avec mon mot de passe, mais depuis quelques jours, je ne peux plus me connecter.
Pourriez-vous m’indiquer la marche à suivre.
Cordialement.