Re: OCR et Linux

2014-06-20 Par sujet L'Africain
Pour dire vrai je n'ai jamais calculé le nombre de fautes. Mais c'est sûr que 
c'est pas un mot sur 20 qui n'est pas reconnu. Le pire exemple que j'ai ces des 
pages texte au format jpg de mauvaise qualité, j'utilise pour ça cuneiform en 
ligne de commande, ça marche assez bien même si ça demande une bonne relecture. 
Mais quand la page est bonne pas besoin de relecture. Mais c'est vrai que je ne 
scanne jamais des choses bien complexe. Pour les colonnes, cuneiform dans xsane 
les reconnaît. Mais c'est certain que vu tes besoins (je ne crois pas les avoir 
lu dans un autre message), ces logiciels ne semblent pas convenir. As-tu au 
moins essayé? Ça serait bien d'avoir un retour. un moment j'ai aussi utilisé 
gscan2pdf, mais je trouve qu'Xsane avec cuneiform fonctionne mieux.
Amicalement,

PS: j'ai aussi un moment travaillé avec ocropus de google

On Mon, 16 Jun 2014 22:30:59 +0200
jguezenec jgueze...@yahoo.fr wrote:

 Je change de titre, c'est plus correct.
 
 95 %, c'est 1 mot non reconnu sur 20 mots ... C'est pas terrible. 300 
 mots par page d'un livre pocket, ça fait 15 erreurs par page.
 
 Dès que tu passe à des revues complexes (tableaux, colonnes, etc..) , je 
 suis certain que tu n'es plus à 95 %.
 
 Sous Fine Reader ou Omnipage, tu es à 99,5 %; tu as reconnaissance des 
 colonnes, des tableaux, des images, etc...
 
 J'ai dû, dans les années 95, reprendre tout le texte d'un livre de plus 
 de 400 pages, pour réédition (le manuscrit avait été perdu, et l'auteur 
 changeait de maison d'édition. - La mort transfiguré, un ouvrage 
 collectif sur les NDE).
 
 Malgré Fine Reader, j'y ai passé des semaines (surtout que c'était un 
 livre scientifique, avec des références constantes à des articles en 
 différentes langues).
 
 Aujourd'hui, ces logiciels (qui ne tournent que sous Windows, sauf Fine 
 Reader qui a une édition Mac) sont capables de scanner et reconnaître 
 des choses aussi complexes que des journaux (le papier est 
 semi-transparent et ce qui est écrit au verso transparaît au recto)...
 
 JG
 
 Le 16/06/2014 21:12, Benoît Lafricain a écrit :
  Ben t'utilise quoi? franchement il arrive que j'ai du 95 %. Faut pas
  non plus que ton texte soit sale.
 
  Le 16/06/2014, jguezenecjgueze...@yahoo.fr a écrit :
  On ne doit pas avoir les mêmes documents à scanner et Ocriser...
 
  JG
 
  Le 16/06/2014 17:41, Benoît Lafricain a écrit :
  Bon j'ai pas suivi attentivement ce post, mais j'ai juste été étonné
  de lire qu'il n'y a rien pour l'OCR sous ubuntu, J'utilise depuis 5ans
  cuneiform avec xsane et ça marche merveilleusement bien !
 
 
 
  --
  Liste de diffusion ubuntu-fr ubuntu-fr@lists.ubuntu.com
  Pour s'abonner ou se désabonner :
  https://lists.ubuntu.com/mailman/listinfo/ubuntu-fr
  Charte de la liste: http://doc.ubuntu-fr.org/groupes/ubuntu-fr-ml/charte
 
 
 
 -- 
 Liste de diffusion ubuntu-fr ubuntu-fr@lists.ubuntu.com
 Pour s'abonner ou se désabonner : 
 https://lists.ubuntu.com/mailman/listinfo/ubuntu-fr
 Charte de la liste: http://doc.ubuntu-fr.org/groupes/ubuntu-fr-ml/charte


-- 
L'Africain lafricai...@gmail.com

-- 
Liste de diffusion ubuntu-fr ubuntu-fr@lists.ubuntu.com
Pour s'abonner ou se désabonner : 
https://lists.ubuntu.com/mailman/listinfo/ubuntu-fr
Charte de la liste: http://doc.ubuntu-fr.org/groupes/ubuntu-fr-ml/charte


OCR et Linux

2014-06-16 Par sujet jguezenec

Je change de titre, c'est plus correct.

95 %, c'est 1 mot non reconnu sur 20 mots ... C'est pas terrible. 300 
mots par page d'un livre pocket, ça fait 15 erreurs par page.


Dès que tu passe à des revues complexes (tableaux, colonnes, etc..) , je 
suis certain que tu n'es plus à 95 %.


Sous Fine Reader ou Omnipage, tu es à 99,5 %; tu as reconnaissance des 
colonnes, des tableaux, des images, etc...


J'ai dû, dans les années 95, reprendre tout le texte d'un livre de plus 
de 400 pages, pour réédition (le manuscrit avait été perdu, et l'auteur 
changeait de maison d'édition. - La mort transfiguré, un ouvrage 
collectif sur les NDE).


Malgré Fine Reader, j'y ai passé des semaines (surtout que c'était un 
livre scientifique, avec des références constantes à des articles en 
différentes langues).


Aujourd'hui, ces logiciels (qui ne tournent que sous Windows, sauf Fine 
Reader qui a une édition Mac) sont capables de scanner et reconnaître 
des choses aussi complexes que des journaux (le papier est 
semi-transparent et ce qui est écrit au verso transparaît au recto)...


JG

Le 16/06/2014 21:12, Benoît Lafricain a écrit :

Ben t'utilise quoi? franchement il arrive que j'ai du 95 %. Faut pas
non plus que ton texte soit sale.

Le 16/06/2014, jguezenecjgueze...@yahoo.fr a écrit :

On ne doit pas avoir les mêmes documents à scanner et Ocriser...

JG

Le 16/06/2014 17:41, Benoît Lafricain a écrit :

Bon j'ai pas suivi attentivement ce post, mais j'ai juste été étonné
de lire qu'il n'y a rien pour l'OCR sous ubuntu, J'utilise depuis 5ans
cuneiform avec xsane et ça marche merveilleusement bien !




--
Liste de diffusion ubuntu-fr ubuntu-fr@lists.ubuntu.com
Pour s'abonner ou se désabonner :
https://lists.ubuntu.com/mailman/listinfo/ubuntu-fr
Charte de la liste: http://doc.ubuntu-fr.org/groupes/ubuntu-fr-ml/charte




--
Liste de diffusion ubuntu-fr ubuntu-fr@lists.ubuntu.com
Pour s'abonner ou se désabonner : 
https://lists.ubuntu.com/mailman/listinfo/ubuntu-fr
Charte de la liste: http://doc.ubuntu-fr.org/groupes/ubuntu-fr-ml/charte