On Tuesday 28 November 2006 17:21, Pierre Keller - BCU Lausanne wrote: > Il s'agit donc de tenir compte de différentes fontes et de différentes > langues d'origine (correction orthographique pour améliorer le taux > de reconnaissance !)
J'ai utilise quelque fois 'ocra', mais je sais qu'il existe aussi un outil GNU. Mon experience est mitigee... C'est a utiliser avec un correcteur orthographique qui pointera tous les mots avec des accents, des apostrophes, cedilles, etc. J'imagine que le probleme est le meme en allemand avec les umlaut, etc. Il y a quand meme pas mal de travail manuel a effectuer, mais de tres loin rien de comparable par rapport a entrer le texte a la main ! Ca vaut la peine, mais, en l'etat de mes connaissances, difficile a automatiser completement. Mais je serais content d'apprendre qu'il existe de nouvelles techniques ou de nouveaux outils dans ce domaine. dc _______________________________________________ gull mailing list [email protected] http://lists.alphanet.ch/mailman/listinfo/gull
