Encoding encore et toujours..

jerome moliere Tue, 23 Jul 2013 08:32:48 -0700

Bonjour a tous,
j'ai un souci avec un fichier (export enorme en XMl de data venant d'un
systeme proprio sous Windows) je dois parser ce fichier et j'ai des
plantages ...
J'ai tente un :
file -bi <monfic>
il me dit ISO-8859-1


les editeurs de texte genre UltraEdit le voient en ISO-8859-15

j'ai tente un recode -f UTF-8 <fic>
et apres 15mn de moulinage mon parser se plante au meme endroit...

D'ou ma question, il y a t'il des outils plus avances que file / recode
pour manipuler les charsets ?des algos de detection plus aboutis...
bref je ne sais pas quelle tactique adoptee car changer le file.encoding de
ma JVM ne marche pas en fonctionnant a tatons

cordialement
J.MOLIERE - Mentor/J

Encoding encore et toujours..

Répondre à