Re: [ssfr] Script de migration latin1 vers utf8

2009-11-28 Par sujet giggz
Goldy a écrit :
 giggzounet a écrit :
 Bonjour à tous,

 je cherche à faire un script de migration des données latin1 vers utf8.
 Je suis au boulot et on utilise opensuse. Je suis donc avec la dernière
 en date 11.2 qui est évidemment tout utf8. J'ai de vieilles données en
 latin1 et je migre, je migre dans la douleur...

 Il n'y apas de paquet miraculeux migrationtools-utf8 comme sous debian.
 J'ai migré tous les noms de fichiers à l'aide de la commande convmv et
 je m'attelle aux donnée en elle même.

 Alors dans l'ordre :
 - avez vous un script merveilleux qui me permette d'avancer mon travail
 sans avoir à réfléchir ? si oui...ben ce serait fort aimable de me le
 montrer :D
 - si non... que pensez vous de celui là :
 #!/bin/bash
 FROM=latin1
 TO=utf-8
 ICONV=iconv -f $FROM -t $TO
 # Convert
 find ./ -type f -name * | while read fn; do
 echo migration of ${fn} ($FROM - $TO)
 $ICONV ${fn}  ${fn}.migration
 mv ${fn}.migration ${fn}
 done


 En fait il marche pas mal. sauf que par exemple les pdf sont par la
 suite inutilisables. Si vous savez pourquoi...ben je suis tout ouï! :D

 Merci d'avance
 Guillaume
 
 
 Juste une remarque ou question, mais quel est l'intérêt de convertir les
 fichiers PDF en UTF-8 ?
 
 À part tout ce qui est à base de fichier texte brut (fichier texte,
 html, xml, etc), il n'y a aucun intérêt à convertir des fichiers PDF qui
 sont des fichiers de données (je pense pas utiliser le bon terme mais on
 m'aura compris), l'affichage des caractères d'un fichier PDF n'est pas
 dépendant d'un codage de caractère, donc il faut ignorer ces fichiers.
 

Salut,

Oui je m'en suis rendu compte par la suite :D j'ai trouvé sur le net un
script qui fait un test sur les charset via file et qui ensuite si le
charset est iso le convertit en utf8. donc ça évite de convertir les
fichiers binaires.

Merci de ta réponse
GiGGz

-- 
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs From et Reply-To:

Pour vous DESABONNER, envoyez un message avec comme objet unsubscribe
vers debian-user-french-requ...@lists.debian.org
En cas de soucis, contactez EN ANGLAIS listmas...@lists.debian.org



Re: [ssfr] Script de migration latin1 vers utf8

2009-11-27 Par sujet Goldy
giggzounet a écrit :
 Bonjour à tous,
 
 je cherche à faire un script de migration des données latin1 vers utf8.
 Je suis au boulot et on utilise opensuse. Je suis donc avec la dernière
 en date 11.2 qui est évidemment tout utf8. J'ai de vieilles données en
 latin1 et je migre, je migre dans la douleur...
 
 Il n'y apas de paquet miraculeux migrationtools-utf8 comme sous debian.
 J'ai migré tous les noms de fichiers à l'aide de la commande convmv et
 je m'attelle aux donnée en elle même.
 
 Alors dans l'ordre :
 - avez vous un script merveilleux qui me permette d'avancer mon travail
 sans avoir à réfléchir ? si oui...ben ce serait fort aimable de me le
 montrer :D
 - si non... que pensez vous de celui là :
 #!/bin/bash
 FROM=latin1
 TO=utf-8
 ICONV=iconv -f $FROM -t $TO
 # Convert
 find ./ -type f -name * | while read fn; do
 echo migration of ${fn} ($FROM - $TO)
 $ICONV ${fn}  ${fn}.migration
 mv ${fn}.migration ${fn}
 done
 
 
 En fait il marche pas mal. sauf que par exemple les pdf sont par la
 suite inutilisables. Si vous savez pourquoi...ben je suis tout ouï! :D
 
 Merci d'avance
 Guillaume


Juste une remarque ou question, mais quel est l'intérêt de convertir les
fichiers PDF en UTF-8 ?

À part tout ce qui est à base de fichier texte brut (fichier texte,
html, xml, etc), il n'y a aucun intérêt à convertir des fichiers PDF qui
sont des fichiers de données (je pense pas utiliser le bon terme mais on
m'aura compris), l'affichage des caractères d'un fichier PDF n'est pas
dépendant d'un codage de caractère, donc il faut ignorer ces fichiers.

-- 
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs From et Reply-To:

Pour vous DESABONNER, envoyez un message avec comme objet unsubscribe
vers debian-user-french-requ...@lists.debian.org
En cas de soucis, contactez EN ANGLAIS listmas...@lists.debian.org