Goldy a écrit :
giggzounet a écrit :
Bonjour à tous,
je cherche à faire un script de migration des données latin1 vers utf8.
Je suis au boulot et on utilise opensuse. Je suis donc avec la dernière
en date 11.2 qui est évidemment tout utf8. J'ai de vieilles données en
latin1 et je migre, je migre dans la douleur...
Il n'y apas de paquet miraculeux migrationtools-utf8 comme sous debian.
J'ai migré tous les noms de fichiers à l'aide de la commande convmv et
je m'attelle aux donnée en elle même.
Alors dans l'ordre :
- avez vous un script merveilleux qui me permette d'avancer mon travail
sans avoir à réfléchir ? si oui...ben ce serait fort aimable de me le
montrer :D
- si non... que pensez vous de celui là :
#!/bin/bash
FROM=latin1
TO=utf-8
ICONV=iconv -f $FROM -t $TO
# Convert
find ./ -type f -name * | while read fn; do
echo migration of ${fn} ($FROM - $TO)
$ICONV ${fn} ${fn}.migration
mv ${fn}.migration ${fn}
done
En fait il marche pas mal. sauf que par exemple les pdf sont par la
suite inutilisables. Si vous savez pourquoi...ben je suis tout ouï! :D
Merci d'avance
Guillaume
Juste une remarque ou question, mais quel est l'intérêt de convertir les
fichiers PDF en UTF-8 ?
À part tout ce qui est à base de fichier texte brut (fichier texte,
html, xml, etc), il n'y a aucun intérêt à convertir des fichiers PDF qui
sont des fichiers de données (je pense pas utiliser le bon terme mais on
m'aura compris), l'affichage des caractères d'un fichier PDF n'est pas
dépendant d'un codage de caractère, donc il faut ignorer ces fichiers.
Salut,
Oui je m'en suis rendu compte par la suite :D j'ai trouvé sur le net un
script qui fait un test sur les charset via file et qui ensuite si le
charset est iso le convertit en utf8. donc ça évite de convertir les
fichiers binaires.
Merci de ta réponse
GiGGz
--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs From et Reply-To:
Pour vous DESABONNER, envoyez un message avec comme objet unsubscribe
vers debian-user-french-requ...@lists.debian.org
En cas de soucis, contactez EN ANGLAIS listmas...@lists.debian.org