Merci pour les infos, Philippe et Alain,
J'ai pour le moment fait un script comme ceci (sur un poste Linux car le
shell OS X ne supporte pas é ou à ou è (??? il est installé en français,
10.4...lapin compris) Donc linux à la rescousse comme d'habitude:
#!/bin/bash
find . -name "*.htm*"|while read line do
mv $line $line.old
sed 's/UTF-8/iso-8859-1/g' $line.old >$line
sed 's/à¨/è/g' $line >$line.old
sed 's/é/é/g' $line.old >$line
sed 's/à®/î/g' $line >$line.old
sed 's/Ã/à/g' $line.old >$line
mv $line.old $line
rm $line.old
done
Je vais regarder du côté de NVU (et Dreamweaver on sait jamais qui
modifie les pages), pour par défaut utiliser UTF dans la
génération/modification des pages
On Mon, 26 Sep 2005, Philippe JAOUEN wrote:
> Vincent Jamart a écrit :
> > Hello
> >
> > Petite probleme...
> > J'ai quelques pages HTML qui ont ete generees par iPhoto (en francais pour
> > des galleries et celui-ci cree les documents avec le charset UTF-8.
> > Ces pages ont ete modifiees pour ajouter des commentaires avec NVU, mais
> > les textes contiennent une accentuation be_fr. Lorsque ces pages ont ete
> > sauvees, le charset est reste UTF mais leur visualiation est moche: les
> > caracteres accentues ont ete remplaces par des signes cabalistiques. J'ai
> > fait un test avec sed, pour remplacer le string utf8 par iso-8859-1 dans
> > les headers html, et ensuite ajouter du texte en francais dans la page. Ca
> > marche, les accents sont OK mais pour les pages generees avant, ca reste
> > des signes cabalistiques, meme dans le code...
> >
> > Petite question donc: comment utiliser ces signes cabalistiques dans mes
> > commandes sed pour les ramplacer par un string normalise genre "a &ute",
> > sachant que le signe cabalistique, je ne peux le taper dans un shell...
> >
> > Par exemple, cette page est typique:
> > http://www.amaymodelesclub.co.uk/membres/modelismo/p-40/p-40.html
> >
> > Accesoirement, si un utilsateur OSX/iPhoto savait comment forcer l'export
> > en iso-8859-1 au lieu de UTF par defaut, ca eviterait tout bricolage dans
> > le futur.
> >
>
> pour éviter un bricolage dans le futur, il faut abandonner iso et
> utiliser utf
>
> au lieu de sed : recode
>
_______________________________________________________
Linux Mailing List - http://www.unixtech.be
Subscribe/Unsubscribe: http://www.unixtech.be/mailman/listinfo/linux
Archives: http://www.mail-archive.com/[email protected]
IRC: chat.unixtech.be:6667 - #unixtech
NNTP: news.gname.org - gmane.org.user-groups.linux.unixtech