Merci pour les infos, Philippe et Alain,

J'ai pour le moment fait un script comme ceci (sur un poste Linux car le 
shell OS X ne supporte pas  é ou à ou è (??? il est installé en français, 
10.4...lapin compris) Donc linux à la rescousse comme d'habitude:

#!/bin/bash
find . -name "*.htm*"|while read line do
  mv $line $line.old
        sed 's/UTF-8/iso-8859-1/g' $line.old >$line
        sed 's/à¨/è/g' $line >$line.old
        sed 's/é/é/g' $line.old >$line
        sed 's/à®/î/g' $line >$line.old
        sed 's/Ã/à/g' $line.old >$line
  mv $line.old $line
  rm $line.old
done

Je  vais regarder du côté de NVU (et Dreamweaver on sait jamais qui 
modifie les pages), pour par défaut utiliser UTF dans la 
génération/modification des pages 

On Mon, 26 Sep 2005, Philippe JAOUEN wrote:

> Vincent Jamart a écrit :
> > Hello
> > 
> > Petite probleme...
> > J'ai quelques pages HTML qui ont ete generees par iPhoto (en francais pour 
> > des galleries et celui-ci cree les documents avec le charset UTF-8.
> > Ces pages ont ete modifiees pour ajouter des commentaires avec NVU, mais 
> > les textes contiennent une accentuation be_fr. Lorsque ces pages ont ete 
> > sauvees, le charset est reste UTF mais leur visualiation est moche: les 
> > caracteres accentues ont ete remplaces par des signes cabalistiques. J'ai 
> > fait un test avec sed, pour remplacer le string utf8 par iso-8859-1 dans 
> > les headers html, et ensuite ajouter du texte en francais dans la page. Ca 
> > marche, les accents sont OK mais pour les pages generees avant, ca reste 
> > des signes cabalistiques, meme dans le code... 
> > 
> > Petite question donc: comment utiliser ces signes cabalistiques dans mes 
> > commandes sed pour les ramplacer par un string normalise genre "a &ute", 
> > sachant que le signe cabalistique, je ne peux le taper dans un shell...
> > 
> > Par exemple, cette page est typique: 
> > http://www.amaymodelesclub.co.uk/membres/modelismo/p-40/p-40.html
> > 
> > Accesoirement, si un utilsateur OSX/iPhoto savait comment forcer l'export 
> > en iso-8859-1 au lieu de UTF par defaut, ca eviterait tout bricolage dans 
> > le futur.
> > 
> 
> pour éviter un bricolage dans le futur, il faut abandonner iso et
> utiliser utf
> 
> au lieu de sed : recode
> 

_______________________________________________________
Linux Mailing List - http://www.unixtech.be
Subscribe/Unsubscribe: http://www.unixtech.be/mailman/listinfo/linux
Archives: http://www.mail-archive.com/linux@lists.unixtech.be
IRC: chat.unixtech.be:6667 - #unixtech
NNTP: news.gname.org - gmane.org.user-groups.linux.unixtech

Répondre à