Vincent Jamart wrote:
Hello

Petite probleme...
J'ai quelques pages HTML qui ont ete generees par iPhoto (en francais pour des galleries et celui-ci cree les documents avec le charset UTF-8. Ces pages ont ete modifiees pour ajouter des commentaires avec NVU, mais les textes contiennent une accentuation be_fr. Lorsque ces pages ont ete sauvees, le charset est reste UTF mais leur visualiation est moche: les caracteres accentues ont ete remplaces par des signes cabalistiques. J'ai fait un test avec sed, pour remplacer le string utf8 par iso-8859-1 dans les headers html, et ensuite ajouter du texte en francais dans la page. Ca marche, les accents sont OK mais pour les pages generees avant, ca reste des signes cabalistiques, meme dans le code... Petite question donc: comment utiliser ces signes cabalistiques dans mes commandes sed pour les ramplacer par un string normalise genre "a &ute", sachant que le signe cabalistique, je ne peux le taper dans un shell...

Salut Vincent,

j'ai jeté un petit coup d'oeil sur ta référence :
un cut&paste m'a permi de faire ceci :

echo améliorations apportées | od -bc

il y a 4 bytes pour ton 'é'

echo -e '\303\203\302\251'
é

j'ai fait (par cut&paste)


echo améliorations apportées | sed  's/é/é/g'
améliorations apportées


Voilà, cela marche; début de piste.

        Bonne journée,

        ALain

Par exemple, cette page est typique: http://www.amaymodelesclub.co.uk/membres/modelismo/p-40/p-40.html

Accesoirement, si un utilsateur OSX/iPhoto savait comment forcer l'export en iso-8859-1 au lieu de UTF par defaut, ca eviterait tout bricolage dans le futur.

Merci




------------------------------------------------------------------------

_______________________________________________________
Linux Mailing List - http://www.unixtech.be
Subscribe/Unsubscribe: http://www.unixtech.be/mailman/listinfo/linux
Archives: http://www.mail-archive.com/linux@lists.unixtech.be
IRC: chat.unixtech.be:6667 - #unixtech
NNTP: news.gname.org - gmane.org.user-groups.linux.unixtech

--
------------------------------------------------------------
Dr Alain EMPAIN  <[EMAIL PROTECTED]> <[EMAIL PROTECTED]>
      Bioinformatics, Molecular Genetics,
      Fac. Med. Vet., University of LIEGEe, Belgium
      Bd de Colonster, B43   B-4000 LIEGEe (Sart-Tilman)
WORK: +32 4 366 4159         FAX: +32 4 366 4122
HOME: rue des Martyrs,7      B- 4550 Nandrin
      +32 85 51 2341         GSM: +32 497 70 1764
-------------------------------------------------------------------------------
"I worry about my child and the Internet all the time, even though she's
too young to have logged on yet. Here's what I worry about. I worry that
10 or 15 years from now, she will come to me and say 'Daddy, where were
you when they took freedom of the press away from the Internet?'"
--Mike Godwin, Electronic Frontier Foundation
-------------------------------------------------------------------------------

_______________________________________________________
Linux Mailing List - http://www.unixtech.be
Subscribe/Unsubscribe: http://www.unixtech.be/mailman/listinfo/linux
Archives: http://www.mail-archive.com/linux@lists.unixtech.be
IRC: chat.unixtech.be:6667 - #unixtech
NNTP: news.gname.org - gmane.org.user-groups.linux.unixtech

Répondre à