Vincent Jamart wrote:
Hello
Petite probleme...
J'ai quelques pages HTML qui ont ete generees par iPhoto (en francais pour
des galleries et celui-ci cree les documents avec le charset UTF-8.
Ces pages ont ete modifiees pour ajouter des commentaires avec NVU, mais
les textes contiennent une accentuation be_fr. Lorsque ces pages ont ete
sauvees, le charset est reste UTF mais leur visualiation est moche: les
caracteres accentues ont ete remplaces par des signes cabalistiques. J'ai
fait un test avec sed, pour remplacer le string utf8 par iso-8859-1 dans
les headers html, et ensuite ajouter du texte en francais dans la page. Ca
marche, les accents sont OK mais pour les pages generees avant, ca reste
des signes cabalistiques, meme dans le code...
Petite question donc: comment utiliser ces signes cabalistiques dans mes
commandes sed pour les ramplacer par un string normalise genre "a &ute",
sachant que le signe cabalistique, je ne peux le taper dans un shell...
Salut Vincent,
j'ai jeté un petit coup d'oeil sur ta référence :
un cut&paste m'a permi de faire ceci :
echo améliorations apportées | od -bc
il y a 4 bytes pour ton 'é'
echo -e '\303\203\302\251'
é
j'ai fait (par cut&paste)
echo améliorations apportées | sed 's/é/é/g'
améliorations apportées
Voilà, cela marche; début de piste.
Bonne journée,
ALain
Par exemple, cette page est typique:
http://www.amaymodelesclub.co.uk/membres/modelismo/p-40/p-40.html
Accesoirement, si un utilsateur OSX/iPhoto savait comment forcer l'export
en iso-8859-1 au lieu de UTF par defaut, ca eviterait tout bricolage dans
le futur.
Merci
------------------------------------------------------------------------
_______________________________________________________
Linux Mailing List - http://www.unixtech.be
Subscribe/Unsubscribe: http://www.unixtech.be/mailman/listinfo/linux
Archives: http://www.mail-archive.com/linux@lists.unixtech.be
IRC: chat.unixtech.be:6667 - #unixtech
NNTP: news.gname.org - gmane.org.user-groups.linux.unixtech
--
------------------------------------------------------------
Dr Alain EMPAIN <[EMAIL PROTECTED]> <[EMAIL PROTECTED]>
Bioinformatics, Molecular Genetics,
Fac. Med. Vet., University of LIEGEe, Belgium
Bd de Colonster, B43 B-4000 LIEGEe (Sart-Tilman)
WORK: +32 4 366 4159 FAX: +32 4 366 4122
HOME: rue des Martyrs,7 B- 4550 Nandrin
+32 85 51 2341 GSM: +32 497 70 1764
-------------------------------------------------------------------------------
"I worry about my child and the Internet all the time, even though she's
too young to have logged on yet. Here's what I worry about. I worry that
10 or 15 years from now, she will come to me and say 'Daddy, where were
you when they took freedom of the press away from the Internet?'"
--Mike Godwin, Electronic Frontier Foundation
-------------------------------------------------------------------------------
_______________________________________________________
Linux Mailing List - http://www.unixtech.be
Subscribe/Unsubscribe: http://www.unixtech.be/mailman/listinfo/linux
Archives: http://www.mail-archive.com/linux@lists.unixtech.be
IRC: chat.unixtech.be:6667 - #unixtech
NNTP: news.gname.org - gmane.org.user-groups.linux.unixtech