Re: utf-8 : cauchemard, désolation, désespoir....

2004-08-15 Par sujet Charles Plessy
On Wed, Jul 21, 2004 at 01:07:36AM +0200, Iznogood wrote :
 Le Tue, 20 Jul 2004 19:18:46 +0200
 Julien Louis [EMAIL PROTECTED] a écrit :
 
  On Tue, Jul 20, 2004 at 05:01:00PM +, Jean-Luc Coulon (f5ibh)
  wrote:
   
   Même aspell et acheck ?
   
  Non malheureusement, et cela m'embète beaucoup :'(
 
 avec un xterm unicode et --encoding=utf-8, ça passe normalement.

Ah oui, effectivement, ça marche aussi sous gnome-terminal ; il faut
juste ne pas se laisser impressionner par les bugs à l'affichage.

-- 
Charles



Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-23 Par sujet Vincent Lefevre
On 2004-07-23 11:23:31 +0100, Yves Rutschle wrote:
 On Fri, Jul 23, 2004 at 02:19:03AM +0200, Vincent Lefevre wrote:
entités HTML, c'est idiot, car ça pose également des problèmes.
   
   Quels genres de problèmes?
  
  Sur terminal avec des locales ASCII. Voilà, c'est pour ceux qui
  veulent prendre en compte toutes les configurations possibles.
 
 Ben non, c'est au browser de gérer le terminal, et de
 transformer eacute; en 'e' si c'est tout ce qu'il peut
 imprimer... que tu encode en UTF-8 ou ISO-machin ou en
 entités HTML ne va rien changer au problème de toute façon.

Pour pouvoir faire cela, il faut avoir des tables de conversion.
Mais bien souvent, lorsqu'un terminal est configuré en ASCII,
c'est que le système ne connaît pas autre chose que l'ASCII, et
la conversion ne peut pas être effectuée (les caractères accentués
sont alors remplacés par des points d'interrogation, par exemple).

-- 
Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/
100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17,
Championnat International des Jeux Mathématiques et Logiques, etc.
Work: CR INRIA - computer arithmetic / SPACES project at LORIA



Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-23 Par sujet Arnaud CALVO

Vincent Lefevre a écrit, Le 21.07.2004 12:12 :


On 2004-07-20 19:33:14 +0200, Arnaud CALVO wrote:

Il faut sélectionner une police qui propose de l'utf8.
Moi j'ai ça pour xmms et pour la liste de lecture :
-adobe-helvetica-medium-r-normal-*-*-80-*-*-p-*-iso10646-1


Pas capable de le faire automatiquement? C'est nul!


C'est mieux que de pas pouvoir le faire...


man et less n'acceptent plus que je fasse de recherche en tapant sur
slash. (= LC_ALL=C man toto)


Pas de pb non plus.


Tu as essayé, avec la dernière version de less, de lire un fichier
ISO-8859-1 avec des locales en UTF-8 et un LESSCHARSET mis à latin1?


J'ai la version 381, mes locales sont en UTF-8, mes fichiers perso 
majoritairement en UTF-8 / iso-8859-15, quant au LESSCHARSET, il n'est 
pas défini chez moi et ça a pas l'air de trop mal marcher... Mais je 
m'aperçois que mes man ont l'air d'être tous en anglais !!!
J'ai essayé less sur un texte perso en iso-8859, et effectivement, la 
recherche n'aboutit pas, mais elle est possible sur des caractères non 
accentués. Ma solution : je passe ce fichier en UTF-8 ;-)


--
La citation du jour :
Une chose est certaine... nous approchons sans cesse de plus tard.


:: Arnaud 



Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-22 Par sujet knoppix

Vincent Lefevre wrote:


L'utilisateur n'est bien souvent pas au courant que IE ne respecte
pas les standards...
   



On peut toujours le lui signaler. Le !--[if IE] ... ![endif]--
est très utile pour cela. :)

 

J'ai même croisé récemment des devs de suites web qui sont persuadés que 
c'est IE qui respecte le mieux les standards (faut dire que pour eux 
Netscape s'est arrêté au 6 et que Mozilla/firefox, ils savent même pas 
que ça existe :-p


Claude



Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-22 Par sujet Jean-Luc Coulon (f5ibh)

Le 22.07.2004 11:18:07, Gaëtan PERRIER a écrit :
« Le Thu, 22 Jul 2004 00:08:59 +0200
« Vincent Lefevre [EMAIL PROTECTED] a écrit:
«
«  On 2004-07-21 23:48:23 +0200, Gaëtan PERRIER wrote:
«   On utilise les caractères français parce que l'on est français,
«   c'est tout. Je te retourne ce que tu dis au-dessus (Si c'est
« pour
«   revenir 10 ans en arrière, non merci.)
« 
«  Mais je suis d'accord avec toi. C'est juste le fait qu'imposer des
«  entités HTML, c'est idiot, car ça pose également des problèmes.
«
« Quels genres de problèmes?
«
« 
«   L'utilisateur n'est bien souvent pas au courant que IE ne
« respecte
«   pas les standards...
« 
«  On peut toujours le lui signaler. Le !--[if IE] ... ![endif]--
«  est très utile pour cela. :)
«
« Ouais mais le pekin de base déjà il ne va pas bien comprendre ce que
« tu lui signales et il ne va pas savoir quoi faire. IE il est
« installé
« avec le PC si il faut qu'il aille télécharger Mozilla (ou un de ces
« dérivés) et qu'il est en rtc il restera avec son IE...

Et si c'est comme au bureau, on nous installe une image complète avec  
win2k ou NT4, la suite office et .. IE5 .. et pas le droit de modifier  
la configuration/


---
- Jean-Luc
«
«
« 



signature.asc
Description: PGP signature


Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-22 Par sujet ygster
Salut,

On jeu, 2004-07-22 at 11:18 +0200, Gaëtan PERRIER wrote:
Le Thu, 22 Jul 2004 00:08:59 +0200
 Vincent Lefevre [EMAIL PROTECTED] a écrit:
  On peut toujours le lui signaler. Le !--[if IE] ... ![endif]--
  est très utile pour cela. :)

 Ouais mais le pekin de base déjà il ne va pas bien comprendre ce que
 tu lui signales et il ne va pas savoir quoi faire. IE il est installé
 avec le PC si il faut qu'il aille télécharger Mozilla (ou un de ces
 dérivés) et qu'il est en rtc il restera avec son IE...

Je suis d'accord que dans certains cas, il FAUT qu'un site soit accessible même
aux utilisateurs d'IE, et que certaines personnes n'ont pas le choix (ou pas la
connaissance) du navigateur qu'elles utilisent. Mais je pense qu'il faut faire,
comme le dit Vincent, 1 maximum de pub sur le sujet. Car quand on y
réfléchit, ce sont des développeurs qui respectent les standards mais qui
veulent aussi toucher les utilisateurs d'IE qui sont obliger de trouver des
hacks pour pallier aux manques d'une société commerciale qui décide
délibérément de ne pas respecter les standards.

Perso, j'ai régulièrement des gens qui me disent tiens ce site est nul il ne
marche pas, et bien sûr ils sont avec IE. Dès que j'ai l'occasion je leur
montre le même site avec Mozilla et au bout de 3 ou 4 fois généralement c'est
radical. Donc je pense qu'une petite explication sur des sites qui sont obligés
de bidouiller pour être visible avec IE, pourrait avoir de l'effet sur certains
utilisateurs.

A+
Ygster



Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-22 Par sujet Vincent Lefevre
On 2004-07-22 11:18:07 +0200, Gaëtan PERRIER wrote:
 Le Thu, 22 Jul 2004 00:08:59 +0200
 Vincent Lefevre [EMAIL PROTECTED] a écrit:
  Mais je suis d'accord avec toi. C'est juste le fait qu'imposer des
  entités HTML, c'est idiot, car ça pose également des problèmes.
 
 Quels genres de problèmes?

Sur terminal avec des locales ASCII. Voilà, c'est pour ceux qui
veulent prendre en compte toutes les configurations possibles.

   L'utilisateur n'est bien souvent pas au courant que IE ne respecte
   pas les standards...
  
  On peut toujours le lui signaler. Le !--[if IE] ... ![endif]--
  est très utile pour cela. :)
 
 Ouais mais le pekin de base déjà il ne va pas bien comprendre ce que
 tu lui signales et il ne va pas savoir quoi faire. IE il est installé
 avec le PC si il faut qu'il aille télécharger Mozilla (ou un de ces
 dérivés) et qu'il est en rtc il restera avec son IE...

Il est au moins au courant du problème. S'il reste avec IE, tant pis
pour lui.

Je te signale que pour les terminaux avec des locales ASCII, ce n'est
pas forcément plus simple de changer (surtout dans les pays anglophones
et probablement au Japon -- cf la config de base du Zaurus SL-C860 par
exemple).

-- 
Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/
100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17,
Championnat International des Jeux Mathématiques et Logiques, etc.
Work: CR INRIA - computer arithmetic / SPACES project at LORIA



Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-21 Par sujet Erwan David
Le Tue 20/07/2004, Leopold BAILLY disait
 Charles Plessy [EMAIL PROTECTED] writes:
 
  Les fichiers texte que je créé sont en utf8, avec un encodage différent
  pour les accents. Ça signifie que mon monde est coupé en deux parties
  qui s'ignorent : iso, et utf8. Tout ce que je fais en utf8 est
  de facto inutilisable, à moins d'aimer avoir des é sur ses pages web.
 
 Pour transformer un fichier ISO-* en UTF-8 : recode.

Avec un bémol : la doc est incompréhensible...
...

-- 
Erwan



Re: Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-21 Par sujet nicolas
Le Tue, 20 Jul 2004 19:10:08 +0200, Jean-Luc Coulon (f5ibh) a écrit :

 Même aspell et acheck ?

Je n'utilise ni l'un ni l'autre...

n.



Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-21 Par sujet nicolas
Le Wed, 21 Jul 2004 07:20:04 +0200, Erwan David a écrit :

 Le Tue 20/07/2004, Leopold BAILLY disait
 Charles Plessy [EMAIL PROTECTED] writes:

 Pour transformer un fichier ISO-* en UTF-8 : recode.

 Avec un bémol : la doc est incompréhensible...

Alors utilise konwert.

n.



Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-21 Par sujet Charles Plessy
On Wed, Jul 21, 2004 at 07:18:28AM +0200, Erwan David wrote :
 Le Tue 20/07/2004, Leopold BAILLY disait
  Charles Plessy [EMAIL PROTECTED] writes:
  
   Les fichiers texte que je créé sont en utf8, avec un encodage différent
   pour les accents. Ça signifie que mon monde est coupé en deux parties
   qui s'ignorent : iso, et utf8. Tout ce que je fais en utf8 est
   de facto inutilisable, à moins d'aimer avoir des é sur ses pages web.
  
  Pour transformer un fichier ISO-* en UTF-8 : recode.
 
 Avec un bémol : la doc est incompréhensible...

Pas 100% à jour, on dirait :

lidlpenguin|charles|$ cat  toto
é

lidlpenguin|charles|$ recode |grep AVANT
dites selon la syntaxe « AVANT1:APRÈS1,AVANT2:APRÈS2,... »; chaque code AVANT
CODAGE est [CHARSET][/[SURFACE]]...; DEMANDE ressemble souvent à AVANT..APRÈs,
AVANT et APRÈS étant des charsets.  Un CHARSET omis sous-entend le charset

lidlpenguin|charles|$ recode UTF-8:ISO-8859-15 toto
recode: Syntaxe désuète, veuillez préférer « UTF-8..ISO-8859-15 »

lidlpenguin|charles|$ file toto
toto: ISO-8859 text


Néanmoins, ça marche :)

lidlpenguin|charles|$ alias unutf='recode UTF-8..ISO-8859-15'

lidlpenguin|charles|$ cat  toto
é

lidlpenguin|charles|$ unutf toto

lidlpenguin|charles|$ file toto
toto: ISO-8859 text

-- 
Charles



Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-21 Par sujet Erwan David
Le Wed 21/07/2004, Charles Plessy disait
 On Wed, Jul 21, 2004 at 07:18:28AM +0200, Erwan David wrote :
  Le Tue 20/07/2004, Leopold BAILLY disait
   Charles Plessy [EMAIL PROTECTED] writes:
   
Les fichiers texte que je créé sont en utf8, avec un encodage différent
pour les accents. Ça signifie que mon monde est coupé en deux parties
qui s'ignorent : iso, et utf8. Tout ce que je fais en utf8 est
de facto inutilisable, à moins d'aimer avoir des é sur ses pages web.
   
   Pour transformer un fichier ISO-* en UTF-8 : recode.
  
  Avec un bémol : la doc est incompréhensible...
 
 Pas 100% à jour, on dirait :
 
 lidlpenguin|charles|$ cat  toto
 é
 
 lidlpenguin|charles|$ recode |grep AVANT
 dites selon la syntaxe « AVANT1:APRÈS1,AVANT2:APRÈS2,... »; chaque code AVANT
 CODAGE est [CHARSET][/[SURFACE]]...; DEMANDE ressemble souvent à AVANT..APRÈs,
 AVANT et APRÈS étant des charsets.  Un CHARSET omis sous-entend le charset

Si quelqu'un est capable d'expliquer à un béotien ce que sont les
charsets et les surfaces. Et comment on gère les fins de ligne en
plus...


-- 
Erwan



Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-21 Par sujet François Boisson
On Tue, 20 Jul 2004 23:10:01 +0900
Charles Plessy [EMAIL PROTECTED] wrote:

 Bonjour à tous,


Erwan David a évoqué il y a un ou deux mois gnu-recode (paquet recode dans
Debian):

Character set conversion utility

Free `recode' converts files between character sets and usages. When exact
transliterations are not possible, it may get rid of the offending
characters or fall back on approximations. This program recognizes or
produces nearly 300 different character sets and is able to transliterate
files between almost any pair. Most RFC 1345 character sets, and all
`libiconv' character sets, are supported.


A mon avis, ça te sera utile


François Boisson



Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-21 Par sujet Vincent Lefevre
On 2004-07-20 23:10:01 +0900, Charles Plessy wrote:
 emacs n'accepte plus la saisie des accents et autres cédilles. J'ai viré
 mon .emacs, rien n'y fait = Je suis passé à vi.

Je trouve qu'emacs est un des programmes qui supporte le mieux UTF-8.
Tu as probablement un problème de config.

 man et less n'acceptent plus que je fasse de recherche en tapant sur
 slash. (= LC_ALL=C man toto)

man utilise un pager externe et n'est donc pas directement en cause.
Oui, less bugge complètement (mais fonctionnait dans le passé!).

zsh n'est pas non plus compatible UTF-8.

 Les fichiers texte que je créé sont en utf8, avec un encodage différent
 pour les accents. Ça signifie que mon monde est coupé en deux parties
 qui s'ignorent : iso, et utf8. Tout ce que je fais en utf8 est
 de facto inutilisable, à moins d'aimer avoir des é sur ses pages web.

Pour l'édition, emacs sait reconnaître l'encodage (sauf quand c'est
trop ambigu, mais aucun problème entre UTF-8 et ISO-8859-1 par
exemple). Pour le HTML, XML, etc. il y a des méthodes pour déclarer
l'encodage, donc aucun problème quand on fait correctement...

 1) Le support utf8 est-il encore inutilisable et expérimental ?

La seule raison pour laquelle je ne suis pas passé à UTF-8 complètement
est zsh.

 2) Si non, qu'ai-je fait d'incorrect pour en arriver là ?

Il faudrait voir les logiciels un par un. Au fait, y a-t-il un howto
complet quelque part?

-- 
Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/
100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17,
Championnat International des Jeux Mathématiques et Logiques, etc.
Work: CR INRIA - computer arithmetic / SPACES project at LORIA



Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-21 Par sujet Vincent Lefevre
On 2004-07-21 07:51:59 +0200, nicolas wrote:
 Le Wed, 21 Jul 2004 07:20:04 +0200, Erwan David a écrit :
 
  Le Tue 20/07/2004, Leopold BAILLY disait
  Charles Plessy [EMAIL PROTECTED] writes:
 
  Pour transformer un fichier ISO-* en UTF-8 : recode.
 
  Avec un bémol : la doc est incompréhensible...
 
 Alors utilise konwert.

Il y a aussi iconv.

-- 
Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/
100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17,
Championnat International des Jeux Mathématiques et Logiques, etc.
Work: CR INRIA - computer arithmetic / SPACES project at LORIA



Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-21 Par sujet Frederic Bothamy
* Vincent Lefevre [EMAIL PROTECTED] [2004-07-21 12:03] :
 On 2004-07-20 23:10:01 +0900, Charles Plessy wrote:

[...]

  2) Si non, qu'ai-je fait d'incorrect pour en arriver là ?
 
 Il faudrait voir les logiciels un par un. Au fait, y a-t-il un howto
 complet quelque part?

Quelque chose comme l'Unicode HOWTO ?
(http://www.tldp.org/HOWTO/Unicode-HOWTO.html, la traduction en français
n'est pas à jour mais peut donner tout de même des informations
intéressantes : http://www.traduc.org/docs/HOWTO/vf/Unicode-HOWTO.html)


Fred

-- 
Comment poser les questions de manière intelligente ?
http://www.gnurou.org/documents/smart-questions-fr.html
Comment signaler efficacement un bug ?
http://www.chiark.greenend.org.uk/~sgtatham/bugs-fr.html



Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-21 Par sujet Vincent Lefevre
On 2004-07-20 19:33:14 +0200, Arnaud CALVO wrote:
 Il faut sélectionner une police qui propose de l'utf8.
 Moi j'ai ça pour xmms et pour la liste de lecture :
 -adobe-helvetica-medium-r-normal-*-*-80-*-*-p-*-iso10646-1

Pas capable de le faire automatiquement? C'est nul!

 man et less n'acceptent plus que je fasse de recherche en tapant sur
 slash. (= LC_ALL=C man toto)
 
 Pas de pb non plus.

Tu as essayé, avec la dernière version de less, de lire un fichier
ISO-8859-1 avec des locales en UTF-8 et un LESSCHARSET mis à latin1?

-- 
Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/
100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17,
Championnat International des Jeux Mathématiques et Logiques, etc.
Work: CR INRIA - computer arithmetic / SPACES project at LORIA



Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-21 Par sujet Vincent Lefevre
On 2004-07-21 11:04:40 +0200, Gaëtan PERRIER wrote:
 Par contre une fois en utf8 tous mes fichiers seront créés en utf8,
 c'est bien ça?

Pas forcément. On peut toujours dire à l'éditeur ou générateur du
fichier de créer le fichier dans un autre encodage. Ce n'est pas
forcément gênant (notamment pour les fichiers XML, les mails...).

Au fait, ce mail est écrit depuis un terminal en ISO-8859-1, via
une session ssh en ISO-8859-1, où est lancé un screen avec Mutt en
UTF-8 (screen s'occupe de faire toutes les conversions nécessaires)
et l'éditeur est Emacs, travaillant en UTF-8 en entrée et en sortie.
Vous recevrez ce mail en ISO-8859-1, car j'ai configuré Mutt pour
envoyer de l'ISO-8859-1 si tous les caractères du mail peuvent être
représentés sous cet encodage. Bref, avec des conversions effectuées
de manière transparente, il n'y a pas de problème d'encodage.

-- 
Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/
100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17,
Championnat International des Jeux Mathématiques et Logiques, etc.
Work: CR INRIA - computer arithmetic / SPACES project at LORIA



Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-21 Par sujet Vincent Lefevre
On 2004-07-21 08:34:54 +, Jean-Luc Coulon (f5ibh) wrote:
 Ca, c'est préjuger (favorablemet) de la manière dont le navigateur du  
 *client* va interpréter les choses. Si on veut pouvoir être lu par les  
 divers navigateurs du marché, c'est quand même préférable d'utiliser  
 les entités HTML.

Non, un navigateur doit savoir suivre les recommandations pour
déterminer l'encodage utillisé.

-- 
Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/
100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17,
Championnat International des Jeux Mathématiques et Logiques, etc.
Work: CR INRIA - computer arithmetic / SPACES project at LORIA



Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-21 Par sujet Vincent Lefevre
On 2004-07-21 13:21:05 +0200, Frederic Bothamy wrote:
 Quelque chose comme l'Unicode HOWTO ?
 (http://www.tldp.org/HOWTO/Unicode-HOWTO.html, la traduction en français
 n'est pas à jour mais peut donner tout de même des informations
 intéressantes : http://www.traduc.org/docs/HOWTO/vf/Unicode-HOWTO.html)

La version anglaise n'est pas non plus à jour (elle a plus de 3 ans!).
C'est quelque chose de ce genre que je cherche, mais à jour. :)

-- 
Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/
100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17,
Championnat International des Jeux Mathématiques et Logiques, etc.
Work: CR INRIA - computer arithmetic / SPACES project at LORIA



Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-21 Par sujet Frederic Bothamy
* Vincent Lefevre [EMAIL PROTECTED] [2004-07-21 14:27] :
 On 2004-07-21 13:21:05 +0200, Frederic Bothamy wrote:
  Quelque chose comme l'Unicode HOWTO ?
  (http://www.tldp.org/HOWTO/Unicode-HOWTO.html, la traduction en français
  n'est pas à jour mais peut donner tout de même des informations
  intéressantes : http://www.traduc.org/docs/HOWTO/vf/Unicode-HOWTO.html)
 
 La version anglaise n'est pas non plus à jour (elle a plus de 3 ans!).
 C'est quelque chose de ce genre que je cherche, mais à jour. :)

Ah oui, exact. Alors cette UTF-8 and Unicode FAQ for Unix/Linux
(proposée dans le HOWTO anglais) :

http://www.cl.cam.ac.uk/~mgk25/unicode.html

qui semble assez à jour (date de dernière modification le 13/06/2004).


Fred

-- 
Comment poser les questions de manière intelligente ?
http://www.gnurou.org/documents/smart-questions-fr.html
Comment signaler efficacement un bug ?
http://www.chiark.greenend.org.uk/~sgtatham/bugs-fr.html



Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-21 Par sujet Jean-Luc Coulon (f5ibh)

Le 21.07.2004 13:49:58, Vincent Lefevre a écrit :
« On 2004-07-21 08:34:54 +, Jean-Luc Coulon (f5ibh) wrote:
«  Ca, c'est préjuger (favorablemet) de la manière dont le navigateur
« du
«  *client* va interpréter les choses. Si on veut pouvoir être lu par
« les
«  divers navigateurs du marché, c'est quand même préférable
« d'utiliser
«  les entités HTML.
«
« Non, un navigateur doit savoir suivre les recommandations pour
« déterminer l'encodage utillisé.

Je te propose d'expliquer ça à tous ceux qui on Internet Explorer 5  
(qui en plus d'être une passoire ne sait pas non plus gérer la  
transparence sur les fichiers .png..)


Je ne partage pas ton opinion : le développeur de site web n'a pas pour  
cible une catégorie particulière d'utilisateurs (utilisateurs de  
Mozilla, d'Opera ou d4internet Explorer). Si je développe un site web,  
c'est pour que la majorité de ceux qui le visitent le voient tel que je  
l'ai réalisé. Et pour ça, je n'ai pas le choix, il faut faire des  
concessions.


Essayer, par exemple, la différence de comportement entre les  
différents navigateurs en mode natif et en mode conforme...


---
- Jean-Luc
«
« --
« Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/



signature.asc
Description: PGP signature


Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-21 Par sujet Vincent Lefevre
On 2004-07-21 17:00:41 +0200, Frederic Bothamy wrote:
 Ah oui, exact. Alors cette UTF-8 and Unicode FAQ for Unix/Linux
 (proposée dans le HOWTO anglais) :
 
 http://www.cl.cam.ac.uk/~mgk25/unicode.html
 
 qui semble assez à jour (date de dernière modification le 13/06/2004).

Cette FAQ est peut-être à jour, mais ce n'est pas un HOWTO.
En particulier, il y a rien concernant l'utilisation d'Unicode
avec les diverses applications...

-- 
Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/
100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17,
Championnat International des Jeux Mathématiques et Logiques, etc.
Work: CR INRIA - computer arithmetic / SPACES project at LORIA



Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-21 Par sujet Vincent Lefevre
On 2004-07-21 15:27:26 +, Jean-Luc Coulon (f5ibh) wrote:
 Je te propose d'expliquer ça à tous ceux qui on Internet Explorer 5  

Je me f... complètement de ces utilisateurs. Ils ont choisi un
navigateur buggé. Qu'ils assument les conséquences.

 Je ne partage pas ton opinion : le développeur de site web n'a pas pour  
 cible une catégorie particulière d'utilisateurs (utilisateurs de  
 Mozilla, d'Opera ou d4internet Explorer).

Dans ce cas, il ne faut pas utiliser de caractères accentués (sous
forme d'entités ou autre), car ils ne passent pas avec certains
terminaux (configurés en US-ASCII, etc.).

-- 
Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/
100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17,
Championnat International des Jeux Mathématiques et Logiques, etc.
Work: CR INRIA - computer arithmetic / SPACES project at LORIA



Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-21 Par sujet Frederic Bothamy
* Vincent Lefevre [EMAIL PROTECTED] [2004-07-21 17:48] :
 On 2004-07-21 17:00:41 +0200, Frederic Bothamy wrote:
  Ah oui, exact. Alors cette UTF-8 and Unicode FAQ for Unix/Linux
  (proposée dans le HOWTO anglais) :
  
  http://www.cl.cam.ac.uk/~mgk25/unicode.html
  
  qui semble assez à jour (date de dernière modification le 13/06/2004).
 
 Cette FAQ est peut-être à jour, mais ce n'est pas un HOWTO.
 En particulier, il y a rien concernant l'utilisation d'Unicode
 avec les diverses applications...

La section What UTF-8 enabled applications are available? ne te
convient pas ? Elle est marquée comme de moins en moins complète depuis
mi-2003. Ce doit être tout de même assez à jour (ça parle d'Emacs 21 et
du futur Emacs 22).


Fred

-- 
Comment poser les questions de manière intelligente ?
http://www.gnurou.org/documents/smart-questions-fr.html
Comment signaler efficacement un bug ?
http://www.chiark.greenend.org.uk/~sgtatham/bugs-fr.html



Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-21 Par sujet Vincent Lefevre
On 2004-07-21 19:53:33 +0200, Jean-Luc Coulon wrote:
 On Wed, Jul 21, 2004 at 05:56:12PM +0200, Vincent Lefevre wrote:
  On 2004-07-21 15:27:26 +, Jean-Luc Coulon (f5ibh) wrote:
   Je te propose d'expliquer ça à tous ceux qui on Internet Explorer 5  
  
  Je me f... complètement de ces utilisateurs. Ils ont choisi un
  navigateur buggé. Qu'ils assument les conséquences.
 
 Je pense que si tu avais à t'occuper d'un site commerçant ou
 simplement d'un site « sérieux » tu ne te ficherais pas des
 utilisateurs.

Mon site est sérieux. Mais il y a des bornes à ne pas dépasser.
Si IE5 est buggé au point de ne pas comprendre les caractères
directement encodés en 8 bits, ce n'est plus mon problème.

 1 - quand on a un site commerçant, tout utilisateur est un cient potentiel.
 2 - quand on publie quelque chose de sérieux sur le web, on a le
 *respect* des utilisateurs quelqu'ils soient, ils n'ont peut être
 pas fait le choix de leurs outils.
 3 - si on rend des données publiques, c'est qu'ojn juge qu'elle on
 un certain intérêt et le *respect* de l'utilisateur fait aussi
 partie des règles de bonne conduite.

Si c'est pour revenir 10 ans en arrière, non merci.

   Je ne partage pas ton opinion : le développeur de site web n'a
   pas pour cible une catégorie particulière d'utilisateurs
   (utilisateurs de Mozilla, d'Opera ou d4internet Explorer).
  
  Dans ce cas, il ne faut pas utiliser de caractères accentués (sous
  forme d'entités ou autre), car ils ne passent pas avec certains
  terminaux (configurés en US-ASCII, etc.).
 
 Lorsqu'on travaille en français, on *doit* utilsier des caractères
 accentués.

Le monde ne s'est pas arrêté de tourner parce qu'il y avait des
logiciels incompatibles avec les caractères accentués. On doit
utiliser des caractères accentués *quand ça ne pose pas de problème*.

 Si le terminal est configuré en US-ASCII c'est que l'utilisateur en
 question n'avait pas à utiliser du français, ne le voulait pas ou ne
 le désirait pas.

Si l'utilisateur utilise IE5, c'est qu'il n'est pas intéressé de
voir des pages respectant les standards.

-- 
Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/
100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17,
Championnat International des Jeux Mathématiques et Logiques, etc.
Work: CR INRIA - computer arithmetic / SPACES project at LORIA



Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-21 Par sujet Vincent Lefevre
On 2004-07-21 20:09:44 +0200, Frederic Bothamy wrote:
 La section What UTF-8 enabled applications are available? ne te
 convient pas ? Elle est marquée comme de moins en moins complète depuis
 mi-2003. Ce doit être tout de même assez à jour (ça parle d'Emacs 21 et
 du futur Emacs 22).

Elle n'explique pas comment faire fonctionner les applications en
question en UTF-8. Et puisque certaines applications ne sont pas
compatibles UTF-8, il faut garder l'interopérabilité avec ISO-8859-1
par exemple, et donc expliquer comment configurer pour que ça
fonctionne avec les deux types de locales simultanément.

Concernant Mutt, il ne supporte pas complètement UTF-8. Par exemple,
en locale UTF-8, les recherches de mots avec caractères accentués dans
le corps depuis l'index échouent.

-- 
Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/
100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17,
Championnat International des Jeux Mathématiques et Logiques, etc.
Work: CR INRIA - computer arithmetic / SPACES project at LORIA



Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-21 Par sujet Vincent Lefevre
On 2004-07-21 23:48:23 +0200, Gaëtan PERRIER wrote:
 On utilise les caractères français parce que l'on est français, c'est
 tout. Je te retourne ce que tu dis au-dessus (Si c'est pour revenir
 10 ans en arrière, non merci.)

Mais je suis d'accord avec toi. C'est juste le fait qu'imposer des
entités HTML, c'est idiot, car ça pose également des problèmes.

 L'utilisateur n'est bien souvent pas au courant que IE ne respecte
 pas les standards...

On peut toujours le lui signaler. Le !--[if IE] ... ![endif]--
est très utile pour cela. :)

-- 
Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/
100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17,
Championnat International des Jeux Mathématiques et Logiques, etc.
Work: CR INRIA - computer arithmetic / SPACES project at LORIA



utf-8 : cauchemard, désolation, désespoir....

2004-07-20 Par sujet Charles Plessy
Bonjour à tous,

Afin d'afficher des caractères japonais (je bosse au japon), je suis
passé à UTF-8. Première impression : ça marche. Deuxième impression : il
y a une foultitude de programmes qui déconnent, et ça commence à me
faire perdre beaucoup de temps. En fait, ça me rapelle le temps où
installer une debian qui accepte les accents français était une
aventure...

Parmis ce qui ne marche pas : des chose pas grave: par exemple, la
playlist de xmms n'affiche plus un seul caractère. Un coup de LC_ALL=C
xmms, et ça repart.

Juste pour un prog, ça irait, et encore... Mais il y a pire :

aspell ne marche plus. Il bute sur les accents français, et les
considère comme des coupures de mots.

emacs n'accepte plus la saisie des accents et autres cédilles. J'ai viré
mon .emacs, rien n'y fait = Je suis passé à vi.

man et less n'acceptent plus que je fasse de recherche en tapant sur
slash. (= LC_ALL=C man toto)

centericq pète les plombs.


Mais le fond du problème n'est pas là ; voici l'objet premier de mon
mail :

Les fichiers texte que je créé sont en utf8, avec un encodage différent
pour les accents. Ça signifie que mon monde est coupé en deux parties
qui s'ignorent : iso, et utf8. Tout ce que je fais en utf8 est
de facto inutilisable, à moins d'aimer avoir des é sur ses pages web.

D'où deux questions :

1) Le support utf8 est-il encore inutilisable et expérimental ?

2) Si non, qu'ai-je fait d'incorrect pour en arriver là ?

Question subsidiaire : n'y a-t-il pas un unligne qui me permettrait de
récupérer le fruit de mon travail.txt en iso? Ou un moyen de n'utiliser
utf8 que quand s'imisce un caractère oriental ?

voici une illustration du problème:

lidlpenguin|charles|$ cat  toto
skljgfklsdg

lidlpenguin|charles|$ file toto
toto: ASCII text

lidlpenguin|charles|$ cat  toto
ljlfqskjémljsf

lidlpenguin|charles|$ file toto
toto: UTF-8 Unicode text

lidlpenguin|charles|$ env | grep FR
[EMAIL PROTECTED]
[EMAIL PROTECTED]

En éspérant qu'il y ait «un médecin dans la salle»,

-- 
Charles



Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-20 Par sujet nicolas
Tu n'as vraiment pas de bol, chez moi tout roule.

[EMAIL PROTECTED]:~$ locale
[EMAIL PROTECTED]
LC_CTYPE=[EMAIL PROTECTED]
LC_NUMERIC=[EMAIL PROTECTED]
LC_TIME=[EMAIL PROTECTED]
LC_COLLATE=[EMAIL PROTECTED]
LC_MONETARY=[EMAIL PROTECTED]
LC_MESSAGES=[EMAIL PROTECTED]
LC_PAPER=[EMAIL PROTECTED]
LC_NAME=[EMAIL PROTECTED]
LC_ADDRESS=[EMAIL PROTECTED]
LC_TELEPHONE=[EMAIL PROTECTED]
LC_MEASUREMENT=[EMAIL PROTECTED]
LC_IDENTIFICATION=[EMAIL PROTECTED]
LC_ALL=

Ce choix est donné dès la connection sous gdm. Je peux même avoir tout
en utf-8, les noms de fichiers, leur contenu, l'affichage, le clavier,
tout.

n.



Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-20 Par sujet Jean-Luc Coulon (f5ibh)


Le 20.07.2004 18:22:16, nicolas a écrit :
« Tu n'as vraiment pas de bol, chez moi tout roule.
«
« [EMAIL PROTECTED]:~$ locale
« [EMAIL PROTECTED]
« LC_CTYPE=[EMAIL PROTECTED]
« LC_NUMERIC=[EMAIL PROTECTED]
« LC_TIME=[EMAIL PROTECTED]
« LC_COLLATE=[EMAIL PROTECTED]
« LC_MONETARY=[EMAIL PROTECTED]
« LC_MESSAGES=[EMAIL PROTECTED]
« LC_PAPER=[EMAIL PROTECTED]
« LC_NAME=[EMAIL PROTECTED]
« LC_ADDRESS=[EMAIL PROTECTED]
« LC_TELEPHONE=[EMAIL PROTECTED]
« LC_MEASUREMENT=[EMAIL PROTECTED]
« LC_IDENTIFICATION=[EMAIL PROTECTED]
« LC_ALL=
«
« Ce choix est donné dès la connection sous gdm. Je peux même avoir
« tout
« en utf-8, les noms de fichiers, leur contenu, l'affichage, le
« clavier,
« tout.

Même aspell et acheck ?

--
J-L
«
« n.
«
«
« --
« Pensez à lire la FAQ de la liste avant de poser une question :
« http://wiki.debian.net/?DebianFrench
«
« Pensez à rajouter le mot ``spam'' dans vos champs From et
« Reply-To:
«
« To UNSUBSCRIBE, email to [EMAIL PROTECTED]
« with a subject of unsubscribe. Trouble? Contact
« [EMAIL PROTECTED]
«
«
«

--
---
  __ _
Jean-Luc Coulon (f5ibh)  / __ \ ___   / /_   (_) _ 
28 rue d'Evette / / / // _ \ / __ \ / // __ `// __ \
90350 Evette-Salbert   / /_/ //  __// /_/ // // /_/ // / / /
France/_/ \___//_.___//_/ \__,_//_/ /_/
  



signature.asc
Description: PGP signature


Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-20 Par sujet Arnaud CALVO

Charles Plessy a écrit, Le 20.07.2004 16:10 :

Afin d'afficher des caractères japonais (je bosse au japon), je suis
passé à UTF-8. Première impression : ça marche. Deuxième impression : il



Parmis ce qui ne marche pas : des chose pas grave: par exemple, la
playlist de xmms n'affiche plus un seul caractère. Un coup de LC_ALL=C
xmms, et ça repart.


Il faut sélectionner une police qui propose de l'utf8.
Moi j'ai ça pour xmms et pour la liste de lecture :
-adobe-helvetica-medium-r-normal-*-*-80-*-*-p-*-iso10646-1


Juste pour un prog, ça irait, et encore... Mais il y a pire :
aspell ne marche plus. Il bute sur les accents français, et les
considère comme des coupures de mots.


Joker. Je n'utilise pas ça.


emacs n'accepte plus la saisie des accents et autres cédilles. J'ai viré
mon .emacs, rien n'y fait = Je suis passé à vi.


J'utilise aussi vi, pas de problème de ce côté-là...


man et less n'acceptent plus que je fasse de recherche en tapant sur
slash. (= LC_ALL=C man toto)


Pas de pb non plus.


Les fichiers texte que je créé sont en utf8, avec un encodage différent
pour les accents. Ça signifie que mon monde est coupé en deux parties
qui s'ignorent : iso, et utf8. Tout ce que je fais en utf8 est
de facto inutilisable, à moins d'aimer avoir des é sur ses pages web.


Je crée mes fichiers en utf8 (merci vi, rox et rox-edit) et je n'ai pas 
de pb pour les (re)lire.



D'où deux questions :
1) Le support utf8 est-il encore inutilisable et expérimental ?


Je le trouve tout à fait utilisable, mais j'attends avec impatience les 
versions gtk2 de mes softs, car quasi aucun de mes softs en gtk1.2 ne 
gère correctement l'utf8...


--
La citation du jour :
J'ai lu un truc sur les méfaits de la boisson : du coup, j'ai arrêté de 
lire.



:: Arnaud 



Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-20 Par sujet Jean-Luc Coulon (f5ibh)

Le 20.07.2004 21:21:05, Leopold BAILLY a écrit :
« Charles Plessy [EMAIL PROTECTED] writes:
«
«  Les fichiers texte que je créé sont en utf8, avec un encodage
« différent
«  pour les accents. Ça signifie que mon monde est coupé en deux
« parties
«  qui s'ignorent : iso, et utf8. Tout ce que je fais en utf8 est
«  de facto inutilisable, à moins d'aimer avoir des é sur ses pages
« web.

Un « é » (par exemple) se code eacute; pour éviter ce genre de  
problème. Ensuite, il faudra, comme le dit Léo, préciser le charset  
utilisé dans l'en-tête. Dans ce cas, ça ne pose aucun problèmes aux  
navigateurs.


---
 -Jean-Luc

«
« Pour transformer un fichier ISO-* en UTF-8 : recode.
«
« Pour les pages html, le navigateur doit comprendre que la page est
« encodée UTF-8.
« Il y a deux précautions à prendre :
« - au niveau du contenu de la page html, spécifier
« HEAD
«   META http-equiv=Content-Type content=text/html;
« charset=UTF-8
« ...
« - au niveau de la réponse http, dans le cas d'une page dynamique, il
« faut insérer l'entête
« Content-Type: text/html; charset=UTF-8
«
«
« Léo.
«
«
« 



signature.asc
Description: PGP signature


Re: utf-8 : cauchemard, désolation, désespoir....

2004-07-20 Par sujet Charles Plessy
On Wed, Jul 21, 2004 at 01:07:36AM +0200, Iznogood wrote :
 Le Tue, 20 Jul 2004 19:18:46 +0200
 Julien Louis [EMAIL PROTECTED] a écrit :
 
  On Tue, Jul 20, 2004 at 05:01:00PM +, Jean-Luc Coulon (f5ibh)
  wrote:
   
   Même aspell et acheck ?
   
  Non malheureusement, et cela m'embète beaucoup :'(
 
 avec un xterm unicode et --encoding=utf-8, ça passe normalement.

Et pour un aspell lancé depuis mutt à travers une connexion ssh?

J'ai l'impression que je touche un problème : l'interaction entre le
terminal d'où est lancé ssh, et le shell distant. Par exemple, je suis
co-administrateur d'une machine. Donc on va mélanger les fichiers iso et
utf, car :

shadow:~# cat  toto
lldkjfqçà

shadow:~# file toto
toto: UTF-8 Unicode text

shadow:~# locale
LANG=fr_FR.ISO-8859-15
LC_CTYPE=[EMAIL PROTECTED]
LC_NUMERIC=[EMAIL PROTECTED]
LC_TIME=[EMAIL PROTECTED]
LC_COLLATE=[EMAIL PROTECTED]
LC_MONETARY=[EMAIL PROTECTED]
LC_MESSAGES=[EMAIL PROTECTED]
LC_PAPER=[EMAIL PROTECTED]
LC_NAME=[EMAIL PROTECTED]
LC_ADDRESS=[EMAIL PROTECTED]
LC_TELEPHONE=[EMAIL PROTECTED]
LC_MEASUREMENT=[EMAIL PROTECTED]
LC_IDENTIFICATION=[EMAIL PROTECTED]
[EMAIL PROTECTED]

= j'ai beau faire tout mon possible, pas moyen d'éviter l'utf8 là où je
n'en veux pas!

(PS : merci à toutes les réponse, qui m'ont rendu un peu de courage)

-- 
Charles