Re: utf-8 : cauchemard, désolation, désespoir....
On Wed, Jul 21, 2004 at 01:07:36AM +0200, Iznogood wrote : Le Tue, 20 Jul 2004 19:18:46 +0200 Julien Louis [EMAIL PROTECTED] a écrit : On Tue, Jul 20, 2004 at 05:01:00PM +, Jean-Luc Coulon (f5ibh) wrote: Même aspell et acheck ? Non malheureusement, et cela m'embète beaucoup :'( avec un xterm unicode et --encoding=utf-8, ça passe normalement. Ah oui, effectivement, ça marche aussi sous gnome-terminal ; il faut juste ne pas se laisser impressionner par les bugs à l'affichage. -- Charles
Re: utf-8 : cauchemard, désolation, désespoir....
On 2004-07-23 11:23:31 +0100, Yves Rutschle wrote: On Fri, Jul 23, 2004 at 02:19:03AM +0200, Vincent Lefevre wrote: entités HTML, c'est idiot, car ça pose également des problèmes. Quels genres de problèmes? Sur terminal avec des locales ASCII. Voilà, c'est pour ceux qui veulent prendre en compte toutes les configurations possibles. Ben non, c'est au browser de gérer le terminal, et de transformer eacute; en 'e' si c'est tout ce qu'il peut imprimer... que tu encode en UTF-8 ou ISO-machin ou en entités HTML ne va rien changer au problème de toute façon. Pour pouvoir faire cela, il faut avoir des tables de conversion. Mais bien souvent, lorsqu'un terminal est configuré en ASCII, c'est que le système ne connaît pas autre chose que l'ASCII, et la conversion ne peut pas être effectuée (les caractères accentués sont alors remplacés par des points d'interrogation, par exemple). -- Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/ 100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17, Championnat International des Jeux Mathématiques et Logiques, etc. Work: CR INRIA - computer arithmetic / SPACES project at LORIA
Re: utf-8 : cauchemard, désolation, désespoir....
Vincent Lefevre a écrit, Le 21.07.2004 12:12 : On 2004-07-20 19:33:14 +0200, Arnaud CALVO wrote: Il faut sélectionner une police qui propose de l'utf8. Moi j'ai ça pour xmms et pour la liste de lecture : -adobe-helvetica-medium-r-normal-*-*-80-*-*-p-*-iso10646-1 Pas capable de le faire automatiquement? C'est nul! C'est mieux que de pas pouvoir le faire... man et less n'acceptent plus que je fasse de recherche en tapant sur slash. (= LC_ALL=C man toto) Pas de pb non plus. Tu as essayé, avec la dernière version de less, de lire un fichier ISO-8859-1 avec des locales en UTF-8 et un LESSCHARSET mis à latin1? J'ai la version 381, mes locales sont en UTF-8, mes fichiers perso majoritairement en UTF-8 / iso-8859-15, quant au LESSCHARSET, il n'est pas défini chez moi et ça a pas l'air de trop mal marcher... Mais je m'aperçois que mes man ont l'air d'être tous en anglais !!! J'ai essayé less sur un texte perso en iso-8859, et effectivement, la recherche n'aboutit pas, mais elle est possible sur des caractères non accentués. Ma solution : je passe ce fichier en UTF-8 ;-) -- La citation du jour : Une chose est certaine... nous approchons sans cesse de plus tard. :: Arnaud
Re: utf-8 : cauchemard, désolation, désespoir....
Vincent Lefevre wrote: L'utilisateur n'est bien souvent pas au courant que IE ne respecte pas les standards... On peut toujours le lui signaler. Le !--[if IE] ... ![endif]-- est très utile pour cela. :) J'ai même croisé récemment des devs de suites web qui sont persuadés que c'est IE qui respecte le mieux les standards (faut dire que pour eux Netscape s'est arrêté au 6 et que Mozilla/firefox, ils savent même pas que ça existe :-p Claude
Re: utf-8 : cauchemard, désolation, désespoir....
Le 22.07.2004 11:18:07, Gaëtan PERRIER a écrit : « Le Thu, 22 Jul 2004 00:08:59 +0200 « Vincent Lefevre [EMAIL PROTECTED] a écrit: « « On 2004-07-21 23:48:23 +0200, Gaëtan PERRIER wrote: « On utilise les caractères français parce que l'on est français, « c'est tout. Je te retourne ce que tu dis au-dessus (Si c'est « pour « revenir 10 ans en arrière, non merci.) « « Mais je suis d'accord avec toi. C'est juste le fait qu'imposer des « entités HTML, c'est idiot, car ça pose également des problèmes. « « Quels genres de problèmes? « « « L'utilisateur n'est bien souvent pas au courant que IE ne « respecte « pas les standards... « « On peut toujours le lui signaler. Le !--[if IE] ... ![endif]-- « est très utile pour cela. :) « « Ouais mais le pekin de base déjà il ne va pas bien comprendre ce que « tu lui signales et il ne va pas savoir quoi faire. IE il est « installé « avec le PC si il faut qu'il aille télécharger Mozilla (ou un de ces « dérivés) et qu'il est en rtc il restera avec son IE... Et si c'est comme au bureau, on nous installe une image complète avec win2k ou NT4, la suite office et .. IE5 .. et pas le droit de modifier la configuration/ --- - Jean-Luc « « « signature.asc Description: PGP signature
Re: utf-8 : cauchemard, désolation, désespoir....
Salut, On jeu, 2004-07-22 at 11:18 +0200, Gaëtan PERRIER wrote: Le Thu, 22 Jul 2004 00:08:59 +0200 Vincent Lefevre [EMAIL PROTECTED] a écrit: On peut toujours le lui signaler. Le !--[if IE] ... ![endif]-- est très utile pour cela. :) Ouais mais le pekin de base déjà il ne va pas bien comprendre ce que tu lui signales et il ne va pas savoir quoi faire. IE il est installé avec le PC si il faut qu'il aille télécharger Mozilla (ou un de ces dérivés) et qu'il est en rtc il restera avec son IE... Je suis d'accord que dans certains cas, il FAUT qu'un site soit accessible même aux utilisateurs d'IE, et que certaines personnes n'ont pas le choix (ou pas la connaissance) du navigateur qu'elles utilisent. Mais je pense qu'il faut faire, comme le dit Vincent, 1 maximum de pub sur le sujet. Car quand on y réfléchit, ce sont des développeurs qui respectent les standards mais qui veulent aussi toucher les utilisateurs d'IE qui sont obliger de trouver des hacks pour pallier aux manques d'une société commerciale qui décide délibérément de ne pas respecter les standards. Perso, j'ai régulièrement des gens qui me disent tiens ce site est nul il ne marche pas, et bien sûr ils sont avec IE. Dès que j'ai l'occasion je leur montre le même site avec Mozilla et au bout de 3 ou 4 fois généralement c'est radical. Donc je pense qu'une petite explication sur des sites qui sont obligés de bidouiller pour être visible avec IE, pourrait avoir de l'effet sur certains utilisateurs. A+ Ygster
Re: utf-8 : cauchemard, désolation, désespoir....
On 2004-07-22 11:18:07 +0200, Gaëtan PERRIER wrote: Le Thu, 22 Jul 2004 00:08:59 +0200 Vincent Lefevre [EMAIL PROTECTED] a écrit: Mais je suis d'accord avec toi. C'est juste le fait qu'imposer des entités HTML, c'est idiot, car ça pose également des problèmes. Quels genres de problèmes? Sur terminal avec des locales ASCII. Voilà, c'est pour ceux qui veulent prendre en compte toutes les configurations possibles. L'utilisateur n'est bien souvent pas au courant que IE ne respecte pas les standards... On peut toujours le lui signaler. Le !--[if IE] ... ![endif]-- est très utile pour cela. :) Ouais mais le pekin de base déjà il ne va pas bien comprendre ce que tu lui signales et il ne va pas savoir quoi faire. IE il est installé avec le PC si il faut qu'il aille télécharger Mozilla (ou un de ces dérivés) et qu'il est en rtc il restera avec son IE... Il est au moins au courant du problème. S'il reste avec IE, tant pis pour lui. Je te signale que pour les terminaux avec des locales ASCII, ce n'est pas forcément plus simple de changer (surtout dans les pays anglophones et probablement au Japon -- cf la config de base du Zaurus SL-C860 par exemple). -- Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/ 100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17, Championnat International des Jeux Mathématiques et Logiques, etc. Work: CR INRIA - computer arithmetic / SPACES project at LORIA
Re: utf-8 : cauchemard, désolation, désespoir....
Le Tue 20/07/2004, Leopold BAILLY disait Charles Plessy [EMAIL PROTECTED] writes: Les fichiers texte que je créé sont en utf8, avec un encodage différent pour les accents. Ça signifie que mon monde est coupé en deux parties qui s'ignorent : iso, et utf8. Tout ce que je fais en utf8 est de facto inutilisable, à moins d'aimer avoir des é sur ses pages web. Pour transformer un fichier ISO-* en UTF-8 : recode. Avec un bémol : la doc est incompréhensible... ... -- Erwan
Re: Re: utf-8 : cauchemard, désolation, désespoir....
Le Tue, 20 Jul 2004 19:10:08 +0200, Jean-Luc Coulon (f5ibh) a écrit : Même aspell et acheck ? Je n'utilise ni l'un ni l'autre... n.
Re: utf-8 : cauchemard, désolation, désespoir....
Le Wed, 21 Jul 2004 07:20:04 +0200, Erwan David a écrit : Le Tue 20/07/2004, Leopold BAILLY disait Charles Plessy [EMAIL PROTECTED] writes: Pour transformer un fichier ISO-* en UTF-8 : recode. Avec un bémol : la doc est incompréhensible... Alors utilise konwert. n.
Re: utf-8 : cauchemard, désolation, désespoir....
On Wed, Jul 21, 2004 at 07:18:28AM +0200, Erwan David wrote : Le Tue 20/07/2004, Leopold BAILLY disait Charles Plessy [EMAIL PROTECTED] writes: Les fichiers texte que je créé sont en utf8, avec un encodage différent pour les accents. Ça signifie que mon monde est coupé en deux parties qui s'ignorent : iso, et utf8. Tout ce que je fais en utf8 est de facto inutilisable, à moins d'aimer avoir des é sur ses pages web. Pour transformer un fichier ISO-* en UTF-8 : recode. Avec un bémol : la doc est incompréhensible... Pas 100% à jour, on dirait : lidlpenguin|charles|$ cat toto é lidlpenguin|charles|$ recode |grep AVANT dites selon la syntaxe « AVANT1:APRÈS1,AVANT2:APRÈS2,... »; chaque code AVANT CODAGE est [CHARSET][/[SURFACE]]...; DEMANDE ressemble souvent à AVANT..APRÈs, AVANT et APRÈS étant des charsets. Un CHARSET omis sous-entend le charset lidlpenguin|charles|$ recode UTF-8:ISO-8859-15 toto recode: Syntaxe désuète, veuillez préférer « UTF-8..ISO-8859-15 » lidlpenguin|charles|$ file toto toto: ISO-8859 text Néanmoins, ça marche :) lidlpenguin|charles|$ alias unutf='recode UTF-8..ISO-8859-15' lidlpenguin|charles|$ cat toto é lidlpenguin|charles|$ unutf toto lidlpenguin|charles|$ file toto toto: ISO-8859 text -- Charles
Re: utf-8 : cauchemard, désolation, désespoir....
Le Wed 21/07/2004, Charles Plessy disait On Wed, Jul 21, 2004 at 07:18:28AM +0200, Erwan David wrote : Le Tue 20/07/2004, Leopold BAILLY disait Charles Plessy [EMAIL PROTECTED] writes: Les fichiers texte que je créé sont en utf8, avec un encodage différent pour les accents. Ça signifie que mon monde est coupé en deux parties qui s'ignorent : iso, et utf8. Tout ce que je fais en utf8 est de facto inutilisable, à moins d'aimer avoir des é sur ses pages web. Pour transformer un fichier ISO-* en UTF-8 : recode. Avec un bémol : la doc est incompréhensible... Pas 100% à jour, on dirait : lidlpenguin|charles|$ cat toto é lidlpenguin|charles|$ recode |grep AVANT dites selon la syntaxe « AVANT1:APRÈS1,AVANT2:APRÈS2,... »; chaque code AVANT CODAGE est [CHARSET][/[SURFACE]]...; DEMANDE ressemble souvent à AVANT..APRÈs, AVANT et APRÈS étant des charsets. Un CHARSET omis sous-entend le charset Si quelqu'un est capable d'expliquer à un béotien ce que sont les charsets et les surfaces. Et comment on gère les fins de ligne en plus... -- Erwan
Re: utf-8 : cauchemard, désolation, désespoir....
On Tue, 20 Jul 2004 23:10:01 +0900 Charles Plessy [EMAIL PROTECTED] wrote: Bonjour à tous, Erwan David a évoqué il y a un ou deux mois gnu-recode (paquet recode dans Debian): Character set conversion utility Free `recode' converts files between character sets and usages. When exact transliterations are not possible, it may get rid of the offending characters or fall back on approximations. This program recognizes or produces nearly 300 different character sets and is able to transliterate files between almost any pair. Most RFC 1345 character sets, and all `libiconv' character sets, are supported. A mon avis, ça te sera utile François Boisson
Re: utf-8 : cauchemard, désolation, désespoir....
On 2004-07-20 23:10:01 +0900, Charles Plessy wrote: emacs n'accepte plus la saisie des accents et autres cédilles. J'ai viré mon .emacs, rien n'y fait = Je suis passé à vi. Je trouve qu'emacs est un des programmes qui supporte le mieux UTF-8. Tu as probablement un problème de config. man et less n'acceptent plus que je fasse de recherche en tapant sur slash. (= LC_ALL=C man toto) man utilise un pager externe et n'est donc pas directement en cause. Oui, less bugge complètement (mais fonctionnait dans le passé!). zsh n'est pas non plus compatible UTF-8. Les fichiers texte que je créé sont en utf8, avec un encodage différent pour les accents. Ça signifie que mon monde est coupé en deux parties qui s'ignorent : iso, et utf8. Tout ce que je fais en utf8 est de facto inutilisable, à moins d'aimer avoir des é sur ses pages web. Pour l'édition, emacs sait reconnaître l'encodage (sauf quand c'est trop ambigu, mais aucun problème entre UTF-8 et ISO-8859-1 par exemple). Pour le HTML, XML, etc. il y a des méthodes pour déclarer l'encodage, donc aucun problème quand on fait correctement... 1) Le support utf8 est-il encore inutilisable et expérimental ? La seule raison pour laquelle je ne suis pas passé à UTF-8 complètement est zsh. 2) Si non, qu'ai-je fait d'incorrect pour en arriver là ? Il faudrait voir les logiciels un par un. Au fait, y a-t-il un howto complet quelque part? -- Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/ 100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17, Championnat International des Jeux Mathématiques et Logiques, etc. Work: CR INRIA - computer arithmetic / SPACES project at LORIA
Re: utf-8 : cauchemard, désolation, désespoir....
On 2004-07-21 07:51:59 +0200, nicolas wrote: Le Wed, 21 Jul 2004 07:20:04 +0200, Erwan David a écrit : Le Tue 20/07/2004, Leopold BAILLY disait Charles Plessy [EMAIL PROTECTED] writes: Pour transformer un fichier ISO-* en UTF-8 : recode. Avec un bémol : la doc est incompréhensible... Alors utilise konwert. Il y a aussi iconv. -- Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/ 100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17, Championnat International des Jeux Mathématiques et Logiques, etc. Work: CR INRIA - computer arithmetic / SPACES project at LORIA
Re: utf-8 : cauchemard, désolation, désespoir....
* Vincent Lefevre [EMAIL PROTECTED] [2004-07-21 12:03] : On 2004-07-20 23:10:01 +0900, Charles Plessy wrote: [...] 2) Si non, qu'ai-je fait d'incorrect pour en arriver là ? Il faudrait voir les logiciels un par un. Au fait, y a-t-il un howto complet quelque part? Quelque chose comme l'Unicode HOWTO ? (http://www.tldp.org/HOWTO/Unicode-HOWTO.html, la traduction en français n'est pas à jour mais peut donner tout de même des informations intéressantes : http://www.traduc.org/docs/HOWTO/vf/Unicode-HOWTO.html) Fred -- Comment poser les questions de manière intelligente ? http://www.gnurou.org/documents/smart-questions-fr.html Comment signaler efficacement un bug ? http://www.chiark.greenend.org.uk/~sgtatham/bugs-fr.html
Re: utf-8 : cauchemard, désolation, désespoir....
On 2004-07-20 19:33:14 +0200, Arnaud CALVO wrote: Il faut sélectionner une police qui propose de l'utf8. Moi j'ai ça pour xmms et pour la liste de lecture : -adobe-helvetica-medium-r-normal-*-*-80-*-*-p-*-iso10646-1 Pas capable de le faire automatiquement? C'est nul! man et less n'acceptent plus que je fasse de recherche en tapant sur slash. (= LC_ALL=C man toto) Pas de pb non plus. Tu as essayé, avec la dernière version de less, de lire un fichier ISO-8859-1 avec des locales en UTF-8 et un LESSCHARSET mis à latin1? -- Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/ 100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17, Championnat International des Jeux Mathématiques et Logiques, etc. Work: CR INRIA - computer arithmetic / SPACES project at LORIA
Re: utf-8 : cauchemard, désolation, désespoir....
On 2004-07-21 11:04:40 +0200, Gaëtan PERRIER wrote: Par contre une fois en utf8 tous mes fichiers seront créés en utf8, c'est bien ça? Pas forcément. On peut toujours dire à l'éditeur ou générateur du fichier de créer le fichier dans un autre encodage. Ce n'est pas forcément gênant (notamment pour les fichiers XML, les mails...). Au fait, ce mail est écrit depuis un terminal en ISO-8859-1, via une session ssh en ISO-8859-1, où est lancé un screen avec Mutt en UTF-8 (screen s'occupe de faire toutes les conversions nécessaires) et l'éditeur est Emacs, travaillant en UTF-8 en entrée et en sortie. Vous recevrez ce mail en ISO-8859-1, car j'ai configuré Mutt pour envoyer de l'ISO-8859-1 si tous les caractères du mail peuvent être représentés sous cet encodage. Bref, avec des conversions effectuées de manière transparente, il n'y a pas de problème d'encodage. -- Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/ 100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17, Championnat International des Jeux Mathématiques et Logiques, etc. Work: CR INRIA - computer arithmetic / SPACES project at LORIA
Re: utf-8 : cauchemard, désolation, désespoir....
On 2004-07-21 08:34:54 +, Jean-Luc Coulon (f5ibh) wrote: Ca, c'est préjuger (favorablemet) de la manière dont le navigateur du *client* va interpréter les choses. Si on veut pouvoir être lu par les divers navigateurs du marché, c'est quand même préférable d'utiliser les entités HTML. Non, un navigateur doit savoir suivre les recommandations pour déterminer l'encodage utillisé. -- Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/ 100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17, Championnat International des Jeux Mathématiques et Logiques, etc. Work: CR INRIA - computer arithmetic / SPACES project at LORIA
Re: utf-8 : cauchemard, désolation, désespoir....
On 2004-07-21 13:21:05 +0200, Frederic Bothamy wrote: Quelque chose comme l'Unicode HOWTO ? (http://www.tldp.org/HOWTO/Unicode-HOWTO.html, la traduction en français n'est pas à jour mais peut donner tout de même des informations intéressantes : http://www.traduc.org/docs/HOWTO/vf/Unicode-HOWTO.html) La version anglaise n'est pas non plus à jour (elle a plus de 3 ans!). C'est quelque chose de ce genre que je cherche, mais à jour. :) -- Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/ 100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17, Championnat International des Jeux Mathématiques et Logiques, etc. Work: CR INRIA - computer arithmetic / SPACES project at LORIA
Re: utf-8 : cauchemard, désolation, désespoir....
* Vincent Lefevre [EMAIL PROTECTED] [2004-07-21 14:27] : On 2004-07-21 13:21:05 +0200, Frederic Bothamy wrote: Quelque chose comme l'Unicode HOWTO ? (http://www.tldp.org/HOWTO/Unicode-HOWTO.html, la traduction en français n'est pas à jour mais peut donner tout de même des informations intéressantes : http://www.traduc.org/docs/HOWTO/vf/Unicode-HOWTO.html) La version anglaise n'est pas non plus à jour (elle a plus de 3 ans!). C'est quelque chose de ce genre que je cherche, mais à jour. :) Ah oui, exact. Alors cette UTF-8 and Unicode FAQ for Unix/Linux (proposée dans le HOWTO anglais) : http://www.cl.cam.ac.uk/~mgk25/unicode.html qui semble assez à jour (date de dernière modification le 13/06/2004). Fred -- Comment poser les questions de manière intelligente ? http://www.gnurou.org/documents/smart-questions-fr.html Comment signaler efficacement un bug ? http://www.chiark.greenend.org.uk/~sgtatham/bugs-fr.html
Re: utf-8 : cauchemard, désolation, désespoir....
Le 21.07.2004 13:49:58, Vincent Lefevre a écrit : « On 2004-07-21 08:34:54 +, Jean-Luc Coulon (f5ibh) wrote: « Ca, c'est préjuger (favorablemet) de la manière dont le navigateur « du « *client* va interpréter les choses. Si on veut pouvoir être lu par « les « divers navigateurs du marché, c'est quand même préférable « d'utiliser « les entités HTML. « « Non, un navigateur doit savoir suivre les recommandations pour « déterminer l'encodage utillisé. Je te propose d'expliquer ça à tous ceux qui on Internet Explorer 5 (qui en plus d'être une passoire ne sait pas non plus gérer la transparence sur les fichiers .png..) Je ne partage pas ton opinion : le développeur de site web n'a pas pour cible une catégorie particulière d'utilisateurs (utilisateurs de Mozilla, d'Opera ou d4internet Explorer). Si je développe un site web, c'est pour que la majorité de ceux qui le visitent le voient tel que je l'ai réalisé. Et pour ça, je n'ai pas le choix, il faut faire des concessions. Essayer, par exemple, la différence de comportement entre les différents navigateurs en mode natif et en mode conforme... --- - Jean-Luc « « -- « Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/ signature.asc Description: PGP signature
Re: utf-8 : cauchemard, désolation, désespoir....
On 2004-07-21 17:00:41 +0200, Frederic Bothamy wrote: Ah oui, exact. Alors cette UTF-8 and Unicode FAQ for Unix/Linux (proposée dans le HOWTO anglais) : http://www.cl.cam.ac.uk/~mgk25/unicode.html qui semble assez à jour (date de dernière modification le 13/06/2004). Cette FAQ est peut-être à jour, mais ce n'est pas un HOWTO. En particulier, il y a rien concernant l'utilisation d'Unicode avec les diverses applications... -- Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/ 100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17, Championnat International des Jeux Mathématiques et Logiques, etc. Work: CR INRIA - computer arithmetic / SPACES project at LORIA
Re: utf-8 : cauchemard, désolation, désespoir....
On 2004-07-21 15:27:26 +, Jean-Luc Coulon (f5ibh) wrote: Je te propose d'expliquer ça à tous ceux qui on Internet Explorer 5 Je me f... complètement de ces utilisateurs. Ils ont choisi un navigateur buggé. Qu'ils assument les conséquences. Je ne partage pas ton opinion : le développeur de site web n'a pas pour cible une catégorie particulière d'utilisateurs (utilisateurs de Mozilla, d'Opera ou d4internet Explorer). Dans ce cas, il ne faut pas utiliser de caractères accentués (sous forme d'entités ou autre), car ils ne passent pas avec certains terminaux (configurés en US-ASCII, etc.). -- Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/ 100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17, Championnat International des Jeux Mathématiques et Logiques, etc. Work: CR INRIA - computer arithmetic / SPACES project at LORIA
Re: utf-8 : cauchemard, désolation, désespoir....
* Vincent Lefevre [EMAIL PROTECTED] [2004-07-21 17:48] : On 2004-07-21 17:00:41 +0200, Frederic Bothamy wrote: Ah oui, exact. Alors cette UTF-8 and Unicode FAQ for Unix/Linux (proposée dans le HOWTO anglais) : http://www.cl.cam.ac.uk/~mgk25/unicode.html qui semble assez à jour (date de dernière modification le 13/06/2004). Cette FAQ est peut-être à jour, mais ce n'est pas un HOWTO. En particulier, il y a rien concernant l'utilisation d'Unicode avec les diverses applications... La section What UTF-8 enabled applications are available? ne te convient pas ? Elle est marquée comme de moins en moins complète depuis mi-2003. Ce doit être tout de même assez à jour (ça parle d'Emacs 21 et du futur Emacs 22). Fred -- Comment poser les questions de manière intelligente ? http://www.gnurou.org/documents/smart-questions-fr.html Comment signaler efficacement un bug ? http://www.chiark.greenend.org.uk/~sgtatham/bugs-fr.html
Re: utf-8 : cauchemard, désolation, désespoir....
On 2004-07-21 19:53:33 +0200, Jean-Luc Coulon wrote: On Wed, Jul 21, 2004 at 05:56:12PM +0200, Vincent Lefevre wrote: On 2004-07-21 15:27:26 +, Jean-Luc Coulon (f5ibh) wrote: Je te propose d'expliquer ça à tous ceux qui on Internet Explorer 5 Je me f... complètement de ces utilisateurs. Ils ont choisi un navigateur buggé. Qu'ils assument les conséquences. Je pense que si tu avais à t'occuper d'un site commerçant ou simplement d'un site « sérieux » tu ne te ficherais pas des utilisateurs. Mon site est sérieux. Mais il y a des bornes à ne pas dépasser. Si IE5 est buggé au point de ne pas comprendre les caractères directement encodés en 8 bits, ce n'est plus mon problème. 1 - quand on a un site commerçant, tout utilisateur est un cient potentiel. 2 - quand on publie quelque chose de sérieux sur le web, on a le *respect* des utilisateurs quelqu'ils soient, ils n'ont peut être pas fait le choix de leurs outils. 3 - si on rend des données publiques, c'est qu'ojn juge qu'elle on un certain intérêt et le *respect* de l'utilisateur fait aussi partie des règles de bonne conduite. Si c'est pour revenir 10 ans en arrière, non merci. Je ne partage pas ton opinion : le développeur de site web n'a pas pour cible une catégorie particulière d'utilisateurs (utilisateurs de Mozilla, d'Opera ou d4internet Explorer). Dans ce cas, il ne faut pas utiliser de caractères accentués (sous forme d'entités ou autre), car ils ne passent pas avec certains terminaux (configurés en US-ASCII, etc.). Lorsqu'on travaille en français, on *doit* utilsier des caractères accentués. Le monde ne s'est pas arrêté de tourner parce qu'il y avait des logiciels incompatibles avec les caractères accentués. On doit utiliser des caractères accentués *quand ça ne pose pas de problème*. Si le terminal est configuré en US-ASCII c'est que l'utilisateur en question n'avait pas à utiliser du français, ne le voulait pas ou ne le désirait pas. Si l'utilisateur utilise IE5, c'est qu'il n'est pas intéressé de voir des pages respectant les standards. -- Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/ 100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17, Championnat International des Jeux Mathématiques et Logiques, etc. Work: CR INRIA - computer arithmetic / SPACES project at LORIA
Re: utf-8 : cauchemard, désolation, désespoir....
On 2004-07-21 20:09:44 +0200, Frederic Bothamy wrote: La section What UTF-8 enabled applications are available? ne te convient pas ? Elle est marquée comme de moins en moins complète depuis mi-2003. Ce doit être tout de même assez à jour (ça parle d'Emacs 21 et du futur Emacs 22). Elle n'explique pas comment faire fonctionner les applications en question en UTF-8. Et puisque certaines applications ne sont pas compatibles UTF-8, il faut garder l'interopérabilité avec ISO-8859-1 par exemple, et donc expliquer comment configurer pour que ça fonctionne avec les deux types de locales simultanément. Concernant Mutt, il ne supporte pas complètement UTF-8. Par exemple, en locale UTF-8, les recherches de mots avec caractères accentués dans le corps depuis l'index échouent. -- Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/ 100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17, Championnat International des Jeux Mathématiques et Logiques, etc. Work: CR INRIA - computer arithmetic / SPACES project at LORIA
Re: utf-8 : cauchemard, désolation, désespoir....
On 2004-07-21 23:48:23 +0200, Gaëtan PERRIER wrote: On utilise les caractères français parce que l'on est français, c'est tout. Je te retourne ce que tu dis au-dessus (Si c'est pour revenir 10 ans en arrière, non merci.) Mais je suis d'accord avec toi. C'est juste le fait qu'imposer des entités HTML, c'est idiot, car ça pose également des problèmes. L'utilisateur n'est bien souvent pas au courant que IE ne respecte pas les standards... On peut toujours le lui signaler. Le !--[if IE] ... ![endif]-- est très utile pour cela. :) -- Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/ 100% validated (X)HTML - Acorn / RISC OS / ARM, free software, YP17, Championnat International des Jeux Mathématiques et Logiques, etc. Work: CR INRIA - computer arithmetic / SPACES project at LORIA
utf-8 : cauchemard, désolation, désespoir....
Bonjour à tous, Afin d'afficher des caractères japonais (je bosse au japon), je suis passé à UTF-8. Première impression : ça marche. Deuxième impression : il y a une foultitude de programmes qui déconnent, et ça commence à me faire perdre beaucoup de temps. En fait, ça me rapelle le temps où installer une debian qui accepte les accents français était une aventure... Parmis ce qui ne marche pas : des chose pas grave: par exemple, la playlist de xmms n'affiche plus un seul caractère. Un coup de LC_ALL=C xmms, et ça repart. Juste pour un prog, ça irait, et encore... Mais il y a pire : aspell ne marche plus. Il bute sur les accents français, et les considère comme des coupures de mots. emacs n'accepte plus la saisie des accents et autres cédilles. J'ai viré mon .emacs, rien n'y fait = Je suis passé à vi. man et less n'acceptent plus que je fasse de recherche en tapant sur slash. (= LC_ALL=C man toto) centericq pète les plombs. Mais le fond du problème n'est pas là ; voici l'objet premier de mon mail : Les fichiers texte que je créé sont en utf8, avec un encodage différent pour les accents. Ça signifie que mon monde est coupé en deux parties qui s'ignorent : iso, et utf8. Tout ce que je fais en utf8 est de facto inutilisable, à moins d'aimer avoir des é sur ses pages web. D'où deux questions : 1) Le support utf8 est-il encore inutilisable et expérimental ? 2) Si non, qu'ai-je fait d'incorrect pour en arriver là ? Question subsidiaire : n'y a-t-il pas un unligne qui me permettrait de récupérer le fruit de mon travail.txt en iso? Ou un moyen de n'utiliser utf8 que quand s'imisce un caractère oriental ? voici une illustration du problème: lidlpenguin|charles|$ cat toto skljgfklsdg lidlpenguin|charles|$ file toto toto: ASCII text lidlpenguin|charles|$ cat toto ljlfqskjémljsf lidlpenguin|charles|$ file toto toto: UTF-8 Unicode text lidlpenguin|charles|$ env | grep FR [EMAIL PROTECTED] [EMAIL PROTECTED] En éspérant qu'il y ait «un médecin dans la salle», -- Charles
Re: utf-8 : cauchemard, désolation, désespoir....
Tu n'as vraiment pas de bol, chez moi tout roule. [EMAIL PROTECTED]:~$ locale [EMAIL PROTECTED] LC_CTYPE=[EMAIL PROTECTED] LC_NUMERIC=[EMAIL PROTECTED] LC_TIME=[EMAIL PROTECTED] LC_COLLATE=[EMAIL PROTECTED] LC_MONETARY=[EMAIL PROTECTED] LC_MESSAGES=[EMAIL PROTECTED] LC_PAPER=[EMAIL PROTECTED] LC_NAME=[EMAIL PROTECTED] LC_ADDRESS=[EMAIL PROTECTED] LC_TELEPHONE=[EMAIL PROTECTED] LC_MEASUREMENT=[EMAIL PROTECTED] LC_IDENTIFICATION=[EMAIL PROTECTED] LC_ALL= Ce choix est donné dès la connection sous gdm. Je peux même avoir tout en utf-8, les noms de fichiers, leur contenu, l'affichage, le clavier, tout. n.
Re: utf-8 : cauchemard, désolation, désespoir....
Le 20.07.2004 18:22:16, nicolas a écrit : « Tu n'as vraiment pas de bol, chez moi tout roule. « « [EMAIL PROTECTED]:~$ locale « [EMAIL PROTECTED] « LC_CTYPE=[EMAIL PROTECTED] « LC_NUMERIC=[EMAIL PROTECTED] « LC_TIME=[EMAIL PROTECTED] « LC_COLLATE=[EMAIL PROTECTED] « LC_MONETARY=[EMAIL PROTECTED] « LC_MESSAGES=[EMAIL PROTECTED] « LC_PAPER=[EMAIL PROTECTED] « LC_NAME=[EMAIL PROTECTED] « LC_ADDRESS=[EMAIL PROTECTED] « LC_TELEPHONE=[EMAIL PROTECTED] « LC_MEASUREMENT=[EMAIL PROTECTED] « LC_IDENTIFICATION=[EMAIL PROTECTED] « LC_ALL= « « Ce choix est donné dès la connection sous gdm. Je peux même avoir « tout « en utf-8, les noms de fichiers, leur contenu, l'affichage, le « clavier, « tout. Même aspell et acheck ? -- J-L « « n. « « « -- « Pensez à lire la FAQ de la liste avant de poser une question : « http://wiki.debian.net/?DebianFrench « « Pensez à rajouter le mot ``spam'' dans vos champs From et « Reply-To: « « To UNSUBSCRIBE, email to [EMAIL PROTECTED] « with a subject of unsubscribe. Trouble? Contact « [EMAIL PROTECTED] « « « -- --- __ _ Jean-Luc Coulon (f5ibh) / __ \ ___ / /_ (_) _ 28 rue d'Evette / / / // _ \ / __ \ / // __ `// __ \ 90350 Evette-Salbert / /_/ // __// /_/ // // /_/ // / / / France/_/ \___//_.___//_/ \__,_//_/ /_/ signature.asc Description: PGP signature
Re: utf-8 : cauchemard, désolation, désespoir....
Charles Plessy a écrit, Le 20.07.2004 16:10 : Afin d'afficher des caractères japonais (je bosse au japon), je suis passé à UTF-8. Première impression : ça marche. Deuxième impression : il Parmis ce qui ne marche pas : des chose pas grave: par exemple, la playlist de xmms n'affiche plus un seul caractère. Un coup de LC_ALL=C xmms, et ça repart. Il faut sélectionner une police qui propose de l'utf8. Moi j'ai ça pour xmms et pour la liste de lecture : -adobe-helvetica-medium-r-normal-*-*-80-*-*-p-*-iso10646-1 Juste pour un prog, ça irait, et encore... Mais il y a pire : aspell ne marche plus. Il bute sur les accents français, et les considère comme des coupures de mots. Joker. Je n'utilise pas ça. emacs n'accepte plus la saisie des accents et autres cédilles. J'ai viré mon .emacs, rien n'y fait = Je suis passé à vi. J'utilise aussi vi, pas de problème de ce côté-là... man et less n'acceptent plus que je fasse de recherche en tapant sur slash. (= LC_ALL=C man toto) Pas de pb non plus. Les fichiers texte que je créé sont en utf8, avec un encodage différent pour les accents. Ça signifie que mon monde est coupé en deux parties qui s'ignorent : iso, et utf8. Tout ce que je fais en utf8 est de facto inutilisable, à moins d'aimer avoir des é sur ses pages web. Je crée mes fichiers en utf8 (merci vi, rox et rox-edit) et je n'ai pas de pb pour les (re)lire. D'où deux questions : 1) Le support utf8 est-il encore inutilisable et expérimental ? Je le trouve tout à fait utilisable, mais j'attends avec impatience les versions gtk2 de mes softs, car quasi aucun de mes softs en gtk1.2 ne gère correctement l'utf8... -- La citation du jour : J'ai lu un truc sur les méfaits de la boisson : du coup, j'ai arrêté de lire. :: Arnaud
Re: utf-8 : cauchemard, désolation, désespoir....
Le 20.07.2004 21:21:05, Leopold BAILLY a écrit : « Charles Plessy [EMAIL PROTECTED] writes: « « Les fichiers texte que je créé sont en utf8, avec un encodage « différent « pour les accents. Ça signifie que mon monde est coupé en deux « parties « qui s'ignorent : iso, et utf8. Tout ce que je fais en utf8 est « de facto inutilisable, à moins d'aimer avoir des é sur ses pages « web. Un « é » (par exemple) se code eacute; pour éviter ce genre de problème. Ensuite, il faudra, comme le dit Léo, préciser le charset utilisé dans l'en-tête. Dans ce cas, ça ne pose aucun problèmes aux navigateurs. --- -Jean-Luc « « Pour transformer un fichier ISO-* en UTF-8 : recode. « « Pour les pages html, le navigateur doit comprendre que la page est « encodée UTF-8. « Il y a deux précautions à prendre : « - au niveau du contenu de la page html, spécifier « HEAD « META http-equiv=Content-Type content=text/html; « charset=UTF-8 « ... « - au niveau de la réponse http, dans le cas d'une page dynamique, il « faut insérer l'entête « Content-Type: text/html; charset=UTF-8 « « « Léo. « « « signature.asc Description: PGP signature
Re: utf-8 : cauchemard, désolation, désespoir....
On Wed, Jul 21, 2004 at 01:07:36AM +0200, Iznogood wrote : Le Tue, 20 Jul 2004 19:18:46 +0200 Julien Louis [EMAIL PROTECTED] a écrit : On Tue, Jul 20, 2004 at 05:01:00PM +, Jean-Luc Coulon (f5ibh) wrote: Même aspell et acheck ? Non malheureusement, et cela m'embète beaucoup :'( avec un xterm unicode et --encoding=utf-8, ça passe normalement. Et pour un aspell lancé depuis mutt à travers une connexion ssh? J'ai l'impression que je touche un problème : l'interaction entre le terminal d'où est lancé ssh, et le shell distant. Par exemple, je suis co-administrateur d'une machine. Donc on va mélanger les fichiers iso et utf, car : shadow:~# cat toto lldkjfqçà shadow:~# file toto toto: UTF-8 Unicode text shadow:~# locale LANG=fr_FR.ISO-8859-15 LC_CTYPE=[EMAIL PROTECTED] LC_NUMERIC=[EMAIL PROTECTED] LC_TIME=[EMAIL PROTECTED] LC_COLLATE=[EMAIL PROTECTED] LC_MONETARY=[EMAIL PROTECTED] LC_MESSAGES=[EMAIL PROTECTED] LC_PAPER=[EMAIL PROTECTED] LC_NAME=[EMAIL PROTECTED] LC_ADDRESS=[EMAIL PROTECTED] LC_TELEPHONE=[EMAIL PROTECTED] LC_MEASUREMENT=[EMAIL PROTECTED] LC_IDENTIFICATION=[EMAIL PROTECTED] [EMAIL PROTECTED] = j'ai beau faire tout mon possible, pas moyen d'éviter l'utf8 là où je n'en veux pas! (PS : merci à toutes les réponse, qui m'ont rendu un peu de courage) -- Charles