Re: Apostrophes et... UTF8 ? [Was: [HS] réponses | Re: failtoban]

2007-06-09 Par sujet Vincent Lefevre
On 2007-06-08 23:17:51 +0200, Jacques L'helgoualc'h wrote:
 Tout ça ne me semble pas très clair : tu parles de fonctions différentes
 d'un même  caractère (apostrophe et guillemet fermant  anglais), mais on
 semble pourtant insister dans la littérature unicode pour considérer que
 c'est la même  lettre M dans toutes les langues de  latin1,

Oui, ça ne pose pas de problème. En revanche la lettre latine P et
la lettre cyrillic Р qui ont le même glyphe doivent être considérées
comme différentes.

 ou qu'il est inutile voire nuisible de créer des lettres bretonnes
 ou autres comme « ch » et « c'h », car on a déjà ce qu'il faut pour
 les écrire :

Je ne connais pas le breton, et je ne sais donc pas si cela a un sens
de créer de nouvelles lettres ou pas.

 si le principe d'unicode est de normaliser le codage des caractères
 en tant que glyphes (ou leurs classes d'équivalence), les ambiguïtés
 d'un langage sont des « bugs » de ce dernier, et pas d'unicode.

Le principe d'Unicode est de normaliser le codage des caractères en
tant que caractères (fonction + glyphe, sans tenir compte des styles,
sauf s'ils modifient la fonction, cf les caractères mathématiques
U+1D400 à U+1D6A3 basés sur l'alphabet latin).

-- 
Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/
100% accessible validated (X)HTML - Blog: http://www.vinc17.org/blog/
Work: CR INRIA - computer arithmetic / Arenaire project (LIP, ENS-Lyon)


-- 
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench   
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs From et
Reply-To:

To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]



Re: Apostrophes et... UTF8 ? [Was: [HS] réponses | Re: failtoban]

2007-06-09 Par sujet Jacques L'helgoualc'h
Vincent Lefevre a écrit, samedi 9 juin 2007, à 13:23 :
 On 2007-06-08 23:17:51 +0200, Jacques L'helgoualc'h wrote:
  Tout ça ne me semble pas très clair : tu parles de fonctions différentes
  d'un même  caractère (apostrophe et guillemet fermant  anglais), mais on
  semble pourtant insister dans la littérature unicode pour considérer que
  c'est la même  lettre M dans toutes les langues de  latin1,

 Oui, ça ne pose pas de problème.

... comme  c'est un  caractère ascii,  il ne pose  pas de  problèmes aux
anglo-saxons ---  mais, si je ne m'abuse,  le « LL » a une  place à part
en  espagnol, le « æ »  latin1 est  une ligature  en français,  mais une
lettre danoise (après le Z dans l'ordre alphabétique)...

 En revanche  la lettre latine  P et la  lettre cyrillic ?? qui  ont le
 même glyphe doivent être considérées comme différentes.

Ça  vient aussi  du  fait que  Unicode a  importé  en bloc  des jeux  de
caractères préexistants. C'est moins gênant pour des langues distinctes,
mais un  gag sous Emacs,  sans unification, était  de ne pas  trouver le
« é »  latin1  dans un  buffer  latin9 ---  c'est  plus  courant que  de
chercher « CCCP » dans un texte français...

D'un autre côté, D. E. Knuth  n'a défini que les majuscules grecques qui
lui manquaient --- il est vrai que lui devait être économe.

  ou qu'il est inutile voire nuisible de créer des lettres bretonnes
  ou autres comme « ch » et « c'h », car on a déjà ce qu'il faut pour
  les écrire :

 Je ne connais pas le breton, et je ne sais donc pas si cela a un sens
 de créer de nouvelles lettres ou pas.

C'est surtout  qu'il y  a des centaines,  voire des milliers  de langues
utilisant  des variantes  de l'alphabet  romain, et  que  Unicode, après
avoir validé un certain nombre de di- et trigrammes, a arrêté les frais.

Certains  typographes  bretons  préconisant  d'incliner le  « skrab »  à
gauche, avoir une lettre {c'h}  ou {c`h} à part entière faciliterait une
normalisation, mais on n'est plus vendredi.

  si le principe d'unicode est de normaliser le codage des caractères
  en tant que glyphes (ou leurs classes d'équivalence), les ambiguïtés
  d'un langage sont des « bugs » de ce dernier, et pas d'unicode.

 Le principe d'Unicode est de normaliser le codage des caractères en
 tant que caractères (fonction + glyphe, sans tenir compte des styles,
 sauf s'ils modifient la fonction, cf les caractères mathématiques
 U+1D400 à U+1D6A3 basés sur l'alphabet latin).

Si  tu  rajoutes  la sémantique  à  la  graphie,  ça devient  une  tâche
herculéenne, et  ça avortera  aussi à un  moment ou  un autre ---  et tu
crois vraiment que les  utilisateurs matheux vont accepter de distinguer
le caractère marquant  la dérivation $f'$ de celui  de l'inversion $A'$,
ou tant qu'à faire les différents types de « + » ?
-- 
Jacques L'helgoualc'h


-- 
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench   
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs From et
Reply-To:

To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]



Re: Apostrophes et... UTF8 ? [Was: [HS] réponses | Re: failtoban]

2007-06-08 Par sujet Vincent Lefevre
On 2007-06-07 13:12:33 +0200, Yves Rutschle wrote:
 Tu aurais une idée de pourquoi iconv ne comprend pas le
 caractère?

Je crois que quand un caractère n'est pas dans le jeu de caractères
des locales (et ne peut pas être transcodé), iconv renvoie une
erreur. Alors Mutt traduit l'octet correspondant par un '?' (je
ne pense pas que Mutt puisse faire mieux: il ne connaît pas UTF-8,
ce n'est pas son travail, mais celui d'iconv). Quand un caractère
est encodé par 3 octets, il est donc remplacé par 3 '?'.

-- 
Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/
100% accessible validated (X)HTML - Blog: http://www.vinc17.org/blog/
Work: CR INRIA - computer arithmetic / Arenaire project (LIP, ENS-Lyon)


-- 
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench   
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs From et
Reply-To:

To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]



Re: Apostrophes et... UTF8 ? [Was: [HS] réponses | Re: failtoban]

2007-06-08 Par sujet Vincent Lefevre
On 2007-06-07 17:57:13 +0200, Yves Rutschle wrote:
 Au fait, d'où sort cette option TRANSLIT? Si j'ai bien
 compris, cette chaine est utilisée pour initialiser des
 appels à iconv qui fait le travail, mais je ne vois pas de
 traces dans iconv(1) ou iconv_open(3)... 

C'est documenté dans le iconv_open(3) (en tout cas dans unstable).
Mais ce n'est pas documenté dans le manuel de la glibc, et c'est
un bug:

  http://sourceware.org/bugzilla/show_bug.cgi?id=3794

-- 
Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/
100% accessible validated (X)HTML - Blog: http://www.vinc17.org/blog/
Work: CR INRIA - computer arithmetic / Arenaire project (LIP, ENS-Lyon)


-- 
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench   
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs From et
Reply-To:

To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]



Re: Apostrophes et... UTF8 ? [Was: [HS] réponses | Re: failtoban]

2007-06-08 Par sujet Vincent Lefevre
On 2007-06-07 12:09:35 +0200, Jacques L'helgoualc'h wrote:
 Bah,  alors c'est  déjà un  bug  de la  typographie anglaise  ; si  deux
 caractères de fonctions différentes ont le même glyphe, je vois mal quoi
 dessiner sur les cabochons des claviers...

Ce n'est pas spécifique à la typographie anglaise. Unicode définit
toute sorte de tirets et de points, par exemple.

-- 
Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/
100% accessible validated (X)HTML - Blog: http://www.vinc17.org/blog/
Work: CR INRIA - computer arithmetic / Arenaire project (LIP, ENS-Lyon)


-- 
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench   
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs From et
Reply-To:

To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]



Re: Apostrophes et... UTF8 ? [Was: [HS] réponses | Re: failtoban]

2007-06-08 Par sujet Jacques L'helgoualc'h
Vincent Lefevre a écrit, vendredi 8 juin 2007, à 17:40 :
 On 2007-06-07 12:09:35 +0200, Jacques L'helgoualc'h wrote:
  Bah,  alors c'est  déjà un  bug  de la  typographie anglaise  ; si  deux
  caractères de fonctions différentes ont le même glyphe, je vois mal quoi
  dessiner sur les cabochons des claviers...
 
 Ce n'est pas spécifique à la typographie anglaise. Unicode définit
 toute sorte de tirets et de points, par exemple.

Tout ça ne me semble pas très clair : tu parles de fonctions différentes
d'un même  caractère (apostrophe et guillemet fermant  anglais), mais on
semble pourtant insister dans la littérature unicode pour considérer que
c'est la même  lettre M dans toutes les langues de  latin1, ou qu'il est
inutile voire  nuisible de créer  des lettres bretonnes ou  autres comme
« ch » et « c'h », car  on a déjà ce qu'il faut pour  les écrire : si le
principe d'unicode  est de normaliser  le codage des caractères  en tant
que  glyphes  (ou  leurs  classes d'équivalence),  les  ambiguïtés  d'un
langage sont des « bugs » de ce dernier, et pas d'unicode.
-- 
Jacques L'helgoualc'h


-- 
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench   
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs From et
Reply-To:

To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]



Re: Apostrophes et... UTF8? [Was: [HS] réponses | Re: failtoban]

2007-06-07 Par sujet Sylvain Sauvage
Vincent Lefevre, jeudi 7 juin 2007, 01:51:13 CEST
 
 On 2007-06-06 19:32:38 +0200, Sylvain Sauvage wrote:
Mes apostrophes sont des :
  U+2019 RIGHT SINGLE QUOTATION MARK
  UTF-8: e2 80 99  UTF-16BE: 2019  Decimal: #8217;
  ’
  Category: Pf (Punctuation, Final quote)
  Bidi: ON (Other Neutrals)
  
qui fait double emploi : fermeture des U+2018 et apostrophe
  typographique.
 
 Ce double emploi empêche tout transcodage fiable. C'est clairement
 un bug dans Unicode. Un conseil: éviter d'utiliser ce caractère en
 attendant que le problème soit corrigé.

  Le problème se pose aussi avec l’apostrophe droite (' U+0027),
et même en pire :  elle sert à la fois comme apostrophe  et pour
l’ouverture et la fermeture d’une citation.

  Voici ce que dit  Unicode 5.0  (idem que 4.1 et que sa version
française officielle d’ailleurs) :

0027'   APOSTROPHE
= APOSTROPHE-QUOTE
= APL quote
· neutral (vertical) glyph with mixed usage
· 2019 ’ is preferred for apostrophe
· preferred characters in English for paired
  quotation marks are 2018 ‘  2019 ’
…
2018‘   LEFT SINGLE QUOTATION MARK
= SINGLE TURNED COMMA QUOTATION MARK
· this is the preferred glyph (as opposed to
  201B ‛)
…
2019’   RIGHT SINGLE QUOTATION MARK
= SINGLE COMMA QUOTATION MARK
· this is the preferred characker to use for
apostrophe
…

[...]
 C'est mieux que rien (le U+2019 sera remplacé par un accent aigu, ce
 qui est acceptable dans le cas d'un guillemet fermant, mais est assez
 horrible dans le cas d'une apostrophe; cependant c'est surtout parce
 que ce caractère n'est pas utilisé comme il était prévu).

  Prévu par qui ? Je suis les conseils, directives, standards, du
consortium Unicode.

-- 
 Sylvain Sauvage



Re: Apostrophes et... UTF8 ? [Was: [HS] réponses | Re: failtoban]

2007-06-07 Par sujet Vincent Lefevre
On 2007-06-07 08:47:09 +0200, Sylvain Sauvage wrote:
   Le problème se pose aussi avec l’apostrophe droite (' U+0027),
 et même en pire :  elle sert à la fois comme apostrophe  et pour
 l’ouverture et la fermeture d’une citation.

Sa fonction première est l'apostrophe. Tout comme les fonctions
premières de U+2018 et U+2019 sont des guillemets.

 [...]
  C'est mieux que rien (le U+2019 sera remplacé par un accent aigu, ce
  qui est acceptable dans le cas d'un guillemet fermant, mais est assez
  horrible dans le cas d'une apostrophe; cependant c'est surtout parce
  que ce caractère n'est pas utilisé comme il était prévu).
 
   Prévu par qui ?

Par la fonction du caractère telle qu'elle était définie à l'origine.

 Je suis les conseils, directives, standards, du consortium Unicode.

qui sont buggés. On ne peut donc que les contourner.

-- 
Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/
100% accessible validated (X)HTML - Blog: http://www.vinc17.org/blog/
Work: CR INRIA - computer arithmetic / Arenaire project (LIP, ENS-Lyon)


-- 
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench   
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs From et
Reply-To:

To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]



Re: Apostrophes et... UTF8? [Was: [HS] réponses | Re: failtoban]

2007-06-07 Par sujet Sylvain Sauvage
Vincent Lefevre, jeudi 7 juin 2007, 09:11:00 CEST
[...] 
 On 2007-06-07 08:47:09 +0200, Sylvain Sauvage wrote:
Le problème se pose aussi avec l’apostrophe droite (' U+0027),
  et même en pire :  elle sert à la fois comme apostrophe  et pour
  l’ouverture et la fermeture d’une citation.
 
 Sa fonction première est l'apostrophe. Tout comme les fonctions
 premières de U+2018 et U+2019 sont des guillemets.

  Pas d’après ce que j’ai cité.

[...]
Prévu par qui ?
 
 Par la fonction du caractère telle qu'elle était définie à l'origine.

  Par le sous-comité X3.2 de l’ASA¹ ? Ceux qui, pas très loin des
temps immémoriaux des origines, ont dit :
« This coded character set is to facilitate  the  general
interchange of information among  information  processing
systems, communication systems, and associated equipment.
[...]  An 8-bit set was considered  but the need for more
than  128  codes  in  general  applications  was  not yet
evident. »
(¹: comité connu pour avoir pondu  l’« American Standard Code for
Information Interchange » dont il question dans la citation...)

  Les 128 premiers codes sont conservés pour compatibilité avec ce
vieux machin.  Les préférences sont justement là pour indiquer que
d’autres glyphes plus  corrects existent  et doivent être utilisés
lorsque c’est possible.

  Je suis les conseils, directives, standards, du consortium Unicode.
 
 qui sont buggés. On ne peut donc que les contourner.

  Je veux bien que,  pour des  fonctions complexes,  des  glyphes
rares,  ou des cultures sous-représentées parmi les votants,  des
erreurs soient faites et que l’on  mette du temps à les corriger,
mais l’apostrophe est fortement utilisée par les votants, et dans
toutes ses fonctions.  Si c’est bien une erreur et si elle devait
être corrigée, elle l’aurait sans doute déjà été.
  (Certaines erreurs sont conservées pour des raisons de compati-
bilité  entre les  versions  d’Unicode  elles-mêmes  (p.ex. quand
d’autres standards/normes en dépendent).)

-- 
 Sylvain Sauvage



Re: Apostrophes et... UTF8 ? [Was: [HS] réponses | Re: failtoban]

2007-06-07 Par sujet Jacques L'helgoualc'h
Vincent Lefevre a écrit, jeudi 7 juin 2007, à 01:51 :
 On 2007-06-06 19:32:38 +0200, Sylvain Sauvage wrote:
Mes apostrophes sont des :
  U+2019 RIGHT SINGLE QUOTATION MARK
  UTF-8: e2 80 99  UTF-16BE: 2019  Decimal: #8217;
  ???
  Category: Pf (Punctuation, Final quote)
  Bidi: ON (Other Neutrals)
  
qui fait double emploi : fermeture des U+2018 et apostrophe
  typographique.
 
 Ce double emploi empêche tout transcodage fiable. C'est clairement
 un bug dans Unicode.

Bah,  alors c'est  déjà un  bug  de la  typographie anglaise  ; si  deux
caractères de fonctions différentes ont le même glyphe, je vois mal quoi
dessiner sur les cabochons des claviers...

 Un conseil: éviter d'utiliser ce caractère en attendant que le
 problème soit corrigé.

Arf.  Dans les années soixante,  j'étais déjà une victime des codages de
l'apostrophe...

[...]
 Un conseil pour Mutt:
 
 set charset=`locale charmap`//TRANSLIT
 
 C'est mieux que rien (le U+2019 sera remplacé par un accent aigu, ce
 qui est acceptable dans le cas d'un guillemet fermant,

à condition que le guillemet ouvrant soit symétrique,

 mais est assez horrible dans le cas d'une apostrophe ;

ou de la lettre « c'h » bretonne...
-- 
Jacques L'helgoualc'h


-- 
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench   
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs From et
Reply-To:

To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]



Re: Apostrophes et... UTF8 ? [Was: [HS] réponses | Re: failtoban]

2007-06-07 Par sujet Vincent Lefevre
On 2007-06-07 11:03:57 +0200, Sylvain Sauvage wrote:
 Vincent Lefevre, jeudi 7 juin 2007, 09:11:00 CEST
 [...] 
  On 2007-06-07 08:47:09 +0200, Sylvain Sauvage wrote:
 Le problème se pose aussi avec l’apostrophe droite (' U+0027),
   et même en pire :  elle sert à la fois comme apostrophe  et pour
   l’ouverture et la fermeture d’une citation.
  
  Sa fonction première est l'apostrophe. Tout comme les fonctions
  premières de U+2018 et U+2019 sont des guillemets.
 
   Pas d’après ce que j’ai cité.

Si (je parle bien de fonction première).

   Les 128 premiers codes sont conservés pour compatibilité avec ce
 vieux machin.  Les préférences sont justement là pour indiquer que
 d’autres glyphes plus  corrects existent  et doivent être utilisés
 lorsque c’est possible.

Cependant, un code point Unicode n'est pas qu'un glyphe. Il a aussi
une sémantique.

-- 
Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/
100% accessible validated (X)HTML - Blog: http://www.vinc17.org/blog/
Work: CR INRIA - computer arithmetic / Arenaire project (LIP, ENS-Lyon)


-- 
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench   
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs From et
Reply-To:

To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]



Re: Apostrophes et... UTF8 ? [Was: [HS] réponses | Re: failtoban]

2007-06-07 Par sujet Yves Rutschle
On Thu, Jun 07, 2007 at 01:51:13AM +0200, Vincent Lefevre wrote:
 Un conseil pour Mutt:
 
 set charset=`locale charmap`//TRANSLIT

Ça marche bien.

 C'est mieux que rien (le U+2019 sera remplacé par un accent aigu, ce
 qui est acceptable dans le cas d'un guillemet fermant, mais est assez
 horrible dans le cas d'une apostrophe; cependant c'est surtout parce
 que ce caractère n'est pas utilisé comme il était prévu).

Ici ça me le remplace par la même apostrophe que
l'apostrophe ascii.

Tu aurais une idée de pourquoi iconv ne comprend pas le
caractère?

Merci du tuyau pour mutt.

Y.


-- 
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench   
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs From et
Reply-To:

To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]



Re: Apostrophes et... UTF8 ? [Was: [HS] réponses | Re: failtoban]

2007-06-07 Par sujet Htaleb
* Quoting Yves Rutschle [13:12 Thu 07 Jun]:
 On Thu, Jun 07, 2007 at 01:51:13AM +0200, Vincent Lefevre wrote:
  Un conseil pour Mutt:
  
  set charset=`locale charmap`//TRANSLIT
 
 Ça marche bien.

Great thanks for this tip Vincent.


-- 
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench   
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs From et
Reply-To:

To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]



Re: Apostrophes et... UTF8 ? [Was: [HS] réponses | Re: failtoban]

2007-06-07 Par sujet Yves Rutschle
On Thu, Jun 07, 2007 at 01:51:13AM +0200, Vincent Lefevre wrote:
 Un conseil pour Mutt:
 
 set charset=`locale charmap`//TRANSLIT

Au fait, d'où sort cette option TRANSLIT? Si j'ai bien
compris, cette chaine est utilisée pour initialiser des
appels à iconv qui fait le travail, mais je ne vois pas de
traces dans iconv(1) ou iconv_open(3)... 

Y.


-- 
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench   
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs From et
Reply-To:

To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]



Apostrophes et... UTF8? [Was: [HS] réponses | Re: failtoban]

2007-06-06 Par sujet Yves Rutschle
On Wed, Jun 06, 2007 at 06:16:58PM +0200, Sylvain Sauvage wrote:
 Faut pas pousser, il n???y a que de rares questions qui n???ont pas
   de réponse.  Poser correctement sa question est très important.
 
 [...]
  PS: mes accents sont encore de daube, ou j'ai encore un pb de mon côté ?
 
   Pas de problème.  Ton message est en utf-8 et  quoted-printable
 avec les accents bien placés. Un problème de police de caractères
 dans ton Kmail ?

Les accents de Damien passent effectivement sans problème,
par contre tes apostrophes (à Sylvain) ne passent pas (chez
moi?), cf. ci dessus: je vois trois points d'interrogations.
C'est d'autant plus curieux que le reste de tes accents
passe correctement. Suis-je le seul à avoir le problème?

Incidemment, les archives de la liste n'ont pas l'air
d'apprécier du tout l'UTF8...

Y.


-- 
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench   
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs From et
Reply-To:

To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]



Re: Apostrophes et... UTF8? [Was: [HS] réponses | Re: failtoban]

2007-06-06 Par sujet Damien Ulrich
Le mercredi 6 juin 2007 18:56, Yves Rutschle a écrit :
 On Wed, Jun 06, 2007 at 06:16:58PM +0200, Sylvain Sauvage wrote:
  Faut pas pousser, il n???y a que de rares questions qui n???ont pas
de réponse.  Poser correctement sa question est très important.
  
  [...]
   PS: mes accents sont encore de daube, ou j'ai encore un pb de mon côté
   ?
 
Pas de problème.  Ton message est en utf-8 et  quoted-printable
  avec les accents bien placés. Un problème de police de caractères
  dans ton Kmail ?
dans mon kmail ça va ... 

 Les accents de Damien passent effectivement sans problème,
 par contre tes apostrophes (à Sylvain) ne passent pas (chez
 moi?), cf. ci dessus: je vois trois points d'interrogations.
 C'est d'autant plus curieux que le reste de tes accents
 passe correctement. Suis-je le seul à avoir le problème?
Ah pas ici, en tout cas ...

 Incidemment, les archives de la liste n'ont pas l'air
 d'apprécier du tout l'UTF8...
Ah ouala... c'est sur les archives que ça fait mal ! :/
M'enfin, j'ai déjà exposé le pb avec l'UTF-8 sur la ml de mailman-dev...
(euh c'est du mailman ici, hein !?)
A mon avis, j'étais pas le premier et ... rien à cirer :)
J'ai alors converti une partie des templates à la mano, mais me reste le pb 
des pages perl-generated (les .po = recompil, bof) ... bon ...
Bof ... je ferais volontiers beaucoup de choses d'autant plus que j'ai le 
temps !
(d'ailleurs, je suis en train d'essayer de lancer un asso LL, ici)
Mais je suppose que ça n'intéresse personne, ici !!...

 Y.
Dams
-- 



Re: Apostrophes et... UTF8? [Was: [HS] réponses | Re: failtoban]

2007-06-06 Par sujet Sylvain Sauvage
Yves Rutschle, mercredi 6 juin 2007, 18:56:32 CEST
 
 On Wed, Jun 06, 2007 at 06:16:58PM +0200, Sylvain Sauvage wrote:
  Faut pas pousser, il n???y a que de rares questions qui n???ont pas
de réponse.  Poser correctement sa question est très important.
  
  [...]
   PS: mes accents sont encore de daube, ou j'ai encore un pb de mon côté ?
  
Pas de problème.  Ton message est en utf-8 et  quoted-printable
  avec les accents bien placés. Un problème de police de caractères
  dans ton Kmail ?
 
 Les accents de Damien passent effectivement sans problème,
 par contre tes apostrophes (à Sylvain) ne passent pas (chez
 moi?), cf. ci dessus: je vois trois points d'interrogations.
 C'est d'autant plus curieux que le reste de tes accents
 passe correctement. Suis-je le seul à avoir le problème?

  Mes apostrophes sont des :
U+2019 RIGHT SINGLE QUOTATION MARK
UTF-8: e2 80 99  UTF-16BE: 2019  Decimal: #8217;
’
Category: Pf (Punctuation, Final quote)
Bidi: ON (Other Neutrals)

  qui fait double emploi : fermeture des U+2018 et apostrophe
typographique.
  Mauvais MUA ? ;oP

 Incidemment, les archives de la liste n'ont pas l'air
 d'apprécier du tout l'UTF8...

  Oui, ça c’est un problème.

-- 
 Sylvain Sauvage



Re: Apostrophes et... UTF8 ? [Was: [HS] réponses | Re: failtoban]

2007-06-06 Par sujet Yves Rutschle
On Wed, Jun 06, 2007 at 07:24:46PM +0200, Damien Ulrich wrote:
  Les accents de Damien passent effectivement sans problème,
  par contre tes apostrophes (à Sylvain) ne passent pas (chez
  moi?), cf. ci dessus: je vois trois points d'interrogations.
  C'est d'autant plus curieux que le reste de tes accents
  passe correctement. Suis-je le seul à avoir le problème?
 Ah pas ici, en tout cas ...

Avec le message de François, ça suggère que Sylvain emploie
un caractère UTF8 pour lequel mon système n'a pas de symbole
à afficher (je dois avoir un problème de vocabulaire ici:
je veux dire que l'entité UTF8 n'a pas de dessin dans la
police que j'emploie).

 M'enfin, j'ai déjà exposé le pb avec l'UTF-8 sur la ml de mailman-dev...
[...]
 J'ai alors converti une partie des templates à la mano, mais me reste le pb 
 des pages perl-generated (les .po = recompil, bof) ... bon ...
 Bof ... je ferais volontiers beaucoup de choses d'autant plus que j'ai le 
 temps !

Heu, j'ai pas compris ce que tu faisais.

A priori, il suffirait que l'archiveur regarde le charset
sur message et passe un coup d'iconv dessus pour tout passer
en latin1 (ou mieux, tout passer en UTF8).

Y.


-- 
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench   
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs From et
Reply-To:

To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]



Re: Apostrophes et... UTF8 ? [Was: [HS] réponses | Re: failtoban]

2007-06-06 Par sujet Yves Rutschle
On Wed, Jun 06, 2007 at 07:32:38PM +0200, Sylvain Sauvage wrote:
   Mes apostrophes sont des :
 U+2019 RIGHT SINGLE QUOTATION MARK
 UTF-8: e2 80 99  UTF-16BE: 2019  Decimal: #8217;
 ???
 Category: Pf (Punctuation, Final quote)
 Bidi: ON (Other Neutrals)

Hmm, va falloir que je creuse un peu.

   Mauvais MUA ? ;oP

Ah! :p

Je pense pas: Mutt doit sous-traiter à peu près toute la
gestion de caractères. Je regarderai ça de chez moi,
histoire de réduire le nombre d'intermédiaires (Mutt, Pager,
ssh, putty, Windows, ça fait plein de gens qui peuvent se
planter).

Le plus curieux finalement, c'est que visiblement UTF8 passe
bien par ailleurs, c'est uniquement ce caractère là.

Y.


-- 
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench   
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs From et
Reply-To:

To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]



Re: Apostrophes et... UTF8 ? [Was: [HS] réponses | Re: failtoban]

2007-06-06 Par sujet Yves Rutschle
On Wed, Jun 06, 2007 at 07:32:38PM +0200, Sylvain Sauvage wrote:
   Mes apostrophes sont des :
 U+2019 RIGHT SINGLE QUOTATION MARK
 UTF-8: e2 80 99  UTF-16BE: 2019  Decimal: #8217;
 ???
 Category: Pf (Punctuation, Final quote)
 Bidi: ON (Other Neutrals)

Je suis troublé: l'apostrophe passe correctement dans gvim,
mais iconv ne la reconnait pas:

  Mes apostrophes sont des :
  U+2019 RIGHT SINGLE QUOTATION MARK
  UTF-8: e2 80 99  UTF-16BE: 2019  Decimal: #8217;
  iconv: illegal input sequence at position 965

Je ne pense pas que ça soit un problème de police de
caractère; on dirait presque que c'est un bout de mon
système qui ne comprend pas le caractère.

Y'a-t-il un spécialiste utf8 dans la salle?

???.


-- 
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench   
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs From et
Reply-To:

To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]



Re: Apostrophes et... UTF8 ? [Was: [HS] réponses | Re: failtoban]

2007-06-06 Par sujet Vincent Lefevre
On 2007-06-06 19:32:38 +0200, Sylvain Sauvage wrote:
   Mes apostrophes sont des :
 U+2019 RIGHT SINGLE QUOTATION MARK
 UTF-8: e2 80 99  UTF-16BE: 2019  Decimal: #8217;
 ’
 Category: Pf (Punctuation, Final quote)
 Bidi: ON (Other Neutrals)
 
   qui fait double emploi : fermeture des U+2018 et apostrophe
 typographique.

Ce double emploi empêche tout transcodage fiable. C'est clairement
un bug dans Unicode. Un conseil: éviter d'utiliser ce caractère en
attendant que le problème soit corrigé.

   Mauvais MUA ? ;oP

Mutt supporte très bien Unicode / UTF-8. Seulement, lorsqu'il tourne
avec des locales 8 bits et que le caractère n'est pas dans le jeu de
caractères des locales, Mutt le remplace par autant de '?' (points
d'interrogation) que d'octets (mais je pense que c'est en fait dû à
libiconv).

Un conseil pour Mutt:

set charset=`locale charmap`//TRANSLIT

C'est mieux que rien (le U+2019 sera remplacé par un accent aigu, ce
qui est acceptable dans le cas d'un guillemet fermant, mais est assez
horrible dans le cas d'une apostrophe; cependant c'est surtout parce
que ce caractère n'est pas utilisé comme il était prévu).

-- 
Vincent Lefèvre [EMAIL PROTECTED] - Web: http://www.vinc17.org/
100% accessible validated (X)HTML - Blog: http://www.vinc17.org/blog/
Work: CR INRIA - computer arithmetic / Arenaire project (LIP, ENS-Lyon)


-- 
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench   
Vous pouvez aussi ajouter le mot ``spam'' dans vos champs From et
Reply-To:

To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of unsubscribe. Trouble? Contact [EMAIL PROTECTED]