Le 30 août 2012 16:02, plonevez <jlplone...@wanadoo.fr> a écrit :
> J’ai volontairement modifié Lannec’huen car il y avait le caractère UTF 8 
> RIGHT SINGLE QUOTATION MARK (226, 128, 153)
>
> Hors ce caractère est tout à fait exceptionnel.

Non c'est même le caractère recommandé et tout à fait correct (pas du
tout une erreur donc) pour l’apostrophe française ou celle du
trigramme breton c’h (qui ne forme qu'une seule et même lettre dans
son alphabet, de même que le digramme ch).

L’apostrophe ASCII (39) est ambiguë je le répète : On la trouve
uniquement par compatibilité avec les sources non UTF-8 qui ne
différencient pas les différents types d'apostrophes et caractères
"similaires" (en apparence seulement et dans une typographie pauvre)
mais qui sont pourtant bel et bien distincts et ont des rôles
différents, uniquement parce que ces anciens codages non Unicode ne
pouvait pas coder autant de caractères distincts : on codait donc une
forma approchée unique.

L’ennui de l'apostrophe ASCII c’est justement son ambiguïté, pour les
mots d'origine étrangères où elle peut désigner une ou plusieurs
lettres différentes. L’ennui suivant est que les mots d'origine
étrangère commencent à pulluler partout, notamment pour les noms
propres, et dans les typonymes non attribués à des unités
territoriales officielles (lieux-dits, noms de sociétés et
marques...).

Même en France on trouve des noms d’origine étrangère, y compris des
caractères non latins (le plus courant c’est l'alphabet grec, pas
toujours romanisé...) ou des noms romanisés en caractères latins mais
nécessitant de conserver certains diacritiques et lettres spéciales
(comme l’ayin arabe et des noms polynésiens qui se transcrivent avec
une « sorte » d’apostrophe plus spécifique pour lever l’ambiguïté, et
les signes de ponctuation ; si on transcrit en utilisant l’apostrophe
ASCII, on perd ces distinctions et on peut même se retrouver avec
plusieurs apostrophes ASCII à suivre, et encore plus de difficultés
pour ensuite éviter aussi l’interprétation comme des signes de
ponctuation pour marquer une citation courte...).

Remplacer une apostrophe française (’ appelée aussi « virgule haute »
par les typographes pour éviter les confusions de formes) par
l’apostrophe-quote ASCII (' verticale) c'est exactement comme
remplacer un É par un E : c'est au lecteur de deviner l'interprétation
selon le contexte. C'est aussi du même ordre que d'utiliser les
guillemets ASCII (" verticaux) à la place de nos guillemets (« » en
chevrons)

Et ce n’est pas du tout un problème d'encodage UTF-8. L’apostrophe
française (virgule haute) avant ta correction était correctement codée
en UTF-8, et c’était même la bonne !!

Et qu’on arrête de dire que c’est au logiciel de rendu de remplacer
les apostrophes automatiquement : il ne le peut pas sans se tromper
assez souvent, même en ayant connaissance de la langue (ce qu’il ne
sait pas quant il lit un champ "name=*" ne précisant pas la langue).

Effectivement un vieux clavier français classique n’a qu’une seule
touche donnant l’apostrophe-quote ASCII. Mais ce n’est pas le cas de
tous les claviers utilisés par les francophones, même en France. Cela
date du temps des machines à écrire, très pauvres en choix de
caractères

On ne tape plus sur des machines à écrire mais sur des ordinateurs où
on a pléthore de méthodes de saisies et de pilotes claviers (y compris
ceux qu'on peut se faire facilement soit-même sans rien programmer),
et les imprimeurs ont toujours conservé les dictinctions.

(Déjà on a eu du mal à faire accepter nos accents, mais même dans le
déjà vieux jeu de caractères codés ISO 8859-1, on a notre apostrophe
française depuis longtemps et presque toutes les polices de caractères
ont un glyphe pour l’afficher correctement : pour le français l’ASCII
est carrément banni, même ici on veut les accents ; le candidat
suivant est l’ISO 8859-1 qui ne suffit déjà plus mais est supporté, et
on a étendu le jeu avec Unicode accepté dans OSM pour intégrer
nativement au moins le russe, l’arabe, l’hébreu, le grec, l’hindi, le
tamoul, le thaï, le coréen, le japonais et le mandarin !)

Pourquoi tant de haine donc contre nos apostrophes standards du
français et ici du breton et cette perpétuation de la verrue ASCII
héritée des vieilles machines à écrire ? Si la raison est l'absence du
caractère sur un clavier français « standard » (ce standard n’existe
plus en tant que « norme » française, et n’est plus imposé même par
l’industrie qui propose bien d'autres choses pour taper correctement
le français), alors on devrait interdire aussi dans OSM les capitales
diacritées françaises À, Ç, É, Ù qui ne sont pas non plus sur ce
clavier dit « standard », et aussi nos ligatures Æ, æ, Œ, œ.

_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr

Répondre à