Re: [OSM-talk-fr] import de lieux-dits

plonevez Thu, 30 Aug 2012 11:15:28 -0700

Dans le fichier places du fichier shp de la Bretagne, il y a 966 noms avec des 
apostrophes ASCII (39). Il n’y que très peu d’apostrophes françaises.


 

Jean

 

 

De : verdy_p [via GIS] [mailto:ml-node+s19327n5722822...@n5.nabble.com] 
Envoyé : jeudi 30 août 2012 19:05
À : plonevez
Objet : Re: import de lieux-dits

 

Le 30 août 2012 16:02, plonevez <[hidden email]> a écrit : 
> J’ai volontairement modifié Lannec’huen car il y avait le caractère UTF 8 
> RIGHT SINGLE QUOTATION MARK (226, 128, 153) 
> 
> Hors ce caractère est tout à fait exceptionnel. 

Non c'est même le caractère recommandé et tout à fait correct (pas du 
tout une erreur donc) pour l’apostrophe française ou celle du 
trigramme breton c’h (qui ne forme qu'une seule et même lettre dans 
son alphabet, de même que le digramme ch). 

L’apostrophe ASCII (39) est ambiguë je le répète : On la trouve 
uniquement par compatibilité avec les sources non UTF-8 qui ne 
différencient pas les différents types d'apostrophes et caractères 
"similaires" (en apparence seulement et dans une typographie pauvre) 
mais qui sont pourtant bel et bien distincts et ont des rôles 
différents, uniquement parce que ces anciens codages non Unicode ne 
pouvait pas coder autant de caractères distincts : on codait donc une 
forma approchée unique. 

L’ennui de l'apostrophe ASCII c’est justement son ambiguïté, pour les 
mots d'origine étrangères où elle peut désigner une ou plusieurs 
lettres différentes. L’ennui suivant est que les mots d'origine 
étrangère commencent à pulluler partout, notamment pour les noms 
propres, et dans les typonymes non attribués à des unités 
territoriales officielles (lieux-dits, noms de sociétés et 
marques...). 

Même en France on trouve des noms d’origine étrangère, y compris des 
caractères non latins (le plus courant c’est l'alphabet grec, pas 
toujours romanisé...) ou des noms romanisés en caractères latins mais 
nécessitant de conserver certains diacritiques et lettres spéciales 
(comme l’ayin arabe et des noms polynésiens qui se transcrivent avec 
une « sorte » d’apostrophe plus spécifique pour lever l’ambiguïté, et 
les signes de ponctuation ; si on transcrit en utilisant l’apostrophe 
ASCII, on perd ces distinctions et on peut même se retrouver avec 
plusieurs apostrophes ASCII à suivre, et encore plus de difficultés 
pour ensuite éviter aussi l’interprétation comme des signes de 
ponctuation pour marquer une citation courte...). 

Remplacer une apostrophe française (’ appelée aussi « virgule haute » 
par les typographes pour éviter les confusions de formes) par 
l’apostrophe-quote ASCII (' verticale) c'est exactement comme 
remplacer un É par un E : c'est au lecteur de deviner l'interprétation 
selon le contexte. C'est aussi du même ordre que d'utiliser les 
guillemets ASCII (" verticaux) à la place de nos guillemets (« » en 
chevrons) 

Et ce n’est pas du tout un problème d'encodage UTF-8. L’apostrophe 
française (virgule haute) avant ta correction était correctement codée 
en UTF-8, et c’était même la bonne !! 

Et qu’on arrête de dire que c’est au logiciel de rendu de remplacer 
les apostrophes automatiquement : il ne le peut pas sans se tromper 
assez souvent, même en ayant connaissance de la langue (ce qu’il ne 
sait pas quant il lit un champ "name=*" ne précisant pas la langue). 

Effectivement un vieux clavier français classique n’a qu’une seule 
touche donnant l’apostrophe-quote ASCII. Mais ce n’est pas le cas de 
tous les claviers utilisés par les francophones, même en France. Cela 
date du temps des machines à écrire, très pauvres en choix de 
caractères 

On ne tape plus sur des machines à écrire mais sur des ordinateurs où 
on a pléthore de méthodes de saisies et de pilotes claviers (y compris 
ceux qu'on peut se faire facilement soit-même sans rien programmer), 
et les imprimeurs ont toujours conservé les dictinctions. 

(Déjà on a eu du mal à faire accepter nos accents, mais même dans le 
déjà vieux jeu de caractères codés ISO 8859-1, on a notre apostrophe 
française depuis longtemps et presque toutes les polices de caractères 
ont un glyphe pour l’afficher correctement : pour le français l’ASCII 
est carrément banni, même ici on veut les accents ; le candidat 
suivant est l’ISO 8859-1 qui ne suffit déjà plus mais est supporté, et 
on a étendu le jeu avec Unicode accepté dans OSM pour intégrer 
nativement au moins le russe, l’arabe, l’hébreu, le grec, l’hindi, le 
tamoul, le thaï, le coréen, le japonais et le mandarin !) 

Pourquoi tant de haine donc contre nos apostrophes standards du 
français et ici du breton et cette perpétuation de la verrue ASCII 
héritée des vieilles machines à écrire ? Si la raison est l'absence du 
caractère sur un clavier français « standard » (ce standard n’existe 
plus en tant que « norme » française, et n’est plus imposé même par 
l’industrie qui propose bien d'autres choses pour taper correctement 
le français), alors on devrait interdire aussi dans OSM les capitales 
diacritées françaises À, Ç, É, Ù qui ne sont pas non plus sur ce 
clavier dit « standard », et aussi nos ligatures Æ, æ, Œ, œ. 

_______________________________________________ 
Talk-fr mailing list 
[hidden email] 
http://lists.openstreetmap.org/listinfo/talk-fr



  _____  

If you reply to this email, your message will be added to the discussion below:

http://gis.19327.n5.nabble.com/import-de-lieux-dits-tp5721992p5722822.html 

To unsubscribe from import de lieux-dits, click here 
<http://gis.19327.n5.nabble.com/template/NamlServlet.jtp?macro=unsubscribe_by_code&node=5721992&code=amxwbG9uZXZlekB3YW5hZG9vLmZyfDU3MjE5OTJ8MjE5NzgxNTQ4>
 .
 
<http://gis.19327.n5.nabble.com/template/NamlServlet.jtp?macro=macro_viewer&id=instant_html%21nabble%3Aemail.naml&base=nabble.naml.namespaces.BasicNamespace-nabble.view.web.template.NabbleNamespace-nabble.view.web.template.NodeNamespace&breadcrumbs=notify_subscribers%21nabble%3Aemail.naml-instant_emails%21nabble%3Aemail.naml-send_instant_email%21nabble%3Aemail.naml>
 NAML 





--
View this message in context: 
http://gis.19327.n5.nabble.com/import-de-lieux-dits-tp5721992p5722835.html
Sent from the France mailing list archive at Nabble.com.

_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr

Re: [OSM-talk-fr] import de lieux-dits

Répondre à