Dans le fichier places du fichier shp de la Bretagne, il y a 966 noms avec des apostrophes ASCII (39). Il n’y que très peu d’apostrophes françaises.
Jean De : verdy_p [via GIS] [mailto:ml-node+s19327n5722822...@n5.nabble.com] Envoyé : jeudi 30 août 2012 19:05 À : plonevez Objet : Re: import de lieux-dits Le 30 août 2012 16:02, plonevez <[hidden email]> a écrit : > J’ai volontairement modifié Lannec’huen car il y avait le caractère UTF 8 > RIGHT SINGLE QUOTATION MARK (226, 128, 153) > > Hors ce caractère est tout à fait exceptionnel. Non c'est même le caractère recommandé et tout à fait correct (pas du tout une erreur donc) pour l’apostrophe française ou celle du trigramme breton c’h (qui ne forme qu'une seule et même lettre dans son alphabet, de même que le digramme ch). L’apostrophe ASCII (39) est ambiguë je le répète : On la trouve uniquement par compatibilité avec les sources non UTF-8 qui ne différencient pas les différents types d'apostrophes et caractères "similaires" (en apparence seulement et dans une typographie pauvre) mais qui sont pourtant bel et bien distincts et ont des rôles différents, uniquement parce que ces anciens codages non Unicode ne pouvait pas coder autant de caractères distincts : on codait donc une forma approchée unique. L’ennui de l'apostrophe ASCII c’est justement son ambiguïté, pour les mots d'origine étrangères où elle peut désigner une ou plusieurs lettres différentes. L’ennui suivant est que les mots d'origine étrangère commencent à pulluler partout, notamment pour les noms propres, et dans les typonymes non attribués à des unités territoriales officielles (lieux-dits, noms de sociétés et marques...). Même en France on trouve des noms d’origine étrangère, y compris des caractères non latins (le plus courant c’est l'alphabet grec, pas toujours romanisé...) ou des noms romanisés en caractères latins mais nécessitant de conserver certains diacritiques et lettres spéciales (comme l’ayin arabe et des noms polynésiens qui se transcrivent avec une « sorte » d’apostrophe plus spécifique pour lever l’ambiguïté, et les signes de ponctuation ; si on transcrit en utilisant l’apostrophe ASCII, on perd ces distinctions et on peut même se retrouver avec plusieurs apostrophes ASCII à suivre, et encore plus de difficultés pour ensuite éviter aussi l’interprétation comme des signes de ponctuation pour marquer une citation courte...). Remplacer une apostrophe française (’ appelée aussi « virgule haute » par les typographes pour éviter les confusions de formes) par l’apostrophe-quote ASCII (' verticale) c'est exactement comme remplacer un É par un E : c'est au lecteur de deviner l'interprétation selon le contexte. C'est aussi du même ordre que d'utiliser les guillemets ASCII (" verticaux) à la place de nos guillemets (« » en chevrons) Et ce n’est pas du tout un problème d'encodage UTF-8. L’apostrophe française (virgule haute) avant ta correction était correctement codée en UTF-8, et c’était même la bonne !! Et qu’on arrête de dire que c’est au logiciel de rendu de remplacer les apostrophes automatiquement : il ne le peut pas sans se tromper assez souvent, même en ayant connaissance de la langue (ce qu’il ne sait pas quant il lit un champ "name=*" ne précisant pas la langue). Effectivement un vieux clavier français classique n’a qu’une seule touche donnant l’apostrophe-quote ASCII. Mais ce n’est pas le cas de tous les claviers utilisés par les francophones, même en France. Cela date du temps des machines à écrire, très pauvres en choix de caractères On ne tape plus sur des machines à écrire mais sur des ordinateurs où on a pléthore de méthodes de saisies et de pilotes claviers (y compris ceux qu'on peut se faire facilement soit-même sans rien programmer), et les imprimeurs ont toujours conservé les dictinctions. (Déjà on a eu du mal à faire accepter nos accents, mais même dans le déjà vieux jeu de caractères codés ISO 8859-1, on a notre apostrophe française depuis longtemps et presque toutes les polices de caractères ont un glyphe pour l’afficher correctement : pour le français l’ASCII est carrément banni, même ici on veut les accents ; le candidat suivant est l’ISO 8859-1 qui ne suffit déjà plus mais est supporté, et on a étendu le jeu avec Unicode accepté dans OSM pour intégrer nativement au moins le russe, l’arabe, l’hébreu, le grec, l’hindi, le tamoul, le thaï, le coréen, le japonais et le mandarin !) Pourquoi tant de haine donc contre nos apostrophes standards du français et ici du breton et cette perpétuation de la verrue ASCII héritée des vieilles machines à écrire ? Si la raison est l'absence du caractère sur un clavier français « standard » (ce standard n’existe plus en tant que « norme » française, et n’est plus imposé même par l’industrie qui propose bien d'autres choses pour taper correctement le français), alors on devrait interdire aussi dans OSM les capitales diacritées françaises À, Ç, É, Ù qui ne sont pas non plus sur ce clavier dit « standard », et aussi nos ligatures Æ, æ, Œ, œ. _______________________________________________ Talk-fr mailing list [hidden email] http://lists.openstreetmap.org/listinfo/talk-fr _____ If you reply to this email, your message will be added to the discussion below: http://gis.19327.n5.nabble.com/import-de-lieux-dits-tp5721992p5722822.html To unsubscribe from import de lieux-dits, click here <http://gis.19327.n5.nabble.com/template/NamlServlet.jtp?macro=unsubscribe_by_code&node=5721992&code=amxwbG9uZXZlekB3YW5hZG9vLmZyfDU3MjE5OTJ8MjE5NzgxNTQ4> . <http://gis.19327.n5.nabble.com/template/NamlServlet.jtp?macro=macro_viewer&id=instant_html%21nabble%3Aemail.naml&base=nabble.naml.namespaces.BasicNamespace-nabble.view.web.template.NabbleNamespace-nabble.view.web.template.NodeNamespace&breadcrumbs=notify_subscribers%21nabble%3Aemail.naml-instant_emails%21nabble%3Aemail.naml-send_instant_email%21nabble%3Aemail.naml> NAML -- View this message in context: http://gis.19327.n5.nabble.com/import-de-lieux-dits-tp5721992p5722835.html Sent from the France mailing list archive at Nabble.com. _______________________________________________ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr