Se dépatouiller avec des bizarreries… On se demande ce qui est bizarre ou
ce qui est normal.

Il faut savoir que certaines (un certain nombre) implémentations de la
reconnaissance de motifs par expressions régulières dans le monde UTF-8 (en
perl, php, extension SQL et sûrement d’autres langages) permettent de
reconnaître des classes de caractères : les espaces, les séparateurs,
caractères de groupement (parenthèses, crochets, etc…), ponctuations,
chiffres, caractères de citation, les caractères accentués, les caractères
en haut de casse, etc… indépendamment de la langue ; ce sont des propriétés
des caractères.

Et j’insiste sur le fait qu’il serait une erreur d’imposer l’utilisation de
ces fameux caractères, puisque tout le monde ne les connaissent pas, et ne
peuvent les saisir !
Mais dès lors qu’ils enrichissent les données et qu’ils peuvent être
exploités, ils ne doivent pas être bannis.

Cordialement,
--



Le 29 novembre 2012 15:13, Vladimir Vyskocil
<vladimir.vysko...@gmail.com>a écrit :

>
> On 29 nov. 2012, at 12:45, Philippe Verdy <verd...@wanadoo.fr> wrote:
>
> > Ce qui se complique encore quand les toponymes ***officiels*** espagnols
> utilisent le "/" pour séparer les noms ***co-officiels*** issus de
> plusieurs langues, ces deux langues ***devant*** toujours être citées
> ensembles et dans l'ordre indiqué sans qu'on puisse en supprimer un ! C'est
> alors le même toponyme dans les langues d'origine, les différences
> linguistiques étant alors abolies dans la dénomination officielle pour la
> même entité (regardez le Pays Basque espagnol par exemple).
> >
> > Dans ce cas le "/" ne signifie pas non plus "sur", ***même*** en
> Français. Comment alors faire un traitement automatique de substitution
> "pour faire joli" ?
> >
> > Oui effectivement le "/" a sa propre sémantique dans ce cas, mais on ne
> doit PAS l'utiliser comme s'il s'agissait d'une abréviation, même en
> français.
> >
> > Bref en aucun cas "Argenton / Creuse" ne signifie la même chose que
> "Argenton-sur-Creuse" (ne pas oublier non plus les traits d'union ici !)
> >
> > Car en Espagne et même en français, ce "/" est un séparateur, distingué
> de l'autre séparateur trait d'union qui est aussi utilisé pour juxtaposer
> deux termes mais avec une autre signification.
> >
> > L'idée qu'un moteur de rendu peut librement remplacer la ponctuation est
> totalement erronée, chacune a sa signification propre mais on ne peut pas
> la déduire de la seule façon dont cette ponctuation est codée puisque pour
> cela il faudrait coder ***aussi*** la sémantique.
> >
>
> Dans ce cas c'est le schema qui n'est pas bon et on aurait du partir par
> exemple sur un tag name multi-valué alors que l'on est clairement parti sur
> une solution simpliste qui revient a tagguer pour le rendu : on veut que
> les 2 noms s'affichent côte à côte séparés par un caractère lambda sans
> rien a avoir a changer aux moteurs de rendu actuels...
> Il faut également prendre en compte tous les outils de recherche qui vont
> faire comment pour se dépatouiller avec des données formatés avec des
> demi-espaces insécables ou je ne sais quelle curiosité de la langue
> française ?
>
> Vladimir
>
>
> _______________________________________________
> Talk-fr mailing list
> Talk-fr@openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-fr
>
_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr

Répondre à