Le 23 juin 2016 à 08:11, <osm.sanspourr...@spamgourmet.com> a écrit :

> Le 22/06/2016 à 23:58, Jérôme Seigneuret - jseigneuret-...@yahoo.fr a
> écrit :
>
> C'est sur que pour exploiter des termes dans une phrase si la saisie
> correspond à une majuscule et pas à une capitale, il est assez facile de
> faire les accords "à le" > "au" . A contrario "à Le" restera "à Le"
>
> C'est un peu plus compliqué : tu vas *au *Mans mais c'est la commune de *Le
> Mans*.
> Tu veux parler du cas Le Brun (Le-Brun ? ;-)).
>

C'est un exemple. l'objectif et plus grand que l'affichage.
Reste qu'au niveau d'OSM le choix et de faire une casse avec une majuscule
en première lettre de chaque mot... Ok mais dans ce cas c'est quoi
l'intérêt de le stocker ainsi vu que l'on est largement capable de le faire
par programmation....

Je pense qu'outre les débats houleux sur les toponymes, ce problème touche
plus d'étiquettes q'on ne le pense. Tous les termes ne sont pas des noms
propres.

L'avantage du "mixed case" c'est d'avoir une règle simple et unique pour
tous le monde sans avoir à se poser cette question de saisie autant que
pour les ligatures et l’existence du tiret... Qui d'ailleurs pose des
problèmes restitution de résultat avec nominatim.

Sous python on utilise un truc "slug" pour ça principalement pour les url
(mais pas que) la fonction s'appelle slugify

elle couple :
- une correction des caractères en supprimant les ligatures
- supprime les caractères accentués et en remplaçant par une valeur non
accentuée
- remplace " " par "-" et les double espaces "  " par "-"
- remplace la casse par une casse minuscule

Ainsi on a un nom qui peut être comparé et retourner des résultats même
avec des erreurs (minime à la recherche)
Ces sûr qu'on retourne plus de données. Mais il suffit d'avoir un
indicateur de correspondance parfaite avec une gestion de niveau d'erreur
afin de limiter ou non les retours.
_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr

Répondre à