Le 23 juin 2016 à 08:11, <osm.sanspourr...@spamgourmet.com> a écrit :
> Le 22/06/2016 à 23:58, Jérôme Seigneuret - jseigneuret-...@yahoo.fr a > écrit : > > C'est sur que pour exploiter des termes dans une phrase si la saisie > correspond à une majuscule et pas à une capitale, il est assez facile de > faire les accords "à le" > "au" . A contrario "à Le" restera "à Le" > > C'est un peu plus compliqué : tu vas *au *Mans mais c'est la commune de *Le > Mans*. > Tu veux parler du cas Le Brun (Le-Brun ? ;-)). > C'est un exemple. l'objectif et plus grand que l'affichage. Reste qu'au niveau d'OSM le choix et de faire une casse avec une majuscule en première lettre de chaque mot... Ok mais dans ce cas c'est quoi l'intérêt de le stocker ainsi vu que l'on est largement capable de le faire par programmation.... Je pense qu'outre les débats houleux sur les toponymes, ce problème touche plus d'étiquettes q'on ne le pense. Tous les termes ne sont pas des noms propres. L'avantage du "mixed case" c'est d'avoir une règle simple et unique pour tous le monde sans avoir à se poser cette question de saisie autant que pour les ligatures et l’existence du tiret... Qui d'ailleurs pose des problèmes restitution de résultat avec nominatim. Sous python on utilise un truc "slug" pour ça principalement pour les url (mais pas que) la fonction s'appelle slugify elle couple : - une correction des caractères en supprimant les ligatures - supprime les caractères accentués et en remplaçant par une valeur non accentuée - remplace " " par "-" et les double espaces " " par "-" - remplace la casse par une casse minuscule Ainsi on a un nom qui peut être comparé et retourner des résultats même avec des erreurs (minime à la recherche) Ces sûr qu'on retourne plus de données. Mais il suffit d'avoir un indicateur de correspondance parfaite avec une gestion de niveau d'erreur afin de limiter ou non les retours.
_______________________________________________ Talk-fr mailing list Talk-fr@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-fr