Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)
Bonjour, >Les homonymies sont un fait. J'ai déjà parlé dans un fil analogue [1] >en >évoquant les communes françaises nommées "Saint-Nicolas". Il y en a un >paquet, est-ce pour autant qu'on va trafiquer leur tag name=* pour s'y >retrouver ? > >Une fois de plus, ce sujet du nommage revient, et une fois de plus il >s'appuie sur les approximations d'un outil (Nominatim), approximations >qu'il faudrait compenser non pas dans l'outil, mais dans la donnée. En l'occurrence la donnée différenciant le nom des entités existe bien, avec les admin_level. Renommer le canton aboutirait aux mêmes problèmes (la chaîne de caractères étant toujours présente). C'est toujours l'outil à vocation internationale qui impose ses contraintes ici ; ce ne devrait pas être le cas. À mon avis il y a encore du travail d'enrichissement de l'algo pour qu'il réponde au besoin. Il faut alors exprimer ce besoin clairement, ça s'appelle un cahier des charges. Quelles sont nos exigences précises en la matière ? Teuxe -- Envoyé de mon téléphone avec Kaiten Mail. Excusez la brièveté. ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)
Bonjour, >Les homonymies sont un fait. J'ai déjà parlé dans un fil analogue [1] >en >évoquant les communes françaises nommées "Saint-Nicolas". Il y en a un >paquet, est-ce pour autant qu'on va trafiquer leur tag name=* pour s'y >retrouver ? > >Une fois de plus, ce sujet du nommage revient, et une fois de plus il >s'appuie sur les approximations d'un outil (Nominatim), approximations >qu'il faudrait compenser non pas dans l'outil, mais dans la donnée. En l'occurrence la donnée différenciant le nom des entités existe bien, avec les admin_level. Renommer le canton aboutirait aux mêmes problèmes (la chaîne de caractères étant toujours présente). C'est toujours l'outil à vocation internationale qui impose ses contraintes ici ; ce ne devrait pas être le cas. À mon avis il y a encore du travail d'enrichissement de l'algo pour qu'il réponde au besoin. Il faut alors exprimer ce besoin clairement, ça s'appelle un cahier des charges. Quelles sont nos exigences précises en la matière ? Teuxe -- Envoyé de mon téléphone avec Kaiten Mail. Excusez la brièveté. -- Envoyé de mon téléphone avec Kaiten Mail. Excusez la brièveté.___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)
Le 21 juin 2013 13:25, Vincent de Château-Thierry a écrit : > > Une fois de plus, ce sujet du nommage revient, et une fois de plus il > s'appuie sur les approximations d'un outil (Nominatim), approximations > qu'il faudrait compenser non pas dans l'outil, mais dans la donnée. D'une part il n'est pas nécessaire de compenser dans la donnée puisque les données sont déjà présentes. De plus Nominatim fait déjà les différences nécessaires. Il faut savoir utiliser l'outil et surtout lire ce qu'il affiche et qui est très clair. Mais une recherche Nominatim dans JOSM fait certanes différences (JOSM affichant en plus la carte). Toute recherche par nom de toute façon pourra ramener des homonymes, en classant selon des degrés de pertinence, ce que Niminatim fait déjà. On ne doit pas se contenter de ne lire que le premier résultat affiché quand Nominatim en fournit déjà une liste visible au premier coup d'oeil ! Ensuite les moteurs de rendus affichent aussi des différences significatives, même si leur rendu peut parfois être amélioré. Mais là encore on ne parle pas de la base dont les données sont déjà correctes, suffisantes, claires, et non ambiguës. Dans une base de données on ne mélange pas dans un me^me champ des informations appartenant à des axes d'analyse et de classification distincts. Ca s'appelle la "modélisation", et c'est ce qui fait l'utilité d'une base de données et permet sa réutilisabilité pour divers types de requêtes selon des besoins différents, où les précisions ajoutées et mélangées sont plus nuisibles qu'utiles. ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)
Le 21/06/2013 16:39, Pieren a écrit : 2013/6/21 Vincent de Château-Thierry : Pourquoi déroger pour le nom ? En le faisant, on dévalorise notre contenu. Ici, on essaie de lever une ambiguité dans OSM, pour OSM. Oui mais on n'est pas en vase clos. Quand je lis "pour OSM", j'ai l'impression que ce qui peut advenir du contenu OSM en dehors de notre microcosme de contributeurs n'a pas d'intérêt :-( Les deux ont le même tag name, et un tag officiel_name différent. Comme quoi, ce qui aurait pu les désambiguïser n'est même pas pris en compte pour le nom principal. C'est un homonyme, assumé. Assumé, c'est vite dit. Peut-être se sont-ils basés sur les données actuelles en France en pensant que c'était assumé chez-nous ;-) Joli ! :-) "compromis" me paraît diamétralement opposé à "référentiel", évoqué plus haut. On ne conciliera pas les deux, pour sûr. Quand je pense "référentiel", c'est avec en tête l'usage qui sera fait de la donnée par des gens que je ne connais pas, dans des applications que je ne connais pas non plus. Mouais, bon. C'est un référentiel ou pas un référentiel, finalement ? Toujours pas :-) C'est surtout l'idée de fiabilité que je voulais exprimer ici. Parmi les aspects déroutants pour ceux qui cherchent à utiliser nos données, il y a l'absence de cahier des charges (je résume). Si on sait montrer que certaines thématiques (ici l'administratif) sont fabriquées avec rigueur, sont un peu "carrées", et donc réutilisables en confiance, ça ne peut qu'aider à faire adhérer. Enfin, c'est mon avis. vincent (un peu borné sur l'idée que les contributeurs d'après-demain sont les consommateurs de demain :-) ) ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)
2013/6/21 Vincent de Château-Thierry : > Pourquoi déroger pour le nom ? En le faisant, on dévalorise notre contenu. Au contraire, on clarifie là où c'est nécessaire. Comme tu le dis, OSM n'est pas un référentiel. Si quelqu'un veut la liste officielle des noms officiels des cantons/arrondissements de France, il peut déjà les trouver dans le COG. Ici, on essaie de lever une ambiguité dans OSM, pour OSM. Les données extérieures doivent servir à enrichir la base mais avec la condition de pouvoir être modifiées. Sinon, tu donnes des billes à ceux qui sont contre toute forme d'import. Si c'est pour importer des données pour ensuite bloquer tout changement sous prétexte qu'il faut coller au référentiel, cela n'a pas sa place dans OSM. > Les deux ont le même tag name, et un tag officiel_name différent. Comme > quoi, ce qui aurait pu les désambiguïser n'est même pas pris en compte pour > le nom principal. C'est un homonyme, assumé. Assumé, c'est vite dit. Peut-être se sont-ils basés sur les données actuelles en France en pensant que c'était assumé chez-nous ;-) > "compromis" me paraît diamétralement opposé à "référentiel", évoqué plus > haut. On ne conciliera pas les deux, pour sûr. Quand je pense "référentiel", > c'est avec en tête l'usage qui sera fait de la donnée par des gens que je ne > connais pas, dans des applications que je ne connais pas non plus. Mouais, bon. C'est un référentiel ou pas un référentiel, finalement ? On peut et on doit se rapprocher autant que possible des données officielles. Mais on ne peut pas bloquer des données importées sous prétexte qu'elles pourraient diverger de la source. Sinon, on n'est plus le "wikipedia des cartes" mais juste un aggrégateur de données publiques. Pieren ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)
Le 21/06/2013 14:27, Pieren a écrit : 2013/6/21 Vincent de Château-Thierry : On renomme tous les niveaux, tant qu'on y est ? Euh ,y a une ville qui s'appelle "Basse Normandie" ? Pas que je sache. Mais tu citais cette page pour illustrer que le nom du canton devrait contenir 'canton de '. Si cette page fait référence, alors soyons un peu logiques :-) . Autant je ne considère pas OSM comme une base référentielle (le mot est dit), autant, sur la thématique des découpages administratifs, on doit pouvoir coller au mieux aux référentiels externes. On ne va pas inventer, ni même déduire du terrain, par où passe une limite indiquée par le cadastre, ou la valeur d'un code émis par l'INSEE. On les prend tels qu'ils sont. Pourquoi déroger pour le nom ? En le faisant, on dévalorise notre contenu. Je ne connais pas d'autres pays qui ont un problème avec une entité administrative qui porte exactement le même nom à différents niveaux dans OSM. De ce que j'ai pu voir, ils n'hésitent pas à ajouter un identifant dans le nom (comme "Orange County", Californie [1] ou "Canton Capellen" au Luxembourg [2]) alors que dans les deux cas, le nom officiel est aussi le nom du chef-lieu. Pourquoi serions-nous moins pragmatiques que les autres ? Tout est affaire d'exemples. Tu observeras le pragmatisme des italiens : http://www.openstreetmap.org/browse/relation/41313 (Rome au niveau 6) inclut http://www.openstreetmap.org/browse/relation/41485 (Rome au niveau 8) Les deux ont le même tag name, et un tag officiel_name différent. Comme quoi, ce qui aurait pu les désambiguïser n'est même pas pris en compte pour le nom principal. C'est un homonyme, assumé. Pourquoi ne pas faire un compromis comme aux USA avec "name=Orange County" + "county:name=Orange" ? "compromis" me paraît diamétralement opposé à "référentiel", évoqué plus haut. On ne conciliera pas les deux, pour sûr. Quand je pense "référentiel", c'est avec en tête l'usage qui sera fait de la donnée par des gens que je ne connais pas, dans des applications que je ne connais pas non plus. En introduisant de la bidouille, je pense qu'on ne donne pas de bons arguments pour populariser l'utilisation de notre contenu. vincent ps. ça ne nous dit pas ce qu'on fait pour désambiguïser les ~50 Saint-Nicolas français ;-) ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)
2013/6/21 Vincent de Château-Thierry : > On renomme tous les niveaux, tant qu'on y est ? Euh ,y a une ville qui s'appelle "Basse Normandie" ? Si la région s'appelait "Caen", on pourrait en rediscuter. Ici, il s'agit de lever une ambiguité facilement. > il s'appuie sur les approximations d'un outil (Nominatim)... > le nom _strict_ d'une entité, surtout lorsqu'un référentiel externe > nous le propose. Ca me rappelle les discussion sur la super-relation boundary pour la France. Si quelqu'un n'avait pas remis une énorme relation simple, il n'y aurait tout simplement pas de géolocalisation correcte pour la France. En trois ans, personne n'a adapté les outils pour prendre en compte les super-relations. Je ne connais pas d'autres pays qui ont un problème avec une entité administrative qui porte exactement le même nom à différents niveaux dans OSM. De ce que j'ai pu voir, ils n'hésitent pas à ajouter un identifant dans le nom (comme "Orange County", Californie [1] ou "Canton Capellen" au Luxembourg [2]) alors que dans les deux cas, le nom officiel est aussi le nom du chef-lieu. Pourquoi serions-nous moins pragmatiques que les autres ? Pourquoi ne pas faire un compromis comme aux USA avec "name=Orange County" + "county:name=Orange" ? Si on ne fait rien, ça sera comme avec la super-relation: ça reviendra régulièrement sur le tapis. Et si vous espérez une adaptation de tous les outils de tous les pays pour tenir compte de notre petit particularisme, vous risquez d'attendre très, très, très longtemps. Pieren [1] http://www.openstreetmap.org/browse/relation/396466 [2] http://www.openstreetmap.org/browse/relation/407813 ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)
Bonjour, Le 21/06/2013 12:10, Pieren a écrit : 2013/6/21 Damouns : Mon idée est que dans une phrase en français courant, 99,9% des phrases contenant "Pontarlier" ou "Issoire" désignent la commune Il est évident que tout document, officiel ou pas, citant "Caen" ou "Pontarlier" tout seul, fait référence à la ville. Notre malheur est que le COG présente les cantons dans un tableau avec le nom du chef-lieu en dessous de la colonne marquée "Canton" et que certains ont pris le nom de ce chef-lieu pour le nom du canton lui-même. Exemple: http://www.insee.fr/fr/methodes/nomenclatures/cog/canarr.asp?codedep=14&codearr=2 Alors que lorsqu'on va dans la fiche détail d'un canton: http://www.insee.fr/fr/methodes/nomenclatures/cog/comcan.asp?codedep=14&codecan=06 Si ce 2e lien doit servir ton argumentaire, alors ça me paraît mal parti : la même page, où le nommage du canton t'arrange, ne parle pas de "Basse-Normandie" mais "Région Basse-Normandie", "Calvados" y est appelé "Département du Calvados". Sans parler, bien sûr, de l'arrondissement de Caen. On renomme tous les niveaux, tant qu'on y est ? on parle bien de "Canton de Bourguébus (06)". (à noter, le bug du COG sur "Canton de Caen 1er Canton (08)" 100% favorable pour nommer les choses par leur nom. Manifestement non, puisque tu proposes de compléter le nom : Mettez "canton de" au début ou "(canton)" à la fin, peu importe, mais évitons les homonymies inutiles avec un peu de bon sens commun. Les homonymies sont un fait. J'ai déjà parlé dans un fil analogue [1] en évoquant les communes françaises nommées "Saint-Nicolas". Il y en a un paquet, est-ce pour autant qu'on va trafiquer leur tag name=* pour s'y retrouver ? Une fois de plus, ce sujet du nommage revient, et une fois de plus il s'appuie sur les approximations d'un outil (Nominatim), approximations qu'il faudrait compenser non pas dans l'outil, mais dans la donnée. Ce raisonnement se défendrait si seul cet outil utilisait les données. Mais que je sache, on contribue à la constitution d'une base de données, pas d'un outil. Et avec l'espoir que cette base servira dans de nombreux contextes (pas juste Nominatim). Aussi, quand on le peut, donner à cette base un peu de cohérence, d'homogénéité, pour lui faire gagner du crédit auprès de ses utilisateurs potentiels, ça me paraît nécessaire. Ce qui se traduit, dans notre sujet, par le fait de mettre comme valeur du tag name le nom _strict_ d'une entité, surtout lorsqu'un référentiel externe nous le propose. vincent [1] : http://lists.openstreetmap.org/pipermail/talk-fr/2013-February/054404.html ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)
Le COG n'inclue pas le nom complet, c'est une présentation faite sur le site à partir d'un assemblage de données codifiées individuellement, pour donner un titre de section ou sous-section dans la page (c'est juste plus joli que de mettre "Canton: Caen 1er Canton". L'exemple que tu cites le démontre clairement. La ligne "Canton de Caen 1er Canton (08)" est bien issu de cet assemblage d'éléments codés individuellement. Si c'était vraiment joli cela devrait être "1er canton de Caen", voire "Premier canton de Caen", quoique les textes de loi du code rural et l'arrêté de création le nomment "canton de Caen-I" (noter la minuscule initiale, ce n'est pas un nom propre, car ni le canton ni l'arrondissement n'ont la personnalité juridique comme les EPCI qui choisissent un nom propre souvent différent de leur statut réel, par exemple ceux qui se nomment "métropoles" ou "pays de") mais quand des listes de cantons sont dressés les termes "canton de" sont supprimés et remplacés contextuellement par un entête de liste mentionnant "cantons de" au pluriel (les chiffres entre parenthèses de ton exemple sont le code du canton dans le département, mais ce n'est pas évident en première lecture de ce seule libellé composé, cela ne se déduit que par le contexte de la page, mais ils témoignent là aussi que le libellé est assemblé automatiquement, il ne fait pourtant pas non plus partie du nom du canton qui se suffit sans ce numéro, et ce numéro affiché n'est pas utilisable seul non plus comme identifiant sans préciser le code du département...). Le 21 juin 2013 12:10, Pieren a écrit : > 2013/6/21 Damouns : > > > Mon idée est que dans une phrase en français courant, 99,9% des > > phrases contenant "Pontarlier" ou "Issoire" désignent la commune > > Il est évident que tout document, officiel ou pas, citant "Caen" ou > "Pontarlier" tout seul, fait référence à la ville. > Notre malheur est que le COG présente les cantons dans un tableau avec > le nom du chef-lieu en dessous de la colonne marquée "Canton" et que > certains ont pris le nom de ce chef-lieu pour le nom du canton > lui-même. > Exemple: > > http://www.insee.fr/fr/methodes/nomenclatures/cog/canarr.asp?codedep=14&codearr=2 > > Alors que lorsqu'on va dans la fiche détail d'un canton: > > http://www.insee.fr/fr/methodes/nomenclatures/cog/comcan.asp?codedep=14&codecan=06 > > on parle bien de "Canton de Bourguébus (06)". > (à noter, le bug du COG sur "Canton de Caen 1er Canton (08)" > > 100% favorable pour nommer les choses par leur nom. Mettez "canton de" > au début ou "(canton)" à la fin, peu importe, mais évitons les > homonymies inutiles avec un peu de bon sens commun. > > Pieren > > ___ > Talk-fr mailing list > Talk-fr@openstreetmap.org > http://lists.openstreetmap.org/listinfo/talk-fr > ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)
2013/6/21 Damouns : > Mon idée est que dans une phrase en français courant, 99,9% des > phrases contenant "Pontarlier" ou "Issoire" désignent la commune Il est évident que tout document, officiel ou pas, citant "Caen" ou "Pontarlier" tout seul, fait référence à la ville. Notre malheur est que le COG présente les cantons dans un tableau avec le nom du chef-lieu en dessous de la colonne marquée "Canton" et que certains ont pris le nom de ce chef-lieu pour le nom du canton lui-même. Exemple: http://www.insee.fr/fr/methodes/nomenclatures/cog/canarr.asp?codedep=14&codearr=2 Alors que lorsqu'on va dans la fiche détail d'un canton: http://www.insee.fr/fr/methodes/nomenclatures/cog/comcan.asp?codedep=14&codecan=06 on parle bien de "Canton de Bourguébus (06)". (à noter, le bug du COG sur "Canton de Caen 1er Canton (08)" 100% favorable pour nommer les choses par leur nom. Mettez "canton de" au début ou "(canton)" à la fin, peu importe, mais évitons les homonymies inutiles avec un peu de bon sens commun. Pieren ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)
Wikipédia a souvent des conventions inconsistantes pour ses noms de pages. Mais c'est difficile à appliquer (alors que cela simplifierait bien des situations et des modèles comme la production et la maintenance des palettes de navigation et infobox). Souvent la règle de la "dénomination la plus courante" emporte et on n'ajoute pas la précision sur un des articles homonymes (chois souvent subjectif et basé sur la popularité dans un pays donné). Sur Commons le problème est plus aigu encore quand les noms retenus pour des toponymes situés en France ne sont pas toujours en français (on en trouve aussi en anglais, exemple : Corsica; les précisions ajoutées sur Commons utilisent les conventions soit francophones (entre parenthèses) soit anglophones (après une virgule, ou rien avant un terme générique avec ou sans majuscule comme "River" ou "river", plus les conflits entre orthographes anglophones), la seule règle étant premier créé, premier servi. Les noms de pages n'obéissent à aucune règle précise, surtout en cas d'homonymies. les liens de redirection posent aussi problèmes régulièrement (direct vers un des articles, tous les autres devant être modifiés, et pas de page d'homonymie unique ou ne devrait y avoir que de très courts paragraphes pour chaque usage, même si aucune ébauche d'article séparée n'est créé qui n'apporterait rien de plus). Et c'est encore pire pour es noms de personnalités avec les alias, les noms avant ou après les mariages, les titres honorifiques, les nombre de prénoms, les translitérations, etc. même si Wikidata commence à y mettre de l'ordre (mais tend aussi à figer les situations pour limiter les renommages)... Le 21 juin 2013 09:29, Francescu GAROBY a écrit : > Sur Wikipedia, je n'ai jamais compris pourquoi la page vers > l'arrondissement de Caen ne s'appelait pas "Caen (arrondissement)", comme > c'est l'usage pour beaucoup d'autres pages homonymes... > Une telle façon de nommer les pages élimineraient de facto les nombreuses > erreurs à cause des "de,du,d',de la," que soulève Nicolas. > > Francescu > > > Le 21 juin 2013 08:08, Damouns a écrit : > > Le 20 juin 2013 20:55, Nicolas Moyroud a écrit : >> > Dans wikipedia je rajoute donc un nom aux liens sans aucun morceau >> ajouté, >> > juste le nom de l'entité. Le lien lui-même donne déjà la version >> complète >> > "Canton de..." mais plus le texte affiché dans l'infobox sur la page. >> >> Dans le cas de l'infobox c'est écrit "Canton : Untel" donc évidemment >> que c'est superflu d'écrire "Canton de..." >> >> Mon idée est que dans une phrase en français courant, 99,9% des >> phrases contenant "Pontarlier" ou "Issoire" désignent la commune, et >> pas le canton de Pontarlier ni l'arrondissement d'Issoire. Et ce même >> dans un contexte où on parle du canton : "Aux dernières élections >> cantonales Blaye a voté pour..." moi je le comprends comme "la commune >> de Blaye a voté pour..." >> >> Damouns >> >> ___ >> Talk-fr mailing list >> Talk-fr@openstreetmap.org >> http://lists.openstreetmap.org/listinfo/talk-fr >> > > > > -- > Cordialement, > Francescu GAROBY > > ___ > Talk-fr mailing list > Talk-fr@openstreetmap.org > http://lists.openstreetmap.org/listinfo/talk-fr > > ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)
Sur Wikipedia, je n'ai jamais compris pourquoi la page vers l'arrondissement de Caen ne s'appelait pas "Caen (arrondissement)", comme c'est l'usage pour beaucoup d'autres pages homonymes... Une telle façon de nommer les pages élimineraient de facto les nombreuses erreurs à cause des "de,du,d',de la," que soulève Nicolas. Francescu Le 21 juin 2013 08:08, Damouns a écrit : > Le 20 juin 2013 20:55, Nicolas Moyroud a écrit : > > Dans wikipedia je rajoute donc un nom aux liens sans aucun morceau > ajouté, > > juste le nom de l'entité. Le lien lui-même donne déjà la version complète > > "Canton de..." mais plus le texte affiché dans l'infobox sur la page. > > Dans le cas de l'infobox c'est écrit "Canton : Untel" donc évidemment > que c'est superflu d'écrire "Canton de..." > > Mon idée est que dans une phrase en français courant, 99,9% des > phrases contenant "Pontarlier" ou "Issoire" désignent la commune, et > pas le canton de Pontarlier ni l'arrondissement d'Issoire. Et ce même > dans un contexte où on parle du canton : "Aux dernières élections > cantonales Blaye a voté pour..." moi je le comprends comme "la commune > de Blaye a voté pour..." > > Damouns > > ___ > Talk-fr mailing list > Talk-fr@openstreetmap.org > http://lists.openstreetmap.org/listinfo/talk-fr > -- Cordialement, Francescu GAROBY ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)
Le 20 juin 2013 20:55, Nicolas Moyroud a écrit : > Dans wikipedia je rajoute donc un nom aux liens sans aucun morceau ajouté, > juste le nom de l'entité. Le lien lui-même donne déjà la version complète > "Canton de..." mais plus le texte affiché dans l'infobox sur la page. Dans le cas de l'infobox c'est écrit "Canton : Untel" donc évidemment que c'est superflu d'écrire "Canton de..." Mon idée est que dans une phrase en français courant, 99,9% des phrases contenant "Pontarlier" ou "Issoire" désignent la commune, et pas le canton de Pontarlier ni l'arrondissement d'Issoire. Et ce même dans un contexte où on parle du canton : "Aux dernières élections cantonales Blaye a voté pour..." moi je le comprends comme "la commune de Blaye a voté pour..." Damouns ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)
Le 20/06/2013 19:37, Damouns a écrit : Je rebondis sur ce problème pour relancer un débat qui a eu lieu il y a quelques temps (je vous laisse le plaisir de rechercher dans les archives de cette liste), sur le nom des cantons, des arrondissements... Je sais que c'est aux outils de s'adapter pour que le rendu soit plus clair pour l'utilisateur, mais depuis le temps que les cantons et les arrondissements sont appelés du seul nom de leur chef-lieu ou de leur préfecture, les outils de recherche comme Nominatim ou de rendu, ou même les éditeurs (JOSM...) ne prennent toujours pas en compte le fait que "Caen" peut représenter autre chose que la commune de Caen. Je serais donc d'avis de changer les noms des cantons en "Canton de..." et des arrondissements en "Arrondissement de...", comme cela se fait sur Wikipédia d'ailleurs. Qui est d'accord ? Damouns PS oui je sais, ça peut vite déraper comme sujet de discussion Bonjour Damouns, C'est amusant ton message parce que je suis en ce moment même en train de faire exactement le contraire de ce que tu dis sur les communes du Languedoc-Roussillon dans wikipedia. Je voudrais faire une extraction d'informations depuis wikipedia pour réaliser une couche géographique mixant les infos OSM et utilisant wikipedia pour certaines valeurs attributaires. Or il se trouve que c'est une horreur de voir figurer les labels "Canton de..." et "Arrondissement de..." dans les valeurs. Ça ne fait pas parti du nom de l'entité administrative et ça n'a rien à y faire ! Sans compter les nombreuses erreurs à cause des "de,du,d',de la," ... Certains labels qui devraient être les mêmes ont des différences parce que pas saisis de la même manière ! Dans wikipedia je rajoute donc un nom aux liens sans aucun morceau ajouté, juste le nom de l'entité. Le lien lui-même donne déjà la version complète "Canton de..." mais plus le texte affiché dans l'infobox sur la page. Nicolas ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)
Si on suivait ta logique d'indiquer en redondance les statuts ou termes génériques nécessaires pour préciser à chaque fois, il faudrait alors mettre dans OSM: - fleuve de la Loire, département de la Loire - commune de Paris, département de Paris (mais légalement une seule entité "Ville de Paris") - église Notre-Dame de Paris, et non église Notre-Dame - etc... Imagine le nombre de combinaisons à analyser (et à traduire...) de façon dépendante pour chaque langue. On peut dire adieu à la traduction à peu près homogène des cartes basées sur OSM. Et ce sera encore plus compliqué de contribuer avec de longues listes de libellés longs. La codification des axes sert à éviter ça, si elle suffit comme précision, il n'est pas nécessaire de la rappeler ailleurs (en créant en plus de nouvelles homonymies dans diverses langues). Le 20 juin 2013 19:51, Philippe Verdy a écrit : > C'est un faux problème qui s'amenuise à mesure qu'on complète les communes > manquantes, et les codes postaux. > > Les noms actuels facilitent les recherches, et les rendus justement. Ces > précisions étant redondantes de toute façon, leur ajout ne changera rien au > fait que Nominatim fera des recherches en texte plein, et qu'il pourra donc > élargir une recherche sur un territoire plus grand que la commune seule si > c'est aussi un canton ou arrondissement. > > Les défauts principaux sont toujours liés à d'autres manques dans la base > > Ce qui se fait sur Wikipédia ce n'est pas utiliser les noms tels quels > mais ajouter assez de précision pour éviter des homonymies dans les noms > d'articles, parce qu'il n'y a pas de redondance à ce niveau et que la > précision est nécessaire. > > Dans OSM on a des données analysées sur plusieurs axes distincts, il n'est > pas nécessaire de les réunir dans un seul champ qu'il faudrait ensuite > analyser avec des heuristiques linguistiques plus ou moins précises. On met > dans les tags le strict nécessaire pour chaque niveau d'analyse. > > OSM est une base de données, pas un moteur de rendu qui fera ses propres > choix pour afficher les tags ou les réunir selon ses besoins propres. > > > > Le 20 juin 2013 19:37, Damouns a écrit : > > Le 20 juin 2013 18:47, Philippe Verdy a écrit : >> > Visiblement la rue de même nom existe dans deux communes du Calvados >> (dans >> > le même arrondissement de Caen). >> >> Je rebondis sur ce problème pour relancer un débat qui a eu lieu il y >> a quelques temps (je vous laisse le plaisir de rechercher dans les >> archives de cette liste), sur le nom des cantons, des >> arrondissements... >> >> Je sais que c'est aux outils de s'adapter pour que le rendu soit plus >> clair pour l'utilisateur, mais depuis le temps que les cantons et les >> arrondissements sont appelés du seul nom de leur chef-lieu ou de leur >> préfecture, les outils de recherche comme Nominatim ou de rendu, ou >> même les éditeurs (JOSM...) ne prennent toujours pas en compte le fait >> que "Caen" peut représenter autre chose que la commune de Caen. >> >> Je serais donc d'avis de changer les noms des cantons en "Canton >> de..." et des arrondissements en "Arrondissement de...", comme cela se >> fait sur Wikipédia d'ailleurs. Qui est d'accord ? >> >> Damouns >> >> PS oui je sais, ça peut vite déraper comme sujet de discussion >> >> ___ >> Talk-fr mailing list >> Talk-fr@openstreetmap.org >> http://lists.openstreetmap.org/listinfo/talk-fr >> > > ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)
C'est un faux problème qui s'amenuise à mesure qu'on complète les communes manquantes, et les codes postaux. Les noms actuels facilitent les recherches, et les rendus justement. Ces précisions étant redondantes de toute façon, leur ajout ne changera rien au fait que Nominatim fera des recherches en texte plein, et qu'il pourra donc élargir une recherche sur un territoire plus grand que la commune seule si c'est aussi un canton ou arrondissement. Les défauts principaux sont toujours liés à d'autres manques dans la base Ce qui se fait sur Wikipédia ce n'est pas utiliser les noms tels quels mais ajouter assez de précision pour éviter des homonymies dans les noms d'articles, parce qu'il n'y a pas de redondance à ce niveau et que la précision est nécessaire. Dans OSM on a des données analysées sur plusieurs axes distincts, il n'est pas nécessaire de les réunir dans un seul champ qu'il faudrait ensuite analyser avec des heuristiques linguistiques plus ou moins précises. On met dans les tags le strict nécessaire pour chaque niveau d'analyse. OSM est une base de données, pas un moteur de rendu qui fera ses propres choix pour afficher les tags ou les réunir selon ses besoins propres. Le 20 juin 2013 19:37, Damouns a écrit : > Le 20 juin 2013 18:47, Philippe Verdy a écrit : > > Visiblement la rue de même nom existe dans deux communes du Calvados > (dans > > le même arrondissement de Caen). > > Je rebondis sur ce problème pour relancer un débat qui a eu lieu il y > a quelques temps (je vous laisse le plaisir de rechercher dans les > archives de cette liste), sur le nom des cantons, des > arrondissements... > > Je sais que c'est aux outils de s'adapter pour que le rendu soit plus > clair pour l'utilisateur, mais depuis le temps que les cantons et les > arrondissements sont appelés du seul nom de leur chef-lieu ou de leur > préfecture, les outils de recherche comme Nominatim ou de rendu, ou > même les éditeurs (JOSM...) ne prennent toujours pas en compte le fait > que "Caen" peut représenter autre chose que la commune de Caen. > > Je serais donc d'avis de changer les noms des cantons en "Canton > de..." et des arrondissements en "Arrondissement de...", comme cela se > fait sur Wikipédia d'ailleurs. Qui est d'accord ? > > Damouns > > PS oui je sais, ça peut vite déraper comme sujet de discussion > > ___ > Talk-fr mailing list > Talk-fr@openstreetmap.org > http://lists.openstreetmap.org/listinfo/talk-fr > ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr
[OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)
Le 20 juin 2013 18:47, Philippe Verdy a écrit : > Visiblement la rue de même nom existe dans deux communes du Calvados (dans > le même arrondissement de Caen). Je rebondis sur ce problème pour relancer un débat qui a eu lieu il y a quelques temps (je vous laisse le plaisir de rechercher dans les archives de cette liste), sur le nom des cantons, des arrondissements... Je sais que c'est aux outils de s'adapter pour que le rendu soit plus clair pour l'utilisateur, mais depuis le temps que les cantons et les arrondissements sont appelés du seul nom de leur chef-lieu ou de leur préfecture, les outils de recherche comme Nominatim ou de rendu, ou même les éditeurs (JOSM...) ne prennent toujours pas en compte le fait que "Caen" peut représenter autre chose que la commune de Caen. Je serais donc d'avis de changer les noms des cantons en "Canton de..." et des arrondissements en "Arrondissement de...", comme cela se fait sur Wikipédia d'ailleurs. Qui est d'accord ? Damouns PS oui je sais, ça peut vite déraper comme sujet de discussion ___ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr