Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)

2013-06-22 Par sujet Teuxe


Bonjour,

Les homonymies sont un fait. J'ai déjà parlé dans un fil analogue [1]
en 
évoquant les communes françaises nommées Saint-Nicolas. Il y en a un 
paquet, est-ce pour autant qu'on va trafiquer leur tag name=* pour s'y 
retrouver ?

Une fois de plus, ce sujet du nommage revient, et une fois de plus il 
s'appuie sur les approximations d'un outil (Nominatim), approximations 
qu'il faudrait compenser non pas dans l'outil, mais dans la donnée.

En l'occurrence la donnée différenciant le nom des entités existe bien, avec 
les admin_level. Renommer le canton aboutirait aux mêmes problèmes (la chaîne 
de caractères étant toujours présente). C'est toujours l'outil à vocation 
internationale qui impose ses contraintes ici ; ce ne devrait pas être le cas. 
À mon avis il y a encore du travail d'enrichissement de l'algo pour qu'il 
réponde au besoin. Il faut alors exprimer ce besoin clairement, ça s'appelle un 
cahier des charges.

Quelles sont nos exigences précises en la matière ?


Teuxe
-- 
Envoyé de mon téléphone avec Kaiten Mail. Excusez la brièveté.

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)

2013-06-22 Par sujet Teuxe


Bonjour,

Les homonymies sont un fait. J'ai déjà parlé dans un fil analogue [1]
en 
évoquant les communes françaises nommées Saint-Nicolas. Il y en a un 
paquet, est-ce pour autant qu'on va trafiquer leur tag name=* pour s'y 
retrouver ?

Une fois de plus, ce sujet du nommage revient, et une fois de plus il 
s'appuie sur les approximations d'un outil (Nominatim), approximations 
qu'il faudrait compenser non pas dans l'outil, mais dans la donnée.

En l'occurrence la donnée différenciant le nom des entités existe bien, avec 
les admin_level. Renommer le canton aboutirait aux mêmes problèmes (la chaîne 
de caractères étant toujours présente). C'est toujours l'outil à vocation 
internationale qui impose ses contraintes ici ; ce ne devrait pas être le cas. 
À mon avis il y a encore du travail d'enrichissement de l'algo pour qu'il 
réponde au besoin. Il faut alors exprimer ce besoin clairement, ça s'appelle un 
cahier des charges.

Quelles sont nos exigences précises en la matière ?


Teuxe
-- 
Envoyé de mon téléphone avec Kaiten Mail. Excusez la brièveté.
-- 
Envoyé de mon téléphone avec Kaiten Mail. Excusez la brièveté.___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)

2013-06-21 Par sujet Damouns
Le 20 juin 2013 20:55, Nicolas Moyroud nmoyr...@free.fr a écrit :
 Dans wikipedia je rajoute donc un nom aux liens sans aucun morceau ajouté,
 juste le nom de l'entité. Le lien lui-même donne déjà la version complète
 Canton de... mais plus le texte affiché dans l'infobox sur la page.

Dans le cas de l'infobox c'est écrit Canton : Untel donc évidemment
que c'est superflu d'écrire Canton de...

Mon idée est que dans une phrase en français courant, 99,9% des
phrases contenant Pontarlier ou Issoire désignent la commune, et
pas le canton de Pontarlier ni l'arrondissement d'Issoire. Et ce même
dans un contexte où on parle du canton : Aux dernières élections
cantonales Blaye a voté pour... moi je le comprends comme la commune
de Blaye a voté pour...

Damouns

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)

2013-06-21 Par sujet Francescu GAROBY
Sur Wikipedia, je n'ai jamais compris pourquoi la page vers
l'arrondissement de Caen ne s'appelait pas Caen (arrondissement), comme
c'est l'usage pour beaucoup d'autres pages homonymes...
Une telle façon de nommer les pages élimineraient de facto les nombreuses
erreurs à cause des de,du,d',de la, que soulève Nicolas.

Francescu


Le 21 juin 2013 08:08, Damouns damo...@gmail.com a écrit :

 Le 20 juin 2013 20:55, Nicolas Moyroud nmoyr...@free.fr a écrit :
  Dans wikipedia je rajoute donc un nom aux liens sans aucun morceau
 ajouté,
  juste le nom de l'entité. Le lien lui-même donne déjà la version complète
  Canton de... mais plus le texte affiché dans l'infobox sur la page.

 Dans le cas de l'infobox c'est écrit Canton : Untel donc évidemment
 que c'est superflu d'écrire Canton de...

 Mon idée est que dans une phrase en français courant, 99,9% des
 phrases contenant Pontarlier ou Issoire désignent la commune, et
 pas le canton de Pontarlier ni l'arrondissement d'Issoire. Et ce même
 dans un contexte où on parle du canton : Aux dernières élections
 cantonales Blaye a voté pour... moi je le comprends comme la commune
 de Blaye a voté pour...

 Damouns

 ___
 Talk-fr mailing list
 Talk-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/talk-fr




-- 
Cordialement,
Francescu GAROBY
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)

2013-06-21 Par sujet Philippe Verdy
Wikipédia a souvent des conventions inconsistantes pour ses noms de pages.
Mais c'est difficile à appliquer (alors que cela simplifierait bien des
situations et des modèles comme la production et la maintenance des
palettes de navigation et infobox). Souvent la règle de la dénomination la
plus courante emporte et on n'ajoute pas la précision sur un des articles
homonymes (chois souvent subjectif et basé sur la popularité dans un pays
donné).

Sur Commons le problème est plus aigu encore quand les noms retenus pour
des toponymes situés en France ne sont pas toujours en français (on en
trouve aussi en anglais, exemple : Corsica; les précisions ajoutées sur
Commons utilisent les conventions soit francophones (entre parenthèses)
soit anglophones (après une virgule, ou rien avant un terme générique avec
ou sans majuscule comme River ou river, plus les conflits entre
orthographes anglophones), la seule règle étant premier créé, premier servi.

Les noms de pages n'obéissent à aucune règle précise, surtout en cas
d'homonymies. les liens de redirection posent aussi problèmes régulièrement
(direct vers un des articles, tous les autres devant être modifiés, et pas
de page d'homonymie unique ou ne devrait y avoir que de très courts
paragraphes pour chaque usage, même si aucune ébauche d'article séparée
n'est créé qui n'apporterait rien de plus). Et c'est encore pire pour es
noms de personnalités avec les alias, les noms avant ou après les mariages,
les titres honorifiques, les nombre de prénoms, les translitérations, etc.
même si Wikidata commence à y mettre de l'ordre (mais tend aussi à figer
les situations pour limiter les renommages)...



Le 21 juin 2013 09:29, Francescu GAROBY windu...@gmail.com a écrit :

 Sur Wikipedia, je n'ai jamais compris pourquoi la page vers
 l'arrondissement de Caen ne s'appelait pas Caen (arrondissement), comme
 c'est l'usage pour beaucoup d'autres pages homonymes...
 Une telle façon de nommer les pages élimineraient de facto les nombreuses
 erreurs à cause des de,du,d',de la, que soulève Nicolas.

 Francescu


 Le 21 juin 2013 08:08, Damouns damo...@gmail.com a écrit :

 Le 20 juin 2013 20:55, Nicolas Moyroud nmoyr...@free.fr a écrit :
  Dans wikipedia je rajoute donc un nom aux liens sans aucun morceau
 ajouté,
  juste le nom de l'entité. Le lien lui-même donne déjà la version
 complète
  Canton de... mais plus le texte affiché dans l'infobox sur la page.

 Dans le cas de l'infobox c'est écrit Canton : Untel donc évidemment
 que c'est superflu d'écrire Canton de...

 Mon idée est que dans une phrase en français courant, 99,9% des
 phrases contenant Pontarlier ou Issoire désignent la commune, et
 pas le canton de Pontarlier ni l'arrondissement d'Issoire. Et ce même
 dans un contexte où on parle du canton : Aux dernières élections
 cantonales Blaye a voté pour... moi je le comprends comme la commune
 de Blaye a voté pour...

 Damouns

 ___
 Talk-fr mailing list
 Talk-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/talk-fr




 --
 Cordialement,
 Francescu GAROBY

 ___
 Talk-fr mailing list
 Talk-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/talk-fr


___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)

2013-06-21 Par sujet Pieren
2013/6/21 Damouns damo...@gmail.com:

 Mon idée est que dans une phrase en français courant, 99,9% des
 phrases contenant Pontarlier ou Issoire désignent la commune

Il est évident que tout document, officiel ou pas, citant Caen ou
Pontarlier tout seul, fait référence à la ville.
Notre malheur est que le COG présente les cantons dans un tableau avec
le nom du chef-lieu en dessous de la colonne marquée Canton et que
certains ont pris le nom de ce chef-lieu pour le nom du canton
lui-même.
Exemple:
http://www.insee.fr/fr/methodes/nomenclatures/cog/canarr.asp?codedep=14codearr=2

Alors que lorsqu'on va dans la fiche détail d'un canton:
http://www.insee.fr/fr/methodes/nomenclatures/cog/comcan.asp?codedep=14codecan=06

on parle bien de Canton de Bourguébus (06).
(à noter, le bug du COG sur Canton de Caen 1er Canton (08)

100% favorable pour nommer les choses par leur nom. Mettez canton de
au début ou (canton) à la fin, peu importe, mais évitons les
homonymies inutiles avec un peu de bon sens commun.

Pieren

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)

2013-06-21 Par sujet Philippe Verdy
Le COG n'inclue pas le nom complet, c'est une présentation faite sur le
site à partir d'un assemblage de données codifiées individuellement, pour
donner un titre de section ou sous-section dans la page (c'est juste plus
joli que de mettre Canton: Caen 1er Canton.

L'exemple que tu cites le démontre clairement. La ligne  Canton de Caen
1er Canton (08) est bien issu de cet assemblage d'éléments codés
individuellement. Si c'était vraiment joli cela devrait être 1er canton de
Caen, voire Premier canton de Caen, quoique les textes de loi du code
rural et l'arrêté de création le nomment canton de Caen-I (noter la
minuscule initiale, ce n'est pas un nom propre, car ni le canton ni
l'arrondissement n'ont la personnalité juridique comme les EPCI qui
choisissent un nom propre souvent différent de leur statut réel, par
exemple ceux qui se nomment métropoles ou pays de) mais quand des
listes de cantons sont dressés les termes canton de sont supprimés et
remplacés contextuellement par un entête de liste mentionnant cantons de
au pluriel

(les chiffres entre parenthèses de ton exemple sont le code du canton dans
le département, mais ce n'est pas évident en première lecture de ce seule
libellé composé, cela ne se déduit que par le contexte de la page, mais ils
témoignent là aussi que le libellé est assemblé automatiquement, il ne fait
pourtant pas non plus partie du nom du canton qui se suffit sans ce numéro,
et ce numéro affiché n'est pas utilisable seul non plus comme identifiant
sans préciser le code du département...).



Le 21 juin 2013 12:10, Pieren pier...@gmail.com a écrit :

 2013/6/21 Damouns damo...@gmail.com:

  Mon idée est que dans une phrase en français courant, 99,9% des
  phrases contenant Pontarlier ou Issoire désignent la commune

 Il est évident que tout document, officiel ou pas, citant Caen ou
 Pontarlier tout seul, fait référence à la ville.
 Notre malheur est que le COG présente les cantons dans un tableau avec
 le nom du chef-lieu en dessous de la colonne marquée Canton et que
 certains ont pris le nom de ce chef-lieu pour le nom du canton
 lui-même.
 Exemple:

 http://www.insee.fr/fr/methodes/nomenclatures/cog/canarr.asp?codedep=14codearr=2

 Alors que lorsqu'on va dans la fiche détail d'un canton:

 http://www.insee.fr/fr/methodes/nomenclatures/cog/comcan.asp?codedep=14codecan=06

 on parle bien de Canton de Bourguébus (06).
 (à noter, le bug du COG sur Canton de Caen 1er Canton (08)

 100% favorable pour nommer les choses par leur nom. Mettez canton de
 au début ou (canton) à la fin, peu importe, mais évitons les
 homonymies inutiles avec un peu de bon sens commun.

 Pieren

 ___
 Talk-fr mailing list
 Talk-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/talk-fr

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)

2013-06-21 Par sujet Vincent de Château-Thierry

Bonjour,

Le 21/06/2013 12:10, Pieren a écrit :

2013/6/21 Damouns damo...@gmail.com:


Mon idée est que dans une phrase en français courant, 99,9% des
phrases contenant Pontarlier ou Issoire désignent la commune


Il est évident que tout document, officiel ou pas, citant Caen ou
Pontarlier tout seul, fait référence à la ville.
Notre malheur est que le COG présente les cantons dans un tableau avec
le nom du chef-lieu en dessous de la colonne marquée Canton et que
certains ont pris le nom de ce chef-lieu pour le nom du canton
lui-même.
Exemple:
http://www.insee.fr/fr/methodes/nomenclatures/cog/canarr.asp?codedep=14codearr=2
Alors que lorsqu'on va dans la fiche détail d'un canton:
http://www.insee.fr/fr/methodes/nomenclatures/cog/comcan.asp?codedep=14codecan=06


Si ce 2e lien doit servir ton argumentaire, alors ça me paraît mal parti 
: la même page, où le nommage du canton t'arrange, ne parle pas de 
Basse-Normandie mais Région Basse-Normandie, Calvados y est appelé 
Département du Calvados. Sans parler, bien sûr, de l'arrondissement de 
Caen. On renomme tous les niveaux, tant qu'on y est ?



on parle bien de Canton de Bourguébus (06).
(à noter, le bug du COG sur Canton de Caen 1er Canton (08)

100% favorable pour nommer les choses par leur nom.


Manifestement non, puisque tu proposes de compléter le nom :

Mettez canton de

au début ou (canton) à la fin, peu importe, mais évitons les
homonymies inutiles avec un peu de bon sens commun.


Les homonymies sont un fait. J'ai déjà parlé dans un fil analogue [1] en 
évoquant les communes françaises nommées Saint-Nicolas. Il y en a un 
paquet, est-ce pour autant qu'on va trafiquer leur tag name=* pour s'y 
retrouver ?


Une fois de plus, ce sujet du nommage revient, et une fois de plus il 
s'appuie sur les approximations d'un outil (Nominatim), approximations 
qu'il faudrait compenser non pas dans l'outil, mais dans la donnée. Ce 
raisonnement se défendrait si seul cet outil utilisait les données. Mais 
que je sache, on contribue à la constitution d'une base de données, pas 
d'un outil. Et avec l'espoir que cette base servira dans de nombreux 
contextes (pas juste Nominatim). Aussi, quand on le peut, donner à cette 
base un peu de cohérence, d'homogénéité, pour lui faire gagner du crédit 
auprès de ses utilisateurs potentiels, ça me paraît nécessaire. Ce qui 
se traduit, dans notre sujet, par le fait de mettre comme valeur du tag 
name le nom _strict_ d'une entité, surtout lorsqu'un référentiel externe 
nous le propose.


vincent

[1] : 
http://lists.openstreetmap.org/pipermail/talk-fr/2013-February/054404.html



___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)

2013-06-21 Par sujet Pieren
2013/6/21 Vincent de Château-Thierry v...@laposte.net:
 On renomme tous les niveaux, tant qu'on y est ?

Euh ,y a une ville qui s'appelle Basse Normandie ? Si la région
s'appelait Caen, on pourrait en rediscuter. Ici, il s'agit de lever
une ambiguité facilement.

 il s'appuie sur les approximations d'un outil (Nominatim)...
 le nom _strict_ d'une entité, surtout lorsqu'un référentiel externe
 nous le propose.

Ca me rappelle les discussion sur la super-relation boundary pour la
France. Si quelqu'un n'avait pas remis une énorme relation simple, il
n'y aurait tout simplement pas de géolocalisation correcte pour la
France. En trois ans, personne n'a adapté les outils pour prendre en
compte les super-relations.

Je ne connais pas d'autres pays qui ont un problème avec une entité
administrative qui porte exactement le même nom à différents niveaux
dans OSM. De ce que j'ai pu voir, ils n'hésitent pas à ajouter un
identifant dans le nom (comme Orange County, Californie [1] ou
Canton Capellen au Luxembourg [2]) alors que dans les deux cas, le
nom officiel est aussi le nom du chef-lieu.
Pourquoi serions-nous moins pragmatiques que les autres ?
Pourquoi ne pas faire un compromis comme aux USA avec name=Orange
County + county:name=Orange ?
Si on ne fait rien, ça sera comme avec la super-relation: ça reviendra
régulièrement sur le tapis. Et si vous espérez une adaptation de tous
les outils de tous les pays pour tenir compte de notre petit
particularisme, vous risquez d'attendre très, très, très longtemps.

Pieren

[1] http://www.openstreetmap.org/browse/relation/396466
[2] http://www.openstreetmap.org/browse/relation/407813

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)

2013-06-21 Par sujet Vincent de Château-Thierry


Le 21/06/2013 14:27, Pieren a écrit :

2013/6/21 Vincent de Château-Thierry v...@laposte.net:

On renomme tous les niveaux, tant qu'on y est ?


Euh ,y a une ville qui s'appelle Basse Normandie ?


Pas que je sache. Mais tu citais cette page pour illustrer que le nom du 
canton devrait contenir 'canton de '. Si cette page fait référence, 
alors soyons un peu logiques :-) .
Autant je ne considère pas OSM comme une base référentielle (le mot est 
dit), autant, sur la thématique des découpages administratifs, on doit 
pouvoir coller au mieux aux référentiels externes. On ne va pas 
inventer, ni même déduire du terrain, par où passe une limite indiquée 
par le cadastre, ou la valeur d'un code émis par l'INSEE. On les prend 
tels qu'ils sont. Pourquoi déroger pour le nom ? En le faisant, on 
dévalorise notre contenu.



Je ne connais pas d'autres pays qui ont un problème avec une entité
administrative qui porte exactement le même nom à différents niveaux
dans OSM. De ce que j'ai pu voir, ils n'hésitent pas à ajouter un
identifant dans le nom (comme Orange County, Californie [1] ou
Canton Capellen au Luxembourg [2]) alors que dans les deux cas, le
nom officiel est aussi le nom du chef-lieu.
Pourquoi serions-nous moins pragmatiques que les autres ?


Tout est affaire d'exemples. Tu observeras le pragmatisme des italiens :
http://www.openstreetmap.org/browse/relation/41313 (Rome au niveau 6)
inclut
http://www.openstreetmap.org/browse/relation/41485 (Rome au niveau 8)
Les deux ont le même tag name, et un tag officiel_name différent. Comme 
quoi, ce qui aurait pu les désambiguïser n'est même pas pris en compte 
pour le nom principal. C'est un homonyme, assumé.



Pourquoi ne pas faire un compromis comme aux USA avec name=Orange
County + county:name=Orange ?


compromis me paraît diamétralement opposé à référentiel, évoqué plus 
haut. On ne conciliera pas les deux, pour sûr. Quand je pense 
référentiel, c'est avec en tête l'usage qui sera fait de la donnée par 
des gens que je ne connais pas, dans des applications que je ne connais 
pas non plus. En introduisant de la bidouille,  je pense qu'on ne donne 
pas de bons arguments pour populariser l'utilisation de notre contenu.


vincent

ps. ça ne nous dit pas ce qu'on fait pour désambiguïser les ~50 
Saint-Nicolas français ;-)


___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)

2013-06-21 Par sujet Pieren
2013/6/21 Vincent de Château-Thierry v...@laposte.net:

 Pourquoi déroger pour le nom ? En le faisant, on dévalorise notre contenu.

Au contraire, on clarifie là où c'est nécessaire. Comme tu le dis, OSM
n'est pas un référentiel. Si quelqu'un veut la liste officielle des
noms officiels des cantons/arrondissements de France, il peut déjà les
trouver dans le COG.
Ici, on essaie de lever une ambiguité dans OSM, pour OSM. Les données
extérieures doivent servir à enrichir la base mais avec la condition
de pouvoir être modifiées. Sinon, tu donnes des billes à ceux qui sont
contre toute forme d'import. Si c'est pour importer des données pour
ensuite bloquer tout changement sous prétexte qu'il faut coller au
référentiel, cela n'a pas sa place dans OSM.

 Les deux ont le même tag name, et un tag officiel_name différent. Comme
 quoi, ce qui aurait pu les désambiguïser n'est même pas pris en compte pour
 le nom principal. C'est un homonyme, assumé.

Assumé, c'est vite dit. Peut-être se sont-ils basés sur les données
actuelles en France en pensant que c'était assumé chez-nous ;-)

 compromis me paraît diamétralement opposé à référentiel, évoqué plus
 haut. On ne conciliera pas les deux, pour sûr. Quand je pense référentiel,
 c'est avec en tête l'usage qui sera fait de la donnée par des gens que je ne
 connais pas, dans des applications que je ne connais pas non plus.

Mouais, bon. C'est un référentiel ou pas un référentiel, finalement ?
On peut et on doit se rapprocher autant que possible des données
officielles. Mais on ne peut pas bloquer des données importées sous
prétexte qu'elles pourraient diverger de la source. Sinon, on n'est
plus le wikipedia des cartes mais juste un aggrégateur de données
publiques.

Pieren

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)

2013-06-21 Par sujet Vincent de Château-Thierry


Le 21/06/2013 16:39, Pieren a écrit :

2013/6/21 Vincent de Château-Thierry v...@laposte.net:


Pourquoi déroger pour le nom ? En le faisant, on dévalorise notre contenu.


Ici, on essaie de lever une ambiguité dans OSM, pour OSM.


Oui mais on n'est pas en vase clos. Quand je lis pour OSM, j'ai 
l'impression que ce qui peut advenir du contenu OSM en dehors de notre 
microcosme de contributeurs n'a pas d'intérêt :-(



Les deux ont le même tag name, et un tag officiel_name différent. Comme
quoi, ce qui aurait pu les désambiguïser n'est même pas pris en compte pour
le nom principal. C'est un homonyme, assumé.


Assumé, c'est vite dit. Peut-être se sont-ils basés sur les données
actuelles en France en pensant que c'était assumé chez-nous ;-)


Joli ! :-)


compromis me paraît diamétralement opposé à référentiel, évoqué plus
haut. On ne conciliera pas les deux, pour sûr. Quand je pense référentiel,
c'est avec en tête l'usage qui sera fait de la donnée par des gens que je ne
connais pas, dans des applications que je ne connais pas non plus.


Mouais, bon. C'est un référentiel ou pas un référentiel, finalement ?


Toujours pas :-) C'est surtout l'idée de fiabilité que je voulais 
exprimer ici. Parmi les aspects déroutants pour ceux qui cherchent à 
utiliser nos données, il y a l'absence de cahier des charges (je 
résume). Si on sait montrer que certaines thématiques (ici 
l'administratif) sont fabriquées avec rigueur, sont un peu carrées, et 
donc réutilisables en confiance, ça ne peut qu'aider à faire adhérer. 
Enfin, c'est mon avis.


vincent (un peu borné sur l'idée que les contributeurs d'après-demain 
sont les consommateurs de demain :-) )



___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)

2013-06-21 Par sujet Philippe Verdy
Le 21 juin 2013 13:25, Vincent de Château-Thierry v...@laposte.net a
écrit :


 Une fois de plus, ce sujet du nommage revient, et une fois de plus il
 s'appuie sur les approximations d'un outil (Nominatim), approximations
 qu'il faudrait compenser non pas dans l'outil, mais dans la donnée.


D'une part il n'est pas nécessaire de compenser dans la donnée puisque les
données sont déjà présentes. De plus Nominatim fait déjà les différences
nécessaires. Il faut savoir utiliser l'outil et surtout lire ce qu'il
affiche et qui est très clair.

Mais une recherche Nominatim dans JOSM fait certanes différences (JOSM
affichant en plus la carte). Toute recherche par nom de toute façon pourra
ramener des homonymes, en classant selon des degrés de pertinence, ce que
Niminatim fait déjà. On ne doit pas se contenter de ne lire que le premier
résultat affiché quand Nominatim en fournit déjà une liste visible au
premier coup d'oeil !

Ensuite les moteurs de rendus affichent aussi des différences
significatives, même si leur rendu peut parfois être amélioré. Mais là
encore on ne parle pas de la base dont les données sont déjà correctes,
suffisantes,  claires, et non ambiguës. Dans une base de données on ne
mélange pas dans un me^me champ des informations appartenant à des axes
d'analyse et de classification distincts.

Ca s'appelle la modélisation, et c'est ce qui fait l'utilité d'une base
de données et permet sa réutilisabilité pour divers types de requêtes selon
des besoins différents, où les précisions ajoutées et mélangées sont plus
nuisibles qu'utiles.
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


[OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)

2013-06-20 Par sujet Damouns
Le 20 juin 2013 18:47, Philippe Verdy verd...@wanadoo.fr a écrit :
 Visiblement la rue de même nom existe dans deux communes du Calvados (dans
 le même arrondissement de Caen).

Je rebondis sur ce problème pour relancer un débat qui a eu lieu il y
a quelques temps (je vous laisse le plaisir de rechercher dans les
archives de cette liste), sur le nom des cantons, des
arrondissements...

Je sais que c'est aux outils de s'adapter pour que le rendu soit plus
clair pour l'utilisateur, mais depuis le temps que les cantons et les
arrondissements sont appelés du seul nom de leur chef-lieu ou de leur
préfecture, les outils de recherche comme Nominatim ou de rendu, ou
même les éditeurs (JOSM...) ne prennent toujours pas en compte le fait
que Caen peut représenter autre chose que la commune de Caen.

Je serais donc d'avis de changer les noms des cantons en Canton
de... et des arrondissements en Arrondissement de..., comme cela se
fait sur Wikipédia d'ailleurs. Qui est d'accord ?

Damouns

PS oui je sais, ça peut vite déraper comme sujet de discussion

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)

2013-06-20 Par sujet Philippe Verdy
C'est un faux problème qui s'amenuise à mesure qu'on complète les communes
manquantes, et les codes postaux.

Les noms actuels facilitent les recherches, et les rendus justement. Ces
précisions étant redondantes de toute façon, leur ajout ne changera rien au
fait que Nominatim fera des recherches en texte plein, et qu'il pourra donc
élargir une recherche sur un territoire plus grand que la commune seule si
c'est aussi un canton ou arrondissement.

Les défauts principaux sont toujours liés à d'autres manques dans la base

Ce qui se fait sur Wikipédia ce n'est pas utiliser les noms tels quels mais
ajouter assez de précision pour éviter des homonymies dans les noms
d'articles, parce qu'il n'y a pas de redondance à ce niveau et que la
précision est nécessaire.

Dans OSM on a des données analysées sur plusieurs axes distincts, il n'est
pas nécessaire de les réunir dans un seul champ qu'il faudrait ensuite
analyser avec des heuristiques linguistiques plus ou moins précises. On met
dans les tags le strict nécessaire pour chaque niveau d'analyse.

OSM est une base de données, pas un moteur de rendu qui fera ses propres
choix pour afficher les tags ou les réunir selon ses besoins propres.



Le 20 juin 2013 19:37, Damouns damo...@gmail.com a écrit :

 Le 20 juin 2013 18:47, Philippe Verdy verd...@wanadoo.fr a écrit :
  Visiblement la rue de même nom existe dans deux communes du Calvados
 (dans
  le même arrondissement de Caen).

 Je rebondis sur ce problème pour relancer un débat qui a eu lieu il y
 a quelques temps (je vous laisse le plaisir de rechercher dans les
 archives de cette liste), sur le nom des cantons, des
 arrondissements...

 Je sais que c'est aux outils de s'adapter pour que le rendu soit plus
 clair pour l'utilisateur, mais depuis le temps que les cantons et les
 arrondissements sont appelés du seul nom de leur chef-lieu ou de leur
 préfecture, les outils de recherche comme Nominatim ou de rendu, ou
 même les éditeurs (JOSM...) ne prennent toujours pas en compte le fait
 que Caen peut représenter autre chose que la commune de Caen.

 Je serais donc d'avis de changer les noms des cantons en Canton
 de... et des arrondissements en Arrondissement de..., comme cela se
 fait sur Wikipédia d'ailleurs. Qui est d'accord ?

 Damouns

 PS oui je sais, ça peut vite déraper comme sujet de discussion

 ___
 Talk-fr mailing list
 Talk-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/talk-fr

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)

2013-06-20 Par sujet Philippe Verdy
Si on suivait ta logique d'indiquer en redondance les statuts ou termes
génériques nécessaires pour préciser à chaque fois, il faudrait alors
mettre dans OSM:
- fleuve de la Loire, département de la Loire
- commune de Paris, département de Paris (mais légalement une seule entité
Ville de Paris)
- église Notre-Dame de Paris, et non église Notre-Dame
- etc...

Imagine le nombre de combinaisons à analyser (et à traduire...) de façon
dépendante pour chaque langue. On peut dire adieu à la traduction à peu
près homogène des cartes basées sur OSM. Et ce sera encore plus compliqué
de contribuer avec de longues listes de libellés longs. La codification des
axes sert à éviter ça, si elle suffit comme précision, il n'est pas
nécessaire de la rappeler ailleurs (en créant en plus de nouvelles
homonymies dans diverses langues).


Le 20 juin 2013 19:51, Philippe Verdy verd...@wanadoo.fr a écrit :

 C'est un faux problème qui s'amenuise à mesure qu'on complète les communes
 manquantes, et les codes postaux.

 Les noms actuels facilitent les recherches, et les rendus justement. Ces
 précisions étant redondantes de toute façon, leur ajout ne changera rien au
 fait que Nominatim fera des recherches en texte plein, et qu'il pourra donc
 élargir une recherche sur un territoire plus grand que la commune seule si
 c'est aussi un canton ou arrondissement.

 Les défauts principaux sont toujours liés à d'autres manques dans la base

 Ce qui se fait sur Wikipédia ce n'est pas utiliser les noms tels quels
 mais ajouter assez de précision pour éviter des homonymies dans les noms
 d'articles, parce qu'il n'y a pas de redondance à ce niveau et que la
 précision est nécessaire.

 Dans OSM on a des données analysées sur plusieurs axes distincts, il n'est
 pas nécessaire de les réunir dans un seul champ qu'il faudrait ensuite
 analyser avec des heuristiques linguistiques plus ou moins précises. On met
 dans les tags le strict nécessaire pour chaque niveau d'analyse.

 OSM est une base de données, pas un moteur de rendu qui fera ses propres
 choix pour afficher les tags ou les réunir selon ses besoins propres.



 Le 20 juin 2013 19:37, Damouns damo...@gmail.com a écrit :

 Le 20 juin 2013 18:47, Philippe Verdy verd...@wanadoo.fr a écrit :
  Visiblement la rue de même nom existe dans deux communes du Calvados
 (dans
  le même arrondissement de Caen).

 Je rebondis sur ce problème pour relancer un débat qui a eu lieu il y
 a quelques temps (je vous laisse le plaisir de rechercher dans les
 archives de cette liste), sur le nom des cantons, des
 arrondissements...

 Je sais que c'est aux outils de s'adapter pour que le rendu soit plus
 clair pour l'utilisateur, mais depuis le temps que les cantons et les
 arrondissements sont appelés du seul nom de leur chef-lieu ou de leur
 préfecture, les outils de recherche comme Nominatim ou de rendu, ou
 même les éditeurs (JOSM...) ne prennent toujours pas en compte le fait
 que Caen peut représenter autre chose que la commune de Caen.

 Je serais donc d'avis de changer les noms des cantons en Canton
 de... et des arrondissements en Arrondissement de..., comme cela se
 fait sur Wikipédia d'ailleurs. Qui est d'accord ?

 Damouns

 PS oui je sais, ça peut vite déraper comme sujet de discussion

 ___
 Talk-fr mailing list
 Talk-fr@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/talk-fr



___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Noms de cantons et d'arrondissements (était : Recherche d'une adresse par Nominatim)

2013-06-20 Par sujet Nicolas Moyroud

Le 20/06/2013 19:37, Damouns a écrit :


Je rebondis sur ce problème pour relancer un débat qui a eu lieu il y
a quelques temps (je vous laisse le plaisir de rechercher dans les
archives de cette liste), sur le nom des cantons, des
arrondissements...

Je sais que c'est aux outils de s'adapter pour que le rendu soit plus
clair pour l'utilisateur, mais depuis le temps que les cantons et les
arrondissements sont appelés du seul nom de leur chef-lieu ou de leur
préfecture, les outils de recherche comme Nominatim ou de rendu, ou
même les éditeurs (JOSM...) ne prennent toujours pas en compte le fait
que Caen peut représenter autre chose que la commune de Caen.

Je serais donc d'avis de changer les noms des cantons en Canton
de... et des arrondissements en Arrondissement de..., comme cela se
fait sur Wikipédia d'ailleurs. Qui est d'accord ?

Damouns

PS oui je sais, ça peut vite déraper comme sujet de discussion


Bonjour Damouns,

C'est amusant ton message parce que je suis en ce moment même en train 
de faire exactement le contraire de ce que tu dis sur les communes du 
Languedoc-Roussillon dans wikipedia. Je voudrais faire une extraction 
d'informations depuis wikipedia pour réaliser une couche géographique 
mixant les infos OSM et utilisant wikipedia pour certaines valeurs 
attributaires. Or il se trouve que c'est une horreur de voir figurer les 
labels Canton de... et Arrondissement de... dans les valeurs. Ça ne 
fait pas parti du nom de l'entité administrative et ça n'a rien à y 
faire ! Sans compter les nombreuses erreurs à cause des de,du,d',de 
la, ... Certains labels qui devraient être les mêmes ont des 
différences parce que pas saisis de la même manière !
Dans wikipedia je rajoute donc un nom aux liens sans aucun morceau 
ajouté, juste le nom de l'entité. Le lien lui-même donne déjà la version 
complète Canton de... mais plus le texte affiché dans l'infobox sur la 
page.


Nicolas


___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr