Re: [OSM-talk-fr] Montrer dans OSM les toponymes réels dans les différentes langues de la République française

2018-01-04 Par sujet Christian Rogel
Effectivement, je n’avais pas bien saisi la méthode.
C’est intéressant en général et, aussi, dans un but de formation.
En se focalisant sur les éléments de relief et de géographie, d’une part, et 
sur les monuments historiques, cela peut être expliqué dans un atelier sur les 
langues régionales, comme celui qui doit être proposé au SOtM France 2018, à 
Bordeaux..


Christian R.

> Le 4 janv. 2018 à 13:48, marc marc  a écrit :
> 
> Le 04. 01. 18 à 11:59, Christian Rogel a écrit :
>> Le versement préalable des données dans Wikidata serait peu praticable
> 
> je ne saisis pas qu'est-ce qui est peu pratique.
> 
> 1) ajouter les toponymes bretons déjà connu de wikidata mais pas d'osm
> exemple https://overpass-turbo.eu/s/udH
> je prend l'un d'eux
> https://www.openstreetmap.org/node/265650103
> https://www.wikidata.org/wiki/Q682644
> en comparant le nom osm et le nom wikidata fr,
> je peux m'assurer qu'on parle bien de la même chose.
> Puisque c'est le cas, on peux ajouter automatiquement
> name:br="Beg ar Vann" à l'objet osm
> On peux le faire de manière assistée avec josm
> Ou envisager des tests plus systématique à la manière
> d'un module d'import ou d'osmose.
> Après je peux comprendre que c'est peut-être plus motivant/visible pour 
> votre groupe de "recruter" x personnes pour faire le travail à la main 
> plutôt que d'améliorer un programme, surtout que ce ne sont pas les 
> mêmes compétences.
> 
> 2) ajouter des toponymes bretons inconnu tant d'osm que de wikidata
> on ajoute l'info à la main sur wikidata, ce qui nous ramène au cas 
> précédent.
> ou on ajoute l'info à la main sur osm en prévoyant un module pour 
> injecter l'info dans wikidata (histoire d'éviter que le travail doive 
> être fait en double, mais nécessite un programme supplémentaire)


___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Montrer dans OSM les toponymes réels dans les différentes langues de la République française

2018-01-04 Par sujet Christian Rogel
> Le 4 janv. 2018 à 12:48, Philippe Verdy  a écrit :
> 
> Déjà standardisés: picard = pcd, normand = nrf, wallon = wa

Merci de l’avoir précisé, mais j’avais mis le code du picard dans la dernière 
version de la liste. 
Pour le moment, nous n’avons en vue pour le serveur OSM France que les 
géolectes de la RF. Les langues romanes de la Suisse seront visibles par le 
débord des cartes (franc-comtois et arpitan)..

> le cas du normand est compliqué par le fait qu'on ne sait pas trop s'il doit 
> unifier aussi le jersias et le guernésiais (officiels dans ces deux 
> territoires).
> le gallo n'est pas codifié effectivement et la seule solution pour l'instant 
> est de le distinguer du français par une extension (provisoire?)

Dans la table des codes ISO 639, il y a un renvoi du jerriais vers la page 
jerriais site Ethnologue. On y voit Also spoken in France, avec renvoi vers la 
fiche du Norman French, 17000 locuteurs, nom alternatif : normand.
Il est clair que nrf signifie norman french.
Ce qui m’étonne, c’est qu’il n’y ait qu’un seul nom en nrf dans OSM et il 
s’agit d’un récif au N de Jersey, les Pierres de Lecq (ou de Lé en normand) ou 
les Paternosters.
Les name:fr-x-norman sont à convertir.

> Le mahorais et les créoles guadeloupéens ou réunionnais ont des codes 
> standards, de même que le tahitien et le wallisien. Regarde l'ISO 639-3.

OK, je n’avais pas pensé au wallisien wls. 28ème géolecte. Le rapport 
Cerquiglini en a trouvé 77 (il manque les langues calédoniennes et guyanaises).

> Attention aux codes d'extension: après "-x-" il ne faut pas plus de 8 
> caractères. De même ces codes d'extension passent toujours après les autres 
> (donc après un éventuel code d'écriture ou de région)

Je supposais bien qu’il y avait une régle de formation.


Christian R.___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Montrer dans OSM les toponymes réels dans les différentes langues de la République française

2018-01-04 Par sujet marc marc
Le 04. 01. 18 à 11:59, Christian Rogel a écrit :
> Le versement préalable des données dans Wikidata serait peu praticable

je ne saisis pas qu'est-ce qui est peu pratique.

1) ajouter les toponymes bretons déjà connu de wikidata mais pas d'osm
exemple https://overpass-turbo.eu/s/udH
je prend l'un d'eux
https://www.openstreetmap.org/node/265650103
https://www.wikidata.org/wiki/Q682644
en comparant le nom osm et le nom wikidata fr,
je peux m'assurer qu'on parle bien de la même chose.
Puisque c'est le cas, on peux ajouter automatiquement
name:br="Beg ar Vann" à l'objet osm
On peux le faire de manière assistée avec josm
Ou envisager des tests plus systématique à la manière
d'un module d'import ou d'osmose.
Après je peux comprendre que c'est peut-être plus motivant/visible pour 
votre groupe de "recruter" x personnes pour faire le travail à la main 
plutôt que d'améliorer un programme, surtout que ce ne sont pas les 
mêmes compétences.

2) ajouter des toponymes bretons inconnu tant d'osm que de wikidata
on ajoute l'info à la main sur wikidata, ce qui nous ramène au cas 
précédent.
ou on ajoute l'info à la main sur osm en prévoyant un module pour 
injecter l'info dans wikidata (histoire d'éviter que le travail doive 
être fait en double, mais nécessite un programme supplémentaire)
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Montrer dans OSM les toponymes réels dans les différentes langues de la République française

2018-01-04 Par sujet Philippe Verdy
Le 2 janvier 2018 à 17:49, Christian Rogel  a écrit :

> Bonne année à tous, soyez tous de meilleurs cartographes qu’en 2017,
>
> En attendant des annonces sur le « vieux »  projet   de serveur « langues
> régionales » d’OSM France, il est bon d’attirer l’attention sur le
> traitement cartographique des langues romanes d’oïl en France.
>
> Si l’occitan (langue d’oc) et l’arpitan (ex-franco-provençal) sont
> présents dans OSM par les codes oc et frp, aucune langue d’oï de Francel,
> même aussi littéraire que le picard (vulgairement et improprement appelé
> c’hti), ne dispose de code reconnu.
>

Déjà standardisés: picard = pcd, normand = nrf, wallon = wa

Tranchons une querelle possible : on ne peut refuser à ces « patois » le
> qualificatif de langue et si cela gêne cetains, ils peuvent parler de
> géolectes. En Suisse, le mot patois n’est pas péjoratif et est inscrit dans
> la loi du Canton du Jura (protection du « patois jurassien »).
> Justement, on peut donner en exemple la langue franc-comtoise qui est
> parlée dans le Jura suisse, le Nord du département du Jura, la Haute-Saône,
> le Doubs, le Territoire de Belfort et 10 communes du Haut-Rhin.  Le nombre
> de locuteurs est en chute libre, mais il y a encore une activité festive et
> savante.
>
> Récemment un jeune chanteur jurassien, Billy Fumey, qui chante en
> franc-comtois, a annoncé avoir créé un « institut de promotion de langues
> régionales de Franche-Comté »
> 
>  qui
> aurait, entre autres missions, de fournir une version franc-comtoise ou
> arpitane des noms de lieu moyennant finance (200 € pour fournir le nom
> d’une commune apparaît irréaliste ???!).
>
> Il y a eu du nouveau pour, au moins faire apparaître des représentations
> cartographiques en l’absence d’un code internationalement reconnu et c’est
> Philippe Verdy qui a mentionné que le gallo et le normand pouvaient être
> codifiés avec name:fr-x-gallo et name:fr-x-norman sur la ge du wiki OSM 
> Multilingual
> names . Qui les a
> choisi set promus ?
>

le cas du normand est compliqué par le fait qu'on ne sait pas trop s'il
doit unifier aussi le jersias et le guernésiais (officiels dans ces deux
territoires).
le gallo n'est pas codifié effectivement et la seule solution pour
l'instant est de le distinguer du français par une extension (provisoire?)

On les trouve aussi sur la page en français correspondante
> .
> Leur utilisation est encore très faible, car, il n’y a que 4 noms en gallo
> et 11 en normand. Mais, le premier est sûrement promis à se développer, car
> la Région Bretagne encourage la promotion de la 2ème langue du pays.
> La publication de cartes spécifiques comme cele qui a été mise au point
> par OSM e brezhoneg (OSM en breton) va inévitablement être décisive pour le
> décollage.
>
> Il n’y pas de raison pour ne pas étendre ce système aux autres langues
> romanes qui  ont toute été illustrées littérairement et ont, chacune, une
> masse d’études locales.
> M’appuyant sur la page Franc-comtois (langue)
>  du Wikipedia, qui
> retient cette appellation pour renseigner la clé name:fr-g-fc avec les
> valeurs données dans cette même page pour les noms d'Altkirch, Belfort,
> Besançon, Vesoul, Banvillars, Champlitte, Échenans, Mandrevillars, Chagey,
> Porrentruy, Sainte-Ursanne, Clôs du Doubs. J’y ai ajouté 3 noms dfournis
> par Billy Fumey (Levier, Pontarlier et Vlleneuve d’Amont).
> Cela nous donne 15 toponymes en name:fr-x-fc.
>
> Ce sera aux Franc-Comtois, Alsaciens (Belfortains et Sundgoviens) et
> Jurassiens suisses de compléter. Pour l’arpitan (de Saint-Étienne à Morez
> et de Tignes à Macon en passant par les Alpes italiennes jusqu’à Ivrée et
> Pignerol), il y a 190 toponymes de répertoriés. On attend les Lyonnais et
> les Savoyards et les autres, puisque ce qui compte, c’est la valeur de la
> source et non la localisation du mappeur.
>
> Essayons donc de bâtir une codification des langues d’oïl de la carte de
> la page Wikipedia Langues d’oïl
>  :
>
> Picard > name:fr-x-pic
>
NON: pcd

> Bourguignon > name:fr-x-brg
> Poitevin > name:fr-x-poi
> Lorrain > name:fr-x-lor
> Saintongeais > name:fr-x-saint
> Berrichon > name:fr-x-ber
> Orléanais > name:fr-x-orlean
> Bourbonnais > name:fr-x-bourbon
> Angevin > name:fr-x-anjevin
> Tourangeau > name:fr-x-tour
> Champenois > name:fr-x-champ
> J’ai laissé le cauchoix de côté, puisqu’il semble pouvoir être rattaché au
> normand.
>
> En comptant les créoles des Antilles et de la Réunion et le tahitien, on
> arriverait à 26 codes de langue pour la RF, mais il resterait les langues
> canaques et le mahorais.
>

Le mahorais et les créoles 

Re: [OSM-talk-fr] Montrer dans OSM les toponymes réels dans les différentes langues de la République française

2018-01-04 Par sujet Christian Rogel
> Le 4 janv. 2018 à 00:34, marc marc  a écrit :
> Ceci dit, sur le fond (avoir des contributeurs pour introduire 27 
> langues dans osm), je me demande si le processus n'est pas 
> fondamentalement inefficace.
Etant l’un de ceux qui se penchent sur la question depuis plusieurs années, je 
suis pourtant surpris par l’impact qu’a la visualisation sur la motivation.
Les 2300 “volontaires” que revendique l’Institut d’estudis occitans ne vont pas 
tous cartographier, mais ils feront de la “publicité” et la minorité qui sera 
formée ne fera pas que renseigner des noms.
> On a vu à mainte reprise les dégâts que cela provoque régulièrement.
Justement, on ne l’a pas encore vu, et un ou deux Basques trop enthousiastes ne 
font pas une armée. La démarche n’est consistante qu’en Bretagne, comme l’ont 
montré les stats.
Si la région de Carhaix est assez bien cartographiée, noms de voie inclus, 
c’est parce que l’Office public de la langue bretonne y a son siège.
Les gardiens du patrimoine linguistique sont portés à rectifier les objets 
voisins de ceux pourvus d’étiquettes et à ajouter le nom officiel pour en 
donner une version locale.
C’est tout bon pour la BAN.
> ne serait-il pas plus intéressant de commencer par les objets osm qui 
> ont un lien wikipedia/data en introduisant leur nom sur wikidata.
> je and suis pas un partisan inconditionnel de wikidata.
> mais dans ce cas précis cela aurait les avantages :
> - d'utiliser les infos déjà existante
> - d'éviter d'avoir plusieurs projet qui font le même travail
> - de monter en qualité.
> au lieu de faire un processus manuel, il pourrait y avoir un import de 
> qualité (vérifier que l'objet osm a le même nom que celui de wikidata 
> (pour éviter de mettre à jour les nombreux village ou lieu-dit qui ont 
> erronément le wikipedia/data de leur commune, ce qui pourrait remonter 
> en anomalie).
> si le nom osm match avec wikipedia/data, on importe le(s) name:xx 
> pertinents selon la zone concernée.
> le même code (par exemple dans osmose) pourrait servir à détecter les 
> vandales, les erreurs et les futurs ajouts.

Le versement préalable des données dans Wikidata serait peu praticable, car il 
n’existe pas, même en Bretagne, de BDD utilisable et couvrant tous les 
terrains. Néanmoins, nous avons poussé la Région à libérer ses bases (nov 16).
L’enjeu est d’amorcer une BDD toponymique générale grâce à OSM et que cela 
serve d’incitation à en créer d’autres spécifiques qui deviendraient des 
sources libres.
Une accélération peut se produire si les universités s’y mettent et, par 
ricochet, elles élargiraient leur usages d’OSM.
Inciter à mettre sur une carte les noms locaux permet à OSM de sortir des 
villes et de libérer un potentiel de rectifications cumulatives.

Christian R.

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Montrer dans OSM les toponymes réels dans les différentes langues de la République française

2018-01-03 Par sujet marc marc
Le 03. 01. 18 à 22:19, Christian Rogel a écrit :
> Donner le nombre de name:X et de valeurs permet de relativiser les 
> tronçonnement des voies.

c'est une bonne idée de se baser sur le nombre de valeur différente
pour faire les stats.

ceci dit, sur le fond (avoir des contributeurs pour introduire 27 
langues dans osm), je me demande si le processus n'est pas 
fondamentalement inefficace.
On a vu à mainte reprise les dégâts que cela provoque régulièrement.
ne serrait-il pas plus intéressant de commencer par les objets osm qui 
ont un lien wikipedia/data en introduisant leur nom sur wikidata.
je ne suis pas un partisan inconditionnel de wikidata.
mais dans ce cas précis cela aurait les avantages :
- d'utiliser les infos déjà existante
- d'éviter d'avoir plusieurs projet qui font le même travail
- de monter en qualité.
au lieu de faire un processus manuel, il pourrait y avoir un import de 
qualité (vérifier que l'objet osm a le même nom que celui de wikidata 
(pour éviter de mettre à jour les nombreux village ou lieu-dit qui ont 
erronément le wikipedia/data de leur commune, ce qui pourrait remonter 
en anomalie).
si le nom osm match avec wikipedia/data, on importe le(s) name:xx 
pertinents selon la zone concernée.
le même code (par exemple dans osmose) pourrait servir à détecter les 
vandales, les erreurs et les futurs ajouts.
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Montrer dans OSM les toponymes réels dans les différentes langues de la République française

2018-01-02 Par sujet Christian Rogel


> Le 3 janv. 2018 à 00:14, osm.sanspourr...@spamgourmet.com a écrit :
> 
> Le 02/01/2018 à 17:49, Christian Rogel - christian.ro...@club-internet.fr 
>  a écrit 
>> 
>> Réactions demandées.
>> 
> 1) Bloavez Mad !
> 2) OK si le code ISO 639-3  n'existe 
> pas. Sauf que l'ISO 639-3 ayant espoir d'être exhaustif...
> http://www-01.sil.org/iso639-3/codes.asp?order=reference_name=%25 
> 
> Te donne pcd pour le picard.
> Pas Picard > name:fr-x-pic.
> 
> Je te laisse corriger les autres et poster la version 2 ;-).
> Je n'ai pas trouvé le normand et encore mois le cauchois mais un descendant 
> du normand : l'anglo-normand http://multitree.org/codes/xno.html 
>  
> 
> 

Merci pour la précision qui sera à ajouter au wiki OSM et aux stats mensuelles 
des langues régionales qui sont à venir.

Dans la liste des codes ISO 6639-3 , on trouve les deux géolectes des îles 
anglo-normandes, le Guernesiais et le Jerriais, avec comme code commun nrf.
Le site SIL renvoie au site Ethnologue qui indique bien que « la langue est 
parlée aussi en France ».
On peut donc en déduire que nrf peut légitiment s’appliqer à tout le normand 
(ils mentionnent que le cauchois en fait partie).

Donc 2 codes ISO de plus, mais des toponmes normands à corriger.

Précision : l’anglo-normand mentionné est noté comme « historical », autrement 
dit, cela vise l’ancienne langue littéraire anglo-normande 
 dans laquelle 
furent écrit les « Tristan » de Béroul et Thomas d’Angleterre au Moyen-Âge.
Elle est encore en usage dans certaines expressions utilisées au Parlement de 
Londres.

Christian R.

Liste des codes de langues mise à jour :

Codes ISO actifs

Picard > name:pcd
Normand > name:nrf  (code provisoire name:fr-x-norman à déclasser)
Arpitan > name:frp
Breton > name:br
Corse > name:co
Basque > name:eu
Occitan > name:oc
Tahitien > name:ty
Créole guyanais > name:gyn
Créole martiniquais > ? Il existe name:gcp, mas il concerne tous les créoles
Créole guadeloupéen > name:gcf
Créole réunionais > name:gcr

Codes provisoires actifs

Gallo > name:fr-x-gallo
Franc-comtois > name:fr-x-fc (il faut, peut-être une 3ème lettre)

Codes provisoires proposés :

Bourguignon > name:fr-x-brg
Poitevin > name:fr-x-poi
Lorrain > name:fr-x-lor
Saintongeais > name:fr-x-saint
Berrichon > name:fr-x-ber
Orléanais > name:fr-x-orlean
Bourbonnais > name:fr-x-bourbon
Angevin > name:fr-x-anjevin
Tourangeau > name:fr-x-tour
Champenois > name:fr-x-cham

Christian R.___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr