Re: [OSM-talk-fr] Nouveaux pays dans Osmose - Était : Catalan support in Osmose

2013-06-18 Par sujet Philippe Verdy
Le 18 juin 2013 15:37, Christian Rogel  a
écrit :

> Ils proposeront ce qu'il faut, lorsque la base sera renseignée, or, les
> quelques milliers d'odonymes bretons sont trop encore peu nombreux.
>

Si le point important pour toi c'est le nombre d'objets à vérifier, pour
les utilisateurs des langues régionales c'est la difficulté à retrouver les
objets en langue régionale (et surtout ceux qui manquent)..

Sinon je te retourne alors l'argument concernant les langues majeures
présentes dans les objets en France :

par exemple des noms anglais ou allemands ajoutés par défaut sans nom en
français pourtant existant pratiquement partout, et même pas toujours
identifiés comme étant dans ces langues (on peut parfois identifier la
langue car le "name=*" est dérivé du nom d'un article Wikipédia anglophone
mentionné dans "wikipedia=en:*" ou "wikipedia=en:*", et via Wikidata
trouver un arrtcle francophone, mais le résultant n'est pas certain non
plus car les sujets d'articles Wikipédia sont parfois différents et leur
titre plus générique, ou mal orthographie ou complété de précisions propres
à Wikipédia pour distinguer des homonymies qui ne s'appliquent pas aux noms
à indiquer dans OSM dans name=*.
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Nouveaux pays dans Osmose - Était : Catalan support in Osmose

2013-06-18 Par sujet Christian Rogel

Le 18 juin 2013 à 11:11, Philippe Verdy  a écrit :

> Franchement ta réaction hostile est incompréhensible. Je suis parti d'un 
> besoin du catalan (pour un utilisateur en Espagne à qui une réponse a été 
> apportée) pour ne parler ici QUE des langues de France (et pas des autres 
> pays), dont le catalan lui-même.
> 
> Et elle est appropriée dans cette discussion concernant Osmose qui effectue 
> DEJA des contrôles linguistiques (et c'est bien pour ça que ce contributeur 
> nous a contacté concernant sa langue), sur des listes de vocabulaire.
> 
> JAMAIS je n'ai dit (comme tu le décris) qu'OSM normalisait le contenu dans sa 
> base et ce n'était pas l'objet non plus de ma demande. C'était entièrement 
> lié à ce que fait DEJA Osmose, qui n'est pas de normaliser ni automatiser les 
> corrections, mais de signaler les problèmes (réels, ou potentiels, et à 
> vérifier avant de les revoir chacun manuellement).

Pour faire court, le découpage par dialecte est inopérant (les dialectes 
secondaires produisent trop peu d'items à normer). La question est entièrement 
entre les mains des contributeurs locaux et pas du ressort de la liste.
Ils proposeront ce qu'il faut, lorsque la base sera renseignée, or, les 
quelques milliers d'odonymes bretons sont trop encore peu nombreux.
Il pourrait être plus urgent (j'en parlerai sur la liste bretonne) de vérifier 
certains "name" en breton dans tous les toponymes (lieux-dits et noms de voie). 
Ex. : "Penhoat" et les variantes "Penc'hoat", "Penhoët" et "Penc'hoad". Mais, 
ce serait un gros boulot.

Christian R.

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Nouveaux pays dans Osmose - Était : Catalan support in Osmose

2013-06-18 Par sujet Philippe Verdy
Franchement ta réaction hostile est incompréhensible. Je suis parti d'un
besoin du catalan (pour un utilisateur en Espagne à qui une réponse a été
apportée) pour ne parler ici QUE des langues de France (et pas des autres
pays), dont le catalan lui-même.

Et elle est appropriée dans cette discussion concernant Osmose qui effectue
DEJA des contrôles linguistiques (et c'est bien pour ça que ce contributeur
nous a contacté concernant sa langue), sur des listes de vocabulaire.

JAMAIS je n'ai dit (comme tu le décris) qu'OSM normalisait le contenu dans
sa base et ce n'était pas l'objet non plus de ma demande. C'était
entièrement lié à ce que fait DEJA Osmose, qui n'est pas de normaliser ni
automatiser les corrections, mais de signaler les problèmes (réels, ou
potentiels, et à vérifier avant de les revoir chacun manuellement).

Alors tu me reproches un discours approximatif, je te reproche ta lecture
approximative et clairement (volontairement je dirais) erronée de ce que
j'ai écrit ou de ce que je n'ai PAS écrit. Si ce que je mets n'est pas
affirmatif (avec un choix ouvertà c'est justement pour que ce ne soit pas
établi comme un fait et pas pour que tu me dises que ce que j'ai écrit est
faux alors que c'est ouvert en soulignant les points à préciser.

Bref c'est une attitude volontairement hostile et dirigée, inutile (et ce
que j'ai écrit mérite de justement "revenir sur le sujet" : les langues
régionales ont leur place et méritent aussi des études de leurs qualité
d'intégration, cette discussion n'est PAS close comme tu veux le faire de
façon brutale par ton dernier paragraphe.).

Et CONTRAIREMENT à ce que tu écrits, ces langues sont du ressort de cette
liste (même si la liste est francophone, ce qui veut dire qu'on y discute
en français ou entre personnes qui peuvent le lire, ou de sujets touchant à
des territoires où le français est très présent). Les langues régionales de
France sont tout à fait appropriées pour qu'on en discute ici en français.

Alors voilà ce que je pense de ta "glose" comme tu dis... Sois plus positif
: on peut critiquer l'état des choses dans OSM dans le but de les améliorer
ou régler les problèmes (c'est le but de ces discussions ici car OSM ne
sera en fait jamais fini et on doit trouver encore des tonnes de choses à
améliorer, en commencer par les critiquer, et c'est normal). Mais on ne
passe pas son temps à critiquer les participants comme tu veux le faire,
car cette critique ne sert à rien et surtout pas à améliorer les choses,
elle gêne plutôt tout le monde (si tu as un problème personnel, règle-le en
privé).


Le 17 juin 2013 18:52, Christian Rogel  a
écrit :

> Le 16 juin 2013 à 22:28, Philippe Verdy  a écrit :
> > Cependant je resoulève la questions pour les lieux situés en France
> métropolitaine, où le catalan est une langue régionale, et aussi sur les
> autres langues régionales pour lesquelles on pourrait avoir des listes de
> vocabulaire à vérifier :
> > - breton avec au moins 2 variétés principales,
> > - alémanique alsacien et belfortain
> > - néerlandais
> > - picard avec 2 grandes variétés (mais pas sûr que le ch'timi du Nord
> soit utilisé dans les toponymes)
> > - et occitan, l'occitan très étendu ayant au moins 4 ou 5 variétés en
> France, même si on met de côté les variétés espagnoles et italiennes
> > - corse (il semble y avoir au moins 2 variétés aussi
>
> Encore une fois, un discours décollé de la réalité sur des questions non
> maîtrisées ou,
> pire, qui ne sont, ni de ton ressort, ni de  celui des lecteurs de cette
> liste.
> Principe de base : OSM ne normalise pas le contenu et il l'enregistre de
> manière normée.
> Application : s'il y a des noms de lieu venus des langues de France, les
> contributeurs
> doivent se référer à la meilleure source ou s'abstenir.
> La situation est simple pour le breton et le basque, puisque des offices
> publics sont
> officiellement chargés de normaliser les toponymes.
> Pour les autres langues, il est inutile de gloser, commenter, car, tout
> dépendra des
> locaux et de leur capacité à proposer  des listes et des  modèles de
> traduction.
>
> Merci de ne pas revenir sur le sujet.
> Compléter la page du wiki sur les "noms de lieu multilingues" sera plus
> efficace que tout
> étalage de connaissances approximatives.
>
> Christian R.
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Nouveaux pays dans Osmose - Était : Catalan support in Osmose

2013-06-17 Par sujet Christian Rogel
Le 16 juin 2013 à 22:28, Philippe Verdy  a écrit :
> Cependant je resoulève la questions pour les lieux situés en France 
> métropolitaine, où le catalan est une langue régionale, et aussi sur les 
> autres langues régionales pour lesquelles on pourrait avoir des listes de 
> vocabulaire à vérifier :
> - breton avec au moins 2 variétés principales,
> - alémanique alsacien et belfortain
> - néerlandais
> - picard avec 2 grandes variétés (mais pas sûr que le ch'timi du Nord soit 
> utilisé dans les toponymes)
> - et occitan, l'occitan très étendu ayant au moins 4 ou 5 variétés en France, 
> même si on met de côté les variétés espagnoles et italiennes
> - corse (il semble y avoir au moins 2 variétés aussi

Encore une fois, un discours décollé de la réalité sur des questions non 
maîtrisées ou,
pire, qui ne sont, ni de ton ressort, ni de  celui des lecteurs de cette liste.
Principe de base : OSM ne normalise pas le contenu et il l'enregistre de 
manière normée.
Application : s'il y a des noms de lieu venus des langues de France, les 
contributeurs
doivent se référer à la meilleure source ou s'abstenir.
La situation est simple pour le breton et le basque, puisque des offices 
publics sont 
officiellement chargés de normaliser les toponymes.
Pour les autres langues, il est inutile de gloser, commenter, car, tout 
dépendra des
locaux et de leur capacité à proposer  des listes et des  modèles de traduction.

Merci de ne pas revenir sur le sujet.
Compléter la page du wiki sur les "noms de lieu multilingues" sera plus 
efficace que tout 
étalage de connaissances approximatives.

Christian R.
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Nouveaux pays dans Osmose - Était : Catalan support in Osmose

2013-06-16 Par sujet Philippe Verdy
Le 16 juin 2013 19:48, Jocelyn Jaubert  a écrit :

>
> Pour lancer les analyses, il y a deux méthodes:
>
>   - les lancer sur une machine de OSM-FR. C'est faisable sur des petits
> extracts (la plupart des pays demandés pour HOT faisaient moins de 10 Mo
> en .pbf). Pour des gros pays comme l'Espagne, on n'a pas vraiment assez
> de ressources pour le moment, à moins de se contenter d'une petite
> région. Pour info, sur un pays comme le Cameroun, avec un .pbf de 22 Mo,
> la machine osm8 met 30 minutes à lancer toutes les analyses.
>

Concernant les petites régions, il me semble qu'il se limitait en Espagne à
la Catalogne, une partie du Pays Valencien, le Val d'Aran,  (et peut-être
certaines franges catalophones des communautés limitrophes), ainsi que les
îles Baléares. Il a cité aussi une ville italienne, mais cela ne doit pas
concerner beaucoup de toponymes et noms de rues.

Ce qu'il oublie de dire c'est que le catalan a au moins deux grandes
sous-familles dialectales (le catalan proprement dit, et le valencien
incluant les Baléares), cequi pourrait poser des difficultés sur les
variantes orthographes adaptées à chaque cas (ce n'est peut-être pas très
grave si le dictionnaire admet les synonymes, mais c'est gênant si Osmose
signales des mots espagnols en suggérant la mauvaise variante parmi ces
deux sous-familles).

Cependant je resoulève la questions pour les lieux situés en France
métropolitaine, où le catalan est une langue régionale, et aussi sur les
autres langues régionales pour lesquelles on pourrait avoir des listes de
vocabulaire à vérifier :
- breton avec au moins 2 variétés principales,
- alémanique alsacien et belfortain
- néerlandais
- picard avec 2 grandes variétés (mais pas sûr que le ch'timi du Nord soit
utilisé dans les toponymes)
- et occitan, l'occitan très étendu ayant au moins 4 ou 5 variétés en
France, même si on met de côté les variétés espagnoles et italiennes
- corse (il semble y avoir au moins 2 variétés aussi)

Si on ajoute les DROM et les COM, on a aussi les langues créoles, le
mahorais, les langues polynésiennes (dont le tahitien), les langues
mélanésiennes (importantes en Nouvelle-Calédonie où les langues kanakes
sont pratiquement officielles, au côté du français légal, dans les
territoires de droit coutumier, mais aussi à Wallis-et-Futuna).

Mais ça va être dur de collecter le vocabulaire à vérifier pour ces
dernières langues (il suffit de voir le peu de contributeurs à Wikipédia
dans ces langues et la faible qualité, pour la plupart des ébauches sans
liens ni sources pour leur toponymie comme pour les noms communs à
l'orthographe changeant un peu partout et en fait jamais corrigée). Nombre
de ces langues n'ayant pas de tradition orthographique établie
(contrairement aux langues régionales métropolitaines), leurs toponymes
quand ils existent sont seulement transcrits dans la même orthographe que
celle utilisée en français (quand ils ont été repris).
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Nouveaux pays dans Osmose - Était : Catalan support in Osmose

2013-06-16 Par sujet Jocelyn Jaubert
Le 15/06/2013 12:09, Jean-Baptiste Holcroft a écrit :
> Bonjour, cette prise de contact me fait m'interroger sur la façon
> d'ajouter un pays à Osmose.
> J'étais il y a peu en Roumanie et clairement, Osmose aiderai bien ...
> Ils n'ont pas d'import du bâti et ont tracé des bâtiments à la main sur
> des images Bing mal positionnées, cela provoque beaucoup d'intersections
> routes/bâti. Et ce n'est qu'une des centaines d'erreurs à corriger.
> Est ce possible d'avoir une carte avec les Pays couverts par osmose et
> les tests réalisés ?
> Est ce complexe d'ajouter des Pays ?

Non, ce n'est pas compliqué d'ajouter des pays. Le principal souci, ce
sont les ressources pour lancer les analyses, et l'extract à utiliser.

Pour l'extract, si il est disponible sur Geofabrik, c'est la solution la
plus simple. Sinon, il est possible d'en générer sur
http://download.openstreetmap.fr/replication/, à partir d'une relation
OSM à me fournir.


Pour lancer les analyses, il y a deux méthodes:

  - les lancer sur une machine de OSM-FR. C'est faisable sur des petits
extracts (la plupart des pays demandés pour HOT faisaient moins de 10 Mo
en .pbf). Pour des gros pays comme l'Espagne, on n'a pas vraiment assez
de ressources pour le moment, à moins de se contenter d'une petite
région. Pour info, sur un pays comme le Cameroun, avec un .pbf de 22 Mo,
la machine osm8 met 30 minutes à lancer toutes les analyses.

  - les lancer sur une machine externe, et envoyer les résultats sur
http://osmose.openstreetmap.fr. C'est ce qui est fait actuellement sur
l'Islande, et ça ne devrait pas être très compliqué à faire. Il faut
juste une machine avec postgresql+postgis, et suffisamment de place pour
un import osmosis complet du pays ou région considéré.



Comme disait Frédéric, on ne partage pas actuellement les pays par
langue, même si c'est prévu pour la Belgique. Ça ne change pas grand
chose, juste la taille de l'extract à utiliser, et c'est bien plus
pratique si une relation sur OSM est définie pour la zone utilisée.


Concernant la langue, on a des analyses dédiées au français, qui sont
désactivés pour les pays non-francophones. Il est possible d'ajouter des
analyses pour les autres langues.


-- 
Jocelyn

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] Nouveaux pays dans Osmose - Était : Catalan support in Osmose

2013-06-16 Par sujet Frédéric Rodrigo

Hi,

There is to tow way to add country into Osmose. First we support your 
area on French server. Now we prefer an other way : run you own backend 
instance on your own infrastructure. In this to way the result is send 
on the same frontend (osmose.openstreetmap.fr).


There is an other problem with your need. We never split an area by 
language, yet. Always we use administrative boundaries to addresses 
language. So in some world area analysed by Osmose there is no language 
specific analysis. Osmose analysis are based on extract, we need an 
extract to run Osmose on an area (we created many 
http://download.openstreetmap.fr/extracts/).


First step is running an Osmose backend somewhere on your area. Maybe 
ask at Geofrabik to split Spain by autonomous communities :

http://download.geofabrik.de/europe/spain.html

Then create a new specific language/area analyser like this :
https://gitorious.org/osmose/backend/blobs/master/plugins/TagFix_MultipleTag_fr.py 
(french)
https://gitorious.org/osmose/backend/blobs/master/plugins/TagFix_MultipleTag_FR.py 
(France)


Frédéric.


Le 15/06/2013 12:09, Jean-Baptiste Holcroft a écrit :

Bonjour, cette prise de contact me fait m'interroger sur la façon
d'ajouter un pays à Osmose.

Est ce complexe d'ajouter des Pays ?

Le 15 juin 2013 02:08, "Philippe Verdy" mailto:verd...@wanadoo.fr>> a écrit :

Comme cette langue est aussi une langue régionale française, ça peut
en intéresser d'autres aussi sur cette liste.

-- Forwarded message --
From: *Joan Montané* mailto:m-359863-a37...@messages.openstreetmap.org>>
Date: 2013/6/13
Subject: [OpenStreetMap] Catalan support in Osmose

Hi Verdy_p

I'm Joan Montané, a Catalan mapper. I think you speak French, sorry
for my bad English.

I see you have been fixed some Catalan administrative boundaries.
I'm working fixing names of places, according Catalan spelling
rules. Today I have found Osmose. I wondering if you (or some one)
can help me providing support for Catalan in Osmose to mark some
common errors.

For instance, a common error is typing names with articles (el, la,
els, les) in uppercase. In Catalan, such toponyms are used with
article in lowercase. Another problem is using Spanish way types
("calle" intead of "carrer", "avenida" instead of "avinguda", ...).

Currently I'm using JOSM with some filters and a very simple script
to fix the "article" problem, but Osmose could be a very good
aproach to detect errors.

I think a first needed step is define a relation (or some relations)
to define "Catalan area". Just for info, Catalonia (Autonomous
Community of Spain) has a zone (Vall d'Aran) where Catalan is a
secondary language, the preferred one is Occitan. Son "name" values
are in Occitan and I want to check "name:ca" in Vall d'Aran. Catalan
language is official in Andorra and it's preferred in Balearic
Islands (another Spanish Autonomous Community) and in some cities in
Valencian Community (mainly the coast line). Catalan language can be
used in non official toponyms in zones of Aragon Community and also
arround Perpignan and Italian city of Alghero. So, as you see,
administrative boundaries aren't a good choice for check Catalan
quality, :(

Can you help me and guide me, thanks in advance.



___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr


[OSM-talk-fr] Nouveaux pays dans Osmose - Était : Catalan support in Osmose

2013-06-15 Par sujet Jean-Baptiste Holcroft
Bonjour, cette prise de contact me fait m'interroger sur la façon d'ajouter
un pays à Osmose.
J'étais il y a peu en Roumanie et clairement, Osmose aiderai bien ... Ils
n'ont pas d'import du bâti et ont tracé des bâtiments à la main sur des
images Bing mal positionnées, cela provoque beaucoup d'intersections
routes/bâti. Et ce n'est qu'une des centaines d'erreurs à corriger.
Est ce possible d'avoir une carte avec les Pays couverts par osmose et les
tests réalisés ?
Est ce complexe d'ajouter des Pays ?
Le 15 juin 2013 02:08, "Philippe Verdy"  a écrit :

> Un utilisateur catalan me demande si je peux l'aider à avoir des
> extensions sur Osmose pour les Catalans. Je vous laisse lire son message
> joint en anglais (les auteurs d'Osmose devraient pouvoir le lire).
>
> Globalement il voudrait que les articles initiaux soient tous en minuscule
> (convention catalane, qui en fait devrait aussi s'appliquer en français,
> comme le fait l'IGN, mais pas l'INSEE pour les communes, car cet article
> est contractible et ne participe pas non plus au tri ; d'ailleurs ce
> devrait aussi être le cas en espagnol, portugais, italien, et même en
> anglais : "the Bahamas" >  "Commonwealth of the Bahamas", "Kingdom of the
> Netherlands" > "the Netherlands", "the United States", l'article
> disparaissant dans les formes où le toponyme est employé au génitif, il
> n'est pas non plus inclus dans le tri).
>
> Il demande aussi de vérifier une liste de vocabulaire pour les termes
> génériques des noms de rue (en catalan et non espagnol, dans les
> name:ca=*), non seuement en Catalogne, Pays valencien et aux Baléares, mais
> aussi en Val d'Aran, en Andorre, voire en France et Italie.
>
> Comme cette langue est aussi une langue régionale française, ça peut en
> intéresser d'autres aussi sur cette liste.
>
>
>
> Notez qu'il ne parle pas français mais se débrouille pas trop mal en
> anglais si vous ne lui répondez pas en catalan.
>
> Seulement je ne suis pas certain que cette adresse email transmise (celle
> d'un message interne sur le site OSM et non son adresse perso, mais un
> message qu'i m'a été envoyé et qui risque de ne pas marcher pour quelqu'un
> d'autre que moi, je n'ai jamais essayé si cette adresse fonctionnait pour
> répondre depuis un autre compte)
>
> -- Forwarded message --
> From: Joan Montané 
> Date: 2013/6/13
> Subject: [OpenStreetMap] Catalan support in Osmose
>
> Bonjour Verdy_p,
>
> Joan Montané  vous
> a envoyé un message depuis OpenStreetMap avec le sujet Catalan support in
> Osmose :
> ==
>
> Hi Verdy_p
>
> I'm Joan Montané, a Catalan mapper. I think you speak French, sorry for my
> bad English.
>
> I see you have been fixed some Catalan administrative boundaries. I'm
> working fixing names of places, according Catalan spelling rules. Today I
> have found Osmose. I wondering if you (or some one) can help me providing
> support for Catalan in Osmose to mark some common errors.
>
> For instance, a common error is typing names with articles (el, la, els,
> les) in uppercase. In Catalan, such toponyms are used with article in
> lowercase. Another problem is using Spanish way types ("calle" intead of
> "carrer", "avenida" instead of "avinguda", ...).
>
> Currently I'm using JOSM with some filters and a very simple script to fix
> the "article" problem, but Osmose could be a very good aproach to detect
> errors.
>
> I think a first needed step is define a relation (or some relations) to
> define "Catalan area". Just for info, Catalonia (Autonomous Community of
> Spain) has a zone (Vall d'Aran) where Catalan is a secondary language, the
> preferred one is Occitan. Son "name" values are in Occitan and I want to
> check "name:ca" in Vall d'Aran. Catalan language is official in Andorra and
> it's preferred in Balearic Islands (another Spanish Autonomous Community)
> and in some cities in Valencian Community (mainly the coast line). Catalan
> language can be used in non official toponyms in zones of Aragon Community
> and also arround Perpignan and Italian city of Alghero. So, as you see,
> administrative boundaries aren't a good choice for check Catalan quality, :(
>
> Can you help me and guide me, thanks in advance.
>
> Joan Montané
>
> ___
> Talk-fr mailing list
> Talk-fr@openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-fr
>
>
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr