Le 16 juin 2013 19:48, Jocelyn Jaubert <jocelyn.jaub...@gmail.com> a écrit :

>
> Pour lancer les analyses, il y a deux méthodes:
>
>   - les lancer sur une machine de OSM-FR. C'est faisable sur des petits
> extracts (la plupart des pays demandés pour HOT faisaient moins de 10 Mo
> en .pbf). Pour des gros pays comme l'Espagne, on n'a pas vraiment assez
> de ressources pour le moment, à moins de se contenter d'une petite
> région. Pour info, sur un pays comme le Cameroun, avec un .pbf de 22 Mo,
> la machine osm8 met 30 minutes à lancer toutes les analyses.
>

Concernant les petites régions, il me semble qu'il se limitait en Espagne à
la Catalogne, une partie du Pays Valencien, le Val d'Aran,  (et peut-être
certaines franges catalophones des communautés limitrophes), ainsi que les
îles Baléares. Il a cité aussi une ville italienne, mais cela ne doit pas
concerner beaucoup de toponymes et noms de rues.

Ce qu'il oublie de dire c'est que le catalan a au moins deux grandes
sous-familles dialectales (le catalan proprement dit, et le valencien
incluant les Baléares), cequi pourrait poser des difficultés sur les
variantes orthographes adaptées à chaque cas (ce n'est peut-être pas très
grave si le dictionnaire admet les synonymes, mais c'est gênant si Osmose
signales des mots espagnols en suggérant la mauvaise variante parmi ces
deux sous-familles).

Cependant je resoulève la questions pour les lieux situés en France
métropolitaine, où le catalan est une langue régionale, et aussi sur les
autres langues régionales pour lesquelles on pourrait avoir des listes de
vocabulaire à vérifier :
- breton avec au moins 2 variétés principales,
- alémanique alsacien et belfortain
- néerlandais
- picard avec 2 grandes variétés (mais pas sûr que le ch'timi du Nord soit
utilisé dans les toponymes)
- et occitan, l'occitan très étendu ayant au moins 4 ou 5 variétés en
France, même si on met de côté les variétés espagnoles et italiennes
- corse (il semble y avoir au moins 2 variétés aussi)

Si on ajoute les DROM et les COM, on a aussi les langues créoles, le
mahorais, les langues polynésiennes (dont le tahitien), les langues
mélanésiennes (importantes en Nouvelle-Calédonie où les langues kanakes
sont pratiquement officielles, au côté du français légal, dans les
territoires de droit coutumier, mais aussi à Wallis-et-Futuna).

Mais ça va être dur de collecter le vocabulaire à vérifier pour ces
dernières langues (il suffit de voir le peu de contributeurs à Wikipédia
dans ces langues et la faible qualité, pour la plupart des ébauches sans
liens ni sources pour leur toponymie comme pour les noms communs à
l'orthographe changeant un peu partout et en fait jamais corrigée). Nombre
de ces langues n'ayant pas de tradition orthographique établie
(contrairement aux langues régionales métropolitaines), leurs toponymes
quand ils existent sont seulement transcrits dans la même orthographe que
celle utilisée en français (quand ils ont été repris).
_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-fr

Répondre à