Le 16 juin 2013 19:48, Jocelyn Jaubert <jocelyn.jaub...@gmail.com> a écrit :
> > Pour lancer les analyses, il y a deux méthodes: > > - les lancer sur une machine de OSM-FR. C'est faisable sur des petits > extracts (la plupart des pays demandés pour HOT faisaient moins de 10 Mo > en .pbf). Pour des gros pays comme l'Espagne, on n'a pas vraiment assez > de ressources pour le moment, à moins de se contenter d'une petite > région. Pour info, sur un pays comme le Cameroun, avec un .pbf de 22 Mo, > la machine osm8 met 30 minutes à lancer toutes les analyses. > Concernant les petites régions, il me semble qu'il se limitait en Espagne à la Catalogne, une partie du Pays Valencien, le Val d'Aran, (et peut-être certaines franges catalophones des communautés limitrophes), ainsi que les îles Baléares. Il a cité aussi une ville italienne, mais cela ne doit pas concerner beaucoup de toponymes et noms de rues. Ce qu'il oublie de dire c'est que le catalan a au moins deux grandes sous-familles dialectales (le catalan proprement dit, et le valencien incluant les Baléares), cequi pourrait poser des difficultés sur les variantes orthographes adaptées à chaque cas (ce n'est peut-être pas très grave si le dictionnaire admet les synonymes, mais c'est gênant si Osmose signales des mots espagnols en suggérant la mauvaise variante parmi ces deux sous-familles). Cependant je resoulève la questions pour les lieux situés en France métropolitaine, où le catalan est une langue régionale, et aussi sur les autres langues régionales pour lesquelles on pourrait avoir des listes de vocabulaire à vérifier : - breton avec au moins 2 variétés principales, - alémanique alsacien et belfortain - néerlandais - picard avec 2 grandes variétés (mais pas sûr que le ch'timi du Nord soit utilisé dans les toponymes) - et occitan, l'occitan très étendu ayant au moins 4 ou 5 variétés en France, même si on met de côté les variétés espagnoles et italiennes - corse (il semble y avoir au moins 2 variétés aussi) Si on ajoute les DROM et les COM, on a aussi les langues créoles, le mahorais, les langues polynésiennes (dont le tahitien), les langues mélanésiennes (importantes en Nouvelle-Calédonie où les langues kanakes sont pratiquement officielles, au côté du français légal, dans les territoires de droit coutumier, mais aussi à Wallis-et-Futuna). Mais ça va être dur de collecter le vocabulaire à vérifier pour ces dernières langues (il suffit de voir le peu de contributeurs à Wikipédia dans ces langues et la faible qualité, pour la plupart des ébauches sans liens ni sources pour leur toponymie comme pour les noms communs à l'orthographe changeant un peu partout et en fait jamais corrigée). Nombre de ces langues n'ayant pas de tradition orthographique établie (contrairement aux langues régionales métropolitaines), leurs toponymes quand ils existent sont seulement transcrits dans la même orthographe que celle utilisée en français (quand ils ont été repris).
_______________________________________________ Talk-fr mailing list Talk-fr@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-fr