Re: [OSM-talk-fr] BANO: 100% des départements traités !

2014-05-31 Par sujet Otourly Wiki
L'abréviation Anc pour Ancien ou Ancienne...
Sinon comment remonter des erreurs dans le noms de voies dans BANO ? Quand ni 
OSM ni le cadastre a tort ?

Exemple Rue Monplaisir au lieu de Montplaisir 
http://layers.openstreetmap.fr/?zoom=17&lat=45.99076&lon=4.72489&layers=00B00FFT

Florian



Le Lundi 26 mai 2014 15h23, Jean-Baptiste Holcroft  a 
écrit :
 


Ou encore les lettres majuscules accentuées : Erable -> Érable
http://tile.openstreetmap.fr/~cquest/leaflet/bano.html#19/48.753964/7.853557 



--
Jean-Baptiste Holcroft


Le 25 mai 2014 02:56, Pierre Knobel  a écrit :

>
>> Je ne crois pas que cela ait déjà été signalé, pour le rapprochement :
>> "oe" et "œ" (exemple : sœur).
>>
>
>Peut-être aussi "ae" et "ä" (exemple 
>http://www.openstreetmap.org/way/41940309).
>
>Pour le problème des communes fusionnées avec le nom de l'ancienne
>commune rajouté après le nom des rues, on doit aussi pouvoir faire
>quelque chose. On pourrait compter le nombre d'occurences pour le
>dernier mot de chaque nom de voie qui n'a pas pu être rapprochée, et
>pour ceux qui apparaissent plusieurs fois retenter le rapprochement
>après avoir supprimé ce dernier mot. Si ça marche, rajouter un
>addr:place="dernier mot" et un fixme:"vérifier addr:place" dans le
>résultat de l'outil d'intégration.
>
>___
>Talk-fr mailing list
>Talk-fr@openstreetmap.org
>https://lists.openstreetmap.org/listinfo/talk-fr
>


___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] BANO: 100% des départements traités !

2014-05-26 Par sujet Jean-Baptiste Holcroft
Ou encore les lettres majuscules accentuées : Erable -> Érable
http://tile.openstreetmap.fr/~cquest/leaflet/bano.html#19/48.753964/7.853557

--
Jean-Baptiste Holcroft


Le 25 mai 2014 02:56, Pierre Knobel  a écrit :

> >
> > Je ne crois pas que cela ait déjà été signalé, pour le rapprochement :
> > "oe" et "œ" (exemple : sœur).
> >
>
> Peut-être aussi "ae" et "ä" (exemple
> http://www.openstreetmap.org/way/41940309).
>
> Pour le problème des communes fusionnées avec le nom de l'ancienne
> commune rajouté après le nom des rues, on doit aussi pouvoir faire
> quelque chose. On pourrait compter le nombre d'occurences pour le
> dernier mot de chaque nom de voie qui n'a pas pu être rapprochée, et
> pour ceux qui apparaissent plusieurs fois retenter le rapprochement
> après avoir supprimé ce dernier mot. Si ça marche, rajouter un
> addr:place="dernier mot" et un fixme:"vérifier addr:place" dans le
> résultat de l'outil d'intégration.
>
> ___
> Talk-fr mailing list
> Talk-fr@openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-fr
>
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] BANO: 100% des départements traités !

2014-05-24 Par sujet Philippe Verdy
Heeeurk ???

   ae -> ä, et oe-> ö

sont typiquement germaniques d'Europe centrale (en France pour l'Alsacien,
en Suisse pour l'Alémanique, aussi à l'Est de la Wallonieet le nord du
Duché de Luxembourg) ici cele tréma n'a pas alors valeur de diérèse mais
c'est un umlaut issue d'une ancienne graphie de la voyelle e diacritique

Dans les langues romanes en revanche (et aussi en Anglais qui n'utilisait
pas la graphie germanique mas les conventions celtes, nordiques et saxonnes
plus à l'ouest, puis des emprunts massifs aux langues romanes dont le latin
et le normand) on a plutôt la dérivation

   ae -> æ, et oe -> œ

(sinon le tréma a valeur de diérèse en graphie française standard, comme
aussi en saxon et bas-allemand ou néerlandais, pour éviter les digrammes et
parfois permettre alors certaines diphtongues en français comme "aï" et
"oï", un rôle complètement opposé à l'umlaut alémanique/haut-allemand qui
au contraire est une fusion monovocalique ***sans aucune diphtongue***, où
les graphies alternatives à digrammes se prononcent en une seule voyelle,
comme notre æ en Français et en Latin qui a la valeur du ä germanique, à
mi-chemin entre nos é et è c'est un e semi-fermé qui n'est pas non plus
notre "e muet" correspondant à un schwa plus rond, semi-nasalisé et à peine
vocalisé)

Bref c'est ambigu en français (et selon les dialectes germaniques qui
coupent l'Allemagne en deux, en gros le long de la Moselle jusqu'en France
entre Lorraine et Alsace/Belfortain/Jura)

on ne peut pas choisir entre les deux interprétations de "ae" et "oe" sans
connaitre le vocabulaire, son étymologie et sa phonologie. C'est pourquoi
"oe", "oë" et "œ" sont clairement distincts en français, de même que "æ",
"aë" et "ae" (bien que plus rares), et la phonologie de "œ" et "æ" non
encadré d'autres voyelles a évolué vers notre "é" fermé (beaucoup moins
arrondi et beaucoup plus palatal).

Attention donc de ne pas faire des "corrections automatiques" sans savoir!
même si on peut essayer de chercher des rapprochements à vérifier ;
* de "ae" avec : soit "æ" /  "ä" /"é', soit "aé"
* de "oe" avec : soit "œ" / "ö" / "é", soit "oë" / "ôé".

Sur les noms communs du dictionnaire (on en a peu) c'est facile mais pour
le reste (des nom propres) il n'y a plus aucune règle, nos toponymes et
noms de rues ayant des origines étymologiques très diverses et ne sont plus
autant "francisés" qu'ils ont peu l'être jusque dans les années 1930,
parfois tellement abusivement et improprement que ces "francisations"
uniformisantes (d'une variété de langue d'oïl totalement construite, très
tardivement en fait au XVIIe siècle seulement sans parvenir à s'imposer en
France avant les années 1920, contre les autres langues régionales de
France, l'actuelle Académie reconnaissant aujourd'hui la diversité du
français au moins dans les apports de toutes les langues romanes, ainsi que
gréco-coptes, slaves et sémitiques ainsi qe depuis le XXe sièvle
l'important apport des langues anglo-saxonnes plus occidentales, et
germaniques plus orientales).

Le "français" comme langue n'a été unifié (de jure et beaucoup par la
force) en fait que pendant 10 ou 20 ans entre les deux Guerres Mondiales et
uniquement en France métropolitaine.

Ce n'est même pas une lingua franca (hors du langage administratif de
l'Etat et ce qu'il a cru pouvoir imposer par l'école), juste une "langue
chapeau" basée sur des théories historiques complètement inventées sur des
mythes pour des raisons politiques — comme peuvent l'être aujourd'hui le
chinois, le croate, le serbe, le bosnien ou le monténégrin et comme ont pu
l'être mais bien avant le français: l'allemand, le néerlandais, l'anglais,
l'italien, l'espagnol, le catalan ou le portugais... Sans oublier non plus
l'occitan qu'on tente de faire oublier alors que son apport au français
moderne est en fait essentiel sans quoi il n'aurait jamais pu être
structuré et acquérir sa "noblesse" ; ce qu'on appelle "vieux français" est
en fait presque toujours de l'occitan et n'avait rien du patois d'oïl
"françoys" du minuscule domaine royal entre bords de la Loire et l'amont de
la Seine, parlé par quelques familles influentes dans une région
aujourd"hui même pas en Île-de-France mais essentiellement dans l'actuelle
région "Centre") qu a été très malhabilement trituré par la première
Académie royale...

Pour le reste on parle très abusivement de "vieux français" ou "moyen
français" en confondant toutes les langues régionales, même à des époques
où la France était beaucoup plus réduite qu'aujoud'hui (en gros, juste le
sud du bassin parisien, une petite partie de ce qu'on appelle aujourd'hui
"Île-de-France" mais qui n'incluait même pas Paris à l'origine : le
français c'est le patois local entre les affluents nord-est au de la Loire
et les afflients au sud-ouest de la Seine mais L'Académie de Richelieu a
tenu à inclure des variétés occitanes mais surtout a fait de nombreux
emprunts normatifs au latin médiéval liturgique avec des barbarismes
inompréhensibles et complètement d

Re: [OSM-talk-fr] BANO: 100% des départements traités !

2014-05-24 Par sujet Otourly Wiki
J'ai vu un Lieutenant Gal → Lieutenant-Général
Et ce pour tout les grades composés...

 
Florian



Le Dimanche 25 mai 2014 2h56, Pierre Knobel  a écrit :
 


>
> Je ne crois pas que cela ait déjà été signalé, pour le rapprochement :
> "oe" et "œ" (exemple : sœur).
>

Peut-être aussi "ae" et "ä" (exemple http://www.openstreetmap.org/way/41940309).

Pour le problème des communes fusionnées avec le nom de l'ancienne
commune rajouté après le nom des rues, on doit aussi pouvoir faire
quelque chose. On pourrait compter le nombre d'occurences pour le
dernier mot de chaque nom de voie qui n'a pas pu être rapprochée, et
pour ceux qui apparaissent plusieurs fois retenter le rapprochement
après avoir supprimé ce dernier mot. Si ça marche, rajouter un
addr:place="dernier mot" et un fixme:"vérifier addr:place" dans le
résultat de l'outil d'intégration.


___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] BANO: 100% des départements traités !

2014-05-24 Par sujet Pierre Knobel
>
> Je ne crois pas que cela ait déjà été signalé, pour le rapprochement :
> "oe" et "œ" (exemple : sœur).
>

Peut-être aussi "ae" et "ä" (exemple http://www.openstreetmap.org/way/41940309).

Pour le problème des communes fusionnées avec le nom de l'ancienne
commune rajouté après le nom des rues, on doit aussi pouvoir faire
quelque chose. On pourrait compter le nombre d'occurences pour le
dernier mot de chaque nom de voie qui n'a pas pu être rapprochée, et
pour ceux qui apparaissent plusieurs fois retenter le rapprochement
après avoir supprimé ce dernier mot. Si ça marche, rajouter un
addr:place="dernier mot" et un fixme:"vérifier addr:place" dans le
résultat de l'outil d'intégration.

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


Re: [OSM-talk-fr] BANO: 100% des départements traités !

2014-05-24 Par sujet Art Penteur
Le 24 mai 2014 12:04, Christian Quest  a écrit :
>[...]
> Prochaines étapes:
> - refaire une passe de rapprochement avec OSM
> - améliorer encore les rapprochements

Je ne crois pas que cela ait déjà été signalé, pour le rapprochement :
"oe" et "œ" (exemple : sœur).

Merci.

Art.

___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr


[OSM-talk-fr] BANO: 100% des départements traités !

2014-05-24 Par sujet Christian Quest
Et voilà, c'est fait. L'ensemble des départements ont été traités.

Bilan environ 17 millions d'addresses dans BANO, et 12 millions dans le jeu
de données de sortie (après dédoublonnage et en ne sélectionnant que les
adresses rapprochées avec FANTOIR).

Un premier jeu de données est publié sur data.gouv.fr:
https://www.data.gouv.fr/dataset/base-d-adresses-nationale-ouverte-bano

N'hésitez pas à cliquer sur le bouton "Utile" pour faire monter la note
(déjà haute).

Les données sont pour l'instant publiées département par département, sous
forme de fichier shapefile et de fichiers CSV.

Les fichiers CSV sont aussi regroupés dans un projet github, ce qui permet
de suivre l'évolution de leur contenu, d'avoir des diff, des historiques et
de simplifier la mise à jour. C'est un peu expérimental, mais ça semble
bien fonctionner.

Prochaines étapes:
- refaire une passe de rapprochement avec OSM
- améliorer encore les rapprochements
- gérer les cas particuliers (communes associées dans le libellé de voie)
- proposer une API de géocodage
- mettre en place un guichet unique de signalement/correction pour ne pas
avoir à passer par OSM pour améliorer la BANO (mais les améliorations iront
dans OSM bien sûr)... rdv à Paris le week-end du 28 juin pour travailler
sur ce sujet

-- 
Christian Quest - OpenStreetMap France
___
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr