Il y a bien une description officielle du Fantoir:
http://www.collectivites-locales.gouv.fr/mise-a-disposition-fichier-fantoir-des-voies-et-lieux-dits
Pourtant ce fichier a une codification bien a lui utilisant des champs
multiples, et tous ces champs ne sont pas utilisés selon les sources qui le
référence. Si je reprend Saint-Etienne, on a des lignes comme:

 
+--+-+***+****+-+----+--------------------------+*+*+**+*+**+*+*+**+*******+*******+*******+*+*******+*******+***************+******+***+********+******************************+
>  |42|0|   |    | |LOIR|E                         | | |  | |  | | |  |
>   |0000000|0000000| |0000000|0000000|               |      |   |        |
>                            |
>
>  
> +--+-+***+****+-+----+--------------------------+*+*+**+*+**+*+*+**+*******+*******+*******+*+*******+*******+***************+******+***+********+******************************+
>
>  
> +--+-+---+****+-+----+--------------------------+*+-+**+-+**+-+-+--+-------+-------+-------+-+-------+-------+***************+******+***+********+******************************+
>  |42|0|218|    |J|SAIN|T-ETIENNE                 | |R|  | |  | |*|
>  |0180773|0000000|0000000| |0000000|1987001|               |      |
>    |                              |
>
>  
> +--+-+---+****+-+----+--------------------------+*+-+**+-+**+-+-+--+-------+-------+-------+-+-------+-------+***************|******+***+********+******************************+
>
>  
> +--+-+---+----+-+----+--------------------------+*+-+**+-+**+-+-+--+-------+-------+-------+-+-------+-------+---------------+------+***|--------+******************************+
>  |42|0|218|0010|B|PL  |ABBAYE                    | |R|  | |  |0| |  |
>   |0000000|0000000| |0000000|1987001|               |004351|   |ABBAYE  |
>                            |
>  |42|0|218|0020|M|RUE |DE L ABBAYE               | |R|  | |  |0| |  |
>   |0000000|0000000| |0000000|1987001|               |004361|   |ABBAYE  |
>                            |
>  |42|0|218|0025|T|RUE |DE L ABBE BREUIL          | |R|  | |  |0| |  |
>   |0000000|0000000| |0000000|1987001|               |004371|   |BREUIL  |
>                            |
>  |42|0|218|0030|Y|MTE |DE L ABBE DE L EPEE       | |R|  | |  |0| |  |
>   |0000000|0000000| |0000000|1987001|               |004381|   |EPEE    |
>                            |
>
>  
> +--+-+---|----+-+----+--------------------------**+-+--+-+**+-+-+--+-------+-------+-------+-+-------+-------+---------------+------+***+--------+******************************+


(Là j'ai découpé les champs pour la lisibilité, en utilisant des lignes de
bordures, mais si les bordures sont des astérisques, c'est juste un champ
"filler").

On voit des lignes de 3 types :
- pour la "direction" locale de la DGFiP (une seule dans ce département de
la Loire, portant le nom du département) ; toujours présente en tête de
chacun des fichiers; son code est "420" autrement dit le code département
plus la direction "0" (pas de découpage du département). Je n'ai pas
regardé tous les fichiers pour voir s'il y avait des départements découpés
en plusieurs directions c'est peut-être hsitorique).
- pour la commune ici le code est "420218" (et non "42218" comme le code
INSEE complet d'une commune) car le code de direction s'y insère
- pour les voies le code est "420218" suivi de 4 chiffres.

La lettre qui suit est incohérente, elle est sensée avoir une signification
de "clé RIVOLI" selon la lettre utilisée (la tranche où elle est allouée
donne normalement un statut, masi visiblement ce n'est pas le cas ici pour
la "Montée de l'Abbé de l'épée".

Malheureusement le fichier est écrit entièrement en capitales, sans aucun
accent ni apostrophe (les types de voies sont abrégés et codés sur 4
positions, ici "MTE " pour "Montée").
- Le nom des voies est limité à 26 caractères (lettre capitale sans accent,
ou espace qui remplace toute apostrophe ou trait d'union).
- Dans certains cas pour faire tenir le nom de la rue, il est abrégé. "RUE
DU DOCTEUR XYZ" pourra être écrit aussi "RUE DOCTEUR XYZ" ou "RUE DOC XYZ",
selon la longueur dy nom qui suit, et un prénom avant le nom pourra être
abrégé à sa première lettre...
- Quand un prénom est abrégé à son initiale, elle peut être ou pas suivie
d'un point abréviatif (le plus souvent non mais ce n'est apparemment pas
une règle)
- Parfois les apostrophes sont conservées et non remplacées par une espace,
parfois on trouve des traits d'union (éventuellement encadrés d'espaces).
- Les noms de lieux-dits suivent parfois la mention "LIEU-DIT " (abrégé
parfois "LIEUDIT " sans trait d'union, ou "LDT ") dans le nom de voie, mais
pas toujours (le type de voie sur 4 caractères est laissé vide).
- Les nombres dans les noms de rue sont écrits en toutes lettres ou en
chiffres, parfois en romains (aucune règle on trouve de tout, même pour les
dates).

Je souhaite bien du plaisir pour traiter ces noms de voies et les
rapprocher des noms dans OSM !!!

Le reste de la ligne donne
- une colonne contient une astérisque our les communes de plus de 30000
habitants sinon reste blanche pour le reste (à mon avis c'est juste un
filler, ce champ ne sert qu'à repérer les principales communes en
parcourant rapidement le fichier, afin ensuite de trouver le nom de rue
- des chiffres de population totale, réelle ou fictive (renseignés
uniquement pour la commune) mais pas forcément à jour (on ne sait pas trop
de quand date la population légale utilisée. Mieux vaut ne pas s'y fier et
utiliser directement la source INSEE.
- des dates de correction/suppression avec un code (ici on n'en a pas),
codées par l'année à 4 chiffres et 3 chiffres pour le quantième du jour de
l'année.
- le reste n'a pas grande importance sauf pour les rues où on retrouve sur
8 caractères maxi les premières lettres du dernier mot signifiant de la rue
(utilisable comme clé de tri partiel et de recherche, mais pas utilisé pour
trier le fichier Fantoir lui-même qui est trié par les codes en tête de
ligne)
- cependant juste avant on a encore un code unique à 6 chiffres qui est
décrit comme "identifiant MAJIC de la voie".

Donc dans Fantoir on a deux identifiants différents des voies:
- un code complet à 10 chiffres, dont les 6 premiers désignent la commune
(voire éventuellement une fraction de commune s'il y a des "directions"
locales). S'il y a plusieurs directions, il n'est pas garanti du tout que
les 4 chiffres à la fin suffisent
- un code MAGIC à 5 chiffres plus 1 chiffre clé : le dernier chiffre est
presque partout un "1" et ressemble à une clé de version, mais les 5
chiffres sont "99999" pour les enregistrements de rues annulées (avec un
autre champ clé "O" ou "Q" pour indiquer un transfert ou pas à une autre
voie).

Les communes dans leurs fichiers utilisent tout ou partie de ces codes,
mais peuvent aussi les compléter (on l'a vu avec Saint-Etienne qui
n'utilise que les 4 derniers chiffres du code Fantoir complet, mais utilise
son propre préfixe "STEDGI" au lieu de "420218"...) ou les raccourcir 3
chiffres au lieu de 4. De plus les orthographes et abréviations (ou mots
supprimés) peuvent différer entre la source communale et le fichier
Fantoir...



Le 29 septembre 2013 23:47, Philippe Verdy <verd...@wanadoo.fr> a écrit :

> A Saint-Etienne les code Fantoir sont à 10 caractères apparemment dans les
> sources : 6 lettres "STEDGI" plus 4 chiffres.
> Il semblerait que les 6 lettres initiales indiquent la source à l'origine
> de la codification (DGI : le cadastre) et un code abrégé pour désigner la
> commune (STE : Saint-Etienne).
> On a donc un code abrégé à 4 chiffres mais il n'est pas suffisant.
> Selon les communes le nombre de chiffres pourrait varier entre 3 et 4, et
> il pourrait y avoir plusieurs sources selon les secteurs ou selon la
> source, ou la collecticité qui a la charge de la voirie et fournit ses
> données.
> S c'est le cas, le code FANTOIR n'a pas un format unique ou bie il faut le
> préfixer par les 6 lettres pour le rendre unique au moins dans la commune
> ou plus grand si nécessaire (s'il y a des sources du département ou d'un
> EPCI ou d'une autre administration de l'Etat, y compris l'armée, ou d'une
> administration locale portuaire, voire un établissement mixte d'aménagement
> local).
> Y a-t-il une page de référence expliquant cette codification foutoir....
> pardon, FANTOIR ???
>
>
>
> Le 29 septembre 2013 19:24, Frédéric Rodrigo <fred.rodr...@gmail.com> a
> écrit :
>
> Le 26/09/2013 23:49, Frédéric Rodrigo a écrit :
>>
>>> A Nantes, c'est d'abord "rivoli" qui avait été retenu puis, à l'exemple
>>>> de Toulouse, la conversion a "ref:FR:FANTOIR" a eu lieu le 8/2/2013..
>>>> Le débat pour savoir si Nantes est en Bretagne semble évité mais si
>>>> c'est pour mettre Nantes en Auvergne...
>>>>
>>>> Concernant la valeur à mettre, l'opendata fournit généralement les 4
>>>> caractères alphanumérique identifiant la voie dans la commune.
>>>> Le code FANTOIR complet comprend les codes du département et de la
>>>> commune. Il peut donc être reconstitué à partir de la localisation de la
>>>> rue sur OSM.
>>>> Le code à 4 caractères est à préconiser dans le wiki d'OSM puisqu'il
>>>> évite de la redondance d'information.
>>>>
>>>> Est-ce que la migration annoncée vers ref:FR:FANTOIR comporte également
>>>> le recadrage de la valeur sur 4 caractères ?
>>>>
>>>
>>> Je ne sais pas c'est avoir.
>>>
>>> Les ref:FR:fantoir sont ceux de Brest et du Finistère. Ces adresses ont
>>> été rentré dans OSM sans relation associatedStreet (je ne sais pas même
>>> si elles étaient d'usage à l'époque). Donc le tag ref:FR:fantoir est
>>> présent pour chaque numéro et est sur quatre carcactères.
>>> Il y a également des zones ou la tag ref:FR:fantoir est juste porté par
>>> des ways, mais sans adresses dans le coin.
>>>
>>> ref:FR:FANTOIR doivent être à Nantes et à Toulouse sur les relations.
>>>
>>> Pour les relations
>>> taille| count
>>>    ----+-------
>>>      1 |    56
>>>      2 |   673
>>>      3 |  2464
>>>      4 |  8980
>>>      5 |   126
>>>     11 |   423
>>>
>>> Pour l'Auvergne il s'agit en fait de 87 noeuds avec une référence sur 11
>>> carcactères, avec des tags places village ou locality : 63081B076G
>>> (sûrement département, commune et code à 5 caractères)
>>>
>>> Pour ce qui est de http://addr.openstreetmap.fr
>>> Arles : ref:FR:FANTOIR 4 4 caractères
>>>
>>> Bordeaux : ref:FR:FANTOIR 5 caractères
>>> Lyon : -
>>> Montpellier : -
>>> Nancy : ref:FR:FANTOIR 4 caractères
>>> Rennes : -
>>>
>>
>> Pour ce qui est de Bordeaux j'ai corrigé les codes fantoir dans l'outil
>> http://addr.openstreetmap.fr et tout ceux qui étaient déjà en base pour
>> passer à un code à 4 caractères.
>>
>> Je propose maintenant de combler les codes à mois de 4 caractères avec
>> des zéros.
>>
>> btw, j'ai ajouté une petite page de stats là :
>> http://addr.openstreetmap.fr/**stats.php<http://addr.openstreetmap.fr/stats.php>
>>
>> J'ai également commencé la page sur le wiki :
>> http://wiki.osm.org/wiki/FR:**Key:ref:FR:FANTOIR<http://wiki.osm.org/wiki/FR:Key:ref:FR:FANTOIR>
>>
>>
>> Frédéric.
>>
>>
>> ______________________________**_________________
>> Talk-fr mailing list
>> Talk-fr@openstreetmap.org
>> https://lists.openstreetmap.**org/listinfo/talk-fr<https://lists.openstreetmap.org/listinfo/talk-fr>
>>
>
>
_______________________________________________
Talk-fr mailing list
Talk-fr@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-fr

Répondre à