Re: [OSM-talk-nl] NLExtract project

Frank Steggink Mon, 23 Jan 2012 12:59:17 -0800

On 23-1-2012 21:27, Michiel Faber wrote:

Just van den Broecke schreef op ma 23-01-2012 om 10:33 [+0100]:

Dit zijn o.a. de "gotchas" waar ik in een eerdere mail op doelde. En
mogelijk zijn er die ik nog niet ken.

groeten,

Just

Hallo,

Ik spui hier zomaar wat vragen die in mij opkomen omtrent de top10.
Dit zijn zo maar dingen die in mij opkomen. Wellicht al bij jullie
opgekomen, niet relevant of al in overleg met het kadaster.

Weet het Kadaster van deze "gotchas"?
Zijn ze bewust er in gebracht?
Hoe gaan zij er mee om?
Wellicht een idee om er met hun over te praten om de brondata al in een
beter formaat (aangeleverd) te krijgen of hun manier van werken te
bekijken?

Succes,
Michiel

Michiel,

De meeste gotcha's zijn inherent aan het datamodel van Top10NL, dus zezijn "bewust" ingebracht. Dit is gebaseerd op GML (geography markuplanguage). Op basis hiervan is door Geonovum NEN3610 ontwikkeld engeïmplementeerd in GML (via een XML Schema-definitie). Dit heeft alsdoel uitwisseling van ruimtelijke data in Nederland. Dit model isbehoorlijk complex. Top10NL is weer op basis van NEN3610 ontwikkeld.Volgens mij is dit alleen door het Kadaster gedaan. NEN3610 biedt al demogelijkheid om meerdere geometrieën aan een object te koppelen (bijv.oppervlakte en hartlijn van een weg), of om meerdere attributen metdezelfde naam toe te voegen (bijv. wegnummers: een weg kan meerderewegnummers hebben). Het doel is om de informatie zo compleet mogelijk opte slaan en uit te wisselen. Het is aan de gebruikers hiervan om tebepalen welke data wel of niet getoond wordt.

Dit heeft als consequentie dat de tooling aan behoorlijke eisen moetvoldoen. ogr2ogr komt een heel eind, maar niet overal is een oplossingvoor. Bijv. de meerdere geometrieen per object: hiervoor is dus desplitsings-stap nodig. Uitlevering in een ander formaat lost hetprobleem niet 1-2-3 op. Bijv. Shape is te beperkt om alle informatieongeschonden door te laten. De data zoals die door het Kadaster wordtuitgeleverd is ook geen eindproduct waar een willekeurige gebruiker ietsmee kan. Daarvoor moet er nog een bewerkingsslag overheen. De reden dathet NLExtract project is opgestart is juist om deze bewerkingsslag temaken en afgeleide producten te genereren, bijv. database-dumps voorPostgreSQL/PostGIS en Oracle. Dit is geen verantwoordelijkheid van hetKadaster. De "markt" kan het prima oplossen. (Het Kadaster levert wel dedata in FGDB uit, maar waarschijnlijk komt dat omdat dit eentussenproduct van hun eigen werkproces is.) O.a. op LinkedIn in de NLOpenData groep is hierover discussie gevoerd.


Andere gotcha's zijn niet bewust:

* Afkappen van velden: dit is iets wat ogr2ogr blijkt te doen. Hier isomheen te werken, door bijv. de GFS-bestanden te editen.* Niet-validerende GML: ik heb begrepen dat het Kadaster hierondertussen van op de hoogte is. In april zou een goede versie moetenkomen. (Kan geen linkje vinden.)* Sommige objecten zijn dubbel als je alles importeert. Dit komt omdatze over de bladgrenzen heen liggen. Dat zullen we met de hand moetenoplossen, tenzij het Kadaster een set landsdekkende GML's gaat makenwaar geen dubbelingen in voorkomen.

Voor de rest moeten we zien waar het schip strandt ;)

Groeten,

Frank

_______________________________________________
Talk-nl mailing list
Talk-nl@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-nl

Re: [OSM-talk-nl] NLExtract project

Antwoord per e-mail aan