Frank,

Ok, we hebben elkaar inmiddels gesproken in Lofen maar voor de record en omdat mijn eerdere mail de lijst niet heeft bereikt:

- ogr2ogr direct op Top10NL GML uitvoeren geeft wel resultaat (in PostGIS) maar kan willekeurige uitkomsten geven:

1) meeste Top10NL objecten hebben meerdere geometrieën. Echter slechts één daarvan komt dan in PostGIS terecht. Welke ? Meen de laatste. 2) sommige attributen kunnen meerdere keren voorkomen: bijv. een Wegdeel kan het attribuut "nwegnummer" meerdere keren voorkomen.
Met -lco ogr2ogr optie kun je beinvloeden wat er moet gebeuren in zo'n geval
3) afkappen velden: ogr2ogr doet scan op GML structuur maar niet uitputtend. Lijkt erop dat wat ie het eerste tegenkomt als kolom-breedte neemt. Je kunt evt de GFS file aanpassen die ogr2ogr genereerd. 4) voor sommige Top10NL bestanden valideert de GML niet, bijv. dubbele identieke geometrie-velden

Dit zijn o.a. de "gotchas" waar ik in een eerdere mail op doelde. En mogelijk zijn er die ik nog niet ken. Vandaar dat we voor Top10NL binnen NLExtract een aantal dingen binnen de extractie procedure opnemen: bijv. een XSLT-stap om de geometrieën uit te splitsen (top10-split.sh) en -lco ogr2ogr opties om met meervoudige attributen om te gaan. Mogelijk moeten we ook .gfs files gaan inchecken.
Zie ook de README:
https://github.com/opengeogroep/NLExtract/blob/master/top10nl/README
Nu zijn het .sh shell scripts maar alle tools komen ook onder Windows voor dus moeten we .bat's kunnen maken...

groeten,

Just

On 22-01-12 12:38, Frank Steggink wrote:
Just,

Ik neem mijn Windows-laptop zometeen mee naar Lofen. Ik was vanochtend
begonnen NLExtract werkend te krijgen :)
BTW, ik heb ook een gevulde PostGIS DB met top10nl, alleen houd ik geen
rekening met meerdere geometrietypen. Ook zijn veel strings afgekapt. Is
dat issue jou bekend? Als je met ogr2ogr een tabel aanmaakt, kijkt hij
waarschijnlijk alleen naar de max. lengte van een string in het bestand
dat hij verwerkt. Dubbele records heb ik handmatig eruitgehaald. Hiervan
heb ik aantekeningen.

Groeten,

Frank

On 22-1-2012 12:09, Just van den Broecke wrote:

Hallo,

Gezien de discussies over BAG en Top10NL wilde ik hier, hoewel in de
steigers, toch vast het project NLExtract aankondigen. In het kort:
met NLExtract willen we software tools bieden voor het converteren,
valideren, verrijken, combineren en visualiseren (WMS) van open
geodata die door NL overheden sinds kort wordt vrijgegeven.

In eerste instantie BAG en Top10NL en dan vooral de conversie van bron
(GML) naar een database (PostgreSQL/PostGIS). Voor BAG bouwen we voort
op BAGExtract+ van I&M/Stefan/Milo en dan vooral commandline. Top10NL
extractie is nieuw. Later: NWB, TopRaster data en meer.

Voorlopig hebben we alleen een GitHub met README's:
https://github.com/opengeogroep/NLExtract

Als je mee wilt werken horen we dat graag. Ik heb zelf gemerkt dat de
brondata van bijv. BAG heel wat "nasties" en "gotchas" bevat: dubbele
records, adressen zonder postcode, niet-valide GML (Top10NL) of
-geometrieen etc. De kennis hierover bundelen is ook een doel.

Welzeker spreek ik een aantal van jullie straks op de borrel in U.

groeten,

Just van den Broecke








_______________________________________________
Talk-nl mailing list
Talk-nl@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-nl




_______________________________________________
Talk-nl mailing list
Talk-nl@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-nl

Antwoord per e-mail aan