Re: [OSM-talk-be] import AGIV CRAB-data

Thomas Wed, 29 Oct 2014 11:53:58 -0700

Ik heb het script nu verder uitgerust met een aantaldata-integriteits-checks rond postcode / gemeente. Daaruit blijken tochnog wat bijzondere dingen waar ik het script op moet aanpassen. Zoblijkt dat een straat (zoals geïdentificeerd door zijn ID in deadressenlijst) in meerdere postcodes kan voorkomen, maar nooit inmeerdere gemeenten. Een gemeente bestaat uiteraard uit meerderepostcodes. Daarnaast kan 1 postcode zich in meerdere gemeenten bevinden.Halleluja; lees deze alinea nog maar 3 keer opnieuw...

Op dit moment identificeren we op basis van postcode → straat. Dat houdtin dat we nu een aantal straten splitsen over de postcode, terwijl we opbasis van de data die straten zouden kunnen samenhouden. Mogelijk(nouja; dat ben ik wel zeker) zijn straten ook gesplitst opgemeentegrenzen, maar deze dataset biedt daar geen mogelijkheden voor.

Mijn script pikt nu deze over-postcodes-heen-gesplitste-straten op; hetgaat om 1920 unieke straten die meestal over 2 maar soms over 3postcodes heen gesplitst zijn. Mijn script biedt al heel watmogelijkheden om hier mee om te gaan, maar we moeten het natuurlijk weleens zijn over wat wenselijk is.

Concreet betekent het in feite dat als we onderscheid maken op basis vaneen postcode, we onherroepelijk straten zullen splitsen. We kunnenervoor kiezen om de data per gemeente te ordenen, maar dan wordt dehoeveelheid data per gemeente bijna 2 keer zo groot als de data nu perpostcode (er zijn in totaal 308 gemeenten en 519 postcodes). Gezien denu vaak al grote hoeveelheid straten per postcode is dit misschienonwenselijk. Zeker omdat het volgens mij vaak al de stedelijke gemeentenzijn die meerdere postcodes hebben. Die gemeenten gaan dan van zeergrote stratenlijsten naar enorme stratenlijsten. Een alternatief is diestraten in beide postcodegebieden op te nemen. Dat vind ik ook geennette uitwerking omdat je dan redundancy krijgt in de de JSON-bestanden.

Volgens mij is dan de beste optie om per straat in depostcode-JSON-bestanden een extra JSON-attribuut mee te geven dieaangeeft of de straat doorloopt in een andere gemeente. Dat zie ik in devorm van een lijst van postcodes per straat waar de straat in doorloopt.Dat kan met wat javascript uitgelezen worden. Die specifieke straat kanin datzelfde stuk javascript opgehaald worden en aan de betrokken straattoegevoegd worden. Als je het meer handmatig wil houden kun je vrijeenvoudig een knop toevoegen voor de gebruiker om die straat in deandere gemeenten mee in te laden. Op deze manier kan de opdeling perpostcode gehandhaafd worden, maar is toch duidelijk op straat-niveauwaar mappers mee rekening dienen te houden. Daarnaast is deze informatiemogelijk ook zeer belangrijk voor de scripts van Jo rond het koppelenvan adressen/gebouwen aan een straat. Wat denken jullie hiervan?

Daarnaast speelt dus het tweede punt dat er een aantal postcodes overmeerdere gemeenten heen lopen. Althans: dat er adrespunten zijn metdezelfde postcode die tot een andere gemeente behoren. Voor mijn scripten onze opzet is dat op zich geen probleem, maar ook hier kan ik dezepunten specifiek eruit lichten. Het gaat overigens 54 van de 519postcodes; toch zo'n 10%. Daarbij zijn 81 gemeenten betrokken; een kwartvan het totaal aantal gemeenten. Het totaal aantal adrespunten draait zorond de 250 adrespunten in totaal. Ik moet mijn script nog wat aanpassenom preciese cijfers hierover te hebben. Ruimtelijke samenhang is erniet: het komt nergens in aanzienlijk grotere mate voor dan elders.Hoewel soms gesteld wordt dat postcodes helemaal niet samenvallen metgemeenten, blijkt dat dit dus maar in 1 op de 15.000 gevallen NIET zois. Meestal gaat het over 1 postcode die over twee gemeenten valt. In 7van de 54 gevallen gaat het om een postcode die binnen 3 gemeenten valt.Nooit gaat het om meer dan 3 gemeenten.

Kort samengevat: op basis van de bij de adrespunten behorende gemeentekunnen we straten die door een postcode gesplitst worden weer aan elkaarplakken. Mijn idee is om een lijst van postcodes aan de straat tekoppelen in de JSON, zodat in het javascript die gegevens verwerktkunnen worden. Daarnaast zijn het postcodesysteem en de gemeentelijkeindeling gescheiden systemen. Wordt daar in de verdere verwerking in OSMrekening mee gehouden? Onder andere bij de verschillende scripts diematching regelen is dat een belangrijk punt. Met mijn script kan ik“afwijkende” punten aangeven, maar dan moeten we wel weten op welkemanier. Wat moeten we hiermee?


Groeten,
Thomas

Sander Deryckere schreef op 29-10-2014 12:06:

Hoi Thomas,
Net het script wat verder aangepast voor de nieuwe data, en geuploadednaar jouw repo. Dus aan iedereen, gelieve vanaf nu vooralhttp://aptum.github.io/import.html te testen,
Kan je de appartementsnummers en busnummers als aparte lijsten in deJSON zetten? Dan kan ik ook het script updaten om addr:flats teondersteunen. Lijsten zijn het best aangezien ze gemakkelijkeromgevormd kunnen worden naar de correcte formaat. Ook die bestalfabetisch sorteren voor de diffs. En misschien enkel de lijsten aande JSON toevoegen indien wel degelijk (dat zal bandbreedte sparen voorde vele adressen die geen busnummers of appartementsnummers hebben).
Aangezien de overlappende en de niet overlappende nummers nu inverschillende kolommen staan, is daar geen verschillende CSS voornodig. Een verschillende CSS voor de herkomst kan wel helpen.Momenteel staat die herkomst nog in CRAB:source om de waardengemakkelijk te kunnen aflezen. Dus momenteel die tags nog niet gaanuploaden.
Als het goed is voor iedereen, dan breng ik die tags naar de vorm

  * odbl:note=CRAB:manueleAanduidingVanGebouw
  * odbl:note=CRAB:geinterpoleerdObvNevenliggendeHuisnummersGebouw
  * ...
odbl:note lijkt mij de meest neutrale van alle discardable tags, enhet voorvoegsel CRAB: kan zorgen voor unieke CSS selectors.
De grootste problemen momenteel zijn de huisnummers met eenunderscore. Ik kan moeilijk beslissen als ik die naar bis, ter, ... ofnaar /1, /2, /3, ... breng. Maar het overlaten aan de mapper kan ervoor zorgen dat de huisnummers met een underscore rechtstreeksgeuploaded worden.
Het andere grote probleem is de spelling van de straatnaam. Dat ismoeilijk om af te leiden met de beperkte OSM data die ik heb in dewebpagina (vooral als er nog geen adressen in OSM zijn). Eenspellingsverschil kan er voor zorgen dat huisnummers geuploaded wordenwaarbij addr:street verschilt van de straatnaam in OSM. Wat natuurlijkvoor problemen zal zorgen. Maar hierbij kan Jo misschien helpen, of deJOSM validator.
Als die problemen opgelost zijn, dan lijken de tools klaar, en wordthet tijd om enkele definitieve beslissingen te maken:
  * Huizen tekenen of niet
  * Aparte gebruikersnaam of niet
  * Welke tags moeten op de changeset
  * Hoe contacteren we het AGIV met opmerkingen?
  * ...

Groeten,
Sander

_______________________________________________
Talk-be mailing list
Talk-be@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-be

Re: [OSM-talk-be] import AGIV CRAB-data

Reply via email to