Inmiddels ben ik weer een heel stuk verder met het script. De memoryload heb ik terug kunnen brengen tot 1,1GB. De looptijd zit nu net boven een uur. Dat komt vooral omdat ik een aantal extra checks heb toegevoegd. Daarmee kan de integriteit van de data wat beter vastgesteld worden, nu en in de toekomstige updates van de lijst. Ook de sortering heb ik nu in orde gebracht.

Concreet test ik nu of een straat-id inderdaad identificerend is voor een straatnaam. Ook houd ik wat gedetailleerder bij hoeveel appartementsnummers en busnummers het script negeert als adrespunt. Daarnaast heb ik in mijn ogen mogelijk zinvolle informatie toegevoegd aan de JSON-bestanden. Die informatie kan dan eenvoudig via het JS al dan niet, met welke tag dan ook, in JOSM geladen worden. Het gaat met name om een detailspecificatie van busnummers en appartementnummers die ook op dat adres geregistreerd zijn.

Verder is er iets bijzonder aan de hand met de huisnummer-labels. Die worden door het AGIV automatisch opgemaakt per huisnummer, althans, zo hoort het. Toch heb ik met een check in mijn script 702 afwijkende huisnummerlabels weten te vinden. Die zijn gekoppeld aan 211 adressen, wat natuurlijk 'veel' is maar tegelijkertijd slechts 0,008% van het totaal. Daarbij in acht genomen dat 67% van die afwijkende huisnummerlabels zich voordoen in postcode 8900 lijkt het mij om een fout in de database te gaan. Wat er precies fout gelopen is op die punten weet ik niet. Ik heb de lijst op mijn server geplaatst: http://downloader.aptum.nl/AfwijkendeHuisnummerLabelsCRAB.pdf

Wat daar aan de hand is moet dus even verder bekeken worden. Ik heb nu de informatie van de huisnummerlabels opgenomen in de JSON bestanden. Wanneer de huisnummerlabels voor alle sub-adressen bij 1 adrespunt (de busnummers en appartementsnummers) niet onderling gelijk zijn, wordt hier ook een melding van gemaakt en wordt de lijst met afwijkende huisnummerlabels doorgegeven via de JSON-bestanden. Als jullie even kunnen kijken of jullie punten op de lijst herkennen en weten wat specifiek daar speelt, dan kan dat heel erg helpen bij het begrijpen wat er precies fout loopt.

Even wat cijfers over de adressenlijst:
    – 3.364.708 reccords
– daarvan bevatten er 142.010 een appartementnummer en 583.913 een busnummer
    – zonder de subadressen, blijven er 2.639.893 unieke adrespunten over.
    – Er zijn 519 postcodes geregistreerd en 79185 straat-id's.

Over welke tags te gebruiken twijfel ik nog wat. Enerzijds vind ik het een goed idee om discardable tags te gebruiken. Anderzijds (als ik de lijst daarvan in de broncode van JOSM bekijk: http://josm.openstreetmap.de/browser/josm/trunk/src/org/openstreetmap/josm/data/osm/OsmPrimitive.java?rev=7643 regel 687 ev) zijn de huidige allemaal op een heel specifiek project gericht. Om zo'n bestaand label te 'verkrachten' met de informatie uit het CRAB vind ik niet helemaal netjes (ook al komen ze niet in OSM); maar misschien denken jullie daar anders over. Daarnaast is het misschien ook vervelend dat die tags default niet weergegeven worden in JOSM, terwijl het om informatie gaat die handig is / kan zijn voor de mappers. Aan de andere kant: als een gebruiker het te moeilijk vindt / te veel moeite om die tags aan te zetten in de configuratie, dan is het misschien ook een te groot risico dat diezelfde gebruikers die tags misschien wel zou opladen naar OSM. Hoe denken jullie hierover?

Nu voorlopig heb ik toch even het CRAB:key-patroon gebruikt zodat ze in deze testfase voor iedereen helder zijn en netjes zichtbaar. Een andere tag-naam is zo aangepast in het javascript. Let voor nu dus wel op dat je deze tags niet naar OSM upload!

Ik heb nu volgende tags toegepast:
1) CRAB:huisnrlabel. Deze bevat het huisnummer-label zoals dat door het CRAB aangeleverd wordt. Het is een samengestelde waarde uit de huisnummers van (qua locatie) samenvallende adrespunten. 2) CRAB:message. Deze bevat informatie over het al dan niet aanwezig zijn van busnummers en appartementnummers op dat specifieke adrespunt. Deze gegevens hoeven niet in OSM opgenomen te worden maar kunnen (zeker nu in de testfase) verhelderend werken. 3) CRAB:source. Deze had ik eerder al toegevoegd en bevat de herkomst van de gegevens.

Ik heb de JSON-bestanden op mijn github-site bijgewerkt. Ik heb ook weer de laatste versie van Sander zijn JS-bestand overgenomen en er de tags aan toegevoegd. Alles staat nog steeds op http://aptum.github.io/import.html

Groeten,
Thomas

Sander Deryckere schreef op 27-10-2014 11:55:
Ik heb een sorteermogelijkheid toegevoegd aan het JS script (door op de headers te klikken, moet de UI nog wat aanpassen om het duidelijker te maken), en ik heb ook nog een issue opgelost met de huisnummervergelijking.

Zo werd in het vorige script nummer 241 niet gemarkeerd als "missing" indien 24 of 41 van die straat in OSM bestond. Wat natuurlijk verkeerd was.

Aangezien de meeste straten ofwel bijna volledig gemap zijn, ofwel bijna niet, was deze fout moeilijk te vinden. Maar nu kan het dus zijn dat je enkele extra "missing" adressen hebt.

Thomas, pas jij het ook aan in jouw kopie?

Groeten,
Sander

Op 26 oktober 2014 22:02 schreef Sus Verhoeven <sus...@gmail.com <mailto:sus...@gmail.com>>:

    Hooi
    Met beide scripten heb ik hetzelfde probleem. Als ik de straat
    gegevens van de script eerst oplaadt in JOSM kan ik geen OSM kaart
    gegevens meer inladen in een apparte laag. Indien ik eerst de OSM
    gegevens inlaad kan ik wel elke straatgegevens in apparte lagen
    inladen.

    In 3970 Leopoldsburg liggen met de nieuwe script de huisnummers
    praktisch op dezelfde plaats dan in GRB, In Leopoldsbug lagen ze
    meestal op de perceelcentroid, dat is dus  veel beter

    In de Koningsstraat krijg ik nu een nummer 40, maar die 40 wordt
    niet gevalideerd door Bpost.
    En volgens de foto en GRB is die moeilijk te verklaren
    Aan de overkant liggen er nog enkele nummers, wel volgens de
    foto's een terrein in aanbouw, Dat zou dus wel kunnen. Met de
    eerste schript lagen er daar veel meer.
    Zou het kunnen dat de mapccs van Jo niet meer werkt. ?
    Toch wel handig.

    Sus


    _______________________________________________
    Talk-be mailing list
    Talk-be@openstreetmap.org <mailto:Talk-be@openstreetmap.org>
    https://lists.openstreetmap.org/listinfo/talk-be




_______________________________________________
Talk-be mailing list
Talk-be@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-be

_______________________________________________
Talk-be mailing list
Talk-be@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-be

Reply via email to