Update: Am terminat partea de scanare a codurilor din OSM și am pus
niște rezultate parțiale (scanare doar pentru addr:postcode pe noduri)
la https://wiki.openstreetmap.org/wiki/Romanian_Postal_Codes

Încă nu fac verificări cu datele de la poștă, sunt doar erori din OSM.
De notat că am modificat un pic codurile de eroare pentru o mai bună
consecvență în notație:
            "E1": u"Nu pot extrage orașul din datele OSM",
            "E2": u"Nu pot extrage strada din datele OSM",
            "W3": u"Nu pot extrage numărul din datele OSM",
            "W4": u"Codul poștal e invalid, conține mai puțin de 6 cifre",
            "E4": u"Codul poștal e invalid (conține altceva decât 6 cifre)",
            "E5": u"Nu găsesc codul poștal în datele de la date.gov.ro",
            "W6": u"Există greșeli în spellingul orașului",
            "E6": u"Orașul nu corespunde între OSM și date.gov.ro",
            "W7": u"Sunt greșeli în spellingul străzii",
            "E7": u"Strada nu corespunde între OSM și date.gov.ro",
            "E8": u"Numărul/blocul nu corespund între OSM și date.gov.ro",

Mi-au atras atenția câteva chestii:
* Sunt foarte multe erori E1, ceea ce înseamnă că nu se practică
punerea orașului în adresă. Știu că cineva a mai întrebat pe listă
dacă e chiar necesar și v-am spus atunci că e nevoie pentru căutări
după o anumită cheie. Uite că am dat chiar peste o asemenea situație
:) Poate la un moment dat voi face o căutare în zonă ca să detectez
orașul, dar deocamdată codurile respective nu vor fi verificare.
* Sunt câteva coduri poștale puse de Michael pe noduri din way-uri cu
numere cu valoarea <unterschiedlich> (<diferite>, dacă nu mă înșală
traducerea automată). Michael, le pui manual sau le pune vreo unealtă?
Dacă sunt manuale, care e rolul lor? Un nod reprezintă un număr, deci
ar trebui să aibă un singur cod, nu?
* Ce alte câmpuri/informații ar mai fi util să pun?

Spor la corectat :)

Strainu

În data de 11 noiembrie 2013, 13:24, Strainu <strain...@gmail.com> a scris:
> Salut,
>
> Ca primă fază a importului codurilor poștale de la date.gov.ro, aș
> vrea să generăm o listă cu erori. Mai jos voi descrie procedura pe
> care vreau să o urmez, atât pentru a primi feedback, cât și pentru a o
> avea scrisă undeva.
>
> 1. Extrag toate nodurile și căile cu coduri poștale și încerc să
> extrag orașul, strada și numărul; dacă se poate, extrag și numele
> blocului. În cazul numerelor de casă  care nu sunt formate doar din
> cifre, iau primul număr din text dacă începe de la caracterul 0 (adică
> "1A" și "1BIS" sunt "1", dar "A1" e eroare)
>  - pentru noduri folosesc "is_in:city" sau ""addr:city",
> "addr:street", respectiv "addr:housenumber"
>  - pentru căi folosesc "is_in:city", "name" sau "addr:street",
> respectiv "addr:housenumber" (dacă avem "addr:street")
>  - pentru coduri poștale folosesc "postal_code" sau "addr:postcode"
>
> 2. Pentru fiecare cod poștal, identific toate intrările din lista de
> la date.gov.ro și pentru fiecare dintre ele încerc să fac matching pe:
>  a. oraș; dacă reușesc, merg la b.; dacă nu reușesc, eroare E6.
>  b. stradă; dacă reușesc, merg la c.; dacă nu reușesc, eroare E8.
>  c. număr; dacă reușesc, succes; dacă nu reușesc, merg la d.
>  d. numele blocului; dacă reușesc, succes; dacă nu reușesc, eroare E10.
>
> Din descriere, complexitatea ar fi pătratică; practic, se poate
> optimiza mult aici.
>
> Tipurile de erori aruncate ar fi (E - eroare care nu poate fi evitată,
> W - eroare care poate fi evitată):
> E1. Nu pot extrage orașul din datele OSM
> E2. Nu pot extrage strada din datele OSM
> W3. Nu pot extrage numărul din datele OSM - asta e OK pentru străzi,
> iar pentru restul căilor și nodurilor pot verifica că nu mai există un
> alt cod pe strada respectivă
> W4. Codul poștal e invalid, conține 5 cifre: încerc să completez cu 0
> și verific dacă dau în E5
> E4. Codul poștal e invalid (conține altceva decât 6 cifre);
> E5. Nu găsesc codul poștal în datele de la date.gov.ro
> E6. Orașul nu corespunde între OSM și date.gov.ro
> W7. Sunt greșeli în spelling-ul orașului (de exemplu diacritice
> incorecte sau lipsă)
> E8. Strada nu corespunde între OSM și date.gov.ro
> W9. Sunt greșeli în spelling-ul străzii (de exemplu diacritice
> incorecte sau lipsă sau tip de stradă diferit)
> E10. Numărul/blocul nu corespund între OSM și date.gov.ro
>
>
> Întrebări deschise:
> I1. Mai sunt și alte moduri (chei) de a extrage informațiile din datele OSM?
> I2. La E1, merită să fac o căutare după limita administrativă care
> conține coordonatele respective înainte de a decreta eroare?
> I3. La W3, dacă avem mai multe segmente cu coduri diferite, e
> acceptabil ca fiecare bucată de stradă să aibă alt cod?
>
> Păreri, opinii?
>     Strainu

_______________________________________________
Talk-ro mailing list
Talk-ro@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-ro

Raspunde prin e-mail lui