Ahoj,

nebylo by lepší ukládat a přibalit potom k výsledku i kousky mapy s
těmi čísly? Zrychlila by se ruční kontrola, zda to OCR rozpoznal
správně. Aneb bylo by možné pak jednoduše třeba zobrazit číslo v
textové podobě a vedle číslo v obrázkové podobě. A stejně už se to
stahuje, ořezává, ... jen to ukládat.

Honza


2010/1/26 Lukas Kabrt <lu...@kabrt.cz>:
> Provedl jsem par zmen v programu tile-processor, binarky [1] i
> zdrojove kody [2] muzete stahovat z mych stranek.
>
> Hlavni zmeny:
> rychlost - OCR utitlita se ted spousti pouze jednou pro kazdou
> dlazdici - prineslo to cca dvojnasobnou rychlost zpracovani
> drobne zvyseni presnosti - presnejsi orez popisku a vynechani budov
> blizko praveho okraje (tak jak navrhoval Petr Dlouhy)
> pridano logovani cinnosti
> osetreni chyb - program by se ted mel byt schopny zotavit z vetsiny
> chyb, pouze zaloguje co se stalo a pokracuje v cinnosti
>
> V binarkach jsou dve verze tile processoru - jedna pro LINUX s upravou
> od Petra Dlouheho ([3], bod 2), druha bez ni. Nechal jsem dve verze,
> protoze u me verze s upravou dava o neco horsi vysledky pri OCR (cca o
> 1 - 2% vice chyb)
>
> Progam jsem zkousel na platforme Win/.NET a Win/MONO a funguji bez
> problemu. Nekoho bych poprosil aby vyzkousel jestli neni nejaky
> problem na Linuxu.
>
>
> Distribuovane pocitani
> Diky vsem, kteri se ozvali a nabidli se, ze pomuzou s vypoctem.
>
> Rozdelil jsem CR na dlazdice 0.2 x 0.2 stupne, celkem je to 302
> dlazdic. Hranice jsou definovany v CSV souboru [4], prilozena je i
> prehledova mapka. Zpracovani jedne dlazdice by se melo vejit do 1
> hodiny.
>
> CSV soubor ma nasledujici format
> ID,sever,vychod,jih,zapad
>
> Pro koordinaci jsem na wiki zalozil stranku [5]. Pokud se rozhodnete
> pomoct, zapiste na wiki, jake dlazdice zpracujete - at se neco
> nepocita vicekrat. Dlazdice prosim vybirejte postupne, at v tom neni
> zmatek.
>
> Moje idea dalsiho postupu je takova, ze vysledky vypoctu (CSV a LOG
> soubory) zpracuju, pripadne opravim data na mistech, kde se vyskytnul
> nejaky error a vysledek umistim nekde na web k dalsimu vyuziti pro
> import adres.
>
> Postup
> 1) na wiki napsat dlazdice, ktere se chystam zpracovat
> 2) ze souboru [4] zjistit hranice dlazdic
> 3) stahnout data z WMS CUZK
>
> tile-downloader.exe -north [sever] -west [zapad] -south [jih] -east
> [vychos] -addressPoints -output [ID-Dlazdice]
>
> 4) zpracovat dlazdici
>
> tile-processor.exe -tiles [ID-Dlazdice] - output [ID-Dlazdice].csv
>
> 5) zabalit vytvorene soubory (CSV a LOG) a vysledek nekam uplodovat
> nebo zaslat na mail o...@kabrt.cz
>
> [1] http://lkabrt.aspone.cz/osm/cuzk.zip
> [2] http://lkabrt.aspone.cz/osm/cuzk-source.zip
> [3] http://lists.openstreetmap.org/pipermail/talk-cz/2010-January/004312.html
> [4] http://lkabrt.aspone.cz/osm/oblasti.zip
> [5] http://wiki.openstreetmap.org/wiki/Import_Adres_ČR/Prubeh_Zpracovani
> --
> Lukas
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz@openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-cz
>

_______________________________________________
Talk-cz mailing list
Talk-cz@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-cz

Odpovedet emailem