>Což ani nevypadá, že by byl problém s Monem. Co má být v souboru
>label.txt? Když ten soubor vytvořím a vložím tam nějaké znaky, tak to
>začne vypisovat:

Program pracuje tak, ze vezme dlaždici, najde na ní definicni body
budov (cervene tecky) a k nim prislusejici text. Text ulozi do obrazku
"tmp.bmp" a potom ho rozpozna exetnim OCR programem (tesseract.exe).
Ten ulozi rozpoznany text prave do souboru label.txt

Proc program nefunguje, kdyz soubor label.txt pred spustenim
neexistuje je mi zahadou. Podle vystupu "output.csv" co jsi posilal,
tak rozpoznavani evidentne funguje ...


>chtěl bych se zeptat, jak tvůj program řeší ořez čísel na okrajích
>stažených dlaždic. Ptám se pro jistotu, aby nevznikly zbytečné chyby.

dlazdice se prekryvaji o 5% na kazde strane, takze temer jiste, ze
alespon na jedne dlazdici je text cely. Tile-processor vysledky nijak
nezpracovava, pouze ulozi polohu bodu a jemu prislusejici text. V
dalsim kroku, pri prirazovani adres jednotlivym bodum se nesmyslene
rozpoznany text vyfiltruje.


>přes Wine to funguje, ale výsledek není ještě pořád ideální. Spočítaná
>poloha jednotlivých bodů totiž nedává úplně smysl - občas je tam NaN,
>občas čísla, mimo rozmezí daného BBOX, občas čísla větší než 100000.
>Nemůže být zase problém s desetinou tečkou/čárkou?

Moje chyba. Tile-downloader ukladal dlazdice se spatny jmenem (opet
carka / tecka). Oprava opet na [1]. Pokud mas nejake dlazdice stazene,
tak staci carky v nazvech souboru nahradit za tecky.


>V příloze posílám výstup z programu, a zkrácený výpis programu. Wine rád 
>vypisuje
>velké množství chyb, takže některých údajů ve výpisu si není třeba všímat.

Ty errory to vypisuje i na WIN, jedna se o nejaky problem v
tesseract.exe, na strankach maji k tomu vytvoreny ticket, s tim ze
program ale funguje spravne.

[1] http://lkabrt.aspone.cz/osm/cuzk.zip

--
Lukas

_______________________________________________
Talk-cz mailing list
Talk-cz@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-cz

Odpovedet emailem