Re: [Talk-cz] Import adres z katastralni mapy
Pardon, myslel jsem dní. On Sun, 24 Jan 2010 08:46:16 +0100, Petr Dlouhý petr.dlo...@email.cz wrote: (mé velmi hrubé odhady se pohybují od 50 do 100 hodin jenom pro 2. fázi). -- Petr Dlouhý ___ Talk-cz mailing list Talk-cz@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-cz
Re: [Talk-cz] Soubor cr.map pro import adres
vygeneroval jsem soubor cr.map [2] obsahující mapování pro program merge-cuzk-db. Soubor je jednoduše vygenerován z ulic MVČR [1], takže trpí některými zásadními nedostatky: Diky, urcite to hodne pomuze. 1) V MVČR se bohužel vykašlali na velikost písmen a napsali všechno velkýma. V souboru je vždy první písmeno velké a ostatní malá. Je tedy nutné upravit názvy podle pravopisu. S velikosti pismen v souboru *.map si neni potreba lamat hlavu. Nazvy stejne beru z datatabaze MVCR a velikost pismen upravuju podobnym algoritmem, jaky je pouzit v pluginu czechaddress. Proc? Protoze z databaze se berou nazvy ulic a i ty jsou vsechny velkyma pismenema. Tak jsem vzal z databaze vse. Vysledek sice v nekterych pripadech neni podle pravidel ceskeho pravopisu, ale postupne na tom pracuju - kdyz narazim na nejakou chybu, tak se ji snazim do algoritmu zakomponovat. Mozna by stalo za uvahu, zda nazvy mest / mestskych casti nebrat ze souboru *.map, kde je mozne velikost pismen upravit rucne. 2) Nepodařilo se mi najít žádný klíč, podle kterého by bylo možné spojit databáze MVČR a CUZK. Do parametru name elementu territory jsem tedy doplnil jméno oblasti. Je tedy nutné doplnit tam u něčeho, pokud se jméno katastrálního území liší. Klic by mohl byt tady [1], nevim ale jak je to s licenci. Je tam prirazeni k.u. - obec, sice uz ne k.u. mestska cast, ale ve vetsine pripadu se ty nazvy podobaji, takze by to mohlo jit odhadnout. 3) Program merge-cuzk-db nezvládá pokud jsou v .map souboru nějaká území navíc oproti .osm souboru katastrálních území. Je tedy nutné před použitím zakomentovat vše kromě těch území, pro která se budou adresy přiřazovat. Pisu si do TODO listu. Udelam to tak, ze program zarve, ale nespadne. Osobne to stejne delam tak, ze merge pouztim pouze na par k.u. najednou, lip se tim pak pracuje v JOSM, je to prehlednejsi. [1] http://www.cuzk.cz/Dokument.aspx?PRARESKOD=10MENUID=10015AKCE=DOC:10-CISE_KUAP -- Lukas ___ Talk-cz mailing list Talk-cz@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-cz
Re: [Talk-cz] Import adres z katastralni mapy
Asi ano, ale kdyz jsem osmosis zkousel, tak vzdycky spadnul na nejakou podovnou vyjimku. Pak jsem v rychlosti dospel k zaveru, ze asi ke sve cinnosti potrebuje nejakou DB (PostreSQL apod.) ... a to se mi nechtelo instalovat ... ale treba je to spatny zaver. Moc jsem to nezkoumal. Urcite funguje i bez DB. pouzivam vyvojovou verzi 0.33 [1] a funguje bez problemu. Musel jsem ale pouzit soubor osmosis.bat z predchozi verze a dopnit do promenne EXEC pridat chybejci knihovnu commons-compress-1.0.jar [1] http://dev.openstreetmap.de:23457/hudson/job/osmosis-SNAPSHOT-ant/lastSuccessfulBuild/artifact/trunk/dist/ -- Lukas ___ Talk-cz mailing list Talk-cz@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-cz
Re: [Talk-cz] Import adres z katastralni mapy
Co se týče skriptů, tak myslím, že je třeba se vydat jinou cestou. Pokud to jde alespoň trochu jednoduše udělat, tak by ten skript měl dokázat pracovat s celou mapou katastrálních území. Problem to neni. Kdyz jsem program vytvarel, tak jsem nevedel o tom, ze existuje vektorizovana mapa k.u. a tak jsem k.u. kreslil rucne. Vzdycky jen par k.u., ktere jsem chtel zpracovat. Takze me rychlost zpracovani OSM souboru nejak netrapila. Na vektorizovanou mapu jsem narazil az kdyz jsem mel program hotovy a jeste jsem se nedostal k tomu ho predelat - dalsi polozka do TODO listu :-) Koukal jsem, ze by sla pouzit knihovna pro praci s OSM soubory z programu Kosmos [1], takze s tim nakonec asi ani nebude tolik prace. [1] http://wiki.openstreetmap.org/wiki/Kosmos -- Lukas ___ Talk-cz mailing list Talk-cz@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-cz
Re: [Talk-cz] Import adres z katastralni mapy
Pardon, myslel jsem dní. On Sun, 24 Jan 2010 08:46:16 +0100, Petr Dlouhý petr.dlo...@email.cz wrote: (mé velmi hrubé odhady se pohybují od 50 do 100 hodin jenom pro 2. fázi). Jestli myslis cisteho vypocetniho casu, tak bych rekl, ze je to pesimisticky odhad. Podle toho, jak rychle probiha vypocet u me, bych to odhadnul na 30 - 50 dni. Limitujici je tady rychlost procesoru. Nedavno jsem zkousel oblast cca 20 x 25 km a rozpoznavani bezelo neco pres 5 hodin. Muj pocitac pritom neni zadne delo - Intel Core2 Duo @ 2Ghz. -- Lukas ___ Talk-cz mailing list Talk-cz@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-cz
Re: [Talk-cz] Import adres z katastralni mapy
To docela odpovídá. Já mám počítač ještě pomalejší, jednojádrový a podle něj jsem to odhadoval. Každopádně je to poměrně dost, a chtělo by to možná zapojit i ty, kdo mají dost procesorového a málo osobního času. On Sun, 24 Jan 2010 10:53:38 +0100, Lukas Kabrt lu...@kabrt.cz wrote: Jestli myslis cisteho vypocetniho casu, tak bych rekl, ze je to pesimisticky odhad. Podle toho, jak rychle probiha vypocet u me, bych to odhadnul na 30 - 50 dni. Limitujici je tady rychlost procesoru. Nedavno jsem zkousel oblast cca 20 x 25 km a rozpoznavani bezelo neco pres 5 hodin. Muj pocitac pritom neni zadne delo - Intel Core2 Duo @ 2Ghz. -- Petr Dlouhý ___ Talk-cz mailing list Talk-cz@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-cz
Re: [Talk-cz] Import adres z katastralni mapy
Mam malo osobniho casu, ale jsem schopen pripravit virtualni masinu s debianem pro zajemce, ktery to uchodi. Je tam 2x2.8GHz XEON a 4GB pameti. Pokud by to pomohlo... K Dne 24.1.2010 10:58, Petr Dlouhý napsal(a): To docela odpovídá. Já mám počítač ještě pomalejší, jednojádrový a podle něj jsem to odhadoval. Každopádně je to poměrně dost, a chtělo by to možná zapojit i ty, kdo mají dost procesorového a málo osobního času. On Sun, 24 Jan 2010 10:53:38 +0100, Lukas Kabrtlu...@kabrt.cz wrote: Jestli myslis cisteho vypocetniho casu, tak bych rekl, ze je to pesimisticky odhad. Podle toho, jak rychle probiha vypocet u me, bych to odhadnul na 30 - 50 dni. Limitujici je tady rychlost procesoru. Nedavno jsem zkousel oblast cca 20 x 25 km a rozpoznavani bezelo neco pres 5 hodin. Muj pocitac pritom neni zadne delo - Intel Core2 Duo @ 2Ghz. ___ Talk-cz mailing list Talk-cz@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-cz
Re: [Talk-cz] Import adres z katastralni mapy
Ahoj, já bych se klidně přidal. Pendluju mezi 2jádrem a 3jádrem, obě poměrně výkonné a málo využité :-) Výkon teď věnuju ti...@home, ale v tomhle vidím větší smysl. Stačilo by, kdyby nás bylo pár, a do dvou týdnů bysme to měli :-) Program by měl jít ale přerušit a znova obnovit, neměl by to být jeden velký cyklus, aby šlo přecházet mezi počítači. Jinak jak tu tak sleduju diskusi, tak velice chválím vaše počiny :-) Aleš Janda On 24.1.2010 10:58, Petr Dlouhý napsal/a: To docela odpovídá. Já mám počítač ještě pomalejší, jednojádrový a podle něj jsem to odhadoval. Každopádně je to poměrně dost, a chtělo by to možná zapojit i ty, kdo mají dost procesorového a málo osobního času. On Sun, 24 Jan 2010 10:53:38 +0100, Lukas Kabrtlu...@kabrt.cz wrote: Jestli myslis cisteho vypocetniho casu, tak bych rekl, ze je to pesimisticky odhad. Podle toho, jak rychle probiha vypocet u me, bych to odhadnul na 30 - 50 dni. Limitujici je tady rychlost procesoru. Nedavno jsem zkousel oblast cca 20 x 25 km a rozpoznavani bezelo neco pres 5 hodin. Muj pocitac pritom neni zadne delo - Intel Core2 Duo @ 2Ghz. ___ Talk-cz mailing list Talk-cz@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-cz
Re: [Talk-cz] Import adres z katastralni mapy
Paměť není moc potřeba, takže to stejně potrvá kolem 20 dní. Klidně to tam rozjedu, ale stejně se to musí rozdělit do čtverců o určité rozloze. On Sun, 24 Jan 2010 11:09:38 +0100, Kubajz kub...@kbx.cz wrote: Mam malo osobniho casu, ale jsem schopen pripravit virtualni masinu s debianem pro zajemce, ktery to uchodi. Je tam 2x2.8GHz XEON a 4GB pameti. Pokud by to pomohlo... K Dne 24.1.2010 10:58, Petr Dlouhý napsal(a): To docela odpovídá. Já mám počítač ještě pomalejší, jednojádrový a podle něj jsem to odhadoval. Každopádně je to poměrně dost, a chtělo by to možná zapojit i ty, kdo mají dost procesorového a málo osobního času. -- Petr Dlouhý ___ Talk-cz mailing list Talk-cz@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-cz
Re: [Talk-cz] Import adres z katastralni mapy
Na OCR by paměť není moc potřeba. Klidně to tam rozběhnu. On Sun, 24 Jan 2010 11:09:38 +0100, Kubajz kub...@kbx.cz wrote: Mam malo osobniho casu, ale jsem schopen pripravit virtualni masinu s debianem pro zajemce, ktery to uchodi. Je tam 2x2.8GHz XEON a 4GB pameti. Pokud by to pomohlo... -- Petr Dlouhý ___ Talk-cz mailing list Talk-cz@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-cz
[Talk-cz] Seznam katastralnich uzemi s umistenim
Dobry den, na [1] si muzete stahnout body katastralnich uzemi. Je jich 13012 a kat. uz. je 13027. Zbyle se mi nepodarilo najit na mape, takze bude treba tech 15 relaci pojmenovat rucne. Script kterym jsem to vytvarel jeste trochu projdu, procistim a zverejnim nekde na webu(asi na hanojovem talku, kde uz nejaka verze je). Souradnicovy system je S-JTSK. [1] http://exile.dobaledova.net/~magon/body_kat_uz Martin ___ Talk-cz mailing list Talk-cz@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-cz
Re: [Talk-cz] Import adres z katastralni mapy
Nemyslím si, že je to háček. Mluví se o bezplatném převzetí od ČSÚ (tedy, že není za to třeba platit ČSÚ). Ale nikoli o tom, že by se data nesměla prodávat (bezplatných produktech, kde budou data použita, nekomerční účely apod.). Honza 2010/1/24 Petr Dlouhý petr.dlo...@email.cz: Háček je v tom bezplatně. U OSM nikdo nezakazuje, aby byla data prodávána. Je otázka, zdali se ale nejedná o úřední dílo - v tom případě by si ČSÚ takové podmínky diktovat asi nemohl. On Sun, 24 Jan 2010 04:46:05 +0100, Jan Bilak jan.bilak@gmail.com wrote: Veškeré údaje na internetových stránkách ČSÚ si může kdokoliv převzít pro své účely bezplatně, pouze s podmínkou, že uvede jako zdroj ČSÚ. Je doporučováno uvádět i datum, kdy údaje byly převzaty. -- Petr Dlouhý ___ Talk-cz mailing list Talk-cz@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-cz ___ Talk-cz mailing list Talk-cz@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-cz
Re: [Talk-cz] Import adres z katastralni mapy
Já myslím, že hodně času žere spouštění nového procesu pro OCR. Pokud lze OCRu předhodit obrázek, který bude obsahovat více textů (a pak rozpoznat, co je co), nebo mu předhodit více obrázků (vícestránkový dokument), tak by to mohlo jít rychleji. Přecijen OCRka se běžně použivají na čtení hustého textu na A4 a s rozpoznání trvá chvilku. Honza Dne 24. ledna 2010 10:53 Lukas Kabrt lu...@kabrt.cz napsal(a): Pardon, myslel jsem dní. On Sun, 24 Jan 2010 08:46:16 +0100, Petr Dlouhý petr.dlo...@email.cz wrote: (mé velmi hrubé odhady se pohybují od 50 do 100 hodin jenom pro 2. fázi). Jestli myslis cisteho vypocetniho casu, tak bych rekl, ze je to pesimisticky odhad. Podle toho, jak rychle probiha vypocet u me, bych to odhadnul na 30 - 50 dni. Limitujici je tady rychlost procesoru. Nedavno jsem zkousel oblast cca 20 x 25 km a rozpoznavani bezelo neco pres 5 hodin. Muj pocitac pritom neni zadne delo - Intel Core2 Duo @ 2Ghz. -- Lukas ___ Talk-cz mailing list Talk-cz@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-cz ___ Talk-cz mailing list Talk-cz@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-cz
Re: [Talk-cz] Import adres z katastralni mapy
Tady je .NETí wrapper nad DLL. Ale píší tam, že Tesseract má memory leaky, takže to čas o času spadne. Ale nějaké dávky (více popisků najednou) by to mohlo zvládnout. http://www.pixel-technology.com/freeware/tessnet2/ Honza 2010/1/24 Jan Bilak jan.bilak@gmail.com: Já myslím, že hodně času žere spouštění nového procesu pro OCR. Pokud lze OCRu předhodit obrázek, který bude obsahovat více textů (a pak rozpoznat, co je co), nebo mu předhodit více obrázků (vícestránkový dokument), tak by to mohlo jít rychleji. Přecijen OCRka se běžně použivají na čtení hustého textu na A4 a s rozpoznání trvá chvilku. Honza Dne 24. ledna 2010 10:53 Lukas Kabrt lu...@kabrt.cz napsal(a): Pardon, myslel jsem dní. On Sun, 24 Jan 2010 08:46:16 +0100, Petr Dlouhý petr.dlo...@email.cz wrote: (mé velmi hrubé odhady se pohybují od 50 do 100 hodin jenom pro 2. fázi). Jestli myslis cisteho vypocetniho casu, tak bych rekl, ze je to pesimisticky odhad. Podle toho, jak rychle probiha vypocet u me, bych to odhadnul na 30 - 50 dni. Limitujici je tady rychlost procesoru. Nedavno jsem zkousel oblast cca 20 x 25 km a rozpoznavani bezelo neco pres 5 hodin. Muj pocitac pritom neni zadne delo - Intel Core2 Duo @ 2Ghz. -- Lukas ___ Talk-cz mailing list Talk-cz@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-cz ___ Talk-cz mailing list Talk-cz@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-cz
Re: [Talk-cz] Soubor cr.map pro import adres
Ahoj, tak už se mi to snad podařilo spojit [1]. Dělám to na základě názvu okresu a obce a podobnosti jména katastrálního území. Používám k tomu seznam katastrálních území ze stránek CUZK a seznam ulic ze stránek MVČR, takže jestli si někdo myslí, že je to problém, tak řekněte. Osobně si myslím, že data z CUZK pouze použijeme a do mapy nebudeme importovat, takže to snad nevadí. Prosím zkontrolujte, jestli přiřazemí proběhlo dobře. [1] http://www.flyshare.cz/stahni/45772/addr_map.tar.bz2 On Sun, 24 Jan 2010 02:35:24 +0100, Petr Dlouhý petr.dlo...@email.cz wrote: 2) Nepodařilo se mi najít žádný klíč, podle kterého by bylo možné spojit databáze MVČR a CUZK. Do parametru name elementu territory jsem tedy doplnil jméno oblasti. Je tedy nutné doplnit tam u něčeho, pokud se jméno katastrálního území liší. -- Petr Dlouhý ___ Talk-cz mailing list Talk-cz@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-cz
Re: [Talk-cz] Import adres z katastralni mapy
Ahoj, stačí použít Dictionary, a už to funguje rozumě rychle (i když celá ČR asi ještě ne - po minutě mi zabrala celou paměť). Opravil jsem i pády při chybějících relacích, i když oprava je dost quickdirty. Posílám zdrojáky změněných souborů i funkční program. On Sun, 24 Jan 2010 10:37:08 +0100, Lukas Kabrt lu...@kabrt.cz wrote: Problem to neni. Kdyz jsem program vytvarel, tak jsem nevedel o tom, ze existuje vektorizovana mapa k.u. a tak jsem k.u. kreslil rucne. Vzdycky jen par k.u., ktere jsem chtel zpracovat. Takze me rychlost zpracovani OSM souboru nejak netrapila. Na vektorizovanou mapu jsem narazil az kdyz jsem mel program hotovy a jeste jsem se nedostal k tomu ho predelat - dalsi polozka do TODO listu :-) Koukal jsem, ze by sla pouzit knihovna pro praci s OSM soubory z programu Kosmos [1], takze s tim nakonec asi ani nebude tolik prace. [1] http://wiki.openstreetmap.org/wiki/Kosmos -- Lukas ___ Talk-cz mailing list Talk-cz@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-cz -- Petr Dlouhý CUZK.MergeDBWithPoints.tar.gz Description: GNU Zip compressed data ___ Talk-cz mailing list Talk-cz@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-cz
Re: [Talk-cz] Import adres z katastralni mapy
Nemyslím si, že je to háček. Mluví se o bezplatném převzetí od ČSÚ (tedy, že není za to třeba platit ČSÚ). Ale nikoli o tom, že by se data nesměla prodávat (bezplatných produktech, kde budou data použita, nekomerční účely apod.). *** take to tak vnimam, zvlaste po rozhovorech s VUV TGM... Oni neco jako open source neznaji a nemluvi k nemu. hanoj ___ Talk-cz mailing list Talk-cz@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-cz
Re: [Talk-cz] Import adres z katastralni mapy
A ČSÚ má mimo jiné na svých stránkách i mapy ... ale většina věcí je tam stejná s katastrem. Např.: http://apl.czso.cz/irso/mapa.jsp?budId=207400obrprvId=184459 *** ty mapy jsou mashup. Velka cast se taha z CUZK! hanoj ___ Talk-cz mailing list Talk-cz@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-cz