Re: [Talk-cz] Import adres z katastralni mapy

2010-01-24 Tema obsahu Petr Dlouhý
Pardon, myslel jsem dní.

On Sun, 24 Jan 2010 08:46:16 +0100, Petr Dlouhý petr.dlo...@email.cz  
wrote:

 (mé velmi hrubé odhady se pohybují od 50 do 100 hodin jenom pro 2. fázi).


-- 
Petr Dlouhý

___
Talk-cz mailing list
Talk-cz@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Soubor cr.map pro import adres

2010-01-24 Tema obsahu Lukas Kabrt
 vygeneroval jsem soubor cr.map [2] obsahující mapování pro program
 merge-cuzk-db. Soubor je jednoduše vygenerován z ulic MVČR [1], takže trpí
 některými zásadními nedostatky:

Diky, urcite to hodne pomuze.

 1) V MVČR se bohužel vykašlali na velikost písmen a napsali všechno
 velkýma. V souboru je vždy první písmeno velké a ostatní malá. Je tedy
 nutné upravit názvy podle pravopisu.

S velikosti pismen v souboru *.map si neni potreba lamat hlavu. Nazvy
stejne beru z datatabaze MVCR a velikost pismen upravuju podobnym
algoritmem, jaky je pouzit v pluginu czechaddress.  Proc? Protoze z
databaze se berou nazvy ulic a i ty jsou vsechny velkyma pismenema.
Tak jsem vzal z databaze vse. Vysledek sice v nekterych pripadech neni
podle pravidel ceskeho pravopisu, ale postupne na tom pracuju - kdyz
narazim na nejakou chybu, tak se ji snazim do algoritmu zakomponovat.
Mozna by stalo za uvahu, zda nazvy mest / mestskych casti nebrat ze
souboru *.map, kde je mozne velikost pismen upravit rucne.

 2) Nepodařilo se mi najít žádný klíč, podle kterého by bylo možné spojit
 databáze MVČR a CUZK. Do parametru name elementu territory jsem tedy
 doplnil jméno oblasti. Je tedy nutné doplnit tam u něčeho, pokud se
 jméno katastrálního území liší.

Klic by mohl byt tady [1], nevim ale jak je to s licenci. Je tam
prirazeni k.u. - obec, sice uz ne k.u. mestska cast, ale ve vetsine
pripadu se ty nazvy podobaji, takze by to mohlo jit odhadnout.

 3) Program merge-cuzk-db nezvládá pokud jsou v .map souboru nějaká území
 navíc oproti .osm souboru katastrálních území. Je tedy nutné před použitím
 zakomentovat vše kromě těch území, pro která se budou adresy přiřazovat.

Pisu si do TODO listu. Udelam to tak, ze program zarve, ale nespadne.

Osobne to stejne delam tak, ze merge pouztim pouze na par k.u.
najednou, lip se tim pak pracuje v JOSM, je to prehlednejsi.

[1] 
http://www.cuzk.cz/Dokument.aspx?PRARESKOD=10MENUID=10015AKCE=DOC:10-CISE_KUAP
--
Lukas

___
Talk-cz mailing list
Talk-cz@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Import adres z katastralni mapy

2010-01-24 Tema obsahu Lukas Kabrt
 Asi ano, ale kdyz jsem osmosis zkousel, tak vzdycky spadnul na nejakou
 podovnou vyjimku. Pak jsem v rychlosti dospel k zaveru, ze asi ke sve
 cinnosti potrebuje nejakou DB (PostreSQL apod.) ... a to se mi
 nechtelo instalovat ... ale treba je to spatny zaver. Moc jsem to
 nezkoumal.

Urcite funguje i bez DB. pouzivam vyvojovou verzi 0.33 [1] a funguje
bez problemu. Musel jsem ale pouzit soubor osmosis.bat z predchozi
verze a dopnit do promenne EXEC pridat chybejci knihovnu
commons-compress-1.0.jar

[1] 
http://dev.openstreetmap.de:23457/hudson/job/osmosis-SNAPSHOT-ant/lastSuccessfulBuild/artifact/trunk/dist/
--
Lukas

___
Talk-cz mailing list
Talk-cz@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Import adres z katastralni mapy

2010-01-24 Tema obsahu Lukas Kabrt
 Co se týče skriptů, tak myslím, že je třeba se vydat jinou cestou.
 Pokud to jde alespoň trochu jednoduše udělat, tak by ten skript měl
 dokázat pracovat s celou mapou katastrálních území.

Problem to neni. Kdyz jsem program vytvarel, tak jsem nevedel o tom,
ze existuje vektorizovana mapa k.u. a tak jsem k.u. kreslil rucne.
Vzdycky jen par k.u., ktere jsem chtel zpracovat. Takze me rychlost
zpracovani OSM souboru nejak netrapila. Na vektorizovanou mapu jsem
narazil az kdyz jsem mel program hotovy a jeste jsem se nedostal k
tomu ho predelat - dalsi polozka do TODO listu :-)

Koukal jsem, ze by sla pouzit knihovna pro praci s OSM soubory z
programu Kosmos [1], takze s tim nakonec asi ani nebude tolik prace.

[1] http://wiki.openstreetmap.org/wiki/Kosmos
--
Lukas

___
Talk-cz mailing list
Talk-cz@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Import adres z katastralni mapy

2010-01-24 Tema obsahu Lukas Kabrt
 Pardon, myslel jsem dní.

 On Sun, 24 Jan 2010 08:46:16 +0100, Petr Dlouhý petr.dlo...@email.cz
 wrote:

 (mé velmi hrubé odhady se pohybují od 50 do 100 hodin jenom pro 2. fázi).

Jestli myslis cisteho vypocetniho casu, tak bych rekl, ze je to
pesimisticky odhad. Podle toho, jak rychle probiha vypocet u me, bych
to odhadnul na 30 - 50 dni. Limitujici je tady rychlost procesoru.
Nedavno jsem zkousel oblast cca 20 x 25 km a rozpoznavani bezelo neco
pres 5 hodin. Muj pocitac pritom neni zadne delo - Intel Core2 Duo @
2Ghz.

--
Lukas

___
Talk-cz mailing list
Talk-cz@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Import adres z katastralni mapy

2010-01-24 Tema obsahu Petr Dlouhý
To docela odpovídá. Já mám počítač ještě pomalejší, jednojádrový a podle  
něj jsem to odhadoval.
Každopádně je to poměrně dost, a chtělo by to možná zapojit i ty, kdo mají  
dost procesorového a málo osobního času.

On Sun, 24 Jan 2010 10:53:38 +0100, Lukas Kabrt lu...@kabrt.cz wrote:

 Jestli myslis cisteho vypocetniho casu, tak bych rekl, ze je to
 pesimisticky odhad. Podle toho, jak rychle probiha vypocet u me, bych
 to odhadnul na 30 - 50 dni. Limitujici je tady rychlost procesoru.
 Nedavno jsem zkousel oblast cca 20 x 25 km a rozpoznavani bezelo neco
 pres 5 hodin. Muj pocitac pritom neni zadne delo - Intel Core2 Duo @
 2Ghz.


-- 
Petr Dlouhý

___
Talk-cz mailing list
Talk-cz@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Import adres z katastralni mapy

2010-01-24 Tema obsahu Kubajz
Mam malo osobniho casu, ale jsem schopen pripravit virtualni masinu s 
debianem pro zajemce, ktery to uchodi. Je tam 2x2.8GHz XEON a 4GB 
pameti. Pokud by to pomohlo...

K

Dne 24.1.2010 10:58, Petr Dlouhý napsal(a):
 To docela odpovídá. Já mám počítač ještě pomalejší, jednojádrový a podle
 něj jsem to odhadoval.
 Každopádně je to poměrně dost, a chtělo by to možná zapojit i ty, kdo mají
 dost procesorového a málo osobního času.

 On Sun, 24 Jan 2010 10:53:38 +0100, Lukas Kabrtlu...@kabrt.cz  wrote:


 Jestli myslis cisteho vypocetniho casu, tak bych rekl, ze je to
 pesimisticky odhad. Podle toho, jak rychle probiha vypocet u me, bych
 to odhadnul na 30 - 50 dni. Limitujici je tady rychlost procesoru.
 Nedavno jsem zkousel oblast cca 20 x 25 km a rozpoznavani bezelo neco
 pres 5 hodin. Muj pocitac pritom neni zadne delo - Intel Core2 Duo @
 2Ghz.
  




___
Talk-cz mailing list
Talk-cz@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Import adres z katastralni mapy

2010-01-24 Tema obsahu Aleš Janda
Ahoj,

já bych se klidně přidal. Pendluju mezi 2jádrem a 3jádrem, obě poměrně výkonné 
a 
málo využité :-)
Výkon teď věnuju ti...@home, ale v tomhle vidím větší smysl. Stačilo by, kdyby 
nás bylo pár, a do dvou týdnů bysme to měli :-)

Program by měl jít ale přerušit a znova obnovit, neměl by to být jeden velký 
cyklus, aby šlo přecházet mezi počítači.

Jinak jak tu tak sleduju diskusi, tak velice chválím vaše počiny :-)

Aleš Janda


On 24.1.2010 10:58, Petr Dlouhý napsal/a:
 To docela odpovídá. Já mám počítač ještě pomalejší, jednojádrový a podle
 něj jsem to odhadoval.
 Každopádně je to poměrně dost, a chtělo by to možná zapojit i ty, kdo mají
 dost procesorového a málo osobního času.

 On Sun, 24 Jan 2010 10:53:38 +0100, Lukas Kabrtlu...@kabrt.cz  wrote:

 Jestli myslis cisteho vypocetniho casu, tak bych rekl, ze je to
 pesimisticky odhad. Podle toho, jak rychle probiha vypocet u me, bych
 to odhadnul na 30 - 50 dni. Limitujici je tady rychlost procesoru.
 Nedavno jsem zkousel oblast cca 20 x 25 km a rozpoznavani bezelo neco
 pres 5 hodin. Muj pocitac pritom neni zadne delo - Intel Core2 Duo @
 2Ghz.




___
Talk-cz mailing list
Talk-cz@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Import adres z katastralni mapy

2010-01-24 Tema obsahu Petr Dlouhý
Paměť není moc potřeba, takže to stejně potrvá kolem 20 dní.
Klidně to tam rozjedu, ale stejně se to musí rozdělit do čtverců o určité  
rozloze.

On Sun, 24 Jan 2010 11:09:38 +0100, Kubajz kub...@kbx.cz wrote:

 Mam malo osobniho casu, ale jsem schopen pripravit virtualni masinu s
 debianem pro zajemce, ktery to uchodi. Je tam 2x2.8GHz XEON a 4GB
 pameti. Pokud by to pomohlo...

 K

 Dne 24.1.2010 10:58, Petr Dlouhý napsal(a):
 To docela odpovídá. Já mám počítač ještě pomalejší, jednojádrový a podle
 něj jsem to odhadoval.
 Každopádně je to poměrně dost, a chtělo by to možná zapojit i ty, kdo  
 mají
 dost procesorového a málo osobního času.



-- 
Petr Dlouhý

___
Talk-cz mailing list
Talk-cz@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Import adres z katastralni mapy

2010-01-24 Tema obsahu Petr Dlouhý
Na OCR by paměť není moc potřeba. Klidně to tam rozběhnu.

On Sun, 24 Jan 2010 11:09:38 +0100, Kubajz kub...@kbx.cz wrote:

 Mam malo osobniho casu, ale jsem schopen pripravit virtualni masinu s
 debianem pro zajemce, ktery to uchodi. Je tam 2x2.8GHz XEON a 4GB
 pameti. Pokud by to pomohlo...


-- 
Petr Dlouhý

___
Talk-cz mailing list
Talk-cz@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-cz


[Talk-cz] Seznam katastralnich uzemi s umistenim

2010-01-24 Tema obsahu Martin Kupec
Dobry den,
na [1] si muzete stahnout body katastralnich uzemi.
Je jich 13012 a kat. uz. je 13027. Zbyle se mi nepodarilo najit
na mape, takze bude treba tech 15 relaci pojmenovat rucne.

Script kterym jsem to vytvarel jeste trochu projdu, procistim a
zverejnim nekde na webu(asi na hanojovem talku, kde uz nejaka
verze je).

Souradnicovy system je S-JTSK.

[1] http://exile.dobaledova.net/~magon/body_kat_uz

Martin


___
Talk-cz mailing list
Talk-cz@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Import adres z katastralni mapy

2010-01-24 Tema obsahu Jan Bilak
Nemyslím si, že je to háček. Mluví se o bezplatném převzetí od ČSÚ
(tedy, že není za to třeba platit ČSÚ). Ale nikoli o tom, že by se
data nesměla prodávat (bezplatných produktech, kde budou data použita,
nekomerční účely apod.).

Honza


2010/1/24 Petr Dlouhý petr.dlo...@email.cz:
 Háček je v tom bezplatně. U OSM nikdo nezakazuje, aby byla data
 prodávána. Je otázka, zdali se ale nejedná o úřední dílo - v tom případě
 by si ČSÚ takové podmínky diktovat asi nemohl.

 On Sun, 24 Jan 2010 04:46:05 +0100, Jan Bilak jan.bilak@gmail.com
 wrote:


 Veškeré údaje na internetových stránkách ČSÚ si může kdokoliv převzít
 pro své účely bezplatně, pouze s podmínkou, že uvede jako zdroj ČSÚ.
 Je doporučováno uvádět i datum, kdy údaje byly převzaty.


 --
 Petr Dlouhý

 ___
 Talk-cz mailing list
 Talk-cz@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/talk-cz


___
Talk-cz mailing list
Talk-cz@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Import adres z katastralni mapy

2010-01-24 Tema obsahu Jan Bilak
Já myslím, že hodně času žere spouštění nového procesu pro OCR. Pokud
lze OCRu předhodit obrázek, který bude obsahovat více textů (a pak
rozpoznat, co je co), nebo mu předhodit více obrázků (vícestránkový
dokument), tak by to mohlo jít rychleji. Přecijen OCRka se běžně
použivají na čtení hustého textu na A4 a s rozpoznání trvá chvilku.

Honza


Dne 24. ledna 2010 10:53 Lukas Kabrt lu...@kabrt.cz napsal(a):
 Pardon, myslel jsem dní.

 On Sun, 24 Jan 2010 08:46:16 +0100, Petr Dlouhý petr.dlo...@email.cz
 wrote:

 (mé velmi hrubé odhady se pohybují od 50 do 100 hodin jenom pro 2. fázi).

 Jestli myslis cisteho vypocetniho casu, tak bych rekl, ze je to
 pesimisticky odhad. Podle toho, jak rychle probiha vypocet u me, bych
 to odhadnul na 30 - 50 dni. Limitujici je tady rychlost procesoru.
 Nedavno jsem zkousel oblast cca 20 x 25 km a rozpoznavani bezelo neco
 pres 5 hodin. Muj pocitac pritom neni zadne delo - Intel Core2 Duo @
 2Ghz.

 --
 Lukas

 ___
 Talk-cz mailing list
 Talk-cz@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/talk-cz


___
Talk-cz mailing list
Talk-cz@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Import adres z katastralni mapy

2010-01-24 Tema obsahu Jan Bilak
Tady je .NETí wrapper nad DLL. Ale píší tam, že Tesseract má memory
leaky, takže to čas o času spadne. Ale nějaké dávky (více popisků
najednou) by to mohlo zvládnout.

http://www.pixel-technology.com/freeware/tessnet2/

Honza


2010/1/24 Jan Bilak jan.bilak@gmail.com:
 Já myslím, že hodně času žere spouštění nového procesu pro OCR. Pokud
 lze OCRu předhodit obrázek, který bude obsahovat více textů (a pak
 rozpoznat, co je co), nebo mu předhodit více obrázků (vícestránkový
 dokument), tak by to mohlo jít rychleji. Přecijen OCRka se běžně
 použivají na čtení hustého textu na A4 a s rozpoznání trvá chvilku.

 Honza


 Dne 24. ledna 2010 10:53 Lukas Kabrt lu...@kabrt.cz napsal(a):
 Pardon, myslel jsem dní.

 On Sun, 24 Jan 2010 08:46:16 +0100, Petr Dlouhý petr.dlo...@email.cz
 wrote:

 (mé velmi hrubé odhady se pohybují od 50 do 100 hodin jenom pro 2. fázi).

 Jestli myslis cisteho vypocetniho casu, tak bych rekl, ze je to
 pesimisticky odhad. Podle toho, jak rychle probiha vypocet u me, bych
 to odhadnul na 30 - 50 dni. Limitujici je tady rychlost procesoru.
 Nedavno jsem zkousel oblast cca 20 x 25 km a rozpoznavani bezelo neco
 pres 5 hodin. Muj pocitac pritom neni zadne delo - Intel Core2 Duo @
 2Ghz.

 --
 Lukas

 ___
 Talk-cz mailing list
 Talk-cz@openstreetmap.org
 http://lists.openstreetmap.org/listinfo/talk-cz



___
Talk-cz mailing list
Talk-cz@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Soubor cr.map pro import adres

2010-01-24 Tema obsahu Petr Dlouhý
Ahoj,

tak už se mi to snad podařilo spojit [1]. Dělám to na základě názvu okresu  
a obce a podobnosti jména katastrálního území.
Používám k tomu seznam katastrálních území ze stránek CUZK a seznam ulic  
ze stránek MVČR, takže jestli si někdo myslí, že je to problém, tak  
řekněte. Osobně si myslím, že data z CUZK pouze použijeme a do mapy  
nebudeme importovat, takže to snad nevadí.

Prosím zkontrolujte, jestli přiřazemí proběhlo dobře.

[1] http://www.flyshare.cz/stahni/45772/addr_map.tar.bz2

On Sun, 24 Jan 2010 02:35:24 +0100, Petr Dlouhý petr.dlo...@email.cz  
wrote:

 2) Nepodařilo se mi najít žádný klíč, podle kterého by bylo možné spojit
 databáze MVČR a CUZK. Do parametru name elementu territory jsem tedy
 doplnil jméno oblasti. Je tedy nutné doplnit tam u něčeho, pokud se
 jméno katastrálního území liší.


-- 
Petr Dlouhý

___
Talk-cz mailing list
Talk-cz@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Import adres z katastralni mapy

2010-01-24 Tema obsahu Petr Dlouhý

Ahoj,

stačí použít Dictionary, a už to funguje rozumě rychle (i když celá ČR asi
ještě ne - po minutě mi zabrala celou paměť).
Opravil jsem i pády při chybějících relacích, i když oprava je dost
quickdirty.

Posílám zdrojáky změněných souborů i funkční program.

On Sun, 24 Jan 2010 10:37:08 +0100, Lukas Kabrt lu...@kabrt.cz wrote:



Problem to neni. Kdyz jsem program vytvarel, tak jsem nevedel o tom,
ze existuje vektorizovana mapa k.u. a tak jsem k.u. kreslil rucne.
Vzdycky jen par k.u., ktere jsem chtel zpracovat. Takze me rychlost
zpracovani OSM souboru nejak netrapila. Na vektorizovanou mapu jsem
narazil az kdyz jsem mel program hotovy a jeste jsem se nedostal k
tomu ho predelat - dalsi polozka do TODO listu :-)

Koukal jsem, ze by sla pouzit knihovna pro praci s OSM soubory z
programu Kosmos [1], takze s tim nakonec asi ani nebude tolik prace.

[1] http://wiki.openstreetmap.org/wiki/Kosmos
--
Lukas

___
Talk-cz mailing list
Talk-cz@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-cz



--
Petr Dlouhý

CUZK.MergeDBWithPoints.tar.gz
Description: GNU Zip compressed data
___
Talk-cz mailing list
Talk-cz@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Import adres z katastralni mapy

2010-01-24 Tema obsahu hanoj
 Nemyslím si, že je to háček. Mluví se o bezplatném převzetí od ČSÚ
 (tedy, že není za to třeba platit ČSÚ). Ale nikoli o tom, že by se
 data nesměla prodávat (bezplatných produktech, kde budou data použita,
 nekomerční účely apod.).
*** take to tak vnimam, zvlaste po rozhovorech s VUV TGM... Oni neco
jako open source neznaji a nemluvi k nemu.

hanoj

___
Talk-cz mailing list
Talk-cz@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Import adres z katastralni mapy

2010-01-24 Tema obsahu hanoj
 A ČSÚ má mimo jiné na svých stránkách i mapy ... ale většina věcí je
 tam stejná s katastrem. Např.:
 http://apl.czso.cz/irso/mapa.jsp?budId=207400obrprvId=184459
*** ty mapy jsou mashup. Velka cast se taha z CUZK!
hanoj

___
Talk-cz mailing list
Talk-cz@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-cz