Re: [Talk-cz] Nedělitelná mezera v OSM datech - poznámka na okraj

2017-01-31 Tema obsahu Jan Martinec
Já bych si dovolil tvrdit něco jiného: Můžeme s tím nesouhlasit, můžeme o tom diskutovat, ale to je situace, kterou s Unicode a s UTF8 už teď máme, a je to stav odpovídající specifikaci unikodu, tj.ne chyba k opravě. Volat "fuj fuj hack nechci to" je sice možný názor, ale jakou navrhuješ

Re: [Talk-cz] Nedělitelná mezera v OSM datech - poznámka na okraj

2017-01-31 Tema obsahu Pavel Machek
On Fri 2017-01-20 20:19:31, Jan Martinec wrote: > (A když jsme u toho párování, porovnávání a podobných mňamek, __normalizace > velkých písmen už teď zdaleka nestačí__ - je třeba používat nástroje, který > má daný jazyk pro Unicode. Ne proto, že by to jinak nešlo, ale proto, že to > tuhle práci

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-20 Tema obsahu Marián Kyral
Dne 20.1.2017 v 12:06 Mikoláš Štrajt napsal(a): > Tak vyzkoušeno v praxi: > > https://www.openstreetmap.org/changeset/45323834 > > A skutečně se to na hlavní mapě projevilo, viz screenshot před úpravou: > > http://imgur.com/a/JhY8J > > a po úpravě: > > http://imgur.com/a/gvOyL > > -- > Severák >

Re: [Talk-cz] Nedělitelná mezera v OSM datech - poznámka na okraj

2017-01-20 Tema obsahu Marián Kyral
Dne 20.1.2017 v 21:17 Jan Martinec napsal(a): > Jo pardon, je to novotvar vytvořený Opráski Sčeskí Historje. > Evidentně ho používám, aniž bych si to uvědomil. > Zde starší (2012) > varianta: http://historje.tumblr.com/post/36601048973/mitlologické-počátki >

Re: [Talk-cz] Nedělitelná mezera v OSM datech - poznámka na okraj

2017-01-20 Tema obsahu Marián Kyral
-- Původní zpráva -- Od: Jan Martinec <j...@martinec.name> Komu: OpenStreetMap Czech Republic <talk-cz@openstreetmap.org> Datum: 20. 1. 2017 20:21:09 Předmět: Re: [Talk-cz] Nedělitelná mezera v OSM datech - poznámka na okraj " ...protože to první jsou čtyři

Re: [Talk-cz] Nedělitelná mezera v OSM datech - poznámka na okraj

2017-01-20 Tema obsahu Jan Martinec
(A když jsme u toho párování, porovnávání a podobných mňamek, __normalizace velkých písmen už teď zdaleka nestačí__ - je třeba používat nástroje, který má daný jazyk pro Unicode. Ne proto, že by to jinak nešlo, ale proto, že to tuhle práci udělá samo, i pro případy, který by mě ani nenapadly. Což

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-20 Tema obsahu Jan Martinec
Ahoj, To jsme zase zpátky hledání problému pro řešení - pokud je ten datový zdroj s jakoukoli Unicode collation (mimo *_bin), tj. stávající stav, tak to bude hledat i porovnávat bez ohledu na diakritiku, velká a malá písmena, a dokonce i "exotické" whitespacy. (Exhibit A: Nominatim, zkuste si v

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-20 Tema obsahu Lukáš Karas
Tak tento problém musí všichni řešit už nyní. A nemusíš ani chtít párovat OSM s jinými daty, ale třeba jen strojově vytvořit strom adres z OSM dat... Například máme název ulice "Pod Lipami" [1] ale adresní nody mají v "addr:street" hodnotu "Pod lipami" [2]. Takže musíš minimálně normalizovat

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-20 Tema obsahu jzvc
Dne 19.1.2017 v 21:36 Jan Macura napsal(a): //pardon, odeslal jsem mail předčasně 2017-01-19 9:01 GMT+01:00 Lukáš Karas >: Ano, zalomení řádku je forma (pokud nepíši poezii). Ale nikdo nechce do osm dat dávat konce řádku do

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-20 Tema obsahu Karel Volný
On Thursday 19 January 2017 17:56:38 Matěj Cepl wrote: > On 2017-01-19, 08:11 GMT, Mikoláš Štrajt wrote: > > skutečně toto vše? - takže bychom vlastně neměli mít "Libčice > > nad Vltavou" ale "Libčice nad Vltava"? :-) > > Ale ta vesnice se tak nejmenuje! > > Matěj jistě, vesnice se tak

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-20 Tema obsahu Jan Martinec
On 01/20/17 13:18, Lukáš Karas wrote: Ano, lidé na to budou zapmínat a dělat chyby. Stejně jako nyní se může stát že někdo napíše název bez diakritiky. Jak chceš indickému nebo čínskému vývojáři vysvětlit že by měl do svého rendereru integrovat processor pro vkládání pevných mezer do českých

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-20 Tema obsahu Lukáš Karas
. ledna 2017 10:00:21 CET Marián Kyral napsal(a): > -- Původní zpráva -- > Od: Pavel Machek <pa...@ucw.cz> > Komu: OpenStreetMap Czech Republic <talk-cz@openstreetmap.org> > Datum: 20. 1. 2017 9:33:43 > Předmět: Re: [Talk-cz] Nedělitelná mezera v OSM datech

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-20 Tema obsahu Mikoláš Štrajt
: Pavel Machek <pa...@ucw.cz> Komu: OpenStreetMap Czech Republic <talk-cz@openstreetmap.org> Datum: 20. 1. 2017 10:21:12 Předmět: Re: [Talk-cz] Nedělitelná mezera v OSM datech "Ahoj! > Od: Pavel Machek <pa...@ucw.cz> > Komu: OpenStreetMap Czech Republic <talk-cz@openst

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-20 Tema obsahu Pavel Machek
Ahoj! > Od: Pavel Machek > Komu: OpenStreetMap Czech Republic > "On Thu 2017-01-19 17:57:44, Marián Kyral wrote: > > Ahoj, > > za sebe jako za uživatele k tomu můžu říct, že v běžném životě typografii > > > vůbec neřeším. Ona ta nezalomitelná mezera

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-20 Tema obsahu Marián Kyral
-- Původní zpráva -- Od: Pavel Machek <pa...@ucw.cz> Komu: OpenStreetMap Czech Republic <talk-cz@openstreetmap.org> Datum: 20. 1. 2017 9:33:43 Předmět: Re: [Talk-cz] Nedělitelná mezera v OSM datech "On Thu 2017-01-19 17:57:44, Marián Kyral wrote: > Ahoj

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-20 Tema obsahu Mikoláš Štrajt
-- Původní zpráva -- Od: Pavel Machek <pa...@ucw.cz> Komu: OpenStreetMap Czech Republic <talk-cz@openstreetmap.org> Datum: 20. 1. 2017 9:33:42 Předmět: Re: [Talk-cz] Nedělitelná mezera v OSM datech "On Thu 2017-01-19 17:57:44, Marián Kyral wrote: > Ahoj

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-20 Tema obsahu Martin Ždila
Podľa mňa dávať do názvov tvrdé medzery zmysel má. Veď na tento účel vlastne tú tvrdú medzeru vymysleli. -- Ing. Martin Ždila OZ Freemap Slovakia tel:+421-908-363-848 mailto:martin.zd...@freemap.sk http://www.freemap.sk/

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-20 Tema obsahu Pavel Machek
On Thu 2017-01-19 17:57:44, Marián Kyral wrote: > Ahoj, > za sebe jako za uživatele k tomu můžu říct, že v běžném životě typografii > vůbec neřeším. Ona ta nezalomitelná mezera je stejně jen pomůcka pro > programy. Normálně není vidět a já fakt nechci řešit dilema, jestli tam > přijde taková

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-19 Tema obsahu Jan Macura
//pardon, odeslal jsem mail předčasně 2017-01-19 9:01 GMT+01:00 Lukáš Karas : > Ano, zalomení řádku je forma (pokud nepíši poezii). Ale nikdo nechce do osm > dat dávat konce řádku do názvů - tedy to kde zalomit. Ale bavíme se o > pevných > mezerách. Tedy kde nezalomit. Je

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-19 Tema obsahu Jan Macura
Ahoj, 2017-01-19 9:01 GMT+01:00 Lukáš Karas : > A proboha, v OSM vytváříme věci ve strojově čitelné podobě, zakládáme mezi > objekty relace aby je bylo možné strojově zpracovat. A najednou, pokud chci > aby i texty byly ve strojově zpracovatelné formě, tak je to špatně? >

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-19 Tema obsahu Matěj Cepl
On 2017-01-19, 08:11 GMT, Mikoláš Štrajt wrote: > skutečně toto vše? - takže bychom vlastně neměli mít "Libčice > nad Vltavou" ale "Libčice nad Vltava"? :-) Ale ta vesnice se tak nejmenuje! Matěj -- https://matej.ceplovi.cz/blog/, Jabber: mc...@ceplovi.cz GPG Finger: 3C76 A027 CA45 AD70 98B5

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-19 Tema obsahu Marián Kyral
renderery na výstupu. Marián -- Původní zpráva -- Od: Ladislav Laska <la...@kam.mff.cuni.cz> Komu: OpenStreetMap Czech Republic <talk-cz@openstreetmap.org> Datum: 19. 1. 2017 9:46:35 Předmět: Re: [Talk-cz] Nedělitelná mezera v OSM datech "Ahoj, nemám zrovna chu

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-19 Tema obsahu Petr Kadlec
Ahoj˝, 2017-01-18 22:35 GMT+01:00 Jan Macura : > 2017-01-18 10:03 GMT+01:00 Karel Volný : > >> obecně souhlas, akorát se neshodneme v tom, co je obsah a co je forma >> > > Zalomení řádku je záležitost formy. Při každém zpracování textu může > dopadnout jinak

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-19 Tema obsahu Ladislav Laska
Ahoj, nemám zrovna chuť polemizovat nad tím, co je správné a rozumné (není na to totiž Jediná Správná Odpověď (TM) ). Nicméně k editorům: Merkaartor si s tím poradí: Pokud vložíš nezalamující mezeru (jako unicode znak), tak ji hezky uploaduje na server, z tama si ji potom vyzvedne a ani při

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-19 Tema obsahu Mikoláš Štrajt
" " > Zalamování řádek, dělení slov, skloňování a časování ať je záležitostí > zpracování dat, ne jejich uložení. skutečně toto vše? - takže bychom vlastně neměli mít "Libčice nad Vltavou" ale "Libčice nad Vltava"? :-) " Heh, napsal jsem to moc obecně :-) Jasně, že v našem případě

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-19 Tema obsahu Lukáš Karas
Souhlasím, ale mám pocit že oba máme na mysli něco jiného. Dne středa 18. ledna 2017 22:35:16 CET Jan Macura napsal(a): > Ahoj, > > 2017-01-18 10:03 GMT+01:00 Karel Volný : > > obecně souhlas, akorát se neshodneme v tom, co je obsah a co je forma > > Zalomení řádku je

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-18 Tema obsahu Jan Macura
Ahoj, 2017-01-18 10:03 GMT+01:00 Karel Volný : > obecně souhlas, akorát se neshodneme v tom, co je obsah a co je forma > Zalomení řádku je záležitost formy. Při každém zpracování textu může dopadnout jinak (jinde). Obsah je na formátování řádek nezávislý. Takže medle celá

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-18 Tema obsahu Petr Kadlec
Ahoj, souhlas třeba s Kavolem. Do názvu Nová Ves u Chýnova nezlomitelná mezera patří, proto tam má být i v OSM. Do názvu Týnec nad Sázavou nezlomitelná mezera nepatří, proto tam nemá být ani v OSM. Nemá to nic společného s renderery a správným vykreslováním, ale prostě s tím, že se to tak má psát

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-18 Tema obsahu Jan Martinec
některé bílé znaky > nejsou validní v XML. > > -- Mikoláš Štrajt / Severák / http://severak.svita.cz/ > > PS: můj renderer "vykresluje" celé názvy na jednom řádku > > -- Původní zpráva -- > Od: LukášKaras <lukas.ka...@centrum.cz> > Komu: tal

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-18 Tema obsahu Mikoláš Štrajt
-- Původní zpráva -- Od: LukášKaras <lukas.ka...@centrum.cz> Komu: talk-cz@openstreetmap.org Datum: 17. 1. 2017 8:47:10 Předmět: [Talk-cz] Nedělitelná mezera v OSM datech "Ahoj, o víkendu autor OSM Scout knihovny přidal užitečnou funkcionalitu - zalamování dlouhých popisků do více řá

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-18 Tema obsahu Jan Martinec
Zrovna co se týče vyhledávání, tak není třeba se obávat: pokud má Nominatim Unicode collation (spoiler: má), tak můžeš zadávat nejen normální mezery, ale dokonce můžeš zadat "usti nad labem" bez diakritiky, a stejně to matchne "Ústí nadLabem", páč whitespace jako whitespace. Máme už století

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-18 Tema obsahu majka
No, já bych měla ještě jeden argument proti, a to opět mobilní aplikace užívající OSM data. Pokud dám do názvu pevnou mezeru, tak to v první fázi podle mě bude znamenat, že jí to bude očekávat i při vyhledávání. Na mobilu si dost dobře nedokážu představit. A ve svojí adrese bych jí měla hned jako

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-18 Tema obsahu Karel Volný
čus, > Forma by měla být oddělena od obsahu. obecně souhlas, akorát se neshodneme v tom, co je obsah a co je forma já nedělitelnou mezeru považuju za obsah, úplně stejně jako mezeru normální nebo téměř jakýkoliv jiný znak - přeci nejde o to, jak vypadá, ale jaký má v textu význam ... v

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-18 Tema obsahu Lukáš Karas
Ahoj. Děkuji všem za názory. Osobně si myslím že konkrétně pevné mezery do OSM patří. Stejně tak by měly být součástí běžných textů, jako třeba maily. To že to automatické korekce často neopravují a lidé běžně explicitně nepíší je jiná věc, ale je to pro mě hlavní argument proti. Lidé je

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-17 Tema obsahu jzvc
Cus, ja bych to neresil. Je to vec renederu. To jaky jazyk je primarni muze snadno zjistit - bud tak, ze se podiva s jakym lang tagem se shoduje, nebo tak, ze se podiva uvnitr jakych hranic lezi. Jak bylo zmineno, to pak zacnem resit jestli se spravne deli slova, co je spojka a co

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-17 Tema obsahu majka
Osobně se z ryze praktických důvodů přikláním k tomu, to zatím ignorovat. I pokud bychom to opravili, nevěřím tomu, že nám to mobilní editory a jejich uživatelé zase zpátky při případné editaci nezmění zpátky. Pokud budeme mít štěstí, zůstanou názvy měst a obcí, ale u ostatních jmen si nedělám

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-17 Tema obsahu Jan Macura
Ahoj, jsem proti. Forma by měla být oddělena od obsahu. Zalamování řádek, dělení slov, skloňování a časování ať je záležitostí zpracování dat, ne jejich uložení. 2017-01-17 11:34 GMT+01:00 Lukáš Karas : > Ta pravidla, která mezera může být dělitelná a která nemůže, se

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-17 Tema obsahu Jan Martinec
Ahoj, On 01/17/17 11:13, Miroslav Suchy wrote: Dne 17.1.2017 v 08:45 Lukáš Karas napsal(a): Moje otázka zní, zda-li je žádoucí do OSM přidávat na taková místa nedělitelné mezery (v xml "", unicode znak U+00A0) Osobně bych byl proti. To bychom tam pak mohli pridavat i hinty, kde rozdelovat

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-17 Tema obsahu Lukáš Karas
Ta pravidla, která mezera může být dělitelná a která nemůže, se mohou lišit podle jazyka. Renderer (v případě osmscout bych to spíš dal na starosti importu) by v takovém případě musel hádat v jakém jazyce je dané jméno a musel by si udržovat pravidla pro různé jazyky... Samozřejmě by to šlo

Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-17 Tema obsahu Miroslav Suchy
Dne 17.1.2017 v 08:45 Lukáš Karas napsal(a): > Moje otázka zní, zda-li je žádoucí do OSM přidávat na taková místa > nedělitelné > mezery (v xml "", unicode znak U+00A0) Osobně bych byl proti. To bychom tam pak mohli pridavat i hinty, kde rozdelovat slova Nove Mesto na Mo- rave > Pokud i s

[Talk-cz] Nedělitelná mezera v OSM datech

2017-01-16 Tema obsahu Lukáš Karas
Ahoj, o víkendu autor OSM Scout knihovny přidal užitečnou funkcionalitu - zalamování dlouhých popisků do více řádků. Dle očekávání se ale názvy zalamují v místech kde vykreslovací engine uzná za vhodné, nikoliv tam kde je to správně (předložky zůstávají na konci řádku), například: Libčice nad