Re: [Talk-cz] Nedělitelná mezera v OSM datech
Cus, ja bych to neresil. Je to vec renederu. To jaky jazyk je primarni muze snadno zjistit - bud tak, ze se podiva s jakym lang tagem se shoduje, nebo tak, ze se podiva uvnitr jakych hranic lezi. Jak bylo zmineno, to pak zacnem resit jestli se spravne deli slova, co je spojka a co predlozka ... Ono tohle porcovani podle mezer nefunguje spravne prakticky v zadnem existujicim jazyce. Apropos, kdyz uz to zminujes … typograficky spravne by si nemel pouzivat "anglicky" ale „cesky“ uvozovky (a ja bych mel psat nabodenicka), stejne tak by se nemelo pouzivat spojovnik - ale pomlcka –(—) jedno pripadne dvouctvercikova, pripadne minus − (i kdyz to tak nevypada sou to 4 ruzny znaky) ... ;D Takovej vyber (vazne nevim jak to dopadne v tom mailu), je to popiska, znak (pokud je zobrazovanej), alt sekvence, hexa kod a html entita. Uvozovky rovné uvozovky (na klávesnici) " 0034x0022 " spodní uvozovky „ 0132x201E „ horní uvozovky “ 0147x201C “ spodní jednoduchá uvozovka ‚ 0130x201A horní jednoduchá uvozovka ‘ 0145x2018 apostrof’ 0146x2019 ’ ’ francouzká otevírací uvozovka » 0187x00BB » francouzká uzavírací uvozovka « 0171x00AB « Matematika X krát × 0215x00D7 × děleno ÷ 0247x00F7 ÷ plus (na klávesnici)+ 0043x002B + mínus − 8722x2212 − plus mínus ± 0177x00B1 ± stupně ° 0176x00B0 ° zeměpisné minuty′ 2032x2032 ′ promile ‰ 8240x2030 ‰ spojovník (na klávesnici) - 0045x002D rozdělovník = spojovník xx 0173 pomlčka – 0150– dlouhá pomlčka — 0151— výpustka… 0133… nedělitelná mezera x x 0160 narození* úmrtí † 0134† euro€ 8364€ copyright © 0169© registrovaná značka ® 0174® m2 ㎡ 13217 Dne 17.1.2017 v 8:45 Lukáš Karas napsal(a): Ahoj, o víkendu autor OSM Scout knihovny přidal užitečnou funkcionalitu - zalamování dlouhých popisků do více řádků. Dle očekávání se ale názvy zalamují v místech kde vykreslovací engine uzná za vhodné, nikoliv tam kde je to správně (předložky zůstávají na konci řádku), například: Libčice nad Vltavou Týnec nad Sázavou Tam lze "nad" na konci řádku ještě tolerovat i když mě osobně se nelibí, ale u "u": Nová ves u Chýnova Je to typograficky špatně. Stejným neduhem trpí i Mapnik. Moje otázka zní, zda-li je žádoucí do OSM přidávat na taková místa nedělitelné mezery (v xml " ", unicode znak U+00A0) a existuje na to nějaký postup jak to provést hromadně? Poradí si s tím běžné editory? Neztratí se ta mezera při první editaci? Pokud i s nedělitelnou mezerou to renderer zalomí špatně, je potřeba opravit renderer, ale bez ní nemá prostě šanci cokoliv hádat... Lukáš ___ Talk-cz mailing list Talk-cz@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-cz ___ Talk-cz mailing list Talk-cz@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-cz
Re: [Talk-cz] Nedělitelná mezera v OSM datech
Osobně se z ryze praktických důvodů přikláním k tomu, to zatím ignorovat. I pokud bychom to opravili, nevěřím tomu, že nám to mobilní editory a jejich uživatelé zase zpátky při případné editaci nezmění zpátky. Pokud budeme mít štěstí, zůstanou názvy měst a obcí, ale u ostatních jmen si nedělám iluze ohledně toho, že by tam nedělitelná mezera zůstala dlouho. Připadá mi, že je to dost práce s velice nejistým výsledkem. V skrytu duše doufám, že render bude časem inteligentnější. Tipla bych si, že slovo o jednom až třech písmenech se zalomením za sebou je chyba v dost jazycích (nebo je to jedno jestli zalomit před či za). Ale vzhledem k tomu, že se ignoruje podle mě větší chyba, a to zalamování jmen měst s pomlčkami, protože to berou jako rozdělovací znaménko, moc naděje si v nejbližší době nedělám. Majka ___ Talk-cz mailing list Talk-cz@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-cz
Re: [Talk-cz] Nedělitelná mezera v OSM datech
Ahoj, jsem proti. Forma by měla být oddělena od obsahu. Zalamování řádek, dělení slov, skloňování a časování ať je záležitostí zpracování dat, ne jejich uložení. 2017-01-17 11:34 GMT+01:00 Lukáš Karas : > Ta pravidla, která mezera může být dělitelná a která nemůže, se mohou > lišit podle jazyka. Renderer (...) by v takovém případě musel hádat v jakém > jazyce je dané jméno > Není od toho v OSM jazykový prefix? H. ___ Talk-cz mailing list Talk-cz@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-cz
[Talk-cz] WeeklyOSM CZ 338
Ahoj, je dostupné vydání 338 týdeníku WeeklyOSM: http://www.weeklyosm.eu/cz/archives/8595 * Placené úseky na D8. * Mapa osvětlení ulic. * Jarní mapping party SK. * Zdrojáky freemap.sk * Tester adres Regio OSM. * Další rozšíření HDYC. * OSM a ženská obřízka. * Uber a OSM. Pěkné počtení ... ___ Talk-cz mailing list Talk-cz@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-cz
Re: [Talk-cz] Nedělitelná mezera v OSM datech
Ahoj, On 01/17/17 11:13, Miroslav Suchy wrote: Dne 17.1.2017 v 08:45 Lukáš Karas napsal(a): Moje otázka zní, zda-li je žádoucí do OSM přidávat na taková místa nedělitelné mezery (v xml " ", unicode znak U+00A0) Osobně bych byl proti. To bychom tam pak mohli pridavat i hinty, kde rozdelovat slova Nove Mesto na Mo- rave to už je overkill - nepíšeme v devanagari, abychom potřebovali znaky pro ZWNBJ a ZWJ. Oproti tomu nedělitelná mezera v češtině dává smysl. Pokud i s nedělitelnou mezerou to renderer zalomí špatně, je potřeba opravit renderer, ale bez ní nemá prostě šanci cokoliv hádat... Ony existuji jeste i "narrow NBSP", pouzivaji se napr. ve francouzstine. To taky, ale pro češtinu se to nepoužívá; takových je povícero: https://en.wikipedia.org/wiki/Whitespace_character#Unicode Každopádně by se to *teoreticky* mělo chovat všechno jako whitespace, leč: 1. podpora ze strany nástrojů (taky *teoreticky* funkční, ale vsadil bych se, že netestovaná - tohle je moje oblíbená třída bugů) a 2. podpora v tagování - chceme masivně přejmenovávat jak v jednadevadesátým? ;) (Osobně bych řekl, že ne) Ja bych to osobne nechal na renderu. Renderer má k dispozici jenom heuristiku, což vede k problematickýmu věštění z koule typu "končí -a, takže ženský rod, is_in: CZ a má tam *nad*, takže za to narvem NBSP" - navíc si to věštění z koule musí každý renderer znovu implementovat (po svým?). Takže bych se těm hintům nebránil, a klidně bych to u těch různých Dlouhojmenovic nad Labem a Vedle Kopce u Dálnice zaváděl - ale postupně, netřeba to narvat do db po importním způsobu. Honza "Piškvor" Martinec ___ Talk-cz mailing list Talk-cz@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-cz
Re: [Talk-cz] Nedělitelná mezera v OSM datech
Ta pravidla, která mezera může být dělitelná a která nemůže, se mohou lišit podle jazyka. Renderer (v případě osmscout bych to spíš dal na starosti importu) by v takovém případě musel hádat v jakém jazyce je dané jméno a musel by si udržovat pravidla pro různé jazyky... Samozřejmě by to šlo zjednodušit a dát nedělitelnou mezeru za všechna jednopísmenná slova... Lukáš Dne úterý 17. ledna 2017 11:13:05 CET Miroslav Suchy napsal(a): > Dne 17.1.2017 v 08:45 Lukáš Karas napsal(a): > > Moje otázka zní, zda-li je žádoucí do OSM přidávat na taková místa > > nedělitelné mezery (v xml " ", unicode znak U+00A0) > > Osobně bych byl proti. To bychom tam pak mohli pridavat i hinty, kde > rozdelovat slova Nove Mesto na Mo- > rave > > > Pokud i s nedělitelnou mezerou to renderer zalomí špatně, je potřeba > > opravit renderer, ale bez ní nemá prostě šanci cokoliv hádat... > > Ony existuji jeste i "narrow NBSP", pouzivaji se napr. ve francouzstine. > > Samozrejme ze ma sanci. Napriklad pro TeX existuji makra, ktere to doplnuji. > http://tex.stackexchange.com/questions/46955/is-there-way-to-put-hard-space > -after-defined-words > > Ja bych to osobne nechal na renderu. > > Mirek > > ___ > Talk-cz mailing list > Talk-cz@openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz signature.asc Description: This is a digitally signed message part. ___ Talk-cz mailing list Talk-cz@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-cz
Re: [Talk-cz] Nedělitelná mezera v OSM datech
Dne 17.1.2017 v 08:45 Lukáš Karas napsal(a): > Moje otázka zní, zda-li je žádoucí do OSM přidávat na taková místa > nedělitelné > mezery (v xml " ", unicode znak U+00A0) Osobně bych byl proti. To bychom tam pak mohli pridavat i hinty, kde rozdelovat slova Nove Mesto na Mo- rave > Pokud i s nedělitelnou mezerou to renderer zalomí špatně, je potřeba opravit > renderer, ale bez ní nemá prostě šanci cokoliv hádat... Ony existuji jeste i "narrow NBSP", pouzivaji se napr. ve francouzstine. Samozrejme ze ma sanci. Napriklad pro TeX existuji makra, ktere to doplnuji. http://tex.stackexchange.com/questions/46955/is-there-way-to-put-hard-space-after-defined-words Ja bych to osobne nechal na renderu. Mirek ___ Talk-cz mailing list Talk-cz@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-cz