Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-17 Tema obsahu jzvc

Cus,

ja bych to neresil. Je to vec renederu. To jaky jazyk je primarni muze 
snadno zjistit - bud tak, ze se podiva s jakym lang tagem se shoduje, 
nebo tak, ze se podiva uvnitr jakych hranic lezi.



Jak bylo zmineno, to pak zacnem resit jestli se spravne deli slova, co 
je spojka a co predlozka ...


Ono tohle porcovani podle mezer nefunguje spravne prakticky v zadnem 
existujicim jazyce.


Apropos, kdyz uz to zminujes … typograficky spravne by si nemel pouzivat 
"anglicky" ale „cesky“ uvozovky (a ja bych mel psat nabodenicka), stejne 
tak by se nemelo pouzivat spojovnik - ale pomlcka –(—) jedno pripadne 
dvouctvercikova, pripadne minus − (i kdyz to tak nevypada sou to 4 ruzny 
znaky)  ... ;D




Takovej vyber (vazne nevim jak to dopadne v tom mailu), je to popiska, 
znak (pokud je zobrazovanej), alt sekvence, hexa kod a html entita.


Uvozovky
rovné uvozovky (na klávesnici)  "  0034x0022   "
spodní uvozovky „   0132x201E   „
horní uvozovky  “   0147x201C   “
spodní jednoduchá uvozovka  ‚   0130x201A   
horní jednoduchá uvozovka   ‘   0145x2018   
apostrof’   0146x2019   ’ ’
francouzká otevírací uvozovka   »   0187x00BB   »
francouzká uzavírací uvozovka   «   0171x00AB   «

Matematika
X krát  ×   0215x00D7   ×
děleno  ÷   0247x00F7   ÷
plus (na klávesnici)+   0043x002B   +
mínus   −   8722x2212   −
plus mínus  ±   0177x00B1   ±
stupně  °   0176x00B0   °
zeměpisné minuty′   2032x2032   ′
promile ‰   8240x2030   ‰
spojovník (na klávesnici)   -   0045x002D   
rozdělovník = spojovník x­x 0173­
pomlčka –   0150–
dlouhá pomlčka  —   0151—
výpustka…   0133…
nedělitelná mezera  x x 0160 
narození*   
úmrtí   †   0134†
euro€   8364€
copyright   ©   0169©
registrovaná značka ®   0174®
m2  ㎡   13217   


Dne 17.1.2017 v 8:45 Lukáš Karas napsal(a):

Ahoj, o víkendu autor OSM Scout knihovny přidal užitečnou funkcionalitu
  - zalamování dlouhých popisků do více řádků. Dle očekávání se ale názvy
zalamují v místech kde vykreslovací engine uzná za vhodné, nikoliv tam kde
je to správně (předložky zůstávají na konci řádku), například:

Libčice nad
   Vltavou

  Týnec nad
   Sázavou

Tam lze "nad" na konci řádku ještě tolerovat i když mě osobně se nelibí,
ale u "u":

Nová ves u
  Chýnova

Je to typograficky špatně. Stejným neduhem trpí i Mapnik.

Moje otázka zní, zda-li je žádoucí do OSM přidávat na taková místa nedělitelné
mezery (v xml " ", unicode znak U+00A0) a existuje na to nějaký postup
jak to provést hromadně? Poradí si s tím běžné editory? Neztratí se ta mezera
při první editaci?

Pokud i s nedělitelnou mezerou to renderer zalomí špatně, je potřeba opravit
renderer, ale bez ní nemá prostě šanci cokoliv hádat...

Lukáš



___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz




___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-17 Tema obsahu majka
Osobně se z ryze praktických důvodů přikláním k tomu, to zatím ignorovat.

I pokud bychom to opravili, nevěřím tomu, že nám to mobilní editory a
jejich uživatelé zase zpátky při případné editaci nezmění zpátky. Pokud
budeme mít štěstí, zůstanou názvy měst a obcí, ale u ostatních jmen si
nedělám iluze ohledně toho, že by tam nedělitelná mezera zůstala dlouho.
Připadá mi, že je to dost práce s velice nejistým výsledkem.

V skrytu duše doufám, že render bude časem inteligentnější. Tipla bych si,
že slovo o jednom až třech písmenech se zalomením za sebou je chyba v dost
jazycích (nebo je to jedno jestli zalomit před či za). Ale vzhledem k tomu,
že se ignoruje podle mě větší chyba, a to zalamování jmen měst s pomlčkami,
protože to berou jako rozdělovací znaménko, moc naděje si v nejbližší době
nedělám.

Majka
___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-17 Tema obsahu Jan Macura
Ahoj, jsem proti.

Forma by měla být oddělena od obsahu.
Zalamování řádek, dělení slov, skloňování a časování ať je záležitostí
zpracování dat, ne jejich uložení.

2017-01-17 11:34 GMT+01:00 Lukáš Karas :

> Ta pravidla, která mezera může být dělitelná a která nemůže, se mohou
> lišit podle jazyka. Renderer (...) by v takovém případě musel hádat v jakém
> jazyce je dané jméno
>

Není od toho v OSM jazykový prefix?

H.
___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


[Talk-cz] WeeklyOSM CZ 338

2017-01-17 Tema obsahu Tom Ka
Ahoj, je dostupné vydání 338 týdeníku WeeklyOSM:

http://www.weeklyosm.eu/cz/archives/8595

* Placené úseky na D8.
* Mapa osvětlení ulic.
* Jarní mapping party SK.
* Zdrojáky freemap.sk
* Tester adres Regio OSM.
* Další rozšíření HDYC.
* OSM a ženská obřízka.
* Uber a OSM.

Pěkné počtení ...

___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-17 Tema obsahu Jan Martinec

Ahoj,

On 01/17/17 11:13, Miroslav Suchy wrote:

Dne 17.1.2017 v 08:45 Lukáš Karas napsal(a):

Moje otázka zní, zda-li je žádoucí do OSM přidávat na taková místa nedělitelné
mezery (v xml " ", unicode znak U+00A0)


Osobně bych byl proti. To bychom tam pak mohli pridavat i hinty, kde rozdelovat 
slova
  Nove Mesto na Mo-
  rave
to už je overkill - nepíšeme v devanagari, abychom potřebovali znaky pro 
ZWNBJ a ZWJ. Oproti tomu nedělitelná mezera v češtině dává smysl.



Pokud i s nedělitelnou mezerou to renderer zalomí špatně, je potřeba opravit
renderer, ale bez ní nemá prostě šanci cokoliv hádat...


Ony existuji jeste i "narrow NBSP", pouzivaji se napr. ve francouzstine.

To taky, ale pro češtinu se to nepoužívá; takových je povícero:
https://en.wikipedia.org/wiki/Whitespace_character#Unicode
Každopádně by se to *teoreticky* mělo chovat všechno jako whitespace, leč:
1. podpora ze strany nástrojů (taky *teoreticky* funkční, ale vsadil 
bych se, že netestovaná - tohle je moje oblíbená třída bugů)
a 2. podpora v tagování - chceme masivně přejmenovávat jak v 
jednadevadesátým? ;) (Osobně bych řekl, že ne)



Ja bych to osobne nechal na renderu.
Renderer má k dispozici jenom heuristiku, což vede k problematickýmu 
věštění z koule typu "končí -a, takže ženský rod, is_in: CZ a má tam 
*nad*, takže za to narvem NBSP" - navíc si to věštění z koule musí každý 
renderer znovu implementovat (po svým?).


Takže bych se těm hintům nebránil, a klidně bych to u těch různých 
Dlouhojmenovic nad Labem a Vedle Kopce u Dálnice zaváděl - ale postupně, 
netřeba to narvat do db po importním způsobu.


Honza "Piškvor" Martinec

___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-17 Tema obsahu Lukáš Karas
Ta pravidla, která mezera může být dělitelná a která nemůže, se mohou lišit 
podle jazyka. Renderer (v případě osmscout bych to spíš dal na starosti 
importu) by v takovém případě musel hádat v jakém jazyce je dané jméno a musel 
by si udržovat pravidla pro různé jazyky...

Samozřejmě by to šlo zjednodušit a dát nedělitelnou mezeru za všechna 
jednopísmenná slova...

Lukáš

Dne úterý 17. ledna 2017 11:13:05 CET Miroslav Suchy napsal(a):
> Dne 17.1.2017 v 08:45 Lukáš Karas napsal(a):
> > Moje otázka zní, zda-li je žádoucí do OSM přidávat na taková místa
> > nedělitelné mezery (v xml " ", unicode znak U+00A0)
> 
> Osobně bych byl proti. To bychom tam pak mohli pridavat i hinty, kde
> rozdelovat slova Nove Mesto na Mo-
>   rave
> 
> > Pokud i s nedělitelnou mezerou to renderer zalomí špatně, je potřeba
> > opravit renderer, ale bez ní nemá prostě šanci cokoliv hádat...
> 
> Ony existuji jeste i "narrow NBSP", pouzivaji se napr. ve francouzstine.
> 
> Samozrejme ze ma sanci. Napriklad pro TeX existuji makra, ktere to doplnuji.
> http://tex.stackexchange.com/questions/46955/is-there-way-to-put-hard-space
> -after-defined-words
> 
> Ja bych to osobne nechal na renderu.
> 
> Mirek
> 
> ___
> Talk-cz mailing list
> Talk-cz@openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz

signature.asc
Description: This is a digitally signed message part.
___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-17 Tema obsahu Miroslav Suchy
Dne 17.1.2017 v 08:45 Lukáš Karas napsal(a):
> Moje otázka zní, zda-li je žádoucí do OSM přidávat na taková místa 
> nedělitelné 
> mezery (v xml " ", unicode znak U+00A0)

Osobně bych byl proti. To bychom tam pak mohli pridavat i hinty, kde rozdelovat 
slova
  Nove Mesto na Mo-
  rave

> Pokud i s nedělitelnou mezerou to renderer zalomí špatně, je potřeba opravit 
> renderer, ale bez ní nemá prostě šanci cokoliv hádat...

Ony existuji jeste i "narrow NBSP", pouzivaji se napr. ve francouzstine.

Samozrejme ze ma sanci. Napriklad pro TeX existuji makra, ktere to doplnuji.
http://tex.stackexchange.com/questions/46955/is-there-way-to-put-hard-space-after-defined-words

Ja bych to osobne nechal na renderu.

Mirek

___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz