Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-19 Tema obsahu Jan Macura
//pardon, odeslal jsem mail předčasně

2017-01-19 9:01 GMT+01:00 Lukáš Karas :

> Ano, zalomení řádku je forma (pokud nepíši poezii). Ale nikdo nechce do osm
> dat dávat konce řádku do názvů - tedy to kde zalomit. Ale bavíme se o
> pevných
> mezerách. Tedy kde nezalomit. Je to věcí jazyka, měly by dle mě být
> součástí
> všech strojově čitelných textů - tedy dle mě obsah.
>

Chápu, ale pořád mi to nepřijde jako dostatečný argument. Je to jedno bez
druhého – informace o tom, kde nezalomit řádek může existovat jen pro
potřeby jeho zalomení a jsme zpátky u formátování dat (textu) pro konkrétní
potřeby.

Ale ten hate Jana Martince mě trochu nalomil (sic!). Pokud neexistuje žádný
argument proti, kromě logického (to, co se tu snažím obhajovat), nemá asi
smysl tomu bránit. Navíc, když Ladislav Laska píše, že některé editory s
tím umí pracovat, bral bych to v nejlepším duchu OSM (a dobrovolnictví)
jako možnost, ale určitě ne nutnost.

2017-01-19 9:11 GMT+01:00 Mikoláš Štrajt :

> Fun fact:
>
> RUIAN už skloňování názvů obcí ve své databázi má. V exportu je to v
> položce obi:MluvnickeCharakteristiky.
>
A to je dobře. Plní tak pečlivě funkci registru územní identifikace. Stejně
tak bych čekal "mluvnické charakteristiky" třeba v GeoNames, ale ne v OSM
;-)

2017-01-19 10:35 GMT+01:00 Petr Kadlec :

> A ještě k
>
> > je extrémně výhodné, aby velikost písmen byla přímo brána jako součást
> obsahu
>
>
> To přece není „extrémně výhodné“ [wut?], to je přece _pravda_. Ta obec se
> _nejmenuje_ „libčice nad vltavou“˝, ale „Libčice nad Vltavou“. _Proto_ to
> tam takhle máme. Ne proto, aby bylo jednodušší to hezky vykreslovat. Stejně
> tak máme mít třeba „PP Opatřilka – Červený lom“, nikoli „PP Opatřilka -
> Červený lom“ (bez ohledu na to, jakým písmem to pak kdo vykresluje).
>

Je to off-topic, ale snad bude strpen. Dokážu si představit takový datový
model, kde jméno objektu nebude řetězec "Kostelec nad Černými lesy", ale
objekt (v OSM tedy relace) se členy "kostelec", "černá", "les" a vyjádřením
jejich vzájemných vztahů , které by velikost písmen implikovaly. Možné by
to bylo, jen je to úplná blbost, takhle to modelovat (= tím myslím, že je
to extrémně nevýhodné ;-) )

H.
___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-19 Tema obsahu Jan Macura
Ahoj,

2017-01-19 9:01 GMT+01:00 Lukáš Karas :

> A proboha, v OSM vytváříme věci ve strojově čitelné podobě, zakládáme mezi
> objekty relace aby je bylo možné strojově zpracovat. A najednou, pokud chci
> aby i texty byly ve strojově zpracovatelné formě, tak je to špatně?
>

To mi přijde trochu přehnané. Měkké mezery strojové zpracování textů
neznemožňují, ty tvrdé ho jen ulehčují.
___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-19 Tema obsahu Matěj Cepl
On 2017-01-19, 08:11 GMT, Mikoláš Štrajt wrote:
> skutečně toto vše? - takže bychom vlastně neměli mít "Libčice 
> nad Vltavou" ale "Libčice nad Vltava"? :-)

Ale ta vesnice se tak nejmenuje!

Matěj

-- 
https://matej.ceplovi.cz/blog/, Jabber: mc...@ceplovi.cz
GPG Finger: 3C76 A027 CA45 AD70 98B5  BC1D 7920 5802 880B C9D8
 
How fleeting are all human passions compared to the massive
continuity of ducks.
  -- Dorothy L. Sayers: Gaudy Night


___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-19 Tema obsahu Marián Kyral
Ahoj,
za sebe jako za uživatele k tomu můžu říct, že v běžném životě typografii 
vůbec neřeším. Ona ta nezalomitelná mezera je stejně jen pomůcka pro 
programy. Normálně není vidět a já fakt nechci řešit dilema, jestli tam 
přijde taková nebo maková mezera, když obě od sebe nejdou normálně rozeznat.
A pochybuji, že to takoví ti příležitostní mappeři vůbec budou řešit. Tam 
budeme rádi, když ten název správně opíší a případně u kapitálek správně 
tipnou, kam dát velká písmena. Sám s tím mám občas problém.

Nějaké nezalomitelné mezery by za ně měly řešit programy. Ať už editory na 
vstupu nebo renderery na výstupu.

Marián


-- Původní zpráva --
Od: Ladislav Laska 
Komu: OpenStreetMap Czech Republic 
Datum: 19. 1. 2017 9:46:35
Předmět: Re: [Talk-cz] Nedělitelná mezera v OSM datech 
"Ahoj,

nemám zrovna chuť polemizovat nad tím, co je správné a rozumné (není na
to totiž Jediná Správná Odpověď (TM) ).

Nicméně k editorům: Merkaartor si s tím poradí: Pokud vložíš
nezalamující mezeru (jako unicode znak), tak ji hezky uploaduje na
server, z tama si ji potom vyzvedne a ani při další úpravě ji nesmaže
(samozřejmě pokud ji nesmazal uživatel). 

Stejné chování bych čekal od JOSM, protože Java je taky unicodová, a od
maps.me, které je také napsané v Qt (jako Merkaartor), ani jedno jsem
ale netestoval.

On Tue, Jan 17, 2017 at 08:45:48AM +0100, Lukáš Karas wrote:
> Ahoj, o víkendu autor OSM Scout knihovny přidal užitečnou funkcionalitu
> - zalamování dlouhých popisků do více řádků. Dle očekávání se ale názvy 
> zalamují v místech kde vykreslovací engine uzná za vhodné, nikoliv tam kde

> je to správně (předložky zůstávají na konci řádku), například:
> 
> Libčice nad
> Vltavou
> 
> Týnec nad
> Sázavou
> 
> Tam lze "nad" na konci řádku ještě tolerovat i když mě osobně se nelibí, 
> ale u "u": 
> 
> Nová ves u 
> Chýnova
> 
> Je to typograficky špatně. Stejným neduhem trpí i Mapnik.
> 
> Moje otázka zní, zda-li je žádoucí do OSM přidávat na taková místa 
nedělitelné 
> mezery (v xml "", unicode znak U+00A0) a existuje na to nějaký 
postup 
> jak to provést hromadně? Poradí si s tím běžné editory? Neztratí se ta 
mezera 
> při první editaci? 
> 
> Pokud i s nedělitelnou mezerou to renderer zalomí špatně, je potřeba 
opravit 
> renderer, ale bez ní nemá prostě šanci cokoliv hádat...
> 
> Lukáš



> ___
> Talk-cz mailing list
> Talk-cz@openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz


-- 
S pozdravem Ladislav "Krakonoš" Láska http://www.krakonos.org/

___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz
"___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-19 Tema obsahu Petr Kadlec
Ahoj˝,

2017-01-18 22:35 GMT+01:00 Jan Macura :

> 2017-01-18 10:03 GMT+01:00 Karel Volný :
>
>> obecně souhlas, akorát se neshodneme v tom, co je obsah a co je forma
>>
>
> Zalomení řádku je záležitost formy. Při každém zpracování textu může
> dopadnout jinak (jinde). Obsah je na formátování řádek nezávislý. Takže
> medle celá problematika "kde řádek zalomit" padá na hlavu zpracovatele dat.
>

Zalomení řádku je pochopitelně záležitost formy, to ale nic nemění na tom,
že v češtině se za jednopísmennými předložkami a spojkami píše nezlomitelná
mezera. Jak přesně si jaký zpracovatel zalomí řádky (jestli třeba
umí/používá Unicode Line Breaking Algorithm), jaké při tom použije písmo a
jestli zarovná na střed nebo doleva, je samozřejmě na něm. To ale
neznamená, že my nemáme používat správné znaky. Jak se ostatně píše ve
standardu Unicode:

> The actual layout in an implementation may differ in detail. A
mathematical layout system, for example, will have many additional,
domain-specific rules for layout, but a well-designed system leaves no
ambiguities as to which character codes are to be used for a given aspect
of the mathematical expression being encoded.
>
> The purpose of defining Unicode default layout behavior is not to enforce
a single and specific aesthetic layout for each script, but rather to
encourage uniformity in encoding. In that way implementers of layout
systems can rely on the fact that users would have chosen a particular
character sequence for a given purpose, and users can rely on the fact that
implementers will create a layout for a particular character sequence that
matches the intent of the user to within the capabilities or technical
limitations of the implementation.

A ještě k

> je extrémně výhodné, aby velikost písmen byla přímo brána jako součást
obsahu

To přece není „extrémně výhodné“ [wut?], to je přece _pravda_. Ta obec se
_nejmenuje_ „libčice nad vltavou“˝, ale „Libčice nad Vltavou“. _Proto_ to
tam takhle máme. Ne proto, aby bylo jednodušší to hezky vykreslovat. Stejně
tak máme mít třeba „PP Opatřilka – Červený lom“, nikoli „PP Opatřilka -
Červený lom“ (bez ohledu na to, jakým písmem to pak kdo vykresluje).

Vkládání nezlomitelných mezer není něco kritického, co musíme hned teď jít
hromadně opravovat (skoro bych řekl naopak, protože to by teď opravdu
vypadalo, že se to jen ladí pro ten jeden konkrétní renderer, kterým tohle
vlákno začlo; ani si nejsem jist, jestli jsem je ve svých vlastních
editacích vkládal), ale je to prostě o trochu _správnější_.

-- Petr Kadlec / Mormegil
___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-19 Tema obsahu Ladislav Laska
Ahoj,

nemám zrovna chuť polemizovat nad tím, co je správné a rozumné (není na
to totiž Jediná Správná Odpověď (TM) ).

Nicméně k editorům: Merkaartor si s tím poradí: Pokud vložíš
nezalamující mezeru (jako unicode znak), tak ji hezky uploaduje na
server, z tama si ji potom vyzvedne a ani při další úpravě ji nesmaže
(samozřejmě pokud ji nesmazal uživatel). 

Stejné chování bych čekal od JOSM, protože Java je taky unicodová, a od
maps.me, které je také napsané v Qt (jako Merkaartor), ani jedno jsem
ale netestoval.

On Tue, Jan 17, 2017 at 08:45:48AM +0100, Lukáš Karas wrote:
> Ahoj, o víkendu autor OSM Scout knihovny přidal užitečnou funkcionalitu
>  - zalamování dlouhých popisků do více řádků. Dle očekávání se ale názvy 
> zalamují v místech kde vykreslovací engine uzná za vhodné, nikoliv tam kde 
> je to správně (předložky zůstávají na konci řádku), například:
> 
> Libčice nad
>   Vltavou
> 
>  Týnec nad
>   Sázavou
> 
> Tam lze "nad" na konci řádku ještě tolerovat i když mě osobně se nelibí, 
> ale u "u": 
> 
> Nová ves u 
>  Chýnova
> 
> Je to typograficky špatně. Stejným neduhem trpí i Mapnik.
> 
> Moje otázka zní, zda-li je žádoucí do OSM přidávat na taková místa 
> nedělitelné 
> mezery (v xml "", unicode znak U+00A0) a existuje na to nějaký postup 
> jak to provést hromadně? Poradí si s tím běžné editory? Neztratí se ta mezera 
> při první editaci? 
> 
> Pokud i s nedělitelnou mezerou to renderer zalomí špatně, je potřeba opravit 
> renderer, ale bez ní nemá prostě šanci cokoliv hádat...
> 
> Lukáš



> ___
> Talk-cz mailing list
> Talk-cz@openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz


-- 
S pozdravem Ladislav "Krakonoš" Láskahttp://www.krakonos.org/

___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-19 Tema obsahu Mikoláš Štrajt
"



" > Zalamování řádek, dělení slov, skloňování a časování ať je záležitostí
> zpracování dat, ne jejich uložení.

skutečně toto vše? - takže bychom vlastně neměli mít "Libčice nad Vltavou" 
ale
"Libčice nad Vltava"? :-)

"



Heh, napsal jsem to moc obecně :-) Jasně, že v našem případě "Libčice nad 
Vltavou", ale tahle diskuse ("zaveďme do slov nedělitelné mezery, protože to
ulehčí zpracování") by taky mohla vést k tomu, že zavedeme tagy name:genitiv
="Libčic nad Vltavou", name:dativ="Libčicím nad Vltavou", atd. protože 
"routovací enginy nabízejí uživateli i textový popis cesty a tohle jim 
ulehčí práci". A to už bychom v OSM opravdu mít neměli ;-)


"



Fun fact: 




RUIAN už skloňování názvů obcí ve své databázi má. V exportu je to v položce
obi:MluvnickeCharakteristiky.




Např:




Žiželic
ŽiželicímŽiželiceŽiželicíchŽiželicemi





Dokonce jsem to už viděl používané - někdo generoval nápisy na trička "Jsem 
z XY".




* * *




Jinak ale souhlasím s myšlenkou, že nedělitelná mezera není obsah ale forma,
tudíž nemá v DB co dělat.




-- 

Mikoláš Štrajt / Severák / http://severak.svita.cz/
___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelná mezera v OSM datech

2017-01-19 Tema obsahu Lukáš Karas
Souhlasím, ale mám pocit že oba máme na mysli něco jiného.

Dne středa 18. ledna 2017 22:35:16 CET Jan Macura napsal(a):
> Ahoj,
> 
> 2017-01-18 10:03 GMT+01:00 Karel Volný :
> > obecně souhlas, akorát se neshodneme v tom, co je obsah a co je forma
> 
> Zalomení řádku je záležitost formy. Při každém zpracování textu může
> dopadnout jinak (jinde). Obsah je na formátování řádek nezávislý. Takže
> medle celá problematika "kde řádek zalomit" padá na hlavu zpracovatele dat.
> 

Ano, zalomení řádku je forma (pokud nepíši poezii). Ale nikdo nechce do osm 
dat dávat konce řádku do názvů - tedy to kde zalomit. Ale bavíme se o pevných 
mezerách. Tedy kde nezalomit. Je to věcí jazyka, měly by dle mě být součástí 
všech strojově čitelných textů - tedy dle mě obsah. 

A proboha, v OSM vytváříme věci ve strojově čitelné podobě, zakládáme mezi 
objekty relace aby je bylo možné strojově zpracovat. A najednou, pokud chci 
aby i texty byly ve strojově zpracovatelné formě, tak je to špatně?

Lukáš

> > kontrolní dotaz - používání malých a velkých písmen je obsah nebo forma?
> 
> To záleží na kontextu. Obecně samozřejmě formy, ale v našem případě, tj.
> sbírání a uchovávání místopisných názvů je extrémně výhodné, aby velikost
> písmen byla přímo brána jako součást obsahu (neměnná). Neexistuje totiž
> případ, kdy bychom ta slova uvažovali samostatně (slovo "libčice", slovo
> "nad" a slovo "vltava") – OSM není ani výkladový slovník ani lexikografická
> databáze.
> 
> > > Zalamování řádek, dělení slov, skloňování a časování ať je záležitostí
> > > zpracování dat, ne jejich uložení.
> > 
> > skutečně toto vše? - takže bychom vlastně neměli mít "Libčice nad Vltavou"
> > ale
> > "Libčice nad Vltava"? :-)
> 
> Heh, napsal jsem to moc obecně :-) Jasně, že v našem případě "Libčice nad
> Vltavou", ale tahle diskuse ("zaveďme do slov nedělitelné mezery, protože
> to ulehčí zpracování") by taky mohla vést k tomu, že zavedeme tagy
> name:genitiv="Libčic
> nad Vltavou", name:dativ="Libčicím nad Vltavou", atd. protože "routovací
> enginy nabízejí uživateli i textový popis cesty a tohle jim ulehčí práci".
> A to už bychom v OSM opravdu mít neměli ;-)
> 
> H.

signature.asc
Description: This is a digitally signed message part.
___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz