Re: [Talk-cz] Nedělitelné mezery v názvech ulic

2018-01-31 Thread Matej Lieskovský
Opravdu chci vidět preprocesor, který zvládne rozpoznat "Dům V. Hálka"
od "Jindřich V. Sálský" (fiktivní příklady).


2018-01-28 17:16 GMT+01:00 Jan Macura :
> Ahoj,
>
> 2018-01-27 19:36 GMT+01:00 Martin Mares :
>>
>> Proto by mi dávalo daleko lepší smysl ukládat toho do primárních dat
>> co nejméně a napsat preprocesor, který bude umět tyto věci odvozovat
>> a jehož výstup bude moci využít libovolný renderer.
>
>
>  To se mi zatím zdá jako nejrozumnější argument v této diskusi.
> A neexistuje třeba už nějaký takový preprocesor? Vybavuji si článek, ve
> kterém nějaký tým řešil, jak lépe zalamovat popisky v mapě (dokonce bych
> řekl, že to bylo pro OSM Carto), tak aby to vypadalo hezky. To s naším
> problémem jednopísmených předložek na koncích řádek docela souvisí.
>
> H.
>
> ___
> Talk-cz mailing list
> Talk-cz@openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>

___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelné mezery v názvech ulic

2018-01-31 Thread Jan Macura
2018-01-31 14:56 GMT+01:00 Matej Lieskovský :

> Opravdu chci vidět preprocesor, který zvládne rozpoznat "Dům V. Hálka"
> od "Jindřich V. Sálský" (fiktivní příklady).
>

V předmětu tohoto vlákna stále ještě stojí "Nedělitelné mezery v názvech
ulic". Nic víc, nic míň. A na to jsem taky reagoval.

H.
___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelné mezery v názvech ulic

2018-01-31 Thread Matej Lieskovský
Vždyť jo. V prvním případě má být nbsp za "V.", v druhém před.

2018-01-31 19:20 GMT+01:00 Jan Macura :
> 2018-01-31 14:56 GMT+01:00 Matej Lieskovský :
>>
>> Opravdu chci vidět preprocesor, který zvládne rozpoznat "Dům V. Hálka"
>> od "Jindřich V. Sálský" (fiktivní příklady).
>
>
> V předmětu tohoto vlákna stále ještě stojí "Nedělitelné mezery v názvech
> ulic". Nic víc, nic míň. A na to jsem taky reagoval.
>
> H.
>
> ___
> Talk-cz mailing list
> Talk-cz@openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>

___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelné mezery v názvech ulic

2018-01-31 Thread Jan Macura
2018-01-31 19:58 GMT+01:00 Matej Lieskovský :

> Vždyť jo. V prvním případě má být nbsp za "V.", v druhém před.
>

Aha, to mě nenapadlo.
Chmno, tak ten by musel mít ten druhý řetězec uložený s Unicode znakem
U+2164 ;-)

H.
___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelné mezery v názvech ulic

2018-01-31 Thread Karel Volný
Dne středa 31. ledna 2018 20:14:24 CET, Jan Macura napsal(a):
> 2018-01-31 19:58 GMT+01:00 Matej Lieskovský :
> > Vždyť jo. V prvním případě má být nbsp za "V.", v druhém před.
> 
> Aha, to mě nenapadlo.
> Chmno, tak ten by musel mít ten druhý řetězec uložený s Unicode znakem
> U+2164 ;-)

ano, Jindřich [pátý] by takto mohl fungovat

ovšem co takový Xindl [iks]?

- hm, X není předložka ... a kdyby někdo vymyslel ulici na počest Anny [ká]?
(aktuálně se sice na svém webu nazývá s tečkou, ale varianta bez tečky je též 
dosti rozšířená)

přijde mi, že se tu furt vymejšlí rovnák na vohejbák ...

*nikdy* to nebudeme mít 100% správně

chápat různé druhy mezer obecně jako mezeru je triviální úložka, povětšinou 
již vyřešená, i ten blbej grep umí [:space:]

vyvěštit z obecné mezery, jestli tam zrovna patří nsbp (popř. i něco jiného), 
je úložka hodná AI kvalitnější než průměrný maturant z češtiny, a vyřešená 
není

- jistě, co se prvého týče, s jistou chybovostí se můžeme smířit, ale pak 
vzniká otázka, kdyby si někdo chtěl dát tu práci a docílit, aby ten program 
chyby nedělal, tak jaké má možnosti, nemá-li to být vázáno na konkrétní data?

... co mě napadá je seznam vyjímek, ale čeština má tu krásnou vlastnost, že by 
určitě brzy vyplulo něco, co se píše stejně, ale má různé významy, a tudíž ta 
vazba osamoceného písmene může být na obě strany

prozradí nám někdo lepší řešení?

- co se druhého týče, sice lze argumentovat existencí vlny apod., ale, jak zde 
již padlo, problém je, kdo to zaháčkuje do všech rendererů, co kdy vznikly a 
vzniknou?

kdo bude nutit člověka na druhém konci světa implementovat nějakou specialitu 
pro zaprděnou desetimilionovou zemičku, když ani zde mezi zastánci odstranění 
nbsp se nenajde dobrovolník, co by ten preprocesor napsal?

pozn. "renderer" se zde nemusí myslet jen vykreslování mapy, ale obecně 
cokoli, co když si třeba budu chtít adresy tisknout na obálky nebo jánevímco 
se dá nad OSM vymyslet, skutečně to všechno pokryjeme, aby to používalo ten 
(neexistující) preprocesor?

obecně dobré pravidlo "nemapovat pro renderer" se zde dovádí ad absurdum, asi 
jako kdyby někdo řekl "pojďme odstranit u mostů layer, vždyť to se přece dá 
odvodit a existuje na to i pravidlo, renderer musí vědět, že cesta vede nad 
řekou" (hm, ne vždy)

K.


signature.asc
Description: This is a digitally signed message part.
___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelné mezery v názvech ulic

2018-01-31 Thread Martin Mares
Ahoj,

> *nikdy* to nebudeme mít 100% správně

nebudeme. Stejně jako nebudeme mít 100% správně nic jiného.

To je myslím lepší přijmout jako fakt, než investovat ohromné množství
úsilí do něčeho, co bude mít místo 99% úspěšnosti 99.9%.

Chci-li podle dat OSM vytvořit papírovou mapu, vyladím si ji do nejmenších
detailů. To často znamená ručně předělávat algoritmická rozhodnutí i v daleko
zásadnějších věcech než dělitelnost mezer: například je často potřeba ručně
posunout nějakou značku, přemístit či zrušit popisek, nakreslit nějaký objekt
mimo měřítko atd. Je to spousta práce, ale výsledek stojí za to.

Na druhou stranu, u online mapy zobrazující data, která lidé pořád upravují,
je taková snaha o dokonalost spíše škodlivá -- nedokonalosti v datech budou
celkovému dojmu škodit víc než nedokonalosti v prezentaci. Proto je důležitější
udržet editaci dat co nejjednodušší, i kdyby to stálo o zlomek procenta vyšší
pravděpodobnost chybné prezentace.

Have a nice fortnight
-- 
Martin `MJ' Mares http://mj.ucw.cz/
Faculty of Math and Physics, Charles University, Prague, Czech Rep., Earth
Some people, when confronted with a problem, think "I know, I'll use XML." Now 
they have two problems. -- P. J. Eby

___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz


Re: [Talk-cz] Nedělitelné mezery v názvech ulic

2018-01-31 Thread Matej Lieskovský
Co přesně se na editaci zkomplikuje, když budeme podporovat
nedělitelné mezery? To, že na to budeme muset myslet, když budeme psát
dotaz do Overpassu? Podobnými argumenty budeme za chvíli zase všude
mazat diakritiku.

2018-01-31 22:16 GMT+01:00 Martin Mares :
> Ahoj,
>
>> *nikdy* to nebudeme mít 100% správně
>
> nebudeme. Stejně jako nebudeme mít 100% správně nic jiného.
>
> To je myslím lepší přijmout jako fakt, než investovat ohromné množství
> úsilí do něčeho, co bude mít místo 99% úspěšnosti 99.9%.
>
> Chci-li podle dat OSM vytvořit papírovou mapu, vyladím si ji do nejmenších
> detailů. To často znamená ručně předělávat algoritmická rozhodnutí i v daleko
> zásadnějších věcech než dělitelnost mezer: například je často potřeba ručně
> posunout nějakou značku, přemístit či zrušit popisek, nakreslit nějaký objekt
> mimo měřítko atd. Je to spousta práce, ale výsledek stojí za to.
>
> Na druhou stranu, u online mapy zobrazující data, která lidé pořád upravují,
> je taková snaha o dokonalost spíše škodlivá -- nedokonalosti v datech budou
> celkovému dojmu škodit víc než nedokonalosti v prezentaci. Proto je 
> důležitější
> udržet editaci dat co nejjednodušší, i kdyby to stálo o zlomek procenta vyšší
> pravděpodobnost chybné prezentace.
>
> Have a nice fortnight
> --
> Martin `MJ' Mares http://mj.ucw.cz/
> Faculty of Math and Physics, Charles University, Prague, Czech Rep., Earth
> Some people, when confronted with a problem, think "I know, I'll use XML." 
> Now they have two problems. -- P. J. Eby
>
> ___
> Talk-cz mailing list
> Talk-cz@openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz

___
Talk-cz mailing list
Talk-cz@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz