Re: [Talk-cz] Nedělitelné mezery v názvech ulic
Opravdu chci vidět preprocesor, který zvládne rozpoznat "Dům V. Hálka" od "Jindřich V. Sálský" (fiktivní příklady). 2018-01-28 17:16 GMT+01:00 Jan Macura : > Ahoj, > > 2018-01-27 19:36 GMT+01:00 Martin Mares : >> >> Proto by mi dávalo daleko lepší smysl ukládat toho do primárních dat >> co nejméně a napsat preprocesor, který bude umět tyto věci odvozovat >> a jehož výstup bude moci využít libovolný renderer. > > > To se mi zatím zdá jako nejrozumnější argument v této diskusi. > A neexistuje třeba už nějaký takový preprocesor? Vybavuji si článek, ve > kterém nějaký tým řešil, jak lépe zalamovat popisky v mapě (dokonce bych > řekl, že to bylo pro OSM Carto), tak aby to vypadalo hezky. To s naším > problémem jednopísmených předložek na koncích řádek docela souvisí. > > H. > > ___ > Talk-cz mailing list > Talk-cz@openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz > ___ Talk-cz mailing list Talk-cz@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-cz
Re: [Talk-cz] Nedělitelné mezery v názvech ulic
2018-01-31 14:56 GMT+01:00 Matej Lieskovský : > Opravdu chci vidět preprocesor, který zvládne rozpoznat "Dům V. Hálka" > od "Jindřich V. Sálský" (fiktivní příklady). > V předmětu tohoto vlákna stále ještě stojí "Nedělitelné mezery v názvech ulic". Nic víc, nic míň. A na to jsem taky reagoval. H. ___ Talk-cz mailing list Talk-cz@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-cz
Re: [Talk-cz] Nedělitelné mezery v názvech ulic
Vždyť jo. V prvním případě má být nbsp za "V.", v druhém před. 2018-01-31 19:20 GMT+01:00 Jan Macura : > 2018-01-31 14:56 GMT+01:00 Matej Lieskovský : >> >> Opravdu chci vidět preprocesor, který zvládne rozpoznat "Dům V. Hálka" >> od "Jindřich V. Sálský" (fiktivní příklady). > > > V předmětu tohoto vlákna stále ještě stojí "Nedělitelné mezery v názvech > ulic". Nic víc, nic míň. A na to jsem taky reagoval. > > H. > > ___ > Talk-cz mailing list > Talk-cz@openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz > ___ Talk-cz mailing list Talk-cz@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-cz
Re: [Talk-cz] Nedělitelné mezery v názvech ulic
2018-01-31 19:58 GMT+01:00 Matej Lieskovský : > Vždyť jo. V prvním případě má být nbsp za "V.", v druhém před. > Aha, to mě nenapadlo. Chmno, tak ten by musel mít ten druhý řetězec uložený s Unicode znakem U+2164 ;-) H. ___ Talk-cz mailing list Talk-cz@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-cz
Re: [Talk-cz] Nedělitelné mezery v názvech ulic
Dne středa 31. ledna 2018 20:14:24 CET, Jan Macura napsal(a): > 2018-01-31 19:58 GMT+01:00 Matej Lieskovský : > > Vždyť jo. V prvním případě má být nbsp za "V.", v druhém před. > > Aha, to mě nenapadlo. > Chmno, tak ten by musel mít ten druhý řetězec uložený s Unicode znakem > U+2164 ;-) ano, Jindřich [pátý] by takto mohl fungovat ovšem co takový Xindl [iks]? - hm, X není předložka ... a kdyby někdo vymyslel ulici na počest Anny [ká]? (aktuálně se sice na svém webu nazývá s tečkou, ale varianta bez tečky je též dosti rozšířená) přijde mi, že se tu furt vymejšlí rovnák na vohejbák ... *nikdy* to nebudeme mít 100% správně chápat různé druhy mezer obecně jako mezeru je triviální úložka, povětšinou již vyřešená, i ten blbej grep umí [:space:] vyvěštit z obecné mezery, jestli tam zrovna patří nsbp (popř. i něco jiného), je úložka hodná AI kvalitnější než průměrný maturant z češtiny, a vyřešená není - jistě, co se prvého týče, s jistou chybovostí se můžeme smířit, ale pak vzniká otázka, kdyby si někdo chtěl dát tu práci a docílit, aby ten program chyby nedělal, tak jaké má možnosti, nemá-li to být vázáno na konkrétní data? ... co mě napadá je seznam vyjímek, ale čeština má tu krásnou vlastnost, že by určitě brzy vyplulo něco, co se píše stejně, ale má různé významy, a tudíž ta vazba osamoceného písmene může být na obě strany prozradí nám někdo lepší řešení? - co se druhého týče, sice lze argumentovat existencí vlny apod., ale, jak zde již padlo, problém je, kdo to zaháčkuje do všech rendererů, co kdy vznikly a vzniknou? kdo bude nutit člověka na druhém konci světa implementovat nějakou specialitu pro zaprděnou desetimilionovou zemičku, když ani zde mezi zastánci odstranění nbsp se nenajde dobrovolník, co by ten preprocesor napsal? pozn. "renderer" se zde nemusí myslet jen vykreslování mapy, ale obecně cokoli, co když si třeba budu chtít adresy tisknout na obálky nebo jánevímco se dá nad OSM vymyslet, skutečně to všechno pokryjeme, aby to používalo ten (neexistující) preprocesor? obecně dobré pravidlo "nemapovat pro renderer" se zde dovádí ad absurdum, asi jako kdyby někdo řekl "pojďme odstranit u mostů layer, vždyť to se přece dá odvodit a existuje na to i pravidlo, renderer musí vědět, že cesta vede nad řekou" (hm, ne vždy) K. signature.asc Description: This is a digitally signed message part. ___ Talk-cz mailing list Talk-cz@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-cz
Re: [Talk-cz] Nedělitelné mezery v názvech ulic
Ahoj, > *nikdy* to nebudeme mít 100% správně nebudeme. Stejně jako nebudeme mít 100% správně nic jiného. To je myslím lepší přijmout jako fakt, než investovat ohromné množství úsilí do něčeho, co bude mít místo 99% úspěšnosti 99.9%. Chci-li podle dat OSM vytvořit papírovou mapu, vyladím si ji do nejmenších detailů. To často znamená ručně předělávat algoritmická rozhodnutí i v daleko zásadnějších věcech než dělitelnost mezer: například je často potřeba ručně posunout nějakou značku, přemístit či zrušit popisek, nakreslit nějaký objekt mimo měřítko atd. Je to spousta práce, ale výsledek stojí za to. Na druhou stranu, u online mapy zobrazující data, která lidé pořád upravují, je taková snaha o dokonalost spíše škodlivá -- nedokonalosti v datech budou celkovému dojmu škodit víc než nedokonalosti v prezentaci. Proto je důležitější udržet editaci dat co nejjednodušší, i kdyby to stálo o zlomek procenta vyšší pravděpodobnost chybné prezentace. Have a nice fortnight -- Martin `MJ' Mares http://mj.ucw.cz/ Faculty of Math and Physics, Charles University, Prague, Czech Rep., Earth Some people, when confronted with a problem, think "I know, I'll use XML." Now they have two problems. -- P. J. Eby ___ Talk-cz mailing list Talk-cz@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-cz
Re: [Talk-cz] Nedělitelné mezery v názvech ulic
Co přesně se na editaci zkomplikuje, když budeme podporovat nedělitelné mezery? To, že na to budeme muset myslet, když budeme psát dotaz do Overpassu? Podobnými argumenty budeme za chvíli zase všude mazat diakritiku. 2018-01-31 22:16 GMT+01:00 Martin Mares : > Ahoj, > >> *nikdy* to nebudeme mít 100% správně > > nebudeme. Stejně jako nebudeme mít 100% správně nic jiného. > > To je myslím lepší přijmout jako fakt, než investovat ohromné množství > úsilí do něčeho, co bude mít místo 99% úspěšnosti 99.9%. > > Chci-li podle dat OSM vytvořit papírovou mapu, vyladím si ji do nejmenších > detailů. To často znamená ručně předělávat algoritmická rozhodnutí i v daleko > zásadnějších věcech než dělitelnost mezer: například je často potřeba ručně > posunout nějakou značku, přemístit či zrušit popisek, nakreslit nějaký objekt > mimo měřítko atd. Je to spousta práce, ale výsledek stojí za to. > > Na druhou stranu, u online mapy zobrazující data, která lidé pořád upravují, > je taková snaha o dokonalost spíše škodlivá -- nedokonalosti v datech budou > celkovému dojmu škodit víc než nedokonalosti v prezentaci. Proto je > důležitější > udržet editaci dat co nejjednodušší, i kdyby to stálo o zlomek procenta vyšší > pravděpodobnost chybné prezentace. > > Have a nice fortnight > -- > Martin `MJ' Mares http://mj.ucw.cz/ > Faculty of Math and Physics, Charles University, Prague, Czech Rep., Earth > Some people, when confronted with a problem, think "I know, I'll use XML." > Now they have two problems. -- P. J. Eby > > ___ > Talk-cz mailing list > Talk-cz@openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz ___ Talk-cz mailing list Talk-cz@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-cz