[Laitoin tämän aluksi väärällä lähettäjän osoitteella, joten viesti ei mennyt 
perille. Jos tuo alkuperäinen kuitenkin tulee lopulta sieltä, niin pyydän 
anteeksi turhaa kaksoiskappaletta. Viestin sisältö on täsmälleen sama.]

Olen uudistamassa OpenOfficen Voikko-lisäosaa, ja samalla korjaamassa muutamia 
puutteita jotka vaivasivat vanhaa lisäosaa ja myös Oo2-soikkoa. Yksi näistä 
puutteista on se, että vanha Voikko ja Soikko eivät huomioi käytännössä 
lainkaan OpenOfficen tavutusasetuksia. Eli vaikka oletuksena kielityökalujen 
asetuksissa on määritettynä, että alle viiden kirjaimen mittaisia sanoja ei 
tavuteta, nämä vanhat lisäosat ovat huoletta tavuttaneet myös nelikirjaimisia 
sanoja. Tämä ei nähtävästi ole kovin paljon ketään haitannut, mutta uudessa 
Voikko-lisäosassa ongelma on korjattu.

Meillä on kuitenkin pientä erimielisyyttä siitä, pitäisikö samaa asetusta 
soveltaa myös yhdyssanan osiin. Toisin sanoen, jos pienimmäksi tavutettavan 
sanan pituudeksi on asetettu viisi merkkiä, sanaa "talo" ei tavuteta, mutta 
pitäisikö sana "kerrostalo" tällöin tavuttaa "ker-ros-ta-lo" 
vai "ker-ros-talo"?

Tämä on kaiken kaikkiaan hiukan monimutkainen ongelma, enkä lähde selostamaan 
kaikkia yksityiskohtia. Seuraavat (pitkähköt) viestiketjut sisältävät 
olennaisimmat yksityiskohdat:
http://hunspell-fi.org/pipermail/devel_hunspell-fi.org/2007-January/001619.html
http://hunspell-fi.org/pipermail/devel_hunspell-fi.org/2007-February/001749.html

Itse kannatan tavutusta "ker-ros-ta-lo" mm. seuraavista syistä:
- Asetuksen nimi "sanojen vähimmäispituus tavutuksessa" ei varsinaisesti anna 
vihjettä siihen suuntaan, että sen pitäisi vaikuttaa yhdyssanan osiin.
- Muiden yhdyssanoja sisältävien kielten tavutus toimii OpenOfficessa tällä 
tavalla.
- Jos rajoitus kohdistetaan myös yhdyssanan osiin, muuttuu Voikon tavutus 
konservatiivisemmaksi kuin Soikon tai Wordin. Tämä aiheuttaa varsinkin 
kapeassa tasapalstaisessa tekstissä ongelmia tekstin sovituksen kanssa. Moni 
(varsinkin Soikosta Voikkoon siirtyvä) voisi pitää tätä bugina. Jos rajoitus 
kohdistetaan vain kokonaisiin sanoihin, Voikon toiminta oletusasetuksilla 
jäisi johonkin Soikon ja Wordin välimaastoon, mikä olisi yhteensopivuuden 
kannalta paras ja vähiten yllätyksiä aiheuttava ratkaisu.
(Word ei tiettävästi oletusasetuksilla tavuta yksittäisiä neljän kirjaimen 
sanoja, mutta yhdyssanoissa se joskus tavuttaa ne, joskus ei.)
- Asiakirjan yleisen ulkoasun kannalta erillisten lyhyiden sanojen 
tavuttaminen tekee tekstistä rikkonaisemman näköistä kuin samojen sanojen 
tavuttaminen yhdyssanan sisällä.

Tavutusta "ker-ros-talo" puoltavat mm. seuraavat seikat:
- Loogisesti voidaan ajatella, että jos neljän kirjaimen sanoja ei haluta 
tavutettavaksi yksinään, ei ole luettavuuden kannalta järkeä tavuttaa niitä 
yhdyssanan osinakaan.
- Jos tällainen tavutus tuntuu liian konservatiiviselta, Soikko-tyylisen 
tavutuksen saa helposti takaisin asettamalla pienimmän tavutettavan sanan 
pituudeksi neljä merkkiä. Tällä asetuksella molemmat tässä esitellyt 
tavutusvaihtoehdot toimisivat täsmälleen samalla tavalla.
- OOo:n tavutuskomponentin ohjelmointirajapinta on jostain syystä suunniteltu 
niin, että tavutuskomponentin on huolehdittava siitä, että sanan 
pituusrajoitus huomioidaan. Jos kyse olisi pelkästä mekaanisesta merkkien 
laskemisesta, voisi komponenttia kutsuva sovelluksen osa päätellä itsekin, 
mitä sanoja ei tarvitse tavuttaa. Tämä viittaisi siihen, että rajapinnan 
suunnittelija on ainakin ajatellut mahdollisuutta, että tuon asetuksen taakse 
haluttaisiin ohjelmoida monimutkaisempaakin logiikkaa. Toisaalta kyse voi 
olla siitäkin, että "merkin" käsite on epätriviaali CTL-kielissä, ja 
rajapinnan suunnittelija on halunnut sysätä vastuun näistä ongelmista 
kielikohtaisille komponenteille.

Vaikka itse varovaisuusperiaatteella valitsisin mieluummin ensimmäisen 
ratkaisuvaihtoehdon, olen molemmat kyllä jo kooditasolla toteuttanut. Eli 
kuulisin mielelläni mahdollisimman paljon mielipiteitä tästä asiasta. Menee 
varmasti huhti-toukokuulle ennen kuin openoffice.org-voikko 2.0 julkaistaan, 
joten aikaa tämän pohtimiselle on vielä reilusti.

Samoin jos teillä on muita parannusehdotuksia, toiveita tai kysymyksiä suomen 
kielityökaluista OpenOfficessa, nyt on hyvä aika tuoda niitä esille kun uusi 
versio on aktiivisen kehityksen alla. Kaikkea en voi luvata toteutettavaksi, 
mutta mielelläni kuulisin, mihin asioihin halutaan parannusta.

Harri

---------------------------------------------------------------------
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]

Reply via email to