[Laitoin tämän aluksi väärällä lähettäjän osoitteella, joten viesti ei mennyt perille. Jos tuo alkuperäinen kuitenkin tulee lopulta sieltä, niin pyydän anteeksi turhaa kaksoiskappaletta. Viestin sisältö on täsmälleen sama.]
Olen uudistamassa OpenOfficen Voikko-lisäosaa, ja samalla korjaamassa muutamia puutteita jotka vaivasivat vanhaa lisäosaa ja myös Oo2-soikkoa. Yksi näistä puutteista on se, että vanha Voikko ja Soikko eivät huomioi käytännössä lainkaan OpenOfficen tavutusasetuksia. Eli vaikka oletuksena kielityökalujen asetuksissa on määritettynä, että alle viiden kirjaimen mittaisia sanoja ei tavuteta, nämä vanhat lisäosat ovat huoletta tavuttaneet myös nelikirjaimisia sanoja. Tämä ei nähtävästi ole kovin paljon ketään haitannut, mutta uudessa Voikko-lisäosassa ongelma on korjattu. Meillä on kuitenkin pientä erimielisyyttä siitä, pitäisikö samaa asetusta soveltaa myös yhdyssanan osiin. Toisin sanoen, jos pienimmäksi tavutettavan sanan pituudeksi on asetettu viisi merkkiä, sanaa "talo" ei tavuteta, mutta pitäisikö sana "kerrostalo" tällöin tavuttaa "ker-ros-ta-lo" vai "ker-ros-talo"? Tämä on kaiken kaikkiaan hiukan monimutkainen ongelma, enkä lähde selostamaan kaikkia yksityiskohtia. Seuraavat (pitkähköt) viestiketjut sisältävät olennaisimmat yksityiskohdat: http://hunspell-fi.org/pipermail/devel_hunspell-fi.org/2007-January/001619.html http://hunspell-fi.org/pipermail/devel_hunspell-fi.org/2007-February/001749.html Itse kannatan tavutusta "ker-ros-ta-lo" mm. seuraavista syistä: - Asetuksen nimi "sanojen vähimmäispituus tavutuksessa" ei varsinaisesti anna vihjettä siihen suuntaan, että sen pitäisi vaikuttaa yhdyssanan osiin. - Muiden yhdyssanoja sisältävien kielten tavutus toimii OpenOfficessa tällä tavalla. - Jos rajoitus kohdistetaan myös yhdyssanan osiin, muuttuu Voikon tavutus konservatiivisemmaksi kuin Soikon tai Wordin. Tämä aiheuttaa varsinkin kapeassa tasapalstaisessa tekstissä ongelmia tekstin sovituksen kanssa. Moni (varsinkin Soikosta Voikkoon siirtyvä) voisi pitää tätä bugina. Jos rajoitus kohdistetaan vain kokonaisiin sanoihin, Voikon toiminta oletusasetuksilla jäisi johonkin Soikon ja Wordin välimaastoon, mikä olisi yhteensopivuuden kannalta paras ja vähiten yllätyksiä aiheuttava ratkaisu. (Word ei tiettävästi oletusasetuksilla tavuta yksittäisiä neljän kirjaimen sanoja, mutta yhdyssanoissa se joskus tavuttaa ne, joskus ei.) - Asiakirjan yleisen ulkoasun kannalta erillisten lyhyiden sanojen tavuttaminen tekee tekstistä rikkonaisemman näköistä kuin samojen sanojen tavuttaminen yhdyssanan sisällä. Tavutusta "ker-ros-talo" puoltavat mm. seuraavat seikat: - Loogisesti voidaan ajatella, että jos neljän kirjaimen sanoja ei haluta tavutettavaksi yksinään, ei ole luettavuuden kannalta järkeä tavuttaa niitä yhdyssanan osinakaan. - Jos tällainen tavutus tuntuu liian konservatiiviselta, Soikko-tyylisen tavutuksen saa helposti takaisin asettamalla pienimmän tavutettavan sanan pituudeksi neljä merkkiä. Tällä asetuksella molemmat tässä esitellyt tavutusvaihtoehdot toimisivat täsmälleen samalla tavalla. - OOo:n tavutuskomponentin ohjelmointirajapinta on jostain syystä suunniteltu niin, että tavutuskomponentin on huolehdittava siitä, että sanan pituusrajoitus huomioidaan. Jos kyse olisi pelkästä mekaanisesta merkkien laskemisesta, voisi komponenttia kutsuva sovelluksen osa päätellä itsekin, mitä sanoja ei tarvitse tavuttaa. Tämä viittaisi siihen, että rajapinnan suunnittelija on ainakin ajatellut mahdollisuutta, että tuon asetuksen taakse haluttaisiin ohjelmoida monimutkaisempaakin logiikkaa. Toisaalta kyse voi olla siitäkin, että "merkin" käsite on epätriviaali CTL-kielissä, ja rajapinnan suunnittelija on halunnut sysätä vastuun näistä ongelmista kielikohtaisille komponenteille. Vaikka itse varovaisuusperiaatteella valitsisin mieluummin ensimmäisen ratkaisuvaihtoehdon, olen molemmat kyllä jo kooditasolla toteuttanut. Eli kuulisin mielelläni mahdollisimman paljon mielipiteitä tästä asiasta. Menee varmasti huhti-toukokuulle ennen kuin openoffice.org-voikko 2.0 julkaistaan, joten aikaa tämän pohtimiselle on vielä reilusti. Samoin jos teillä on muita parannusehdotuksia, toiveita tai kysymyksiä suomen kielityökaluista OpenOfficessa, nyt on hyvä aika tuoda niitä esille kun uusi versio on aktiivisen kehityksen alla. Kaikkea en voi luvata toteutettavaksi, mutta mielelläni kuulisin, mihin asioihin halutaan parannusta. Harri --------------------------------------------------------------------- To unsubscribe, e-mail: [EMAIL PROTECTED] For additional commands, e-mail: [EMAIL PROTECTED]
