On Saturday 20 August 2005 10:16, Teemu Likonen wrote:
> Onko sanakirjassa vain perusmuoto (I infinitiifin lyhempi muoto) esim.
> "nukku|a", josta sitten jotenkin astevaihtelulogiikalla muodostetaan
> myös juurimorfeemi "nuku" (nuku|n, nuku|ttu, nuku|tta|e|ssa, nuku|ttu|
> i|ne ym.)? Vielä ongelmallisemmalta tuntuu tehdä-verbi, josta pitäisi
> jotenkin maagisesti saada esimerkiksi tee|n, tehd|e|n, teke|mi|llä,
> tehtä|vä (I partis.).
Ajattelin, että laitetaan aina tuo perusmuoto, mutta tietysti jos verbien 
kohdalla joku muu muoto vaikuttaa helpommalta niin sekin kyllä periaatteessa 
käy. Mutta astevaihtelut joudutaan joka tapauksessa verbeillekin toteuttamaan 
Python-skriptin avulla (esimerkkisanassasikin tarvitaan vahvaa astetta 
esimerkiksi muodossa "nukkui" ja heikkoa astetta muodossa "nukun"). Tässä 
asiassa voit katsoa esimerkkiä jo tekemistäni substantiivestä: astevaihtelun 
alaisille sanoille tulee tiedostoon finnish.dict.in ainoastaan perusmuoto, 
mutta tiedostoon finnish.dict generoidaan sekä heikko että vahva vartalo. 
Näille tehdään sitten affiksitiedostoon erilliset affiksit sen mukaan, missä 
muodoissa käytetään heikkoa ja missä vahvaa vartaloa.
Tehdä-verbi taitaa olla epäsäännöllinen, joten sitä sinun ei ehkä tässä 
vaiheessa kannata liikaa miettiä. Kun ensin saadaan säännöllisten verbien 
taivutus oikein, niin sitten voidaan katsoa että missä määrin ne säännöt 
pätevät tehdä- tai olla-verbeihin ja yksinkertaisesti lisätä käsin sanastoon 
sellaiset muodot joita ei affiksien avulla saada aikaiseksi.

> Voiko hunspellin laittaa tunnistamaan kaksi erilaista vaihtoehtoa?
> Muutenkin homonyymien käsittely on hieman epäselvää, koska kahden
> homonyymin erottaminen toisistaan vaatii, että taustalla oleva verbi
> osataan tunnistaa astevaihteluineen
Jos sama sana löytyy useamman erillisen affiksiyhdistelmän kautta niin 
hunmorph listaa kaikki nämä mahdollisuudet. Oikoluvun kannalta on tietysti 
oleellista vain se, että sana voidaan tulkita oikeaksi edes yhdellä tavalla, 
joten jos törmäät tapaukseen joissa kaksi kieliopillisesti eri muotoa 
kirjoitetaan aina samalla tavalla, niin ei ole tarpeellista koodata 
affiksitiedostoon kuin toinen näistä. Substantiiveissa tästä löytyy esimerkki 
akkusatiivista, joka on aina sama kuin yksikön genetiivi tai monikon 
nominatiivi.

> nuku|tta|e|ssa        "Teltassa nukuttaessa täytyy muistaa..."
> (nukkua-verbin pass. II inf. yks. ines.)
> nuku|tta|e|ssa        "Äidin nukuttaessa lastaan..."
> (nukuttaa-verbin akt. II inf. yks. ines.)
Tässäkään en usko, että oikoluvun kannalta on oleellista tietää kummasta 
tapauksesta on kyse. Jos onnistumme riittävän hyvin koodaamaan sekä nukkua- 
että nukuttaa-verbien taivutukset, niin hunmorph löytäisi nämä molemmat 
vaihtoehdot.

> Joo, jatkan opiskelua. Varsinaiseen affiksikoodaamiseen pääsee vasta,
> kun em. asioihin löytyy ratkaisu. Onko kellään tiedossa hyvää teosta
> sanojen taivutustyypeistä? Saisi olla sivua
>
> http://fi.wiktionary.org/wiki/Wikisanakirja:Suomen_kielen_taivutustyypit
>
> monipuolisempi.
Itselläni on kopioituna sanaoppia käsittelevä osuus Osmo Ikolan Nykysuomen 
käsikirjasta. Ei siinäkään näitä asioita esitetä tavalla joka olisi erityisen 
käyttökelpoinen oikolukuohjelmien kannalta, mutta on siitä minulle ollut aika 
paljon hyötyä.

Harri

---------------------------------------------------------------------
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]

Reply via email to