On Saturday 20 August 2005 10:16, Teemu Likonen wrote: > Onko sanakirjassa vain perusmuoto (I infinitiifin lyhempi muoto) esim. > "nukku|a", josta sitten jotenkin astevaihtelulogiikalla muodostetaan > myös juurimorfeemi "nuku" (nuku|n, nuku|ttu, nuku|tta|e|ssa, nuku|ttu| > i|ne ym.)? Vielä ongelmallisemmalta tuntuu tehdä-verbi, josta pitäisi > jotenkin maagisesti saada esimerkiksi tee|n, tehd|e|n, teke|mi|llä, > tehtä|vä (I partis.). Ajattelin, että laitetaan aina tuo perusmuoto, mutta tietysti jos verbien kohdalla joku muu muoto vaikuttaa helpommalta niin sekin kyllä periaatteessa käy. Mutta astevaihtelut joudutaan joka tapauksessa verbeillekin toteuttamaan Python-skriptin avulla (esimerkkisanassasikin tarvitaan vahvaa astetta esimerkiksi muodossa "nukkui" ja heikkoa astetta muodossa "nukun"). Tässä asiassa voit katsoa esimerkkiä jo tekemistäni substantiivestä: astevaihtelun alaisille sanoille tulee tiedostoon finnish.dict.in ainoastaan perusmuoto, mutta tiedostoon finnish.dict generoidaan sekä heikko että vahva vartalo. Näille tehdään sitten affiksitiedostoon erilliset affiksit sen mukaan, missä muodoissa käytetään heikkoa ja missä vahvaa vartaloa. Tehdä-verbi taitaa olla epäsäännöllinen, joten sitä sinun ei ehkä tässä vaiheessa kannata liikaa miettiä. Kun ensin saadaan säännöllisten verbien taivutus oikein, niin sitten voidaan katsoa että missä määrin ne säännöt pätevät tehdä- tai olla-verbeihin ja yksinkertaisesti lisätä käsin sanastoon sellaiset muodot joita ei affiksien avulla saada aikaiseksi.
> Voiko hunspellin laittaa tunnistamaan kaksi erilaista vaihtoehtoa? > Muutenkin homonyymien käsittely on hieman epäselvää, koska kahden > homonyymin erottaminen toisistaan vaatii, että taustalla oleva verbi > osataan tunnistaa astevaihteluineen Jos sama sana löytyy useamman erillisen affiksiyhdistelmän kautta niin hunmorph listaa kaikki nämä mahdollisuudet. Oikoluvun kannalta on tietysti oleellista vain se, että sana voidaan tulkita oikeaksi edes yhdellä tavalla, joten jos törmäät tapaukseen joissa kaksi kieliopillisesti eri muotoa kirjoitetaan aina samalla tavalla, niin ei ole tarpeellista koodata affiksitiedostoon kuin toinen näistä. Substantiiveissa tästä löytyy esimerkki akkusatiivista, joka on aina sama kuin yksikön genetiivi tai monikon nominatiivi. > nuku|tta|e|ssa "Teltassa nukuttaessa täytyy muistaa..." > (nukkua-verbin pass. II inf. yks. ines.) > nuku|tta|e|ssa "Äidin nukuttaessa lastaan..." > (nukuttaa-verbin akt. II inf. yks. ines.) Tässäkään en usko, että oikoluvun kannalta on oleellista tietää kummasta tapauksesta on kyse. Jos onnistumme riittävän hyvin koodaamaan sekä nukkua- että nukuttaa-verbien taivutukset, niin hunmorph löytäisi nämä molemmat vaihtoehdot. > Joo, jatkan opiskelua. Varsinaiseen affiksikoodaamiseen pääsee vasta, > kun em. asioihin löytyy ratkaisu. Onko kellään tiedossa hyvää teosta > sanojen taivutustyypeistä? Saisi olla sivua > > http://fi.wiktionary.org/wiki/Wikisanakirja:Suomen_kielen_taivutustyypit > > monipuolisempi. Itselläni on kopioituna sanaoppia käsittelevä osuus Osmo Ikolan Nykysuomen käsikirjasta. Ei siinäkään näitä asioita esitetä tavalla joka olisi erityisen käyttökelpoinen oikolukuohjelmien kannalta, mutta on siitä minulle ollut aika paljon hyötyä. Harri --------------------------------------------------------------------- To unsubscribe, e-mail: [EMAIL PROTECTED] For additional commands, e-mail: [EMAIL PROTECTED]
