Hei kaikille,
Olen lukenut tätä listaa ajoittain ja huomasin nyt, että listalla
on syntynyt mielenkiintoista keskustelua suomenkielisen
Open-Source oikoluku ohjelman toteutuksesta. Itse olen vain
pinnallisesti tutustunut niiden avointen oikolukuohjelmien
toimintaan, mitä tällä listallakin on nyt mainittu. Sen verran
ainakin tiedän, että oikolukuohjelman luonnissa se suurin ongelma
on kattavan sanalistan luominen ja tämän yhdistäminen oikeisiin
taivutus sääntöihin. Sen lisäksi, että tälläisen sanaston
kokoaminen on työlästä, on ongelmana myös sen oikeellisuus.
Sanojen perusmuotojen ja taivutussääntöjen oikeellisuus.
Internetistä ja jopa kirjoista, sekä virallisista teksteistä
sanoja haettaessa on monia sanoja joiden väärinkirjoitus on
paljon yleisempää kuin oikeinkirjoitus.
Minusta tässä ei ehkä kannattaisi lähteä keksimään pyörää
uudestaan, kun tälläinen lista on jo olemassa meidän kaikkien
verorahoilla kustannettuna eduskunnan aloitteesta. Vielä
sellaiselta taholta, jonka virallisena tehtävänä on antaa
suosituksia sanojen oikeinkirjoituksesta ja taivutuksesta.
Niin mistä siis tuollainen lista löytyy?
Vastaus on Kotimaisten Kielten Tutkimuskeskuksen - Suomen Kielen
Perussanakirjasta (1990) (Kotus www.kotus.fi, sähköinen versio
CD-Perussanakirja http://www.kotus.fi/julkaisut/sanakirjat/ps/).
Suomen Kielen Perussanakirjassa on noin 100 000 hakusanaa, joista
on ilmoitettu taivutusluokka 1-78 ja astevaihtelu-"luokka" 1-13.
Lisäksi löytyy mahdollinen sanallinen kuvaus ja konteksti
esimerkki.
Tuo Suomen Kielen Perussanakirja on yksin kertaistettu versio
Nykysuomen sanakirjasta (ensin julkaistu 1951-1961), joka
sisältää noin 200 000 hakusanaa, mutta ei tosin tietoa sanojen
taivutuksesta.
Lainaus Kotuksen sivuilta:
"Sanakirjan historiaa
Ennen Kielitoimiston perustamista Suomalaisen Kirjallisuuden
Seuralla oli jo meneillään suurtyö suomen kielen parissa.
Marraskuun 17. päivänä 1927 oli eduskunta päättänyt
Antti Kukkosen ja seitsemän muun kansanedustajan aloitteesta
"kehottaa hallitusta ryhtymään toimenpiteisiin suomen kirja-
ja sivistyskielen kantasanakirjan aikaansaamiseksi""
Mikä siis tuo Kotimaisten Kielten Tutkimuskeskus on?
Kotuksen sivuilta suoraan lainattuna:
"Kotimaisten kielten tutkimuskeskus (Kotus) on valtion
kielitieteellinen tutkimuslaitos. Se tutkii suomea, ruotsia,
saamen kieliä, romanikieltä ja viittomakieltä. Toimintaan
kuuluu kielenhuolto (Kielitoimisto), sanakirjojen teko ja
tutkimushankkeita. Kotuksella on myös laaja kirjasto ja
kielitieteellisiä arkistoja."
"Kotus on opetusministeriön alainen tutkimuslaitos, jonka
toiminnasta säädetään Kotimaisten kielten tutkimuskeskusta
koskevassa laissa (48/1976, 591/1996) ja asetuksessa. Viraston
toimintaa tukee neuvottelukunta."
Kotuksen toiminta-ajatus, arvot ja visio:
"Kotimaisten kielten tutkimuskeskus eli Kotus on
kielitieteellinen tutkimuslaitos, jonka toiminta-ajatuksena on
lisätä tietoa kotimaisista kielistä ja niiden asemasta
kulttuurissa ja yhteiskunnassa sekä näin luoda edellytyksiä
kielelliselle tasa-arvolle Suomessa."
Nyt kun tiedossa on mistä tuo oikeinkirjoituksen tarkistamiseen
tarvittava sanalista löytyy niin tehtäväksi jää vain Kotuksen
suostutteleminen vapauttamaan kyseinen sanalista sopivan
lisenssin alla kaiken kansan käyttöön. Mikä paremmin
toteuttaisikaan kielellistä tasa-arvoa, kun suomen kielen
oikeinkirjoituksen tarkistuksen saattaminen niidenkin käyttöön
joilla ei ole varaa kalliisiin kaupallisiin toimisto-ohjelma
sovelluksiin. Mikäli tuon kielellisen tasa-arvon voi tällä tavoin
tulkita. Lisäksi tämä avaisi ovet kaikenlaisille muillekin
sovelluksille.
Minusta henkilökohtaisesti on harmi ettei opetusministeriö ole
saattanut tuota teosta ilmaiseksi Internettiin kaikkien
käytettäväksi.
Jotta asia ei olisi aivan näin helppoa, en usko että Kotus olisi
valmis vapauttamaan kyseistä sanalistaa aivan helposti
useastakaan syystä.
1.
Tälläiset tutkimuslaitokset ovat erittäin mustasukkaisia
aineistojensa suhteen ja suojelevat omien niiden
tekijänoikeuksia kynsin ja hampain, eivätkä mielellään anna
niitä tuosta vaan toisten käsiin.
2.
Aineistoin vapauttaminen voisi huonontaa CD-perussanakirjan
myyntiä jonka tuloilla rahoitetaan Kotuksen toimintaa.
Tosin Kotuksen noin 6 milj eur budjetista tulee 90% valtion
kassasta ja veikkausvaroista. Ja tuosa jäljelle jäävästä
osuudestakin suurimman osan muodostavat kotuksen neuvonta-,
tekstintarkastus- ja koulutus palvelut, sekä muut myytävät
tuotteet.
Lisäksi tuota sanakirjaahan ei tarvitsisi vapauttaa kokonaan.
Riittäisi kun saisimme pelkän sanalistan ja taivutus tiedot.
Kuvauksilla ja konteksti esimerkeilla, sekä muilla tiedoilla
me emme tekisi paljoakaan. Pelkkänä sanalistana vapautettuna
ei tuo luultavasti haittaisi juuri ollenkaan itse sanakirjan
myyntiä.
Uskon kuitenkin, että tämä olisi mahdollista, jos idean taakse
saataisiin tarpeeksi arvovaltaisia tahoja vakuuttamaan Kotus,
että aineiston vapauttamisella se saisi paljon enemmän
positiivistä julkisuutta ja voisi ottaa aivan uudenlaisen roolin
suomenkielen vaikuttajana. Vaikka kotus ei olisikaan heti
kiinnostunut vapauttamaan kyseistä aineistoa niin voisi auttaa,
jos joku opetusministeriössä puoltaisi asiaa. Vaikka
opetusministeriöllä ei olekaan päätäntä valtaa Kotuksessa niin
kyllä rahoittajan ääntä aina hieman kuunnellaan.
No ehkä tämä meni jo vähän pitkälle, mutta minusta olisi
todella hyvä jos tälläiseen hankkeeseen saataisiin mukaan
juuri se taho jolla virallinen vastuu suomessa sanojen
oikeinkirjoituksesta. Ja vielä kun tuo toiminta on verorahoin
kustannettu, niin on sääli jos nämä hyödyt jäävät vain harvojen
käsiin.
Vaikka kukaan ei päätyisikään ajamaan tuon aineiston
vapauttamista niin kannattaisi silti muuten tutustua tuohon
Perussanakirjaan ja tapaan jolla siellä on sanat jaettu
taivutus- ja astevaihteluluokkiin. Jos joku haluaa esimerkin
miten tuossa teoksessa nämä on esitetty, niin voin kopioida
jonkun esimerkin.
Terveisin Saku Seppälä
---------------------------------------------------------------------
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]