Salut,

Am tăcut mâlc vreo două zile :) Dacă aveți mysql instalat, puteți
downloada baza de date de la
http://dexonline.ro/download/dex-database.sql.gz . Structura
tabelelor, foarte pe scurt, este:

- lexems: cuvintele în forma de bază
- wordlist: formele flexionare
- inflection: diversele flexiuni existente, de exemplu "substantiv
neutru, nominativ-acuzativ, singular, nearticulat"
- LexemDefinitionMap: mapează lexeme la definiții (many-to-many)

Câmpul lexem_model_type indică tipul lexemului: A = adjectiv, M/F/N =
substantiv masc./fem./neutru, V = verb, VT = verb tranzitiv
(participiul se declină ca adjectiv), I = invariabil, P =
pronume/numeral, T = temporar (încă neetichetat).

De exemplu, lista completă de lexeme ar fi

select lexem_neaccentuat from lexems;

iar lista completă de flexiuni, cu forme de bază și modul de derivare ar fi:

select wl_neaccentuat, lexem_neaccentuat, infl_descr from wordlist,
lexems, inflections where wl_lexem = lexem_id and wl_analyse = infl_id
order by wl_neaccentuat;

Dacă nu aveți mysql, am pus aceste liste la
http://voronet.francu.com/~cata/cuvinte.txt și respectiv
http://voronet.francu.com/~cata/flexiuni.zip . De remarcat că acolo
sunt incluse și cuvinte trimise, dar încă nemoderate (circa 1000). Se
pot filtra și alea, cu niște query-uri mai complexe un pic.

Cum vi se pare? Chiar sunt curios, eu am așteptări mari de la acest
generator. :)

Cătălin

On 10/1/07, Alexandru Szasz <[EMAIL PROTECTED]> wrote:
> În data de 01.10.2007, Alexandru Szasz <[EMAIL PROTECTED]> a scris:
> > În data de 30.09.2007, struct bylighting <[EMAIL PROTECTED]> a scris:
> > > ...
> > >
> > > Pentru commabelow trebuie schimbat in iso8859-16
> > >
> >
> > N-aș vrea să folosesc ISO-8859-16, n-aș vrea să folosesc niciun iso,
> > nu sunt de acord cu posibilitatea de a afișa doar o limbă la un moment
> > dat, deci aș folosi UTF-8, crezi că e vreo problemă în aspell? În
> > myspell/hunspell am văzut că nu este.
> >
> > O să încerc să pun la punct o interfață cât pot de repede unde se
> > poate vizualiza/edita/adăuga la lista de cuvinte, dar ar fi excelent
> > dacă aș putea conecta-o la lista de cuvinte a dexonline-ului fără a
> > descărca întreaga bază de date mereu să văd dacă au apărut schimbări.
> >
> > --
> > Alexandru Szasz
> >
>
> Am realizat interfaţa de care vorbeam, o s-o fac publică în curând.
> Dintre listele care le-am folosit până acum, cea a lui Ionuţ Păduraru
> are problema că este mult prea mare datorită faptului că nu prea a
> folosit fişierul .aff .
> Lista lui Lucian conţine nişte cuvinte cu - care din câte am testat eu
> nu sunt necesare.
>
> Dacă Cătălin mai e prin preajmă şi poate trimite o listă completă de
> cuvinte (fără definiţii) din DEX98 ar fi excelent. Ultima dată când am
> încercat eu să extrag aşa ceva din DEX98 am găsit nişte cuvinte scrise
> greşit pe care nu le-am putut izola după nişte parametrii.
>
> Dacă mai are altcineva alte liste separate cu nume proprii, nume de
> oraşe, ţări, etc. poate să mi le trimită pe e-mail să mai testez
> interfaţa cu ele.
>
> --
> Alexandru Szasz
>

Raspunde prin e-mail lui