Dacă nu mai e cineva interesat de contribuţie, contactează-mă pe mine
pe vreun mesager şi putem colabora la dicţionar.

google talk: alexxed, yahoo: alexandruszasz, msn: [EMAIL PROTECTED]

În data de 27.04.2007, Ionut Paduraru <[EMAIL PROTECTED]> a scris:
>> Dictionarul nostru cuprinde deocamdata o lista de 63230 cuvinte
După cum spuneam, lista de care dispun este mult mai mare, circa 500 de mii
de cuvinte. Aceasta este de fapt problema mea - este prea mare....

>> Asa cum spunea si Sorin, trebuie gasit un echilibru: nici o lista de
>> cuvinte imensa dar nici reguli foarte complicate pentru afixe.
Perfect de-acord. Dar... cum procedăm?
Consideraţi viabilă următoarea soluţie: aplicarea regulilor actuale asupra
formelor bază şi eliminarea din listă a formelor flexionare astfel obţinute?
Dacă da, cum pot reproduce programatic comportamentul OpenOfffce la
aplicarea regulilor?


On 27/04/07, Nicu Buculei <[EMAIL PROTECTED]> wrote:
>
> Ionut Paduraru wrote:
> > Dispun de o listă destul de completă de cuvinte din limba română
> (inclusiv
>
> Dictionarul nostru cuprinde deocamdata o lista de 63230 cuvinte
>
> > forme flexionare). Cum pot ajunge de la această listă la un dicţionar
> > ortografic? Trebuie să elimin intrările care se pot determina pe baza
> > regulilor? Şi dacă da, cum obţin regulile?
> > Nu ştiu cum funcţionează corectorul ortografic, dar bănuiesc că o listă
> de
> > câteva sute de mii de cuvinte ar întreuna foarte mult viteza de
> procesare.
> > Mă poate ajuta cineva?
>
> Arunca o privire la http://ro.openoffice.org/langtools/ro_RO-pack.zip
> Dictionarul ortografic contine doua fisiere:
> - o lista de cuvinte, ro_RO.dic;
> - o lista de afixe, ro_RO.aff, continind reguli flexionare a cuvintelor
> din dictionar.
>
> De principiu dictionarul poate functiona si numai cu lista de cuvinte,
> fara nici o regla de afixe, numai ca ar fi nevoie de o lista foarte
> lunga de cuvinte, care sa contina toate variatiile (singular-plural,
> declinari, conjugari, articulari etc.)
>
> Asa cum spunea si Sorin, trebuie gasit un echilibru: nici o lista de
> cuvinte imensa dar nici reguli foarte complicate pentru afixe.
>
> --
> nicu :: http://nicubunu.ro :: http://nicubunu.blogspot.com
> my OpenOffice.org pages: http://ooo.nicubunu.ro
> Open Clip Art Library: http://www.openclipart.org
> my cool Fedora wallpapers: http://fedora.nicubunu.ro/wallpapers/
>
> ---------------------------------------------------------------------
> To unsubscribe, e-mail: [EMAIL PROTECTED]
> For additional commands, e-mail: [EMAIL PROTECTED]
>
>



--
Alexandru Szasz

Raspunde prin e-mail lui