Dictionarul nostru cuprinde deocamdata o lista de 63230 cuvinte
După cum spuneam, lista de care dispun este mult mai mare, circa 500 de mii
de cuvinte. Aceasta este de fapt problema mea - este prea mare....

Asa cum spunea si Sorin, trebuie gasit un echilibru: nici o lista de
cuvinte imensa dar nici reguli foarte complicate pentru afixe.
Perfect de-acord. Dar... cum procedăm?
Consideraţi viabilă următoarea soluţie: aplicarea regulilor actuale asupra
formelor bază şi eliminarea din listă a formelor flexionare astfel obţinute?
Dacă da, cum pot reproduce programatic comportamentul OpenOfffce la
aplicarea regulilor?


On 27/04/07, Nicu Buculei <[EMAIL PROTECTED]> wrote:

Ionut Paduraru wrote:
> Dispun de o listă destul de completă de cuvinte din limba română
(inclusiv

Dictionarul nostru cuprinde deocamdata o lista de 63230 cuvinte

> forme flexionare). Cum pot ajunge de la această listă la un dicţionar
> ortografic? Trebuie să elimin intrările care se pot determina pe baza
> regulilor? Şi dacă da, cum obţin regulile?
> Nu ştiu cum funcţionează corectorul ortografic, dar bănuiesc că o listă
de
> câteva sute de mii de cuvinte ar întreuna foarte mult viteza de
procesare.
> Mă poate ajuta cineva?

Arunca o privire la http://ro.openoffice.org/langtools/ro_RO-pack.zip
Dictionarul ortografic contine doua fisiere:
- o lista de cuvinte, ro_RO.dic;
- o lista de afixe, ro_RO.aff, continind reguli flexionare a cuvintelor
din dictionar.

De principiu dictionarul poate functiona si numai cu lista de cuvinte,
fara nici o regla de afixe, numai ca ar fi nevoie de o lista foarte
lunga de cuvinte, care sa contina toate variatiile (singular-plural,
declinari, conjugari, articulari etc.)

Asa cum spunea si Sorin, trebuie gasit un echilibru: nici o lista de
cuvinte imensa dar nici reguli foarte complicate pentru afixe.

--
nicu :: http://nicubunu.ro :: http://nicubunu.blogspot.com
my OpenOffice.org pages: http://ooo.nicubunu.ro
Open Clip Art Library: http://www.openclipart.org
my cool Fedora wallpapers: http://fedora.nicubunu.ro/wallpapers/

---------------------------------------------------------------------
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]


Raspunde prin e-mail lui