On Sun, Mar 2, 2008 at 10:12 PM, Lucian Constantin
<[EMAIL PROTECTED]> wrote:
> Salut,
>
>  Am pus un aspell6-ro-02-latin10.tar.bz2 in pagina de
>  download.
>
>  Un email earlier (nu situ cum de nu a ajuns pe lista):
>

Mersi, am compilat din nou pachetul aspell, e pe diacritice.ro, de ce
nu trimiţi dicţionarul la aspell pentru a fi distribuit? Orice e mai
bine decât nimic. Chiar dacă nu oferă sugestii perfecte, măcar
subliniază ce e incorect.

>  >>>>>
>
>  Scuze pentru mesajul precedent, am uitat ca nu imparte
>  automat paragrafele in linii, asadar au iesit liniile
>  alea kilometrice.
>
>  Am observat si eu ieri seara chestia cu "intr".
>  Face parte din ciclul unde dai si unde crapa. Sa
>  incerc sa explic.
>
>  Eu tin cuvintele in liste separate, pot fi vazute
>  si descarcate de la
>
>  http://rospell.svn.sourceforge.net/viewvc/rospell/
>
>  (este un web svn, pot fi accesate si direct prin svn).
>
>  Am acolo liste pe caprarii de substantive, verbe,
>  nume proprii, etc. Printre ele si doua liste de
>  cuvinte extrase din dexonline.ro, una din 2006 si
>  alta de anul trecut. Acum, prin cele doua liste
>  dexonline exista multe greseli de spelling, greseli
>  care vor deveni foarte vizibile in momentul in care
>  spellerul incearca sa sugereze cuvinte corecte. Deci,
>  spellerul gaseste un cuvant gresit, si iti sugereaza
>  ca inlocuitor unul si mai gresit!
>
>  Este problema pe care o avea dictionarul precedent.
>  Am rezolvat-o foarte simplu, eliminand cele doua
>  liste dexonline din dictionar. Acum casuta de
>  sugestii arata mult mai bine. Totodata, cuvintele
>  corecte din listele dexonline au disparut din
>  dictionar. Va mai dura ceva pana voi apuca sa trec
>  prin cele doua fisiere, si sa extrag cuvintele
>  corecte. Este vorba de cateva zeci de mii de cuvinte
>  in fiecare fisier.
>
>  Iar acum mizeria cu "intr". Cuvantul acesta figura
>  in mod gresit in una din listele dexonline. In
>  momentul in care a fost elimint, au iesit la lumina
>  alte probleme care erau acolo de la bun inceput
>  insa nimeni nu le-a vazut. Este vorba despre
>  caracterul linioara '-' care joaca un rol diferit
>  in limba engleza si in limba romana. Practic,
>  openoffice.org considera ca '-' delimiteaza doua
>  cuvinte diferite si-i va trimite spellerului separat
>  cuvintele din stanga si din dreapta linioarei. Nu-mi
>  dau seama cum il convingem pe openoffice.org ca
>  in cazul nostru '-' functioneaza ca o litera si
>  nu desparte doua cuvinte.
>
>  Avem suport in aspell pentru acest lucru iar aspell
>  functioneaza corect. Are un fisier separat unde-i
>  specifici ce litere pot face parte dintr-un cuvant.
>
>  Practic nu-mi dau seama cum rezolvam problema global,
>  apare peste tot, in openoffice, gnome, kde, probabil
>  gasim ceva similar si prin mozille. Ii contactam
>  si le umplem bugzilele de buguri? Chiar sunt curios,
>  ce sanse am avea sa ne bage in seama.
>
>  Alta solutie este sa o mascam. Deschid o noua lista
>  cu cuvinte in mod intentionat gresite pe care o pun
>  in dictionar. Va rezolva "intr-o" si o serie de alte
>  cuvinte uzuale - a mers in releasul precedent fara sa
>  ne dam seama. Practic, intr-o luna putem fi gata cu un
>  nou release. Probabil este vorba de cateva zeci de
>  cuvinte. Mai adaug si alte cuvinte uzuale care s-au
>  evaporat pe drum.
>
>  Deci, ce facem?
>
>  Daca dati de cuvinte care fie lipsesc, fie se afla in
>  dictionar si nu ar trebui sa fie acolo, le postati
>  aici pe lista. Niciun cuvant nu este prea neimportant
>  pentru a fi corectat. Multumiri lui Cristi pentru
>  lista de probleme semnalata in emailul precedent.
>
>
>  Alex:
>  > tu parcă ai spus de un ro.cwd, e un alt
>  > fișier decât ro.cwl ?
>
>  Am facut altfel de data asta. Cei de la aspell.net
>  distribuie un pachet numit aspell-lang pentru
>  impachetat dictionare. Practic ii dau o lista
>  de cuvinte necompresata si ii specific formatul, isi
>  creaza singur ce-i trebuie, inclusiv arhiva tar.bz2.
>
>  Cred ca word-list-compress il foloseau in aspell
>  0.50, acum s-au mutat pe alte bazaconii. Iti fac
>  urgent un dictionar aspell latin10 si il pun in
>  pagina de download.
>
>  Lucian
>  --
>  http://rospell.sourceforge.net
>
>

Eu o să încerc când am timp să mă uit şi eu peste cum funcţionează mai
în detaliu aspell şi hunspell.
Ţi-am spus că vreau să fac o interfaţă web pentru gestionarea listelor
de cuvinte şi posibilitatea de a descărca corectoare împachetate.

-- 
Alexandru Szasz

Raspunde prin e-mail lui