On Sun, Mar 2, 2008 at 10:12 PM, Lucian Constantin <[EMAIL PROTECTED]> wrote: > Salut, > > Am pus un aspell6-ro-02-latin10.tar.bz2 in pagina de > download. > > Un email earlier (nu situ cum de nu a ajuns pe lista): >
Mersi, am compilat din nou pachetul aspell, e pe diacritice.ro, de ce nu trimiţi dicţionarul la aspell pentru a fi distribuit? Orice e mai bine decât nimic. Chiar dacă nu oferă sugestii perfecte, măcar subliniază ce e incorect. > >>>>> > > Scuze pentru mesajul precedent, am uitat ca nu imparte > automat paragrafele in linii, asadar au iesit liniile > alea kilometrice. > > Am observat si eu ieri seara chestia cu "intr". > Face parte din ciclul unde dai si unde crapa. Sa > incerc sa explic. > > Eu tin cuvintele in liste separate, pot fi vazute > si descarcate de la > > http://rospell.svn.sourceforge.net/viewvc/rospell/ > > (este un web svn, pot fi accesate si direct prin svn). > > Am acolo liste pe caprarii de substantive, verbe, > nume proprii, etc. Printre ele si doua liste de > cuvinte extrase din dexonline.ro, una din 2006 si > alta de anul trecut. Acum, prin cele doua liste > dexonline exista multe greseli de spelling, greseli > care vor deveni foarte vizibile in momentul in care > spellerul incearca sa sugereze cuvinte corecte. Deci, > spellerul gaseste un cuvant gresit, si iti sugereaza > ca inlocuitor unul si mai gresit! > > Este problema pe care o avea dictionarul precedent. > Am rezolvat-o foarte simplu, eliminand cele doua > liste dexonline din dictionar. Acum casuta de > sugestii arata mult mai bine. Totodata, cuvintele > corecte din listele dexonline au disparut din > dictionar. Va mai dura ceva pana voi apuca sa trec > prin cele doua fisiere, si sa extrag cuvintele > corecte. Este vorba de cateva zeci de mii de cuvinte > in fiecare fisier. > > Iar acum mizeria cu "intr". Cuvantul acesta figura > in mod gresit in una din listele dexonline. In > momentul in care a fost elimint, au iesit la lumina > alte probleme care erau acolo de la bun inceput > insa nimeni nu le-a vazut. Este vorba despre > caracterul linioara '-' care joaca un rol diferit > in limba engleza si in limba romana. Practic, > openoffice.org considera ca '-' delimiteaza doua > cuvinte diferite si-i va trimite spellerului separat > cuvintele din stanga si din dreapta linioarei. Nu-mi > dau seama cum il convingem pe openoffice.org ca > in cazul nostru '-' functioneaza ca o litera si > nu desparte doua cuvinte. > > Avem suport in aspell pentru acest lucru iar aspell > functioneaza corect. Are un fisier separat unde-i > specifici ce litere pot face parte dintr-un cuvant. > > Practic nu-mi dau seama cum rezolvam problema global, > apare peste tot, in openoffice, gnome, kde, probabil > gasim ceva similar si prin mozille. Ii contactam > si le umplem bugzilele de buguri? Chiar sunt curios, > ce sanse am avea sa ne bage in seama. > > Alta solutie este sa o mascam. Deschid o noua lista > cu cuvinte in mod intentionat gresite pe care o pun > in dictionar. Va rezolva "intr-o" si o serie de alte > cuvinte uzuale - a mers in releasul precedent fara sa > ne dam seama. Practic, intr-o luna putem fi gata cu un > nou release. Probabil este vorba de cateva zeci de > cuvinte. Mai adaug si alte cuvinte uzuale care s-au > evaporat pe drum. > > Deci, ce facem? > > Daca dati de cuvinte care fie lipsesc, fie se afla in > dictionar si nu ar trebui sa fie acolo, le postati > aici pe lista. Niciun cuvant nu este prea neimportant > pentru a fi corectat. Multumiri lui Cristi pentru > lista de probleme semnalata in emailul precedent. > > > Alex: > > tu parcă ai spus de un ro.cwd, e un alt > > fișier decât ro.cwl ? > > Am facut altfel de data asta. Cei de la aspell.net > distribuie un pachet numit aspell-lang pentru > impachetat dictionare. Practic ii dau o lista > de cuvinte necompresata si ii specific formatul, isi > creaza singur ce-i trebuie, inclusiv arhiva tar.bz2. > > Cred ca word-list-compress il foloseau in aspell > 0.50, acum s-au mutat pe alte bazaconii. Iti fac > urgent un dictionar aspell latin10 si il pun in > pagina de download. > > Lucian > -- > http://rospell.sourceforge.net > > Eu o să încerc când am timp să mă uit şi eu peste cum funcţionează mai în detaliu aspell şi hunspell. Ţi-am spus că vreau să fac o interfaţă web pentru gestionarea listelor de cuvinte şi posibilitatea de a descărca corectoare împachetate. -- Alexandru Szasz
