Cătălin Frâncu:
> În primul rând, am o întrebare, fiindcă niciodată nu m-am preocupat
> să aflu (scuze!). În ce măsură folosiți datele de la DEX online pentru
> corectorul ortografic al OpenOffice?

Am folosit http://dexonline.ro pentru verificarea și îmbunătățirea listei de
cuvinte. Puteam să folosim evident un dexoffline însă am găsit că varianta
web este mult mai ușor de accesat și manevrat. Definițiile din dexonline
nu prezintă interes pentru noi, dată fiind natura total diferită a proiectului.
O culegere de cuvinte automatizată din dexonline ridică pentru noi o serie
întreagă de probleme și nu am folosit așa ceva - revin mai jos cu ce
probleme avem.

> Eu mă refer strict la paternitatea asupra listei de forme
> flexionare produsă de DEX online, numai în cazul în care o folosiți.

Flexionarea este a noastră și este total diferită de ce aveți
voi. A pornit cu cel puțin trei ani înainte ca voi să vă apucați de
flexionare, și a evoluat independent. De exemplu, în 2006 flexionarea
lui Adrian Stoica genera în jur de 700.000 cuvinte, iar apoi în 2007
eu personal am rescris-o reușind să generez 1.300.000 cuvinte.
Varianta de astăzi ajunge undeva la 1.500.000 cuvinte.

Nu exclud mergând mai departe o oarecare
sincronizare a flexionărilor între diferitele dicționare discutate aici.

> De exemplu, două lucruri pe care DEX online nu
> le știe sunt (1) numele proprii și (2) formele enclitice (într-,
> ducându- etc.).

(1) Avem lista noastră de nume proprii, o puteți prelua dacă doriți.
(2) Le tratăm direct în regulile de flexionare.

> Și cum tratați neajunsurile bazei de date a DEX online?

Cel mai mare neajuns (dpdv al construirii unui speller) este că
are în baza de date o mulțime de cuvinte care fie nu mai sunt
în folosință, fie sunt regionalisme. De exemplu cuvântul
"fereastă". Nu mă încălzește cu nimic că a fost folosit de
Eminescu, sau că dexonline îi citează sursa ca [DLRM] Dicționarul
limbii române moderne, Academia Română, Institutul de Lingvistică 
"Iorgu Iordan", Editura Academiei, București, 1958.

Asemenea cuvinte apar când te aștepți mai puțin în lista de sugestii
oferite utilizatorului de către speller și este extrem de deranjant. Acesta
este principalul motiv pentru care excludem o preluare directă de date
din dexonline.

> eu nu pot fi moralmente de acord cu nici o
> relicențiere care ar putea duce la pierderea sistemului copyleft
> (http://www.gnu.org/copyleft/).

LGPL și MPL sunt două licențe copyleft. Este drept că MPL este o
chestie mai ciudată, în care module copyleft și module necopyleft
pot conviețui pașnic. Totuși, modulele copyleft își păstrează
caracteristica de copyleft.

Practic, dicționarul împreună cu codul de hunspell rămân copyleft
pentru oricine le folosește, fiind module legate original de o licență GPL.

Alex Szasz:
> Dacă nu, îi voi contacta eu peste 2 zile.

Cred că cel mai bine ar fi să deschizi un nou thread pe diacritice
google groups, ceva cu LaTeX în titlu, ca să-l trezim și pe Mugurel :)


Lucian
--
http://rospell.sourceforge.net



      
____________________________________________________________________________________
Be a better friend, newshound, and 
know-it-all with Yahoo! Mobile.  Try it now.  
http://mobile.yahoo.com/;_ylt=Ahu06i62sR8HDtDypao8Wcj9tAcJ

---------------------------------------------------------------------
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]

Raspunde prin e-mail lui