Има напредък ;)

Сканирах няколко сайта за български думички. Няма да казвам кой, за да
не ме бият, че съм им товарил хостовете. ;)

Събирал съм думи избирателно, защото често в заглавната част, в
долната част и в менютата една и съща дума се повтаря многократно. Та
е сканирано всичко, което е съдържание. Проста проверка да е в между
<p> и </p> върши отлична работа. ;)

Имам около 20 милиона думички. Днеска мисля да пусна скриптове да ги
обработват и да имам някакъв резултат към края на деня. ;)


ItaEst се разпространява свободно, но кодът и данните не са свободни.
Трябва да се декомпилира (деасемблира), за да се изкарат някакви
данни. Предпочитам да си събера думичките сам. ;)


Лек ден,




2009/9/7 Nick <[email protected]>:
> On 09/07/2009 04:05 AM, Валерий Вутов wrote:
>
>> Здравейте,
>
>> ...
>> Ако някои си има на идея дали има такова нещо някъде под свободен лиценз да
>> свирка.
>> ...
>
>> В "джам" среда (всички версии) има един коректор (свободен лиценз) за
>> проверка и корекция на правопис ItaEst
>
> само дето последния път, когато инсталирах ItaEst, той все още беше само
> за офисния пакет на Microsoft. бях предложил на авторите да го направят
> и за OpenOffice (тогава май нямаше читаво сричкопренасяне там), но не
> знам дали са го направили.
>
> --
> the lunatics are in my head
> ---------------------------
> Nick Angelow
> _______________________________________________
> Dict mailing list
> [email protected]
> http://zver.fsa-bg.org/cgi-bin/mailman/listinfo/dict
>
_______________________________________________
Dict mailing list
[email protected]
http://zver.fsa-bg.org/cgi-bin/mailman/listinfo/dict

Raspunde prin e-mail lui