На 3 октомври 2001 (сряда) в 16:33 часа Luben Karavelov писа: > > в сайта на института по български език пише, че имат в електронен вид речник на > думите в българския - 80 000 думи ако не ме лъже паметта. някой има ли познати > в него за да попита при какви условия може да бъде използван. Считай, че при никакви. Но аз вече писах това на Радостин: авторски права има за колекции от думи, а не за самите думи. Това значи, че ако отнякъде се извади списък от думи, той може да се използва, стига да направим достатъчно промени в него. (Т.е. може да се използва легално, защото нелегално е ясно, че може.) > от друга страна може да се помисли за използването текстова база за да извлекат > думи. На първо време дори и думите от речника на Радостин ще са напълно достатъчни. Разбира се ако се допълнят с граматика, така че да се появят всички форми. > проблема при този подход е, че тази текстова база трябва да бъде подложена на > доста сложен текстов анализ, за да може в речника да имаме примерно: > > пис (с->ш) (глагол 1спр) (представки: на под из пре при). > а не въпросните 50-100 производни форми. Ще ти пратя това, което съм направил за mmorph, за да видиш наготово как изглежда една българска граматика. Разбира се граматиките за ispell са по-прости, като идеята явно ще бъде по-простите правила да се компенсират с повече явно описани изключения. С поздрав: Антон Зиновиев [EMAIL PROTECTED], [EMAIL PROTECTED] =========================================================================== A mail-list of Linux Users Group - Bulgaria (bulgarian linuxers) http://www.linux-bulgaria.org/ Hosted by Internet Group Ltd. - Stara Zagora