2012/9/12 Михаил Монашёв <[email protected]>
> > BM25 немного доработанная вроде. Сфинкс - это та же база данных, > только заточенная под поиск. Использовать её для выделения ключевых > слов и потом использовать их для поиска можно. Но зачем себя к Сфинксу > привязывать? У него много своих заморочек. Он хорошо выполняет базовые > задачи, а чуть в стороны - начинаются разные ограничения. Автор > Сфинкса готов их даже преодолевать, если у Вас есть для этого деньги. > > Для выделения ключевых слов её использовать не надо, а вот для поиска похожих текстов по уже выделенным словам можно было бы. Как достаточно быстрое решение, думаю, это годится. Незачем в этом месте писать свою работу с индексом. Но если дальше алгоритм планируется увести за пределы использования ключевых слов, то да, нужно нечто большее.
-- Moscow.pm mailing list [email protected] | http://moscow.pm.org
