[dataparksearch] [Forum] Abount chinese segment

2008-10-19 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: yjzheng Subject: Abount chinese segment Title and body of pages both contain the keyword ''. If they are indexed at the same time , the keyword '' is found via search.cgi. when I only index on the title, the search result for

[dataparksearch] [Forum] Re: Можно-ли использовать вывод скрипта в indexer.conf?

2008-10-20 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: lxx Subject: Re: Можно-ли использовать вывод скрипта в indexer.conf? Понял, спасибо, так и сделал. И еще один вопрос из той-же оперы: Можно-ли в шаблоне search.htm использовать вставки на PHP или Перле, или-же инклудить php/perl

[dataparksearch] [Forum] Re: some Help for result listing

2008-10-20 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: dearste Subject: Re: some Help for result listing At 02:19:01 18/10/08, Maxime wrote: Have you set CollectLinks yes option in your indexer.conf before indexing ? Have you executed indexer -TW after indxeing had been done ? Sure

[dataparksearch] [Forum] Re: some Help for result listing

2008-10-20 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: dearste Subject: Re: some Help for result listing At 12:50:02 20/10/08, Maxime wrote: The only way to influent result ordering directly is to disable PopRank calculation, assign your own url.pop_rank values and then use s=PR

[dataparksearch] [Forum] Re: some Help for result listing

2008-10-20 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: some Help for result listing This function isn't related to the result ordering. I use it to track clicks on document position in the SERP of 43n39e.ru. Perhaps, you would be interested to rebuild dpsearch with

[dataparksearch] [Forum] Re: what is the best indexer parameter for this configuration

2008-10-20 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: what is the best indexer parameter for this configuration DataparkSearch automatically reindex all pages in the database after a period speified by the Period command has been expired. During this process all new

[dataparksearch] [Forum] Re: PagesInGroup does not work

2008-10-20 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: PagesInGroup does not work Please change GroupBySite no to GroupBySite yes - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: highlight seach word

2008-10-20 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: highlight seach word You need to enable the support for Stored database, see http://www.dataparksearch.org/dpsearch-stored.en.html - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: accessing forums

2008-10-20 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: accessing forums DataparkSearch supports only the Basic authentication, see http://www.dataparksearch.org/dpsearch-indexcmd.en.html#authbasic_cmd - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the

[dataparksearch] [Forum] Re: Оптимальная среда

2008-10-20 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Оптимальная среда Пересоберите, пожалуйста, с новой версией src/parsehtml.c: http://dataparksearch.googlecode.com/svn/trunk/src/parsehtml.c - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full

[dataparksearch] [Forum] Re: один вопросик

2008-10-21 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: overseer Subject: Re: один вопросик VarDir: '/usr/local/dpsearch/var' Affixes: 0, Spells: 0, Synonyms: 0, Acronyms: 0, Stopwords: 0 Chinese dictionary with 0 entries Korean dictionary with 0 entries Thai dictionary with 0 entries

[dataparksearch] [Forum] Re: один вопросик

2008-10-21 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: overseer Subject: Re: один вопросик у меня при запросе похоже сразу все результаты в куче выдаются,ведь при запросе должно с выдаваться в скобочках количество результатов с этого сайта, но я их ни разу пока ни разу не наблюдал) - -

[dataparksearch] [Forum] Re: some Help for result listing

2008-10-21 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: some Help for result listing Yes, you can adjust url.pop_rank value with any your own script. But you need to execute indexer -TW command to write down update URL unfo and send -HUP signal to searchd to reload

[dataparksearch] [Forum] Re: один вопросик

2008-10-21 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: один вопросик Для включения групировки по сайтам, необходимо передавать CGI-параметр GroupBySite=yes, чтобы включить группировку по умолчанию, добавьте команду GroupBySite yes в вам поисковый шаблон search.htm. - -

[dataparksearch] [Forum] Re: один вопросик

2008-10-21 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: swsn Subject: Re: один вопросик GroupBySite=yes - не отдуплился GroupBySite yes - работает но,практически все результаты со всех сайтов попадают туда. - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: один вопросик

2008-10-21 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: swsn Subject: Re: один вопросик т.е. если смотреть все результаты для этого сайта то туда попадают и другие индексируемые сервера.( - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: один вопросик

2008-10-21 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: один вопросик Какое значение MaxSiteLevel у вас задано ? - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: один вопросик

2008-10-21 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: swsn Subject: Re: один вопросик забыл в индексере её указать... - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here: http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=05;topic_id=1219057417;page=2

[dataparksearch] [Forum] Re: highlight seach word

2008-10-21 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: alextan Subject: Re: highlight seach word i tried this, but i got this error, Can't open/create file /usr/local/dpsearch/var/store/doc007f.i [base.c:96] -- 2 (No such file or directory) the directory exist and writeable, any ideas?

[dataparksearch] [Forum] Re: highlight seach word

2008-10-21 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: highlight seach word This is normal for fresh created stored database. Although, please check file permissions on such files for a user under which search.cgi is executed. - - - - - - - - - - - - - - - - - - - - -

[dataparksearch] [Forum] Re: PagesInGroup does not work

2008-10-21 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: dearste Subject: Re: PagesInGroup does not work is possible use GroupBySite no and PagesInGroup value to 2? so i can see google loke results? - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: some Help for result listing

2008-10-21 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: dearste Subject: Re: some Help for result listing At 10:36:04 21/10/08, Maxime wrote: Yes, you can adjust url.pop_rank value with any your own script. But you need to execute indexer -TW command to write down update URL unfo and

[dataparksearch] [Forum] Re: PagesInGroup does not work

2008-10-21 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: PagesInGroup does not work No, PagesInGroup is taken in account only when GroupBySite is enabled. Try to put GroupBySite yes PagesInGroup 2 in your search template also. - - - - - - - - - - - - - - - - - - - - - -

[dataparksearch] [Forum] Re: some Help for result listing

2008-10-21 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: some Help for result listing Adjust means either increase or decrease the value of url.pop_rank, so the example is: UPDATE url SET pop_rank = pop_rank + 0.1 WHERE url='http://www.site.ext/'; or to set the maximal

[dataparksearch] [Forum] Re: PagesInGroup does not work

2008-10-21 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: dearste Subject: Re: PagesInGroup does not work Ok I know. But I never see GrBeg on my results. is possible this? - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Антон Лесников

2008-10-22 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: nexus Subject: Антон Лесников

[dataparksearch] [Forum] Re: Возможности DataparkSearch

2008-10-24 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Возможности DataparkSearch 1. Да, минимальный размер документа к индексированию задается командой MinDocSize, http://www.dataparksearch.org/dpsearch-indexcmd.ru.html#mindocsize_cmd 2. Да, но дефолтовый шаблон

[dataparksearch] [Forum] Re: running 2 or more indexer

2008-10-24 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: alextan Subject: Re: running 2 or more indexer Hi Maxime I'm confused with the documentation, if i have another indexer.conf (indexer-2.conf) file,, does it mean that it should contain the sames sites in the indexer.conf or the

[dataparksearch] [Forum] Re: scrapping a website

2008-10-24 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: alextan Subject: Re: scrapping a website Hi Maxime I only want one (1) site to be downloaded to the local directory, and the rest of the sites to the database, how do i do this? thanks marlo At 09:10:31 23/10/08, Maxime wrote:

[dataparksearch] [Forum] Re: Возможности DataparkSearch

2008-10-24 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Возможности DataparkSearch При сканировании документа на ссылки, все относительные ссылки переводятся в абсолютные перед записью в базу, в результата поиска выдаются абсолютные ссылки. Возможно вам подойтет

[dataparksearch] [Forum] Re: Возможности DataparkSearch

2008-10-24 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maniac Subject: Re: Возможности DataparkSearch Server HrefOnly http://www.mnogosearch.org/ Realm CheckOnly * - это именно то, что мне надо. Последний вопрос перед боем - Не вызовет ли это каких-то ограничений в поиске по тексту

[dataparksearch] [Forum] Re: running 2 or more indexer

2008-10-24 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: running 2 or more indexer Different configs also means different DBAddr commands, so you have to create yet another database for the second config, - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the

[dataparksearch] [Forum] Invalid MySQL directory - unable to find mysql.h

2008-10-25 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maniac Subject: Invalid MySQL directory - unable to find mysql.h Invalid MySQL directory - unable to find mysql.h а у меня его нигде нет... Debian. MySql установлен через apt-get... Подскажите пожалуйста - чем его удовлетворить? - - -

[dataparksearch] [Forum] %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5

2008-10-26 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maniac Subject: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5 Это русский язык. И URL и в Сrosswords - в выдаче, в логах и в базе. На входе windows-1251. RemoteCharset windows-1251 URLCharset windows-1251 Подскажите пожалуйста , что я упустил.

[dataparksearch] [Forum] Re: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5

2008-10-26 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5 А что вы ожидаете получить. а что получаете ? - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: Возможности DataparkSearch

2008-10-26 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Возможности DataparkSearch ... страницы будут выкачиваться, в них будут искаться новые ссылки, но их содержимое не будет индексироваться. - это подразумевает, что в базу ничего не попадает... - - - - - - - - - -

[dataparksearch] [Forum] Re: Неумирающие процессы httpd

2008-10-26 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Неумирающие процессы httpd Если число незавершившихся процессов не превышает значения MaxSpareServers + число процессов httpd, обрабатывающих запросов в данный момент, то все происходит строго в соответсвии с

[dataparksearch] [Forum] Re: Кодировка в storedoc

2008-10-26 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Кодировка в storedoc В заголовках ответа сервера отдаётся кодировка windows-1251. - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: Возможности DataparkSearch

2008-10-26 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maniac Subject: Re: Возможности DataparkSearch This is it ! ( Отож! ) Как же понимать Ваш совет данный двумя постами ранее? Я то хочу чтобы в неё попали ссылки с анкорами... Что я не понимаю? - - - - - - - - - - - - - - - - - - -

[dataparksearch] [Forum] Re: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5

2008-10-26 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5 А в поисковом шаблоне search.htm как выводится URL, мета-переменной $%(URL) или $(URL) ? Первая обозначает вывод с перекодировкой всех недопустимых символов с url-escape. - - - -

[dataparksearch] [Forum] Re: Возможности DataparkSearch

2008-10-26 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Возможности DataparkSearch Простите, я уже совсем запутался, что и с какого сайта вы ходите получить... - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: Возможности DataparkSearch

2008-10-26 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maniac Subject: Re: Возможности DataparkSearch Дико извиняюсь за замороченье и тупость - я не нарочно. Http - предмет поиска - как внешние так и внутренние ссылки на видеофайлы. Результат(выдача) поиска - список ссылок с указанием

[dataparksearch] [Forum] Re: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5

2008-10-27 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5 Какую версию dpsearch вы используете ?Если это версия 4.50 или выше, попробуйте секции, относящиеся к URL описать в sections.conf с опцией strict: Section url 5 512 strict и

[dataparksearch] [Forum] Re: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5

2008-10-27 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maniac Subject: Re: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5 Использую транк. Section url 6 512 strict Section url.file7 512 strict #Section url.directory 7 512

[dataparksearch] [Forum] Re: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5

2008-10-27 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5 В Request.Accept-Charset приоритетной указывается кодировка LocalCharset. - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: Возможности DataparkSearch

2008-10-27 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Возможности DataparkSearch Да, crosswords будут приписаны к документу, на котрый ссылается соответствующая ссылка, но только при следующем индексировании документа по это ссылке (а не того докумена, где эти

[dataparksearch] [Forum] Re: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5

2008-10-28 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maniac Subject: Re: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5 ОК спасибо за прояснение -- При поиске по FTP не работает иначе: media/Music/??? ?? так оно выводит русские

[dataparksearch] [Forum] Re: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5

2008-10-28 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5 К сожалению, сайт mpeg.net.ua:8000 недоступен. Приведите, пожалуйста, другой пример. - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: Неумирающие процессы httpd

2008-10-28 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: zabar Subject: Re: Неумирающие процессы httpd найден ответ в modsearchd.conf #AspellExtensions yes закомментировав аспель процессы стали умирать в штатном режиме - это все наверное продолжение этой темы

[dataparksearch] [Forum] Re: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5

2008-10-28 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maniac Subject: Re: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5 Региональные ограничения? http://clip.net.ua/upload_test/ должно быть доступно отовсюду Очень иллюстративно - из четырёх файлов показывает 8 в разной кодировке! Результат здесь :

[dataparksearch] [Forum] Re: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5

2008-10-28 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maniac Subject: Re: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5 Пардон - у меня некие проблемы с базой! Несмотря на то, что везде UTF-8 general ci не пускает русские буквицы - даже вручную через phpmyadmin... Sorry - пошел разбираться... - - -

[dataparksearch] [Forum] Re: Problem with search.cgi

2008-10-31 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Skuta Subject: Re: Problem with search.cgi Found the -TW thing thx :) - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here: http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=02;topic_id=1225440969

[dataparksearch] [Forum] Листинг индексатора

2008-10-31 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: zabar Subject: Листинг индексатора Иногда вот такая красота проскакивает http://s47.radikal.ru/i115/0810/7a/f1d5fcae1470.jpg - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: Листинг индексатора

2008-10-31 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: zabar Subject: Re: Листинг индексатора не, я о том, что ранее индексатор вроде не выводил на показ фрагменты кода - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: Листинг индексатора

2008-10-31 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Листинг индексатора парсер сообщает о неправильном тэге и о тэге, который ожидается. Просто из-за ошибки разбирался код PHP вместо XML, - так получилось, что часть кода было распознано как тэг :) - - - - - - - - -

[dataparksearch] [Forum] Re: accessing forums

2008-10-31 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Skuta Subject: Re: accessing forums I'd suggest to write some script that would open the communication - and echo the forum's websites to indexer, but that's another story :) - - - - - - - - - - - - - - - - - - - - - - - - - - - -

[dataparksearch] [Forum] Indexer deleting old urls?

2008-10-31 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Skuta Subject: Indexer deleting old urls? Hey, I haven't found anything about this in documentation. But imagine website A is being indexed.. then i decide I do not want to index A but B. So I change indexer.conf - Delete Server A

[dataparksearch] [Forum] Re: Writing a search frontend

2008-10-31 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Fero Subject: Re: Writing a search frontend Yes, Maxime, please tell us :) - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Можно ли проиндексировать только главные страницы сайтов

2008-10-31 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: DT Subject: Можно ли проиндексировать только главные страницы сайтов Задача: при помощи первоначального списка доменов (Server) проиндексировать только главные страницы, получить список на другие сайты (которых нет в списке Server),

[dataparksearch] [Forum] Re: Можно ли проиндексировать только главные страницы сайтов

2008-10-31 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Можно ли проиндексировать только главные страницы сайтов Вам нужно к вашему списку команд Server добавить команду Server regex http://[^\/]*\/$ А также команду ServerAlias, преобразовывающую все ссылки в ссылки на

[dataparksearch] [Forum] Re: Segmentation fault

2008-10-31 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: zabar Subject: Re: Segmentation fault новая кора GNU gdb 6.1.1 [FreeBSD] Copyright 2004 Free Software Foundation, Inc. GDB is free software, covered by the GNU General Public License, and you are welcome to change it and/or distribute

[dataparksearch] [Forum] Re: Можно ли проиндексировать только главные страницы сайтов

2008-11-01 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: DT Subject: Re: Можно ли проиндексировать только главные страницы сайтов После добавления указанных строк ругается на регулярное выражение. Если Server regex *\/$]http://[^\/]*\/$ заменить на Server regex ^http:\/\/[^\.].ru то это

[dataparksearch] [Forum] Re: Можно ли проиндексировать только главные страницы сайтов

2008-11-01 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: DT Subject: Re: Можно ли проиндексировать только главные страницы сайтов Спасибо - такой вариант работает. - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: Ошибка при установке

2008-11-01 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: zabar Subject: Re: Ошибка при установке в портах есть 4.50 ставь и не парься cd /usr/ports/www/dpsearch/ make install clean - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: dictionary tables

2008-11-02 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Skuta Subject: Re: dictionary tables I have similar task, I don't need dict-type of search but full text. dbmode is set multi - how do I set up dataparsearch to do it as full text? - storing document, url, and keywords. What we need

[dataparksearch] [Forum] Re: cached тормозит

2008-11-02 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: zabar Subject: Re: cached тормозит по завершению работы run-splitter получаю следующее Splitting done. Deleting logs... Done т.е. процесс завершил работу и все в норме, но открыв папку splitter вижу в ней неотработанные *.log файлы,

[dataparksearch] [Forum] Re: the help in installation Is necessary, I will pay $

2008-11-03 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Hrajsa.sk Subject: Re: the help in installation Is necessary, I will pay $ http://www.justuber.com/linux:ubuntu_and_debian:installing_dataparksearch_engine_on_ubuntu_from_scratch - - - - - - - - - - - - - - - - - - - - - - - - - - - -

[dataparksearch] [Forum] Re: getting closer to my end result

2008-11-03 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Skuta Subject: Re: getting closer to my end result I think that indexer should have option of do not eat so much CPU time - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: Построение рефератов(нагрузка)

2008-11-03 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Построение рефератов(нагрузка) Отложить построение рефератов возможности нет, они создаются во время индексирования. Попробуйте с помощью ключа -p установить паузу междупоследовательно индексируемыми документами

[dataparksearch] [Forum] Re: search.cgi downloading

2008-11-03 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Skuta Subject: Re: search.cgi downloading NuBee: Use this as your guide to install dataparksearch correctly: http://www.justuber.com/linux:ubuntu_and_debian:installing_dataparksearch_engine_on_ubuntu_from_scratch - - - - - - - - - - -

[dataparksearch] [Forum] Как сделать полный текст индексации и поиска?

2008-11-03 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Skuta Subject: Как сделать полный текст индексации и поиска? Привет, Я заинтересован в принятии dataparksearch как полный текст искателя - это означает, что будет идти через веб-сайты, индекс них + сохранить полную копию БД.

[dataparksearch] [Forum] Re: Ошибка при установке

2008-11-04 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Ошибка при установке А что выводится в config.log ? - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here: http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=04;topic_id=1196338373

[dataparksearch] [Forum] Re: Adding rank to URL

2008-11-04 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Adding rank to URL Please explain, what are you expecting to archive ? FYI: you can record all search parameters with search request tracking, see http://www.dataparksearch.org/dpsearch-track.en.html - - - - - - -

[dataparksearch] [Forum] Re: Как сделать полный текст индексации и поиска?

2008-11-05 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Как сделать полный текст индексации и поиска? В чем будет заключаться проверка на плагиат ? Поиска с учетом неточной похожести текстов в DataparkSearch нет. Для сохранения копий индексируемых документов вам нужно

[dataparksearch] [Forum] Re: Indexer deleting old urls?

2008-11-05 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: alex tan Subject: Re: Indexer deleting old urls? the surest way to clear the database is to delete and re create it. No 'Server' command for url - you have missed the trailing / - - - - - - - - - - - - - - - - - - - - - - - - - - - -

[dataparksearch] [Forum] Re: Не ищет файлы с русскими именами

2008-11-05 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Не ищет файлы с русскими именами RemoteCharset windows-1251 Realm file:///mnt/shmelev/test3/*/ Server page file:///mnt/shmelev/test3/ RemoteCharset Server file:///mnt/shmelev/test3/ URL file:///mnt/shmelev/test3/ -

[dataparksearch] [Forum] searchd speed

2008-11-05 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: dearste Subject: searchd speed Hi, I have 87000 document indexed, i have added 2 searchd in my search template. the searchd daemons run on 2 different pc, and the template is on third pc. But the search speed is very slow...about 20

[dataparksearch] [Forum] Re: searchd speed

2008-11-05 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: searchd speed Have you URL data preloaded with PreloadURLData yes command in your searchd.conf files ? If you use cache mode limits, you can also preload some limits with the PreloadLimit command. - - - - - - - -

[dataparksearch] [Forum] Re: searchd speed

2008-11-06 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: dearste Subject: Re: searchd speed At 01:49:14 06/11/08, Maxime wrote: Have you URL data preloaded with PreloadURLData yes command in your searchd.conf files ? If you use cache mode limits, you can also preload some limits with the

[dataparksearch] [Forum] Re: cached тормозит

2008-11-06 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Cerg Subject: Re: cached тормозит В старом варианте как правильно сбрасывать кеш? indexer -THW run-splitter -k -s -o или достаточно run-splitter -k -s -o - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic

[dataparksearch] [Forum] Re: cached тормозит

2008-11-06 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: cached тормозит indexer -TH run-splitter -s -o или run-splitter -k -s -o - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: Adding rank to URL

2008-11-07 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: alex tan Subject: Re: Adding rank to URL I thinks he wanted to increase the popularity rank of a site everytime the link is clicked, is this possible? or is it already included in dpsearch At 02:07:46 05/11/08, Maxime wrote:

[dataparksearch] [Forum] Re: Adding rank to URL

2008-11-07 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: dearste Subject: Re: Adding rank to URL At 12:34:48 07/11/08, alex tan wrote: I thinks he wanted to increase the popularity rank of a site everytime the link is clicked, is this possible? or is it already included in dpsearch At

[dataparksearch] [Forum] Регистрация запросов

2008-11-08 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Cerg Subject: Регистрация запросов Добрый день! Наблюдаю непонятку в регистрации запросов qtrack поле found пример: запрос собаки - найдено 2420 сайтов а в таблицу ложатся и 74446, 7360, 2420, а так же и 0 проскакивает что не так? -

[dataparksearch] [Forum] Команды и их позиции в *.conf-dist

2008-11-09 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: zabar Subject: Команды и их позиции в *.conf-dist Максим, может быть у Вас найдется время на пересоздание всех *.conf-dist с указанием всех возможных команд и самое главное с их точным(рабочим позиционированием)? С

[dataparksearch] [Forum] Re: Не ищет файлы с русскими именами

2008-11-09 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Не ищет файлы с русскими именами Покажите, пожалуста, полный вывод для обоих случаев. - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: Не ищет файлы с русскими именами

2008-11-10 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Andrew Subject: Re: Не ищет файлы с русскими именами Полный вывод для обоих случаев --- Эксперимент №1

[dataparksearch] [Forum] Re: cached тормозит

2008-11-10 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: zabar Subject: Re: cached тормозит indexer -TRN3 /usr/local/dpsearch/indexer-zoo.conf GNU gdb 6.1.1 [FreeBSD] Copyright 2004 Free Software Foundation, Inc. GDB is free software, covered by the GNU General Public License, and you are

[dataparksearch] [Forum] status code 2200

2008-11-10 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: yjzheng Subject: status code 2200 what meaning is the status code 2200? - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here: http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=02;post=

[dataparksearch] [Forum] Re: status code 2200

2008-11-10 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: status code 2200 Status code 2200 means that document is a clone and its status code is 200 (2000+200). - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: abount indexing

2008-11-10 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: yjzheng Subject: Re: abount indexing When I ran the indexer command for the first time, the scaning output is the following: [EMAIL PROTECTED] etc]# indexer -a -N5 indexer[28095]: {00} indexer from dpsearch-4.50-mysql started with

[dataparksearch] [Forum] Re: Оптимальная среда

2008-11-10 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Fox Subject: Re: Оптимальная среда snapshot: 4.51-01112008 ./configure --enable-memdebug --enable-shared --enable-pthreads --disable-parser --without-aspell --enable-file --enable-http --enable-ftp --disable-news --with-pgsql

[dataparksearch] [Forum] Re: использование BodyPattern

2008-11-11 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: использование BodyPattern Используйте команду NoIndexIf: http://www.dataparksearch.org/dpsearch-indexcmd.ru.html#noindexif_cmd - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: scrapping a website

2008-11-11 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: scrapping a website With the latest snapshot http://www.dataparksearch.org/dpsearch-4.51-2008.tar.bz2 you can specify MirrorRoot and MirrorHeadersRoot on per server basis, i.e. MirrorRoot /path/to/mirror Sever

[dataparksearch] [Forum] Использование NoIndexIf

2008-11-12 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Михаил Subject: Использование NoIndexIf Здравствуйте! Поставил в конце indexer.conf строку : NoIndexIf String body *content-container* после индексации (а сперва делаю indexer -C), всё равно при поиске вылезают страницы содержащие

[dataparksearch] [Forum] Re: mod_dpsearch exit signal Segmentation fault (11)

2008-11-12 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: mod_dpsearch exit signal Segmentation fault (11) У вас mod_dpsearch работает из-под nginx, разве это возможно ? Обычно в FreeBSD чтобы получить coredump для apache необходимо выставить параметр ядра sysctl

[dataparksearch] [Forum] Re: mod_dpsearch exit signal Segmentation fault (11)

2008-11-12 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: mod_dpsearch exit signal Segmentation fault (11) Перестартуйте apache. Coredump файлы будут записываться в HOME директорию юзера, из-под которого запускается apache. - - - - - - - - - - - - - - - - - - - - - - - -

[dataparksearch] [Forum] Re: mod_dpsearch exit signal Segmentation fault (11)

2008-11-12 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: zabar Subject: Re: mod_dpsearch exit signal Segmentation fault (11) сделал, но дампа все равно нет. перезагрузить не забыл. [EMAIL PROTECTED] /nonexistent]# cat /etc/passwd | grep www www:*:80:80:World Wide Web

[dataparksearch] [Forum] Re: mod_dpsearch exit signal Segmentation fault (11)

2008-11-12 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: mod_dpsearch exit signal Segmentation fault (11) Попробуйте в httpd.conf указать команду CoreDumpDirectory /tmp и перестартовать apache. coredump должен появиться в директории /tmp - - - - - - - - - - - - - - - - -

[dataparksearch] [Forum] Re: mod_dpsearch exit signal Segmentation fault (11)

2008-11-12 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: mod_dpsearch exit signal Segmentation fault (11) Проверьте, пожалуйста, права на чтение файлов шаблонов поиска и включаемых из них юзером: из-пол которого запускается apache. - - - - - - - - - - - - - - - - - - - -

<    1   2   3   4   5   6   7   8   9   >