- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: yjzheng
Subject: Abount chinese segment
Title and body of pages both contain the keyword ''. If they are indexed at
the same time , the keyword '' is found via search.cgi. when I only index
on the title, the search result for
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: lxx
Subject: Re: Можно-ли использовать вывод скрипта в indexer.conf?
Понял, спасибо, так и сделал.
И еще один вопрос из той-же оперы:
Можно-ли в шаблоне search.htm использовать вставки на PHP или Перле, или-же
инклудить php/perl
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: dearste
Subject: Re: some Help for result listing
At 02:19:01 18/10/08, Maxime wrote:
Have you set CollectLinks yes option in your indexer.conf before indexing ?
Have you executed indexer -TW after indxeing had been done ?
Sure
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: dearste
Subject: Re: some Help for result listing
At 12:50:02 20/10/08, Maxime wrote:
The only way to influent result ordering directly is to disable PopRank
calculation, assign your own url.pop_rank values and then use s=PR
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: some Help for result listing
This function isn't related to the result ordering. I use it to track clicks
on document position in the SERP of 43n39e.ru.
Perhaps, you would be interested to rebuild dpsearch with
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: what is the best indexer parameter for this configuration
DataparkSearch automatically reindex all pages in the database after a period
speified by the Period command has been expired. During this process all new
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: PagesInGroup does not work
Please change GroupBySite no to GroupBySite yes
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: highlight seach word
You need to enable the support for Stored database, see
http://www.dataparksearch.org/dpsearch-stored.en.html
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: accessing forums
DataparkSearch supports only the Basic authentication, see
http://www.dataparksearch.org/dpsearch-indexcmd.en.html#authbasic_cmd
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Оптимальная среда
Пересоберите, пожалуйста, с новой версией src/parsehtml.c:
http://dataparksearch.googlecode.com/svn/trunk/src/parsehtml.c
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: overseer
Subject: Re: один вопросик
VarDir: '/usr/local/dpsearch/var'
Affixes: 0, Spells: 0, Synonyms: 0, Acronyms: 0, Stopwords: 0
Chinese dictionary with 0 entries
Korean dictionary with 0 entries
Thai dictionary with 0 entries
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: overseer
Subject: Re: один вопросик
у меня при запросе похоже сразу все результаты в куче выдаются,ведь при запросе
должно с выдаваться в скобочках количество результатов с этого сайта, но я их
ни разу пока ни разу не наблюдал)
- -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: some Help for result listing
Yes, you can adjust url.pop_rank value with any your own script. But you need
to execute indexer -TW command to write down update URL unfo and send -HUP
signal to searchd to reload
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: один вопросик
Для включения групировки по сайтам, необходимо передавать CGI-параметр
GroupBySite=yes, чтобы включить группировку по умолчанию, добавьте команду
GroupBySite yes
в вам поисковый шаблон search.htm.
- -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: swsn
Subject: Re: один вопросик
GroupBySite=yes - не отдуплился
GroupBySite yes - работает но,практически все результаты со всех сайтов
попадают туда.
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: swsn
Subject: Re: один вопросик
т.е. если смотреть все результаты для этого сайта то туда попадают и другие
индексируемые сервера.(
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: один вопросик
Какое значение MaxSiteLevel у вас задано ?
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: swsn
Subject: Re: один вопросик
забыл в индексере её указать...
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=05;topic_id=1219057417;page=2
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: alextan
Subject: Re: highlight seach word
i tried this, but i got this error,
Can't open/create file /usr/local/dpsearch/var/store/doc007f.i [base.c:96] --
2 (No such file or directory)
the directory exist and writeable, any ideas?
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: highlight seach word
This is normal for fresh created stored database. Although, please check file
permissions on such files for a user under which search.cgi is executed.
- - - - - - - - - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: dearste
Subject: Re: PagesInGroup does not work
is possible use GroupBySite no and PagesInGroup value to 2?
so i can see google loke results?
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: dearste
Subject: Re: some Help for result listing
At 10:36:04 21/10/08, Maxime wrote:
Yes, you can adjust url.pop_rank value with any your own script. But you need
to execute indexer -TW command to write down update URL unfo and
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: PagesInGroup does not work
No, PagesInGroup is taken in account only when GroupBySite is enabled.
Try to put
GroupBySite yes
PagesInGroup 2
in your search template also.
- - - - - - - - - - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: some Help for result listing
Adjust means either increase or decrease the value of url.pop_rank, so the
example is:
UPDATE url SET pop_rank = pop_rank + 0.1 WHERE url='http://www.site.ext/';
or to set the maximal
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: dearste
Subject: Re: PagesInGroup does not work
Ok I know.
But I never see GrBeg on my results.
is possible this?
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: nexus
Subject: Антон Лесников
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Возможности DataparkSearch
1. Да, минимальный размер документа к индексированию задается командой
MinDocSize,
http://www.dataparksearch.org/dpsearch-indexcmd.ru.html#mindocsize_cmd
2. Да, но дефолтовый шаблон
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: alextan
Subject: Re: running 2 or more indexer
Hi Maxime
I'm confused with the documentation, if i have another indexer.conf
(indexer-2.conf) file,, does it mean that it should contain the sames sites in
the indexer.conf or the
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: alextan
Subject: Re: scrapping a website
Hi Maxime
I only want one (1) site to be downloaded to the local directory, and the rest
of the sites to the database, how do i do this?
thanks
marlo
At 09:10:31 23/10/08, Maxime wrote:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Возможности DataparkSearch
При сканировании документа на ссылки, все относительные ссылки переводятся в
абсолютные перед записью в базу, в результата поиска выдаются абсолютные ссылки.
Возможно вам подойтет
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maniac
Subject: Re: Возможности DataparkSearch
Server HrefOnly http://www.mnogosearch.org/
Realm CheckOnly *
- это именно то, что мне надо.
Последний вопрос перед боем -
Не вызовет ли это каких-то ограничений в поиске по тексту
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: running 2 or more indexer
Different configs also means different DBAddr commands, so you have to create
yet another database for the second config,
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maniac
Subject: Invalid MySQL directory - unable to find mysql.h
Invalid MySQL directory - unable to find mysql.h
а у меня его нигде нет... Debian. MySql установлен через apt-get...
Подскажите пожалуйста - чем его удовлетворить?
- - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maniac
Subject: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5
Это русский язык.
И URL и в Сrosswords - в выдаче, в логах и в базе.
На входе windows-1251.
RemoteCharset windows-1251
URLCharset windows-1251
Подскажите пожалуйста , что я упустил.
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5
А что вы ожидаете получить. а что получаете ?
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Возможности DataparkSearch
... страницы будут выкачиваться, в них будут искаться новые ссылки, но их
содержимое не будет индексироваться. - это подразумевает, что в базу ничего не
попадает...
- - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Неумирающие процессы httpd
Если число незавершившихся процессов не превышает значения MaxSpareServers +
число процессов httpd, обрабатывающих запросов в данный момент, то все
происходит строго в соответсвии с
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Кодировка в storedoc
В заголовках ответа сервера отдаётся кодировка windows-1251.
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maniac
Subject: Re: Возможности DataparkSearch
This is it ! ( Отож! )
Как же понимать Ваш совет данный двумя постами ранее?
Я то хочу чтобы в неё попали ссылки с анкорами...
Что я не понимаю?
- - - - - - - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5
А в поисковом шаблоне search.htm как выводится URL, мета-переменной $%(URL) или
$(URL) ?
Первая обозначает вывод с перекодировкой всех недопустимых символов с
url-escape.
- - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Возможности DataparkSearch
Простите, я уже совсем запутался, что и с какого сайта вы ходите получить...
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maniac
Subject: Re: Возможности DataparkSearch
Дико извиняюсь за замороченье и тупость - я не нарочно.
Http - предмет поиска - как внешние так и внутренние ссылки на видеофайлы.
Результат(выдача) поиска - список ссылок с указанием
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5
Какую версию dpsearch вы используете ?Если это версия 4.50 или выше, попробуйте
секции, относящиеся к URL описать в sections.conf с опцией strict:
Section url 5 512 strict
и
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maniac
Subject: Re: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5
Использую транк.
Section url 6 512 strict
Section url.file7 512 strict
#Section url.directory 7 512
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5
В Request.Accept-Charset приоритетной указывается кодировка LocalCharset.
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Возможности DataparkSearch
Да, crosswords будут приписаны к документу, на котрый ссылается соответствующая
ссылка, но только при следующем индексировании документа по это ссылке (а не
того докумена, где эти
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maniac
Subject: Re: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5
ОК спасибо за прояснение
--
При поиске по FTP не работает иначе:
media/Music/??? ?? так оно выводит русские
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5
К сожалению, сайт mpeg.net.ua:8000 недоступен. Приведите, пожалуйста, другой
пример.
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: zabar
Subject: Re: Неумирающие процессы httpd
найден ответ
в modsearchd.conf
#AspellExtensions yes
закомментировав аспель процессы стали умирать в штатном режиме - это все
наверное продолжение этой темы
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maniac
Subject: Re: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5
Региональные ограничения?
http://clip.net.ua/upload_test/ должно быть доступно отовсюду
Очень иллюстративно - из четырёх файлов показывает 8 в разной кодировке!
Результат здесь :
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maniac
Subject: Re: %cf%ee%eb%e8%f6%e5%e9%f1%ea%e8%e5
Пардон - у меня некие проблемы с базой!
Несмотря на то, что везде UTF-8 general ci не пускает русские буквицы - даже
вручную через phpmyadmin...
Sorry - пошел разбираться...
- - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Skuta
Subject: Re: Problem with search.cgi
Found the -TW thing thx :)
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=02;topic_id=1225440969
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: zabar
Subject: Листинг индексатора
Иногда вот такая красота проскакивает
http://s47.radikal.ru/i115/0810/7a/f1d5fcae1470.jpg
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: zabar
Subject: Re: Листинг индексатора
не, я о том, что ранее индексатор вроде не выводил на показ фрагменты кода
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Листинг индексатора
парсер сообщает о неправильном тэге и о тэге, который ожидается. Просто из-за
ошибки разбирался код PHP вместо XML, - так получилось, что часть кода было
распознано как тэг :)
- - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Skuta
Subject: Re: accessing forums
I'd suggest to write some script that would open the communication - and
echo the forum's websites to indexer, but that's another story :)
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Skuta
Subject: Indexer deleting old urls?
Hey,
I haven't found anything about this in documentation. But imagine website A is
being indexed.. then i decide I do not want to index A but B. So I change
indexer.conf - Delete Server A
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Fero
Subject: Re: Writing a search frontend
Yes, Maxime, please tell us :)
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: DT
Subject: Можно ли проиндексировать только главные страницы сайтов
Задача:
при помощи первоначального списка доменов (Server) проиндексировать только
главные страницы, получить список на другие сайты (которых нет в списке
Server),
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Можно ли проиндексировать только главные страницы сайтов
Вам нужно к вашему списку команд Server добавить команду
Server regex http://[^\/]*\/$
А также команду ServerAlias, преобразовывающую все ссылки в ссылки на
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: zabar
Subject: Re: Segmentation fault
новая кора
GNU gdb 6.1.1 [FreeBSD]
Copyright 2004 Free Software Foundation, Inc.
GDB is free software, covered by the GNU General Public License, and you are
welcome to change it and/or distribute
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: DT
Subject: Re: Можно ли проиндексировать только главные страницы сайтов
После добавления указанных строк ругается на регулярное выражение.
Если
Server regex *\/$]http://[^\/]*\/$
заменить на
Server regex ^http:\/\/[^\.].ru
то это
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: DT
Subject: Re: Можно ли проиндексировать только главные страницы сайтов
Спасибо - такой вариант работает.
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: zabar
Subject: Re: Ошибка при установке
в портах есть 4.50 ставь и не парься
cd /usr/ports/www/dpsearch/ make install clean
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Skuta
Subject: Re: dictionary tables
I have similar task, I don't need dict-type of search but full text. dbmode is
set multi - how do I set up dataparsearch to do it as full text? - storing
document, url, and keywords. What we need
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: zabar
Subject: Re: cached тормозит
по завершению работы run-splitter
получаю следующее
Splitting done.
Deleting logs...
Done
т.е. процесс завершил работу и все в норме, но открыв папку splitter вижу в ней
неотработанные *.log файлы,
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Hrajsa.sk
Subject: Re: the help in installation Is necessary, I will pay $
http://www.justuber.com/linux:ubuntu_and_debian:installing_dataparksearch_engine_on_ubuntu_from_scratch
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Skuta
Subject: Re: getting closer to my end result
I think that indexer should have option of do not eat so much CPU time
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Построение рефератов(нагрузка)
Отложить построение рефератов возможности нет, они создаются во время
индексирования.
Попробуйте с помощью ключа -p установить паузу междупоследовательно
индексируемыми документами
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Skuta
Subject: Re: search.cgi downloading
NuBee: Use this as your guide to install dataparksearch correctly:
http://www.justuber.com/linux:ubuntu_and_debian:installing_dataparksearch_engine_on_ubuntu_from_scratch
- - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Skuta
Subject: Как сделать полный текст индексации и поиска?
Привет,
Я заинтересован в принятии dataparksearch как полный текст искателя - это
означает, что будет идти через веб-сайты, индекс них + сохранить полную
копию БД.
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Ошибка при установке
А что выводится в config.log ?
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=04;topic_id=1196338373
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Adding rank to URL
Please explain, what are you expecting to archive ?
FYI: you can record all search parameters with search request tracking, see
http://www.dataparksearch.org/dpsearch-track.en.html
- - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Как сделать полный текст индексации и поиска?
В чем будет заключаться проверка на плагиат ? Поиска с учетом неточной
похожести текстов в DataparkSearch нет.
Для сохранения копий индексируемых документов вам нужно
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: alex tan
Subject: Re: Indexer deleting old urls?
the surest way to clear the database is to delete and re create it.
No 'Server' command for url - you have missed the trailing /
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Не ищет файлы с русскими именами
RemoteCharset windows-1251
Realm file:///mnt/shmelev/test3/*/
Server page file:///mnt/shmelev/test3/
RemoteCharset
Server file:///mnt/shmelev/test3/
URL file:///mnt/shmelev/test3/
-
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: dearste
Subject: searchd speed
Hi,
I have 87000 document indexed,
i have added 2 searchd in my search template.
the searchd daemons run on 2 different pc, and the template is on third pc.
But the search speed is very slow...about 20
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: searchd speed
Have you URL data preloaded with
PreloadURLData yes
command in your searchd.conf files ?
If you use cache mode limits, you can also preload some limits with the
PreloadLimit command.
- - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: dearste
Subject: Re: searchd speed
At 01:49:14 06/11/08, Maxime wrote:
Have you URL data preloaded with
PreloadURLData yes
command in your searchd.conf files ?
If you use cache mode limits, you can also preload some limits with the
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Cerg
Subject: Re: cached тормозит
В старом варианте как правильно сбрасывать кеш?
indexer -THW
run-splitter -k -s -o
или достаточно
run-splitter -k -s -o
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: cached тормозит
indexer -TH
run-splitter -s -o
или
run-splitter -k -s -o
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: alex tan
Subject: Re: Adding rank to URL
I thinks he wanted to increase the popularity rank of a site everytime the link
is clicked,
is this possible? or is it already included in dpsearch
At 02:07:46 05/11/08, Maxime wrote:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: dearste
Subject: Re: Adding rank to URL
At 12:34:48 07/11/08, alex tan wrote:
I thinks he wanted to increase the popularity rank of a site everytime the
link is clicked,
is this possible? or is it already included in dpsearch
At
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Cerg
Subject: Регистрация запросов
Добрый день!
Наблюдаю непонятку в регистрации запросов
qtrack поле found
пример: запрос
собаки - найдено 2420 сайтов
а в таблицу ложатся и 74446, 7360, 2420, а так же и 0 проскакивает
что не так?
-
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: zabar
Subject: Команды и их позиции в *.conf-dist
Максим, может быть у Вас найдется время на пересоздание всех *.conf-dist с
указанием всех возможных команд и самое главное с их точным(рабочим
позиционированием)?
С
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Не ищет файлы с русскими именами
Покажите, пожалуста, полный вывод для обоих случаев.
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Andrew
Subject: Re: Не ищет файлы с русскими именами
Полный вывод для обоих случаев
---
Эксперимент №1
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: zabar
Subject: Re: cached тормозит
indexer -TRN3 /usr/local/dpsearch/indexer-zoo.conf
GNU gdb 6.1.1 [FreeBSD]
Copyright 2004 Free Software Foundation, Inc.
GDB is free software, covered by the GNU General Public License, and you are
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: yjzheng
Subject: status code 2200
what meaning is the status code 2200?
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=02;post=
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: status code 2200
Status code 2200 means that document is a clone and its status code is 200
(2000+200).
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: yjzheng
Subject: Re: abount indexing
When I ran the indexer command for the first time, the scaning output is the
following:
[EMAIL PROTECTED] etc]# indexer -a -N5
indexer[28095]: {00} indexer from dpsearch-4.50-mysql started with
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Fox
Subject: Re: Оптимальная среда
snapshot: 4.51-01112008
./configure --enable-memdebug --enable-shared --enable-pthreads
--disable-parser --without-aspell --enable-file --enable-http --enable-ftp
--disable-news --with-pgsql
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: использование BodyPattern
Используйте команду NoIndexIf:
http://www.dataparksearch.org/dpsearch-indexcmd.ru.html#noindexif_cmd
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: scrapping a website
With the latest snapshot
http://www.dataparksearch.org/dpsearch-4.51-2008.tar.bz2
you can specify MirrorRoot and MirrorHeadersRoot on per server basis, i.e.
MirrorRoot /path/to/mirror
Sever
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Михаил
Subject: Использование NoIndexIf
Здравствуйте!
Поставил в конце indexer.conf строку :
NoIndexIf String body *content-container*
после индексации (а сперва делаю indexer -C), всё равно при поиске вылезают
страницы содержащие
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: mod_dpsearch exit signal Segmentation fault (11)
У вас mod_dpsearch работает из-под nginx, разве это возможно ?
Обычно в FreeBSD чтобы получить coredump для apache необходимо выставить
параметр ядра
sysctl
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: mod_dpsearch exit signal Segmentation fault (11)
Перестартуйте apache. Coredump файлы будут записываться в HOME директорию
юзера, из-под которого запускается apache.
- - - - - - - - - - - - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: zabar
Subject: Re: mod_dpsearch exit signal Segmentation fault (11)
сделал, но дампа все равно нет. перезагрузить не забыл.
[EMAIL PROTECTED] /nonexistent]# cat /etc/passwd | grep www
www:*:80:80:World Wide Web
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: mod_dpsearch exit signal Segmentation fault (11)
Попробуйте в httpd.conf указать команду
CoreDumpDirectory /tmp
и перестартовать apache. coredump должен появиться в директории /tmp
- - - - - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: mod_dpsearch exit signal Segmentation fault (11)
Проверьте, пожалуйста, права на чтение файлов шаблонов поиска и включаемых из
них юзером: из-пол которого запускается apache.
- - - - - - - - - - - - - - - - - - - -
Результаты 501 - 600 из 860 matches
Mail list logo