[dataparksearch] [Forum] Re: indexer -YY - stored удаляет все документы

2009-02-03
Name: ISukhanov
Subject: Re: indexer -YY - stored удаляет все документы

так, покопался в коде, нашел причину

при сохранении документа stored вычисляет его id как 
при проверке - как hash32(url)
Т.о. если присутствует content_language - иды никогда не равны и все документы 
в хранилище считаются потерянными.

content_language берется из Sections

Теперь вопрос - можно ли конфигом как то выправить положение (пробовал 
коментировать секцию Content-Language - не помогло вроде бы..) или это надо 
исходники патчить?
И может ли кто нибудь сделать разумный патч - ибо глубоко в структуру и 
идеологию кода закапываться неохота?
Name: ISukhanov
indexer from dpsearch-4.51-mysql
[dataparksearch] [Forum] Как определить ссылку?

2009-01-31
Name: NovalPro
Subject: Как определить ссылку?

Доброе время суток. 
Как определить ссылку страницы с которой проиндексирована картинка?
[dataparksearch] [Forum] Re: Как определить ссылку?

2009-01-31
Name: Maxime
Subject: Re: Как определить ссылку?

url.rec_ud страницы, где ссылка была впервые обнаружена (вне зависимости 
картинка это или страницы или что-либо еще), записывается в поле url.referrer 
[dataparksearch] [Forum] Re: Как определить ссылку?

2009-01-31
Name: NovalPro
Subject: Re: Как определить ссылку?

Мaxime, простите мою не компетенцию, но я не нашел поле или переменную 
Может Вы имели ввиду  url.rec_id?
[dataparksearch] [Forum] Re: Как определить ссылку?

2009-01-31
Name: Maxime
Subject: Re: Как определить ссылку?

Простите, опечатался, действительно url.rec_id
[dataparksearch] [Forum] Re: Как определить ссылку?

2009-01-31
Name: NovalPro
Subject: Re: Как определить ссылку?

Maxime спасибо и еще дополнительный вопрос.
Если url.rec_id в поисковой форме соответствует переменная DP_ID, а тогда для 
url.referrer какая?

[dataparksearch] [Forum] Re: bug in 4.52-17012009

2009-01-30
Name: Fox
Subject: Re: bug in 4.52-17012009

Полет нормальный, больше 1 дня.
[dataparksearch] [Forum] Re: Поиск по всем словам

2009-01-29
Name: Ahilles
Subject: Re: Поиск по всем словам

Здравствуйте, у меня еще вопрос.
Пользователь вводит слово например forumexe и если в базе есть такой сайт 
то поисковик выводит этот сайт на первое место.
А то у меня получается, при поиск этого слова выдает все найденные слова.
[dataparksearch] [Forum] Re: bug in 4.52-17012009

2009-01-28
Name: Maxime
Subject: Re: bug in 4.52-17012009

Пожалуйста, попробуйте новый снапшот:
[dataparksearch] [Forum] Re: Can

2009-01-27
Name: Maxime
Subject: Re: Can

You need to change /tmp/mysql.sock in the DBAddr above to the real mysql socket 
location in your system.
[dataparksearch] [Forum] Re: Поиск по всем словам

2009-01-26
Name: Ahilles
Subject: Re: Поиск по всем словам

Спасибо, переустановил dpsearch и все заработало.
Еще вопрос.
Если у меня например 3 команды 

Servers http://www.dataparksearch.org
Servers http://www.dsdsadasdsd.ru
Servers http://www.dsdsdsd.com

Это нормально?
И в какой последовательности они будут индексироватся, каждый раз когда я буду 
вызывать indexer. Просто у меня 3 форума, на которых очень быстро появляются 
новые сообщения, и как то надо настроить оперативное индексирование.
[dataparksearch] [Forum] Re: Поиск по всем словам

2009-01-26
Name: Maxime
Subject: Re: Поиск по всем словам

Правильно команданазывается Server (без s на конце). И необходимо в конце URL, 
указываемом в этой команде ставить оконечный / :

Server http://www.dataparksearch.org/
Server http://www.dsdsadasdsd.ru/
Server http://www.dsdsdsd.com/

Последовательность индексирования зависит от указываемых ключей для indexer, 
это могут быть -oedrz, запустите indexer -? и посмотрите описание этих ключей.

Чтобы индевсировтаь форумы оперативно, нужно задать меньший период для страниц, 
где показыватся ссылки на новые сообщения, например, это могут быть RSS-фиды:

Period 1h
Server page hrefonly http://www.dsdsadasdsd.ru/rss.xml

Period 30d
Server http://www.dsdsadasdsd.ru/

если затем ежечасно запускать indexer, он будет снова искать ссылки на странице 
фида и затем индексировать их.
[dataparksearch] [Forum] Re: Поиск по всем словам

2009-01-26
Name: Ahilles
Subject: Re: Поиск по всем словам

Спасибо, буду пробовать!!!
Еще вопрос.
1.Есть ли Русифицированая часть search.htm. Сама форума поиска.
2. Как составить форму как на www.43n39e.ru, вводишь поисковой запрос и он 
переадрисирует в www.43n39e.ru/cgi-bin/search.cgi
[dataparksearch] [Forum] Re: Поиск по всем словам

2009-01-26
Name: Maxime
Subject: Re: Поиск по всем словам

1. Нет, но вы можете отредактировать этот шаблон по совему усмотрению, в том 
числе руссифицировать.
2. См. файлы simple.htm иextended.htm в директории doc/samples дистрибутива 
(начиная с версии 4.51).
[dataparksearch] [Forum] Searching test including of not displaying results

2009-01-26
Name: Grant
Subject: Searching test including of not displaying results

This seems like a simple problem, but I am having problems figuring it out.  

I've configured dbsearch-4.51 with mysql dbmode=multi to index our Intranet 
page.  Included in the intranet is a list of scientific journals, including 
Journal of Clinical Oncology.

When I search with the term:

Journal of Clinical Oncology, I get:

Search for Journal of Clinical Oncology.  Search results: journal: 598 / 598, 
of: 204 / 204, clinical: 122 / 122, oncology: 30 / 30

Sorry, your search for Journal of Clinical Oncology did not find any results.
No documents were found containing Journal of Clinical Oncology.

but when I search:

Journal Clinical Oncology, I get the correct results:

Search for Journal Clinical Oncology.  Search results: journal: 598 / 598, 
clinical: 122 / 122, oncology: 30 / 30.   Results 1-10 of 10.  Search took 
0.040 seconds

and the correct page is linked first on the list.

How can I get the search results if the user includes the word of?

Thanks for your help.


[dataparksearch] [Forum] Re: Searching test including of not displaying results

2009-01-26
Name: Maxime
Subject: Re: Searching test including of not displaying results

Please verify that you use the same stopword files in your search.htm (or 
searchd.conf, if searchd is used) as in your indexer.conf.
[dataparksearch] [Forum] Re: Searching test including of not displaying results

2009-01-26
Name: Grant
Subject: Re: Searching test including of not displaying results

Spot on, as usual!  Many thanks!
[dataparksearch] [Forum] Limiting search to subdirectories of document root

2009-01-26
Name: Grant
Subject: Limiting search to subdirectories of document root

I've read through the documentation, and I can't seem to understand out this 
would be done.

We have an intranet, and I'd like to index the entire content, so in 
indexer.conf I have Server http://intranet.domain.com

But I'd like to have search front-ends on each department home page (IT, HR, 
Accounting, etc) that would only display results from that sub-directory and on 
down the file system.  

Does this mean I need separate indexer.conf files for each department?  Or can 
I limit the search query or results based on where the user searched from?

Thanks for your help,


[dataparksearch] [Forum] Re: Поиск по всем словам

2009-01-26
Name: Ahilles
Subject: Re: Поиск по всем словам

Не работает.
HTTPHeader User-Agent: forumexe 
Ставлю это значение перидкесирую, но все ровно он определяется как - - [26/Jan/2009:22:01:40 +0300] GET /lostpass.php HTTP/1.0 200 
6094 - DataparkSearch/4.52-26012009 (+http://dataparksearch.org/bot)
Почему такое может быть?
[dataparksearch] [Forum] Re: Поиск по всем словам

2009-01-26
Name: Ahilles
Subject: Re: Поиск по всем словам

Спасибо за ответы.
Все работает.
[dataparksearch] [Forum] Re: Limiting search to subdirectories of document root

2009-01-26
Name: Maxime
Subject: Re: Limiting search to subdirectories of document root

Probably, you need use tags, see 

For example, you may modify your indexer.conf something like that:

Tag d1
Server http://intranet.domain.com/department1/

Tag d2
Server http://intranet.domain.com/department2/

Tag d3
Server http://intranet.domain.com/department3/


# strip tag for the rest
Server http://intranet.domain.com/

Then you select part to search trough by t= CGI-parameter:

[dataparksearch] [Forum] This the output--

2009-01-26
Name: Ramnath
Subject: This the output--

c$ sudo /usr/local/dpsearch/bin/search.cgi test 
{sql.c:3974} Query: SELECT url_id,intag FROM dict,url WHERE dict.word = 'test' 
AND url.rec_id=dict.url_id ORDER BY url_id,intag
SQL-server message: MySQL driver: #1045: Access denied for user 
'root'@'localhost' (using password: NO)

META NAME=Content-Type Content=text/html; charset=
TITLEQuery: test/TITLE

table bgcolor=#EE width=100%
  BR Search for:
  INPUT TYPE=text NAME=q SIZE=50 value=test 
  INPUT TYPE=submit NAME=cmd value=Search! 
  smalla href=?form=extendedExtended/a/small

table bgcolor=#EE width=100%
  smallSearch for btest/b./small
  smallSearch results: btest: 0 / 0/b/small
Sorry, your search for btest/b did not find any results.br
No documents were found containing btest/b.br
  LI Make sure all words are spelled correctly.
  LI Try different keywords.
  LI Try more general keywords.
  Also, you can try a href=?form=extendedextended search mode/a.
table bgcolor=#EE width=100%
table width=100% bgcolor=#FF
  td align=left
font size=1a href=http://www.technotree.blogspot.com;Blog/a/font

[dataparksearch] [Forum] Re: Can

2009-01-26
Name: Maxime
Subject: Re: Can

You have incorrect login/password for SQL-connection in DBAddr command in your 
search template, they must be the same as in your indexer.conf file.
[dataparksearch] [Forum] They are same

2009-01-26
Name: Ramnath
Subject: They are same

DBAddr  mysql://root:maragat...@localhost/search/?dbmode=cache

is the command in both the files . maragatham is the root password ...
[dataparksearch] [Forum] Re: Can

2009-01-26
Name: Ramnath
Subject: Re: Can

I am able to login to my MYSQL database with this command directly  was not 
promoted to enter any other password..
$ mysql -u root -pmaragatham
I am able to access all the tables in the search database without any further 
What might be my DBAddr then ..?
Please help
[dataparksearch] [Forum] Re: Can

2009-01-26
Name: Maxime
Subject: Re: Can

Do your MySQL server accept connections via TCP ? Ic not, you need to configure 
MySQL socket connecion with socket= parameter in DBAddr command, see 
[dataparksearch] [Forum] How to verify that MySQL acceps Conn via TCP

2009-01-26
Name: Ramnath
Subject: How to verify that MySQL acceps Conn via TCP

How to know or see that MySQL accepts connections or not?
[dataparksearch] [Forum] Shall I?

2009-01-26
Name: Ramnath
Subject: Shall I?

Shall I use...
---DBAddr mysql://root:maragat...@localhost/search/?socket=/tmp/mysql.sock
Instead of
---DBAddr mysql://root:maragat...@localhost/search/?dbmode=cache

[dataparksearch] [Forum] Tried DBAddr mysql://root:maragat...@localhost/search/?socket=/tmp/mysql.sock

2009-01-26
Name: Ramnath
Subject: Tried DBAddr 

I have replaced DBAddr as,
DBAddr mysql://root:maragat...@localhost/search/?socket=/tmp/mysql.sock
But this error(Unnable to connect to server) is what I get while indexing ..

$ sudo /usr/local/dpsearch/sbin/indexer -am
{sql.c:811} Query: SELECT rec_id, url, tag, category, command, parent, ordre, 
weight FROM server WHERE rec_id=-1009981404
SQL-server message: MySQL driver: #2002: Can't connect to local MySQL server 
through socket '/tmp/mysql.sock' (2)

indexer.cfg[10277]: {00} MySQL driver: #2002: Can't connect to local MySQL 
server through socket '/tmp/mysql.sock' (2)
DB err: MySQL driver: #2002: Can't connect to local MySQL server through socket 
'/tmp/mysql.sock' (2) - /usr/local/dpsearch/etc/indexer.conf:359:

[dataparksearch

2009-01-26 Пенетрантность DataparkSearchForum
Name: Ramnath
Subject: Re: Can

DBAddr mysql://root:maragat...@localhost/search/?dbmode=cache
When the above was my DBAddr, I was able to index . But was not able to see 
any results ...
[dataparksearch] [Forum] Re: Поиск по всем словам

2009-01-23 Пенетрантность DataparkSearchForum
Name: Ahilles
Subject: Re: Поиск по всем словам

Как мне сконфигурировать на поиск по всему сайту целиом, а то плохо понимает 
php файлы 
вот такую ссылку index.php?automodule=blog он индексирует, а все ссылки что 
внутри не индексирует.
[dataparksearch] [Forum] Re: Поиск по всем словам

2009-01-23 Пенетрантность DataparkSearchForum
Name: Ahilles
Subject: Re: Поиск по всем словам

Вот что мне дала команда -v5 
[dataparksearch] [Forum] Re: Поиск по всем словам

2009-01-23 Пенетрантность DataparkSearchForum
Name: Maxime
Subject: Re: Поиск по всем словам

Очевидно, у вас в indexer.conf присуствует команда
Disallow *
запрещающая индексировать все, что не разрешено явно. Вам нужно либо добавить 
правила Allow, разрешающие явно индексировать нужные вам документы, напрмиер с 
расширением .php:
Allow *.php
либо убрать эту команду Disallow заменив на явное перечисление расширений, 
запрещенных к индексированию.
[dataparksearch] [Forum] Re: Поиск по всем словам

2009-01-23 Пенетрантность DataparkSearchForum
Name: Ahilles
Subject: Re: Поиск по всем словам

Сделал include langmap.conf

Ниже мой langmap.conf

LangMapFile langmap/af.latin1.lm
LangMapFile langmap/af.latin1.bible.lm
LangMapFile langmap/ar.arabic.lm
LangMapFile langmap/ar.arabic.quran.lm
LangMapFile langmap/ar.cp1256.lm
LangMapFile langmap/ar.cp1256.quran.lm
LangMapFile langmap/az.utf8.lm
LangMapFile langmap/be.cp1251.lm
LangMapFile langmap/bg.cp1251.lm
LangMapFile langmap/bg.cp1251.bible.lm
LangMapFile langmap/bg.cyrillic.lm
LangMapFile langmap/bg.cyrillic.bible.lm
LangMapFile langmap/br.latin1.lm
LangMapFile langmap/bs.ascii.lm
LangMapFile langmap/bs.cp1250.lm
LangMapFile langmap/bs.latin2.lm
LangMapFile langmap/ca.latin1.lm
LangMapFile langmap/ca.latin1.lit.lm
LangMapFile langmap/cs.cp1250.lm
LangMapFile langmap/cs.latin2.lm
LangMapFile langmap/cy.latin1.lm
LangMapFile langmap/da.latin1.lm
LangMapFile langmap/da.latin1.bible.lm
LangMapFile langmap/de.latin1.lm
LangMapFile langmap/de.latin1.bible.lm
LangMapFile langmap/el.cp1253.lm
LangMapFile langmap/el.greek.lm
LangMapFile langmap/en.ascii.lm
LangMapFile langmap/eo.latin3.lm
LangMapFile langmap/eo.latin3.as.lm
LangMapFile langmap/eo.latin1-x.as.lm
LangMapFile langmap/eo.latin1-h.as.lm
LangMapFile langmap/eo.utf8.as.lm
LangMapFile langmap/es.latin1.lm
LangMapFile langmap/es.latin1.bible.lm
LangMapFile langmap/et.cp1257.lm
LangMapFile langmap/et.latin4.lm
LangMapFile langmap/eu.latin1.lm
LangMapFile langmap/fi.latin1.lm
LangMapFile langmap/fr.latin1.lm
LangMapFile langmap/fr.latin1.bible.lm
LangMapFile langmap/ga.latin1.lm
LangMapFile langmap/ga.latin1.lit.lm
LangMapFile langmap/he.hebrew.lm
LangMapFile langmap/hr.ascii.lm
LangMapFile langmap/hr.cp1250.lm
LangMapFile langmap/hr.cp1250.bible.lm
LangMapFile langmap/hr.latin2.lm
LangMapFile langmap/hu.cp1250.lm
LangMapFile langmap/hu.latin2.lm
LangMapFile langmap/hy.armscii-8.lm
LangMapFile langmap/is.latin1.lm
LangMapFile langmap/it.latin1.lm
# uncomment this if japanese support is enabled in configure
#LangMapFile langmap/ja.euc-jp.lm
#LangMapFile langmap/ja.sjis.lm
# uncomment this if euc-kr support is enabled in connfigure
#LangMapFile langmap/ko.EUC-KR.lm
#LangMapFile langmap/ko.euc-kr.lit.lm
LangMapFile langmap/ko.utf8.lm
LangMapFile langmap/ko.utf8.lit.lm
LangMapFile langmap/la.ascii.lm
LangMapFile langmap/lt.cp1257.lm
LangMapFile langmap/lt.latin4.lm
LangMapFile langmap/lv.cp1257.lm
LangMapFile langmap/lv.latin4.lm
LangMapFile langmap/mi.latin1.lm
LangMapFile langmap/mi.utf-8.lm
LangMapFile langmap/nl.latin1.lm
LangMapFile langmap/nl.latin1.bible.lm
LangMapFile langmap/no.latin1.lm
LangMapFile langmap/no.utf-8.lm
LangMapFile langmap/pl.cp1250.lm
LangMapFile langmap/pl.cp852.lm
LangMapFile langmap/pl.latin2.lm
LangMapFile langmap/pt-br.latin1.lm
LangMapFile langmap/pt-pt.latin1.lm
LangMapFile langmap/ro.ascii.lm
LangMapFile langmap/ro.cp1250.lm
LangMapFile langmap/ro.latin2.lm
LangMapFile langmap/ro.utf-8.lm
LangMapFile langmap/ru.cp1251.lm
LangMapFile langmap/ru.cp866.lm
LangMapFile langmap/ru.cyrillic.lm
LangMapFile langmap/ru.koi8-r.lm
LangMapFile langmap/ru.maccyr.lm
LangMapFile langmap/ru.utf8.lm
LangMapFile langmap/sk.ascii.lm
LangMapFile langmap/sk.cp1250.lm
LangMapFile langmap/sk.latin2.lm
LangMapFile langmap/sl.ascii.lm
LangMapFile langmap/sl.cp1250.lm
LangMapFile langmap/sl.latin2.lm
LangMapFile langmap/sq.latin1.lm
LangMapFile langmap/sr.cp1250.lm
LangMapFile langmap/sr.latin2.lm
LangMapFile langmap/sv.latin1.lm
LangMapFile langmap/sv.latin1.bible.lm
LangMapFile langmap/sw.latin1.lm
LangMapFile langmap/th.cp874.lm
LangMapFile langmap/th.tis-620.lm
# uncomment this if tscii support enabled in configure
#LangMapFile langmap/ta.tscii.lm
LangMapFile langmap/tl.ascii.lm
LangMapFile langmap/tl.ascii.bible.lm
LangMapFile langmap/tr.cp1254.lm
LangMapFile langmap/tr.cp857.lm
LangMapFile langmap/tr.latin5.lm
LangMapFile langmap/uk.cp1251.lm
LangMapFile langmap/uk.koi8-u.lm
LangMapFile langmap/vi.viscii.lm
# uncomment these if chinese support is enabled in configure
#LangMapFile langmap/zh.gb2312.lm
#LangMapFile langmap/zh.big5.lm
LangMapFile langmap/zh.utf8.lm

[dataparksearch] [Forum] Re: Поиск по всем словам

2009-01-23 Пенетрантность DataparkSearchForum
Name: Maxime
Subject: Re: Поиск по всем словам

Можно удалить карты для языков, которые заведомо небудут на ваших индексируемых 
страницах, это позволит и точнее определять язык и быстрее индексировать.
[dataparksearch] [Forum] Re: How to Install? -Newbie

2009-01-23 Пенетрантность DataparkSearchForum
Name: Ramnath
Subject: Re: How to Install? -Newbie

Thanx MaximeTaht solved my problem
[dataparksearch] [Forum] Re: Поиск по всем словам

2009-01-23 Пенетрантность DataparkSearchForum
Name: Ahilles
Subject: Re: Поиск по всем словам

Опять всеровно не выдает в результаты поиска Русские буквы.
Что еще может быть?

LangMapFile langmap/az.utf8.lm
LangMapFile langmap/be.cp1251.lm
LangMapFile langmap/bg.cp1251.lm
LangMapFile langmap/bg.cp1251.bible.lm

[dataparksearch] [Forum] Re: Зависимость оперативки от кол-ва сайтов

2009-01-23 Пенетрантность DataparkSearchForum
Name: Михаил
Subject: Re: Зависимость оперативки от кол-ва сайтов

Максим а есть шансы на документацию по коду и схеме базы данных - интересует 
алгоритмика (взаимодействие с параметрами и т.д.) ? 
[dataparksearch] [Forum] Re: Поиск по всем словам

2009-01-23 Пенетрантность DataparkSearchForum
Name: Maxime
Subject: Re: Поиск по всем словам

Какое значение MaxWordLength у вас указано ?
Попробуйте выставить его равным 255 в search.htm и searchd.conf, если 
[dataparksearch] [Forum] Re: Зависимость оперативки от кол-ва сайтов

2009-01-23 Пенетрантность DataparkSearchForum
Name: Maxime
Subject: Re: Зависимость оперативки от кол-ва сайтов

Что есть взаимодействие с параметрами ?

Часть схемы базы данных описана в документации:
[dataparksearch] [Forum] Re: Поиск по всем словам

2009-01-23 Пенетрантность DataparkSearchForum
Name: Ahilles
Subject: Re: Поиск по всем словам

# This is a minimal sample indexer config file
Не помогло, может что то в конфиге не то?

DBAddr mysql://4:...@localhost/index/?dbmode=single
Server  http://forumexe.ru/index.php
Server  http://forumexe.ru/index.php?automodule=blog
# Allow some known extensions and directory index
Allow *.php *.html *.htm *.shtml *.txt 

Include sections.conf
Include langmap.conf
GuesserUseMeta yes
[dataparksearch] [Forum] Re: Поиск по всем словам

2009-01-23 Пенетрантность DataparkSearchForum
Name: Maxime
Subject: Re: Поиск по всем словам

Укажите команду
MaxWordLength 255
в indexer.conf и переиндексируйте.
[dataparksearch] [Forum] Re: Поиск по всем словам

2009-01-23 Пенетрантность DataparkSearchForum
Name: Ahilles
Subject: Re: Поиск по всем словам

Не помогло, уже не знаю что делать, не ищет Русские буквы и все.
Уже кодировки менял местами, не помогло, пробовал windows-1251 и UTF-8 Но UTF-8 
явно не объявлял в конфиге
Может уже что то в search.htm не правельно.
Привожу search.htm Без HTML


This is default template file for DataparkSearch 4
(C) 1999-2001, mnoGoSearch developers team de...@mnogosearch.org
(C) 2003-2005, Datapark corp.

Please rename to search.htm and edit as desired.
See doc/dpearch-templates.html for detailed information.
You may want to keep the original file for future reference.

WARNING: Use proper chmod to protect your passwords!
# Database parameters are to be used with SQL backend
# and do not matter for built-in text files support
# Format: DBType:[//[DBUser[:dbpa...@]dbhost[:DBPort]]/DBName/[?dbmode=mode]
DBAddr  mysql://цц:й�...@localhost/index/?dbmode=single
LogLevel 5
# Uncomment this line to enable search result cache
#Cache yes
GuesserUseMeta yes
#  Comment this line if you want to show clones
MaxWordLength 255
# Use proper local and browser charsets
# Default charset is iso-8859-1 (latin1)
# which is suitable for the most Western European languages

#BrowserCharset UTF-8
LocalCharset   UTF-8
# Load stopwords file.  File name is either absolute
# or relative to /etc directory of DataparkSearch installation.
#StopwordFile stopwords/en.sl
#StopwordFile stopwords/ru.sl

# Minimum and maximum word lengths
MinWordLength 1
MaxWordLength 32

# Number of pages in navigator bar
PagesPerScreen 10

# Load synonyms file.  File name is either absolute
# or relative to /etc directory of DataparkSearch installation.
#Synonym synonym/english.syn
#Synonym synonym/russian.syn

# How to hilight searched words.
HlBeg   b
HlEnd   /b

# How to hilight consecutive following results from same site.
# Uncomment these lines if you compiled with a-la Google results grouping
#GrBeg  blockquote
#GrEnd  /blockquote

# Uncomment this line to enable error loging to stderr
#Log2stderr yes

# Uncomment this line to enable aspell based suggestions for mistyped words
#AspellExtensions yes

# Uncomment this line to change default URL basis for storedoc.cgi
#StoredocURL /cgi-bin/storedoc

# Uncoment this line to change default maximal excerpt size. Default value is 
#ExcerptSize 1024

# Uncomment this line to change number of characters before and after search 
# in excerpts. Default value is 40.
#ExcerptPadding 64

# Uncomment this line to specify maximum IdexDocSizeLimit value specified in 
#IndexDocSizeLimit 65536

# Uncomment this line to change Last-Modified format output
# Use strftime function meta variables
#DateFormat %d %b %Y %X %Z

# Uncomment this line to change Content-Type for results by this template.
# Value by default: text/html
#ResultContentType text/xml

# Uncomment this line to specify LC_ALL locale for search results output.
#Locale fr_FR.ISO_8859-1

# Uncomment this line to specify your own list of caharacters to escape in 
$(x) meta-variables.
#CharsToEscape \![]

[dataparksearch] [Forum] Re: different search template

2009-01-22 Пенетрантность DataparkSearchForum
Name: Maxime
Subject: Re: different search template

Yes, it's possible. You need to alter search.htm template accordingly. This 
template is a text file, so you can use any text editor to modify it. See 
[dataparksearch] [Forum] Re: Problem with install of 4.50

2009-01-22 Пенетрантность DataparkSearchForum
Name: Maxime
Subject: Re: Problem with install of 4.50

Using configure conly is a valid way to configure dataparksearch. Usually you 
don't need to install jade/jadetex to build dataparksearch until you have to 
make modifications in the documentation. Please show which error is displayed 
when you run configure.
[dataparksearch] [Forum] Re: bug in 4.52-17012009

2009-01-22 Пенетрантность DataparkSearchForum
Name: Fox
Subject: Re: bug in 4.52-17012009

Вот еще, это после 20 часов индексирования

#0  0x7fd520910755 in free () from /lib/libc.so.6
#1  0x7fd521c23a45 in DpsVarListFree (vars=0x7fd5109ccc40) at vars.c:308
#2  0x7fd521c23112 in DpsDocFree (Result=0x7fd5109ca8c0) at doc.c:97
#3  0x7fd521c295d2 in DpsURLAction (A=0x3efda40, D=0x7fd5109ca8c0, cmd=19) 
at db.c:620
#4  0x7fd521bd6b77 in DpsIndexNextURL (Indexer=0x3efda40) at indexer.c:2277
#5  0x00405f3c in thread_main (arg=value optimized out) at main.c:899
#6  0x7fd5216e40c0 in start_thread () from /lib/libpthread.so.0
#7  0x7fd52096490d in clone () from /lib/libc.so.6
#8  0x in ?? ()

[dataparksearch] [Forum] indexer.core

2009-01-22 Пенетрантность DataparkSearchForum
Name: zabar
Subject: indexer.core

сборка dpsearch-4.52-17012009
индексация в 30 нитей

GNU gdb 6.1.1 [FreeBSD]
Copyright 2004 Free Software Foundation, Inc.
GDB is free software, covered by the GNU General Public License, and you are
welcome to change it and/or distribute copies of it under certain conditions.
Type show copying to see the conditions.
There is absolutely no warranty for GDB.  Type show warranty for details.
This GDB was configured as amd64-marcel-freebsd...(no debugging symbols 
Core was generated by `indexer'.
Program terminated with signal 11, Segmentation fault.
Reading symbols from /usr/local/lib/libdpsearch-4.so...(no debugging symbols 
Loaded symbols for /usr/local/lib/libdpsearch-4.so
Reading symbols from /usr/local/lib/libdpcharset-4.so...(no debugging symbols 
Loaded symbols for /usr/local/lib/libdpcharset-4.so
Reading symbols from /lib/libthr.so.3...(no debugging symbols found)...done.
Loaded symbols for /lib/libthr.so.3
Reading symbols from /usr/local/lib/libcares.so.1...(no debugging symbols 
Loaded symbols for /usr/local/lib/libcares.so.1
Reading symbols from /usr/local/lib/mysql/libmysqlclient.so.16...(no debugging 
symbols found)...done.
Loaded symbols for /usr/local/lib/mysql/libmysqlclient.so.16
Reading symbols from /lib/libcrypt.so.4...(no debugging symbols found)...done.
Loaded symbols for /lib/libcrypt.so.4
Reading symbols from /lib/libm.so.5...(no debugging symbols found)...done.
Loaded symbols for /lib/libm.so.5
Reading symbols from /lib/libz.so.4...(no debugging symbols found)...done.
Loaded symbols for /lib/libz.so.4
Reading symbols from /lib/libc.so.7...(no debugging symbols found)...done.
Loaded symbols for /lib/libc.so.7
Reading symbols from /libexec/ld-elf.so.1...(no debugging symbols found)...done.
Loaded symbols for /libexec/ld-elf.so.1
#0  0x000800683254 in DpsRobotListFree () from 
[New Thread 0x8136ac880 (LWP 100316)]
[New Thread 0x8136aca00 (LWP 100312)]
[New Thread 0x8136ac280 (LWP 100309)]
[New Thread 0x8136ac100 (LWP 100306)]
[New Thread 0x8136ac700 (LWP 100302)]
[New Thread 0x8136abb00 (LWP 100299)]
[New Thread 0x8136abc80 (LWP 100296)]
[New Thread 0x8136abf80 (LWP 100292)]
[New Thread 0x8136abe00 (LWP 100289)]
[New Thread 0x8136ab800 (LWP 100286)]
[New Thread 0x8136ab980 (LWP 100284)]
[New Thread 0x8136ab680 (LWP 100280)]
[New Thread 0x8136ab200 (LWP 100276)]
[New Thread 0x8136ab380 (LWP 100273)]
[New Thread 0x8136aad80 (LWP 100270)]
[New Thread 0x8136aa480 (LWP 100266)]
[New Thread 0x8136ab500 (LWP 100263)]
[New Thread 0x8136aaf00 (LWP 100260)]
[New Thread 0x8136aaa80 (LWP 100257)]
[New Thread 0x8136ab080 (LWP 100252)]
[New Thread 0x8136aa600 (LWP 100248)]
[New Thread 0x8136aac00 (LWP 100244)]
[New Thread 0x8136aa900 (LWP 100241)]
[New Thread 0x8136aa780 (LWP 100238)]
[New Thread 0x8136a9e80 (LWP 100236)]
[New Thread 0x801302900 (LWP 100234)]
[New Thread 0x8136aa300 (LWP 100232)]
[New Thread 0x8136aa180 (LWP 100230)]
[New Thread 0x8136aa000 (LWP 100228)]
[New Thread 0x801302600 (LWP 100226)]
[New Thread 0x801302180 (LWP 100150)]
(gdb) thread apply all bt

Thread 31 (Thread 0x801302180 (LWP 100150)):
#0  0x00080117e4cc in nanosleep () from /lib/libc.so.7
#1  0x00080115104c in sleep () from /lib/libc.so.7
#2  0x0008009ed162 in sleep () from /lib/libthr.so.3
#3  0x004060af in ?? ()
#4  0x00407186 in ?? ()
#5  0x00402dfe in ?? ()
#6  0x00080053 in ?? ()
#7  0x in ?? ()
#8  0x0005 in ?? ()
#9  0x7fffe890 in ?? ()
#10 0x7fffe898 in ?? ()
#11 0x7fffe89b in ?? ()
#12 0x7fffe89e in ?? ()
#13 0x7fffe8a1 in ?? ()
#14 0x in ?? ()
#15 0x7fffe8c6 in ?? ()
#16 0x7fffe8e0 in ?? ()
#17 0x7fffe8ec in ?? ()
#18 0x7fffe8f6 in ?? ()
#19 0x7fffe908 in ?? ()
#20 0x7fffe916 in ?? ()
#21 0x7fffecfd in ?? ()
#22 0x7fffed0b in ?? ()
#23 0x7fffed16 in ?? ()
#24 0x7fffee9b in ?? ()
#25 0x7fffeeb2 in ?? ()
#26 0x7fffeec7 in ?? ()
#27 0x7fffeed9 in ?? ()
#28 0x7fffeef6 in ?? ()
#29 0x7fffef11 in ?? ()
#30 0x7fffef28 in ?? ()
#31 0x7fffef3b in ?? ()
#32 0x7fffef5c in ?? ()
#33 0x7fffef64 in ?? ()
#34 0x7fffef83 in ?? ()
#35 0x7fffef90 in ?? ()
#36 0x7fffef99 in ?? ()
#37 0x7fffefa4 in ?? ()
#38 0x in ?? ()
#39 0x0003 in ?? ()
#40 0x00400040 in ?? ()
#41 0x0004 in ?? ()
#42 0x0038 in ?? ()
---Type return to continue, or q return to quit---q
#0  0x000800683254 in DpsRobotListFree () from 

[dataparksearch] [Forum] Re: Зависимость оперативки от кол-ва сайтов

2009-01-22 Пенетрантность DataparkSearchForum
Name: Михаил
Subject: Re: Зависимость оперативки от кол-ва сайтов

В dpsearch очень странно реализован алгоритм добавления новых url.
При добавлении 10 URL через файл или urldb каждый процесс начинает занимать 
по 200 метров. Мы решили проблему через ./indexer -i -f файл с записями, 
добавляем не более чем по 1 url.
[dataparksearch] [Forum] Re: Зависимость оперативки от кол-ва сайтов

2009-01-22 Пенетрантность DataparkSearchForum
Name: Maxime
Subject: Re: Зависимость оперативки от кол-ва сайтов

В принципе абсолютно новые ссылки можно добавлять напрямую в таблицу url со 
статусом=0 и next_index_time=0 минуя все проверки.
Но удалять документы таким образом противопоказано.
[dataparksearch] [Forum] Re: vivod ssilok rezultatah poiska

2009-01-22 Пенетрантность DataparkSearchForum
Name: Maxime
Subject: Re: vivod ssilok rezultatah poiska

Прямого способа получить требуемого нет, но можно извернуться:
Включить сбор ссылок командой
CollectLinks yes
тогда в таблицу links будут записываться ссылки в виде (ot,k), где в качестве 
значений ot и k будут указаны соответсвующие rec_id таблицы url.
После этого вам нужно создать CGI-скрипт, который, получив в качестве параметра 
rec_id, будет выбирать данные из таблиц links и url.
Вызов же скрипта со страницы результатов поиска можно сделать и через include и 
через iframe, или еще лучше xmlhttp (а-ля AJAX), передав нужный rec_id 
используя мете-переменную щаблона $(DP_ID).
[dataparksearch] [Forum] bug in 4.52-17012009

2009-01-21 Пенетрантность DataparkSearchForum
Name: Fox
Subject: bug in 4.52-17012009

 $ gdb indexer core.30664
GNU gdb 6.8
This GDB was configured as x86_64-pc-linux-gnu...

warning: Can't read pathname for load map: Input/output error.
Reading symbols from /mnt/pub/indexer/dpsearch/lib/libdpsearch-4.so...done.
Loaded symbols for /home/indexer/dpsearch/lib/libdpsearch-4.so
Reading symbols from /mnt/pub/indexer/dpsearch/lib/libdpcharset-4.so...done.
Loaded symbols for /home/indexer/dpsearch/lib/libdpcharset-4.so
Reading symbols from /lib64/libpthread.so.0...done.
Loaded symbols for /lib/libpthread.so.0
Reading symbols from /lib64/librt.so.1...done.
Loaded symbols for /lib/librt.so.1
Reading symbols from /lib64/libm.so.6...done.
Loaded symbols for /lib/libm.so.6
Reading symbols from /lib64/libz.so.1...done.
Loaded symbols for /lib/libz.so.1
Reading symbols from /usr/lib64/libpq.so.5...done.
Loaded symbols for /usr/lib/libpq.so.5
Reading symbols from /lib64/libcrypt.so.1...done.
Loaded symbols for /lib/libcrypt.so.1
Reading symbols from /lib64/libc.so.6...done.
Loaded symbols for /lib/libc.so.6
Reading symbols from /lib64/ld-linux-x86-64.so.2...done.
Loaded symbols for /lib64/ld-linux-x86-64.so.2
Reading symbols from /usr/lib64/libssl.so.0.9.8...done.
Loaded symbols for /usr/lib64/libssl.so.0.9.8
Reading symbols from /usr/lib64/libcrypto.so.0.9.8...done.
Loaded symbols for /usr/lib64/libcrypto.so.0.9.8
Reading symbols from /lib64/libdl.so.2...done.
Loaded symbols for /lib/libdl.so.2
Reading symbols from /lib64/libnss_compat.so.2...done.
Loaded symbols for /lib/libnss_compat.so.2
Reading symbols from /lib64/libnsl.so.1...done.
Loaded symbols for /lib/libnsl.so.1
Reading symbols from /lib64/libnss_nis.so.2...done.
Loaded symbols for /lib/libnss_nis.so.2
Reading symbols from /lib64/libnss_files.so.2...done.
Loaded symbols for /lib/libnss_files.so.2
Reading symbols from /lib64/libnss_dns.so.2...done.
Loaded symbols for /lib/libnss_dns.so.2
Reading symbols from /lib64/libresolv.so.2...done.
Loaded symbols for /lib/libresolv.so.2
Reading symbols from /lib64/libgcc_s.so.1...done.
Loaded symbols for /lib/libgcc_s.so.1
Core was generated by `/indexer:[10] URL:htt'.
Program terminated with signal 6, Aborted.
[New process 30679]
#0  0x7f75c1e4b375 in raise () from /lib/libc.so.6
(gdb) backtrace
#0  0x7f75c1e4b375 in raise () from /lib/libc.so.6
#1  0x7f75c1e4c7de in abort () from /lib/libc.so.6
#2  0x7f75c1e86a77 in ?? () from /lib/libc.so.6
#3  0x7f75c1e8bd4d in ?? () from /lib/libc.so.6
#4  0x7f75c1e8e0eb in ?? () from /lib/libc.so.6
#5  0x7f75c1e8fe93 in malloc () from /lib/libc.so.6
#6  0x7f75c2e8e62d in DpsUniDup (s=0x7f75982a65d0) at unicode.c:49
#7  0x7f75c319e98c in DpsCrossListAddFantom (Doc=0x4788610, 
CrossWord=0x45029e80) at crossword.c:47
#8  0x7f75c319ea40 in DpsCrossListAdd (Doc=0x77c8, CrossWord=0x77d7) at 
#9  0x7f75c319cff0 in DpsPrepareItem (Indexer=0x40aba70, Doc=0x4788610, 
Item=0x531e2a0, ustr=0x7f759800c830,
UStr=0x7f7598039140, content_lang=value optimized out, 
indexed_size=0x4502a088, indexed_limit=0x4502a080,
max_word_len=64, min_word_len=1, crossec=10) at parsehtml.c:166
#10 0x7f75c319d837 in DpsPrepareWords (Indexer=0x40aba70, Doc=0x4788610) at 
#11 0x7f75c31540bd in DpsIndexNextURL (Indexer=0x40aba70) at indexer.c:2208
#12 0x00405f3c in thread_main (arg=value optimized out) at main.c:899
#13 0x7f75c2c610c0 in start_thread () from /lib/libpthread.so.0
#14 0x7f75c1ee190d in clone () from /lib/libc.so.6
#15 0x in ?? ()

[dataparksearch] [Forum] Re: Не работает файл search.cgi

2009-01-21 Пенетрантность DataparkSearchForum
Name: Ahilles
Subject: Re: Не работает файл search.cgi

 Нужно выставить права 755, и поставить одну группу и владельца.
[dataparksearch] [Forum] Поиск по всем словам

2009-01-21 Пенетрантность DataparkSearchForum
Name: Ahilles
Subject: Поиск по всем словам

Установил DataparkSearch
Все настроил как написанно (вроде)
Проиндексировал сай который добавил в команду Server 
Например Server http://www.dataparksearch.org/
Проиндексировал, отредактировал search.htm.
Захожу в поиск и обнаружел что поиск находит только слово www.dataparksearch.org
и показывает все найденные ссылки, и выделяет толко это слово, а отдельные 
слова не находит.
[dataparksearch] [Forum] Re: php

2009-01-21 Пенетрантность DataparkSearchForum
Name: Maxime
Subject: Re: php

Чтобы собрать с --enable-php-module, нужно установить пэкадж php-dev
Однако php-module - не более чем концепция по сбоке такого модуля, он не 
пригоден для реальной работы.
[dataparksearch] [Forum] Re: Поиск по всем словам

2009-01-21 Пенетрантность DataparkSearchForum
Name: Maxime
Subject: Re: Поиск по всем словам

Какие секции определены в вашем section.conf, если этот файл не создан, 
создайте его на основе sections.conf-dist и переиндексируйте все.
[dataparksearch] [Forum] Re: Поиск по всем словам

2009-01-21 Пенетрантность DataparkSearchForum
Name: Ahilles
Subject: Re: Поиск по всем словам

Вот мой section.conf
Подскажите какие значения ставить.

# Document sections.
# Format is:
#   Section string number maxlen
# where string is a section name and number is section ID
# between 0 and 255. Use 0 if you don't want to index some of 
# these sections. It is better to use different sections IDs
# for different documents parts. In this case during search 
# time you'll be able to give different weight to each part
# or even disallow some sections at a search time.
# maxlen argument contains a maximum length of section
# which will be stored in database.

# Standard HTML sections: body, title

Section body1   256
Section title   2   128

# META tags

Section meta.keywords   3   128
Section meta.description4   128

# HTTP headers example, let's store Server HTTP header
#Section header.server  5   64

# Document's URL or URL parts
# 'strict' option for a section mean strict rules for tokenization, so '/' is 
always a word break.

Section url 6   0   strict
#Section url.file   6   0   strict
#Section url.directory  7   0   strict
#Section url.path   8   0   strict
#Section url.host   9   0   strict
#Section url.proto  10  0   strict

# CrossWords

Section crosswords  11

Section Charset 12  32
Section Content-Type13  64
Section Content-Language14  16

# Uncomment the following lines if you want tag attributes
# to be indexed

#Section attribute.alt  15  128
#Section attribute.label16  128
#Section attribute.summary  17  128
#Section attribute.title18  128
#Section attribute.longdesc 19  128

# Uncomment the following lines if you want use NewsExtensions
# You may add any Newsgroups header to be indexed and stored in urlinfo table

#Section References 20  0
#Section Message-ID 21  0
#Section Parent-ID  22  0

# Uncomment the following lines if you want index MP3 tags.
#Section MP3.Song   23128
#Section MP3.Album  24128
#Section MP3.Artist 25128
#Section MP3.Year   26128
#Section MP3.Comment27128
# These are ID3v.2.2 tags
#Section ID3.TT128128
#Section ID3.TT229128
#Section ID3.TT330128
#Section ID3.TP131128
#Section ID3.TP232128
#Section ID3.TP333128
#Section ID3.TP434128
#Section ID3.TCM35128
#Section ID3.TXT36128
#Section ID3.TLA37128
#Section ID3.TAL38128
#Section ID3.TYE39128
#Section ID3.TCR40128
#Section ID3.TPB41128
#Section ID3.TOT42128
#Section ID3.TOA43128
#Section ID3.TOL44128
#Section ID3.TOR45128

# Uncomment the following line if you want index images comment extensions.
#Section IMG.comment460

# Uncomment the following line if you want use Summary Extraction Algorithm.
# Change maxlen value from 0, if you want to use $(sea) value if search 
#Section sea470

# Uncomment the following line if you fish to store geopositions found.
#Section geo.lat0 32
#Section geo.lon0 32

[dataparksearch] [Forum] Re: Поиск по всем словам

2009-01-21 Пенетрантность DataparkSearchForum
Name: Maxime
Subject: Re: Поиск по всем словам

Это правильный sections.conf, он был у вас определен во время индексирования 
ваших документов ?

[dataparksearch] [Forum] Re: Поиск по всем словам

2009-01-21 Пенетрантность DataparkSearchForum
Name: Ahilles
Subject: Re: Поиск по всем словам

Да, он был, я его создал перед первым индексированием.
[dataparksearch] [Forum] Re: Поиск по всем словам

2009-01-21 Пенетрантность DataparkSearchForum
Name: Maxime
Subject: Re: Поиск по всем словам

Тогда объясните, по-подробнее, пожалуйста, какой запрос вы даете, что 
получаете, и что ожидаетеполучить.

Если сипользуется cached, сбрасывались ли по окончании индексирования его 
буфера командой
./indexer -TH
[dataparksearch] [Forum] Re: Индексация только главной страницы.

2009-01-21 Пенетрантность DataparkSearchForum
Name: Альберт
Subject: Re: Индексация только главной страницы.

[dataparksearch] [Forum] different search template

2009-01-21 Пенетрантность DataparkSearchForum
Name: dearste
Subject: different search template

is possible split results in three columns using datapark template? ( something 
like www.cuil.com )..
If yes, how?

Many Thanks
[dataparksearch] [Forum] Re: Problem with install of 4.50

2009-01-21 Пенетрантность DataparkSearchForum
Name: Ramnath
Subject: Re: Problem with install of 4.50

I have got some similar problems . I am using Xubuntu 8.10 and when i try 
to install it says an error and says it needs libz, jade packages. Please 
explain what else is required? How to install them?
[dataparksearch] [Forum] Re: Problem with install of 4.50

2009-01-21 Пенетрантность DataparkSearchForum
Name: Ramnath
Subject: Re: Problem with install of 4.50

Can any one explain how to run the - install.pl file??
I did not run it but used ./configure directly and it required th efollowing 
packages before I can install - libz Jade jadetex I think i also need 
perl interpreter sed - stream editor.
[dataparksearch] [Forum] Re: поиск страниц со сылкой на url

2009-01-20 Пенетрантность DataparkSearchForum
Name: Sergey
Subject: Re: поиск страниц со сылкой на url

2. Какие значения для LocalCharet и BrowserCharset используются ? Какая версия 
dpsearch ?

LocalCharset   cp1251
BrowserCharset utf-8
стояла dpsearch 4.50, поставил 4.51, проблема не исчезла

[dataparksearch] [Forum] Re: Since its downloaded, now what?

2009-01-20 Пенетрантность DataparkSearchForum
Name: tushar  netake
Subject: Re: Since its downloaded, now what?

Hi i wana to install DataparkSearch on windows machine. 
 here i found installation guid for linux system.

is there any installation documentation for windows ??

help me please 

[dataparksearch] [Forum] Re: поиск страниц со сылкой на url

2009-01-19 Пенетрантность DataparkSearchForum
Name: Sergey
Subject: Re: поиск страниц со сылкой на url

Большое спасибо за ответ

Беспокоит еще один вопрос в двух частях

Поиск используется на wap портале XHTML MP
1. есть ли возможность для экранирования символов CharsToEscape \ 
использовать не # а html мнемоники
2. результат поиска выдается $^(Body:256). При этом встречается ситуация когда 
тег, например #62; попадает на конец результата и выдается например #6... . К 
сожалению в xhtml это приводит к ошибке синтаксического анализа, и как 
следствие не отображении страницы. Если ли возможность это както обойти?

[dataparksearch] [Forum] Re: поиск страниц со сылкой на url

2009-01-19 Пенетрантность DataparkSearchForum
Name: Sergey
Subject: Re: поиск страниц со сылкой на url

пункт 2 не корректно вывелся
экранируемый  символ  заменяется на (амперсанд) # 6 2 ;
если символ стоит в конце, то есть ограничение 256, он стоит в 255 позиции и 
заменяется (амперсанд) # 6 ... , тоесть символы 2; обрезаются

[dataparksearch] [Forum] Re: Индексация только главной страницы.

2009-01-19 Пенетрантность DataparkSearchForum
Name: Альберт
Subject: Re: Индексация только главной страницы.

Не работает :(
[dataparksearch] [Forum] Re: Индексация только главной страницы.

2009-01-19 Пенетрантность DataparkSearchForum
Name: Альберт
Subject: Re: Индексация только главной страницы.

Все ровно лезет внешние страницы индексировать)
[dataparksearch] [Forum] Re: поиск страниц со сылкой на url

2009-01-19 Пенетрантность DataparkSearchForum
Name: Maxime
Subject: Re: поиск страниц со сылкой на url

1. такой возможности нет.
2. Какие значения для LocalCharet и BrowserCharset используются ? Какая версия 
dpsearch ?
[dataparksearch] [Forum] Re: Индексация только главной страницы.

2009-01-19 Пенетрантность DataparkSearchForum
Name: Альберт
Subject: Re: Индексация только главной страницы.

Нет вы меня не поняли, оно собирает ссылки, но индексериует все страницы, там 
http://site.ru/page.htm, http://site.ru/page2.html, а надо чтобы только 
[dataparksearch] [Forum] Re: Индексация только главной страницы.

2009-01-19 Пенетрантность DataparkSearchForum
Name: Maxime
Subject: Re: Индексация только главной страницы.

Покажите вам файл indexer.conf целиком (за исключением паролей, если есть).
[dataparksearch] [Forum] Re: Хостинг

2009-01-19 Пенетрантность DataparkSearchForum
Name: Ahilles
Subject: Re: Хостинг

Самый оптимальных хостинг http://firstvds.ru/index.html?from=27156
Использую давно.
[dataparksearch] [Forum] Re: HELP, reinstall fails site down

2009-01-17 Пенетрантность DataparkSearchForum
Name: Maxime
Subject: Re: HELP, reinstall fails site down

Please send me your indexer.conf file to maxime [at] maxime [dot] net [dot] ru
[dataparksearch] [Forum] поиск страниц со сылкой на url

2009-01-16 Пенетрантность DataparkSearchForum
Name: Sergey
Subject: поиск страниц со сылкой на url

Добрый день!
Сначала хочу поблагодарить за хороший поисковик, так держать.

Появился вопрос
1. Как выдать в результат поиска только страницы, ссылающиеся на определенный 
URL, то есть например страницы содержащие a 
href=http://example.com/tochonado/;random/a или поднять результаты на 
первые позиции поиска.
2. Чисто философский вопрос, долго думал, но так и не понял причину: почему 
ключ -С выдает запрос на подтверждение операции, а -Edrop нет

Заранее благодарен за ответ
[dataparksearch] [Forum] MakePrefixes Как использовать?

2009-01-16 Пенетрантность DataparkSearchForum
Name: belser
Subject: MakePrefixes Как использовать?

MakePrefixes Как использовать?
[dataparksearch] [Forum] HELP, reinstall fails site down

2009-01-16 Пенетрантность DataparkSearchForum
Name: Mike (biblers)
Subject: HELP, reinstall fails site down


[r...@server sbin]# ./indexer -Ecreate
*** glibc detected *** ./indexer: free(): invalid next size (normal): 
0x0807e760 ***
=== Backtrace: =
=== Memory map: 
08048000-0805 r-xp  08:03 11208642   
0805-08051000 rw-p 8000 08:03 11208642   
08051000-080e2000 rw-p 08051000 00:00 0  [heap]
a560-a5621000 rw-p a560 00:00 0
a5621000-a570 ---p a5621000 00:00 0
a57ce000-a57d1000 rw-p a57ce000 00:00 0
a57d1000-a580c000 r-xp  08:03 25331920   /lib/libsepol.so.1
a580c000-a580d000 rw-p 0003a000 08:03 25331920   /lib/libsepol.so.1
a580d000-a5817000 rw-p a580d000 00:00 0
a5817000-a582d000 r-xp  08:03 25331887   /lib/libselinux.so.1
a582d000-a582f000 rw-p 00015000 08:03 25331887   /lib/libselinux.so.1
a582f000-a583e000 r-xp  08:03 24248371   /lib/libresolv-2.5.so
a583e000-a583f000 r--p e000 08:03 24248371   /lib/libresolv-2.5.so
a583f000-a584 rw-p f000 08:03 24248371   /lib/libresolv-2.5.so
a584-a5842000 rw-p a584 00:00 0
a5842000-a5844000 r-xp  08:03 25331936   /lib/libkeyutils-1.2.so
a5844000-a5845000 rw-p 1000 08:03 25331936   /lib/libkeyutils-1.2.so
a5845000-a584d000 r-xp  08:03 9523824/usr/lib/libkrb5support.so.0.1
a584d000-a584e000 rw-p 7000 08:03 9523824/usr/lib/libkrb5support.so.0.1
a584e000-a584f000 rw-p a584e000 00:00 0
a584f000-a5851000 r-xp  08:03 25335081   /lib/libcom_err.so.2.1
a5851000-a5852000 rw-p 1000 08:03 25335081   /lib/libcom_err.so.2.1
a5852000-a5877000 r-xp  08:03 9521920/usr/lib/libk5crypto.so.3.1
a5877000-a5878000 rw-p 00025000 08:03 9521920/usr/lib/libk5crypto.so.3.1
a5878000-a5908000 r-xp  08:03 9513804/usr/lib/libkrb5.so.3.3
a5908000-a590b000 rw-p 0008f000 08:03 9513804/usr/lib/libkrb5.so.3.3
a590b000-a591d000 r-xp  08:03 9510422/usr/lib/libz.so.1.2.3
a591d000-a591e000 rw-p 00011000 08:03 9510422/usr/lib/libz.so.1.2.3
a591e000-a5929000 r-xp  08:03 24248336   
a5929000-a592a000 rw-p a000 08:03 24248336   
a592a000-a592b000 rw-p a592a000 00:00 0
a592b000-a5957000 r-xp  08:03 9519296/usr/lib/libgssapi_krb5.so.2.2
a5957000-a5958000 rw-p 0002c000 08:03 9519296/usr/lib/libgssapi_krb5.so.2.2
a5958000-a5a75000 r-xp  08:03 24248334   /lib/libcrypto.so.0.9.8b
a5a75000-a5a88000 rw-p 0011c000 08:03 24248334   /lib/libcrypto.so.0.9.8b
a5a88000-a5a8b000 rw-p a5a88000 00:00 0
a5a8b000-a5acc000 r-xp  08:03 9521453/usr/lib/libisc.so.11.1.1
a5acc000-a5acd000 rw-p 00041000 08:03 9521453/usr/lib/libisc.so.11.1.1
a5acd000-a5c0a000 r-xp  08:03 24248345   /lib/libc-2.5.so
a5c0a000-a5c0c000 r--p 0013d000 08:03 24248345   /lib/libc-2.5.so
a5c0c000-a5c0d000 rw-p 0013f000 08:03 24248345   /lib/libc-2.5.so
a5c0d000-a5c1 rw-p a5c0d000 00:00 0
a5c1-a5c23000 r-xp  08:03 24248369   /lib/libpthread-2.5.so
a5c23000-a5c24000 r--p 00012000 08:03 24248369   /lib/libpthread-2.5.so
a5c24000-a5c25000 rw-p 00013000 08:03 24248369   /lib/libpthread-2.5.so
a5c25000-a5c28000 rw-p a5c25000 00:00 0
a5c28000-a5c4d000 r-xp  08:03 24248353   /lib/libm-2.5.so
a5c4d000-a5c4e000 r--p 00024000 08:03 24248353   /lib/libm-2.5.so
a5c4e000-a5c4f000 rw-p 00025000 08:03 24248353   /lib/libm-2.5.so
a5c4f000-a5c62000 r-xp  08:03 24248355   /lib/libnsl-2.5.so
a5c62000-a5c63000 r--p 00012000 08:03 24248355   /lib/libnsl-2.5.so
a5c63000-a5c64000 rw-p 00013000 08:03 24248355   /lib/libnsl-2.5.so
a5c64000-a5c66000 rw-p a5c64000 00:00 0
a5c66000-a5c6f000 r-xp  08:03 24248349   /lib/libcrypt-2.5.so
a5c6f000-a5c7 r--p 8000 08:03 24248349   /lib/libcrypt-2.5.so
a5c7-a5c71000 rw-p 9000 08:03 24248349   /lib/libcrypt-2.5.so
a5c71000-a5c98000 rw-p a5c71000 00:00 0
a5c98000-a5d76000 r-xp  08:03 9517016/usr/lib/libstdc++.so.6.0.8
a5d76000-a5d79000 r--p 000dd000 08:03 9517016/usr/lib/libstdc++.so.6.0.8
a5d79000-a5d7b000 rw-p 000e 08:03 9517016/usr/lib/libstdc++.so.6.0.8
a5d7b000-a5d81000 rw-p a5d7b000 00:00 0
a5d81000-a5d83000 r-xp  08:03 24248351   /lib/libdl-2.5.so
a5d83000-a5d84000 r--p 1000 08:03 24248351   /lib/libdl-2.5.so
a5d84000-a5d85000 rw-p 2000 08:03 24248351   /lib/libdl-2.5.so
a5d85000-a5e2e000 r-xp  08:03 9523980
a5e2e000-a5e32000 rw-p 000a8000 08:03 9523980

[dataparksearch] [Forum] Re: ПРАВИЛЬНАЯ КОНФИГУРАЦИЯ

2009-01-06 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: belser

еще добавились такие сообщения ! 

indexer[13270]: {00} si[4060] size adjusted by offset: 348 - 0
indexer[13270]: {00} si[4065] size adjusted by offset: 345 - 0
indexer[13270]: {00} si[4188] size adjusted by offset: 354 - 0
indexer[13270]: {00} si[4224] size adjusted by offset: 335 - 332
indexer[13270]: {00} si[4312] size adjusted by offset: 300 - 0
indexer[13270]: {00} si[4436] size adjusted by offset: 358 - 0
indexer[13270]: {00} si[4446] size adjusted by offset: 355 - 0
indexer[13270]: {00} si[4620] size adjusted by offset: 345 - 0

Дайте полний ответ на єтот и 
[dataparksearch] [Forum] Re: ПРАВИЛЬНАЯ КОНФИГУРАЦИЯ

2009-01-06 Пенетрантность DataparkSearchForum
Name: Maxime

Эти сообщения говорят о повреждении базы cached. Если используется старая 
версия dpsearch, есть смысл перейти на версию 4.51. Команда indexer -TZZ 
исправляет такие ошибки. но далеко не всегда, возможно придется её запускать 
несколько раз. Также имеет смысл сделать полную проверку базы при помощи 
команды indexer -TZZZ. Эти команды выполняются долго. Если используется 
cached, то он выполняет основную работу, а indexer в этом случае всего лишь 
передает команды на проверку в cached.
[dataparksearch] [Forum] Re: ПРАВИЛЬНАЯ КОНФИГУРАЦИЯ

2009-01-06 Пенетрантность DataparkSearchForum
Name: Maxime

Для исправления неправильного TITLE в выдаче, пересоберите с этой версией 
После этого переиндексируйте этот URL.
[dataparksearch] [Forum] ajax like suggestion

2009-01-05 Пенетрантность DataparkSearchForum
Name: dearste
Subject: ajax like suggestion

is possible make an ajax suggestion like google ? ( I use cache mode )

[dataparksearch] [Forum] Re: Looking to use this for fetching text

2009-01-05 Пенетрантность DataparkSearchForum
Name: Maxime
Subject: Re: Looking to use this for fetching text

DataparkSearch uses its own storage database to save copy of indexing 
documents, sql-database isn't used to store crawled pages.
[dataparksearch] [Forum] Re: Несколько вопросов

2009-01-04 Пенетрантность DataparkSearchForum
Name: Maxime
Subject: Re: Несколько вопросов

Это не похоже на вывод dpsearch, возможно это сообщение вашего шэлла о том, что 
программы indexer в каталоге /usr/local/sbin нет.
[dataparksearch] [Forum] Re: searchd help

2009-01-04 Пенетрантность DataparkSearchForum
Name: dearste
Subject: Re: searchd help

 At 00:56:40  04/01/09, Maxime wrote:
Do you use Apache's AddHandler or Action directive to setup search ? If yes, 
try to reconfigure Apache to avoid such commands.

i'm using this command

ScriptAlias /find /usr/local/dpsearch/bin/search.cgi

I try to recompile 4.51 and now seems to work ok.
but if i run search.cgi from shell I have the same error.
[dataparksearch] [Forum] Re: ПРАВИЛЬНАЯ КОНФИГУРАЦИЯ

2009-01-04 Пенетрантность DataparkSearchForum
Name: belser

ок! я так понял такого рода топики остаются без ответа... В своем случае 
отменил UseCRC32URLId т.к. не находило по некоторим словам у которих отсутвовал 
ід сайта в хранилище (наверно нельзя такую методику генарации использовать?)... 
потом виполнил -ТДВ и -ТЗЗЗ и все стало на места... но как Максим избавиться от
 1. Реестр сайтов МЕТА Украина : Украина : Сельское хозяйство body,td { 
font-size: 80% [0.005% Popularity: 0.25]

* http://dir.meta.ua/topics/ru/business/ag... - 43276 bytes [text/html; 
charset=windows-1251] - 31 Dec 2008 10:17:19 EET
[Cached copy]
[All results from this site (1 total) ]
Плюс чего в тайтл лезет текст видаbody,td { font-size: 
80% . ?Что нужно изменить.?
С ув. Спасибо.

[dataparksearch] [Forum] Re: searchd help

2009-01-02 Пенетрантность DataparkSearchForum
Name: dearste
Subject: Re: searchd help

 At 08:46:30  02/01/09, Maxime wrote:
Most likely user under which search.cgi is executed has no rights to read 
As well please verify that user which searchd run has the rights to read files 
under /usr/local/dpsearch/var/ directory, /usr/local/dpsearch/var/url/info* 

very strange cause im the root user..
so its only a problem of privileges?
[dataparksearch] [Forum] Re: Не устанавливается!

2009-01-01 Пенетрантность DataparkSearchForum
Name: Альберт
Subject: Re: Не устанавливается!

Где этот uconv.lo находится?
[dataparksearch] [Forum] Re: Не устанавливается!

2009-01-01 Пенетрантность DataparkSearchForum
Name: Альберт
Subject: Re: Не устанавливается!

Когда устанавливаеш через http://www.freshports.org/www/dpsearch/, то куда 
сохраняется search.cgi?
[dataparksearch] [Forum] Re: searchd help

2009-01-01 Пенетрантность DataparkSearchForum
Name: dearste
Subject: Re: searchd help

 At 23:20:38  01/01/09, Maxime wrote:
Please show variables section of your search template.
Also, please check that your search template has res section defined.

yes, res section is defined,

here var in search.htm

DBAddr searchd://
GroupBySite yes
PagesInGroup 1
LocalCharset   utf-8
BrowserCharset utf-8
m near
DoStore yes
sp 1
sy 1
LogLevel 5
MinWordLength 1
MaxWordLength 64
Synonym synonym/italian.syn
Synonym synonym/english.syn
HlBeg   b
HlEnd   /b
GrBeg   blockquote
GrEnd   /blockquote
AspellExtensions yes

[dataparksearch] [Forum] Re: searchd help

2009-01-01 Пенетрантность DataparkSearchForum
Name: dearste
Subject: Re: searchd help

 At 01:09:46  02/01/09, Maxime wrote:
Try to execute search.cgi from command line:

./search.cgi esteris=IRPDtmplt=search.htmlabel=web

and watch if you have any error messages in stderr.

what mean this?

 cd /usr/local/dpsearch/bin/
 ./search.cgi esteris=IRPDtmplt=search.htmlabel=web
Can't load template: '/usr/local/dpsearch/etc/index.htm' Unable to stat 
template '/usr/local/dpsearch/etc/index.htm': No such file or directory
Content-Type: text/html; charset=utf-8

META NAME=Content-Type Content=text/html; charset=utf-8

[dataparksearch] [Forum] Re: searchd help

2009-01-01 Пенетрантность DataparkSearchForum
Name: Maxime
Subject: Re: searchd help

Most likely user under which search.cgi is executed has no rights to read 
As well please verify that user which searchd run has the rights to read files 
under /usr/local/dpsearch/var/ directory, /usr/local/dpsearch/var/url/info* 
[dataparksearch] [Forum] Не устанавливается!

2008-12-31 Пенетрантность DataparkSearchForum
Name: Альберт
Subject: Не устанавливается!

При установке пишет:
libtool: link: `uconv.lo' is not a valid libtool object
*** Error code 1

Stop in /usr/src/dpsearch-4.50/src.
*** Error code 1

Stop in /usr/src/dpsearch-4.50/src.
*** Error code 1

Stop in /usr/src/dpsearch-4.50.

[dataparksearch] [Forum] Re: Нужна помощь

2008-12-31 Пенетрантность DataparkSearchForum
Name: vladimir
Subject: Re: Нужна помощь

Здравствуйте. Спасибо за ответы.
Планирую использовать оператор !IFNOT раз 5-7. Он выдирает url на картинку. 
Не будет ли тармазов?

И что делает оператор !IFLIKE. Вы написали что его нужно аккуратнее 

Заранее спасибо. С наступающим новым годом
[dataparksearch] [Forum] Re: Нужна помощь

2008-12-31 Пенетрантность DataparkSearchForum
Name: Maxime
Subject: Re: Нужна помощь

1. Условный оператор !IFLIKE аналогичен оператору !IF, только сравнение 
происходит не на точное совпадение, а на соответствие шаблону, указываемому в 
аттрибуте VALUE.

2. Запустите indexer с ключом -v5 и среди отладочной информации будет сообщено 
почему каждая ссылка была принята или отклонена к индексированию.
[dataparksearch] [Forum] Re: ПРАВИЛЬНАЯ КОНФИГУРАЦИЯ

2008-12-31 Пенетрантность DataparkSearchForum
Name: belser

 At 01:28:33  31/12/08, Maxime wrote:
Можно пример такого документа и списка слов, которые в нем не находятся ?

слово meta . По моим соображениям должна отображаться стартовая страница а 
получаем -

1.  Реестр сайтов МЕТА Украина : Украина : Сельское хозяйство body,td { 
font-size: 80%  [0.005% Popularity: 0.25]

* http://dir.meta.ua/topics/ru/business/ag... - 43276 bytes [text/html; 
charset=windows-1251] - 31 Dec 2008 10:17:19 EET
  [Cached copy]
  [All results from this site (1 total) ] 
Плюс чего в тайтл лезет текст вида body,td { font-size: 80% . ?Что нужно 
[dataparksearch] [Forum] ПРАВИЛЬНАЯ КОНФИГУРАЦИЯ

2008-12-30 Пенетрантность DataparkSearchForum
Name: belser

Можно увидеть подробную не типовую конфигурацию indexer.conf stored.conf 
sections.conf search.htm?
Задачи индексировать весь текст на страничках без ограничений! а также при 
поиске все слова находились.

[dataparksearch] [Forum] Re: ПРАВИЛЬНАЯ КОНФИГУРАЦИЯ

2008-12-30 Пенетрантность DataparkSearchForum
Name: Maxime

Примеры конфигураций можно найти в директории doc/samples дистрибутива dpsearch.
[dataparksearch] [Forum] Re: ПРАВИЛЬНАЯ КОНФИГУРАЦИЯ

2008-12-30 Пенетрантность DataparkSearchForum
Name: belser

 At 20:43:16  30/12/08, Maxime wrote:
Примеры конфигураций можно найти в директории doc/samples дистрибутива 

Спасибо за ответ!
У меня не находит слова приимущественно в конце документа
Использую dpsearch-4.51-24122008

DBAddr  mysql://root:%...@localhost/probce/?dbmode=cache
VarDir /usr/local/ROBOT/var
LocalCharset UTF-8
CrossWords yes
CollectLinks yes
DoStore yes
StopwordFile stopwords/en.big.sl
StopwordFile stopwords/ru.sl
StopwordFile stopwords/uk.sl
Include stopwords.conf
MinWordLength 1
MaxWordLength 32
LangMapUpdate yes
LangMapFile langmap/en.ascii.lm
LangMapFile langmap/ru.cp1251.lm
LangMapFile langmap/ru.cp866.lm
LangMapFile langmap/ru.cyrillic.lm
LangMapFile langmap/ru.koi8-r.lm
LangMapFile langmap/ru.maccyr.lm
LangMapFile langmap/ru.utf8.lm
LangMapFile langmap/uk.cp1251.lm
LangMapFile langmap/uk.koi8-u.lm
Include langmap.conf
GuesserUseMeta yes
UseDateHeader yes
GuesserBytes 0
OptimizeAtUpdate yes
LangMapUpdate yes
UseCRC32URLId yes
ProvideReferer yes
LongestTextItems 4
MarkForIndex no
FastHrefCheck yes
HoldBadHrefs 30d
UseRemoteContentType yes
DefaultLang  ua
MaxNetErrors 0
NetErrorDelayTime 1d
Robots yes
Cookies yes
DetectClones yes
Include sections.conf
Index yes
RemoteCharset cp1251
PopRankMethod Neo
MaxDocsPerServer 10
Server http://ugingroup.narod.ru/

DBAddr  mysql://root:%...@localhost/probce/?dbmode=cache
VarDir /usr/local/ROBOT/var
DoStore yes
LocalCharset   utf-8
BrowserCharset utf-8
StopwordFile stopwords/en.big.sl
StopwordFile stopwords/ru.sl
StopwordFile stopwords/uk.sl
MinWordLength 1
MaxWordLength 32
PagesPerScreen 10


Section body  1 64000
Section title 2 256
Section meta.keywords   3   128
Section meta.description4   128

Section url 6   0   strict
Section url.host9   0   
Section crosswords  11   0

Section Charset 12  0
Section Content-Type13  0
Section Content-Language14  0

в чем ошибка?

[dataparksearch] [Forum] Re: Нужна помощь

2008-12-30 Пенетрантность DataparkSearchForum
Name: Maxime
Subject: Re: Нужна помощь

Несколько условных операторов на сравнение вряд ли заметно деградируют скорость 
выдачи результатов. Гораздо важнее осторожнее подходить к использованию 
операторов !IFLIKE
  1   2   3   4   5   6   7   8   9   >