[dataparksearch] [Forum] Странные записи в таблице server

2007-12-15 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: ooptimum
Subject: Странные записи в таблице server

Давно заметил, что в таблице server присутствуют странные записи, например, 
параметры из indexer.conf, такие как Disallow, а также неверно сформированные 
URL из индексируемых документов, например, с неправильно сформированным именем 
протокола. Это нормально?

[pre]mysql> select rec_id,parent,url from server where url not like 
'http://%.tj%' order by url;
+-+-+-+
| rec_id  | parent  | url   
  |
+-+-+-+
| -1558897981 |   0 | *.??_ 
  |
|  -303415946 |   0 | *.a   
  |
|   752243032 |   0 | *.ai  
  |
|  1653070540 |   0 | *.aif 
  |
|  1420788177 |   0 | *.aiff
  |
| -1487048733 |   0 | *.am  
  |
| -1624862788 |   0 | *.arj 
  |
|  1248070425 |   0 | *.avi 
  |
| -1009981404 |   0 | *.b   
  |
|  -252565531 |   0 | *.bin 
  |
| -1109799009 |   0 | *.bmp 
  |
| -1376835098 |   0 | *.bms 
  |
|  1845106943 |   0 | *.bz2 
  |
|  -784521992 |   0 | *.cab 
  |
|   648492231 |   0 | *.cdf 
  |
|   912494834 |   0 | *.class   
  |
| -1258315430 |   0 | *.com 
  |
| -1937387122 |   0 | *.cpt 
  |
| -1744002416 |   0 | *.css 
  |
|   197990351 |   0 | *.dat 
  |
| -1714321870 |   0 | *.dll 
  |

|   -89864740 |  1845846513 | 00://tut.freenet.tj/  
  |
|   872479281 |  1845846513 | 01://tut.freenet.tj/  
  |
|  1980206859 |  1845846513 | 02://tut.freenet.tj/  
  |
|   151508414 |  1845846513 | 03://tut.freenet.tj/  
  |
|  1009636514 |  1845846513 | 04://tut.freenet.tj/  
  |
|  1028664751 |  1845846513 | 05://tut.freenet.tj/  
  |
| -1531880002 |  1845846513 | 06://tut.freenet.tj/  
  |
|  1650203748 |  1845846513 | 07://tut.freenet.tj/  
  |


|  -905561487 |  1845846513 | c://tut.freenet.tj/   
  |
|   139958690 |  1845846513 | c://www.cst.tj/   
  |
|  1955943923 |  1845846513 | c://www.tut.freenet.tj/   
  |
|   2984

[dataparksearch] [Forum] Re: segfault на 4.48

2007-12-15 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: ooptimum
Subject: Re: segfault на 4.48

Вчера тоже поймал segfault на dpsearch-4.48-mysql-freetds, правда, без core 
dump. Запускал просто как indexer -N 5.

# uname -a
Linux spider 2.6.17-gentoo-r4 #1 SMP Sat Aug 26 17:44:54 TJT 2006 i686 Intel(R) 
Pentium(R) 4 CPU 3.00GHz GenuineIntel GNU/Linux

# gcc --version
gcc (GCC) 4.1.2 (Gentoo 4.1.2 p1.0.2)

# /lib/libc.so.6
GNU C Library stable release version 2.6.1, by Roland McGrath et al.
Copyright (C) 2007 Free Software Foundation, Inc.
This is free software; see the source for copying conditions.
There is NO warranty; not even for MERCHANTABILITY or FITNESS FOR A
PARTICULAR PURPOSE.
Compiled by GNU CC version 4.1.2 (Gentoo 4.1.2 p1.0.2).
Compiled on a Linux >>2.6.17-gentoo-r4<< system on 2007-12-04.
Available extensions:
C stubs add-on version 2.1.2
crypt add-on version 2.1 by Michael Glad and others
Gentoo patchset 1.1
GNU Libidn by Simon Josefsson
Native POSIX Threads Library by Ulrich Drepper et al
Support for some architectures added on, not maintained in glibc core.
BIND-8.2.3-T5B

- - - - - - - - - - - - - - - - - - - - - - - - - - - -

Read the full topic here:
http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=06;topic_id=1194500284



[dataparksearch] [Forum] No 'Server' command for url

2007-12-15 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: ooptimum
Subject: No 'Server' command for url

Что делает indexer еще, кроме вывода сообщения "No 'Server' command for url", 
когда он встречает такие условия?
- - - - - - - - - - - - - - - - - - - - - - - - - - - -

Read the full topic here:
http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=06;post=