- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Xit
Subject: Поиск mp3

В локальной сети есть сайт, который раздаёт mp3. Хочу его проиндексировать, и 
проводить поиск по mp3. Правильный или нет content-type отдаёт сайт я незнаю, 
расширения файла в URL'е тоже не прослеживается, ссылки получаются такие вот: 
"http://сайт/c/m3u/?id=105714&cont=1";.

Пробовал по разному конфиг писать, ни один не работает... По запросу информация 
о mp3 файле находится в описание альбомов или там при ссылках на mp3, а мне 
надо чтобы индексировались информация внутри тагов mp3 и в результате поиска 
выдавалась прямая ссылка на файл.

Может быть, у кого-нибудь есть готовый рецепт на эту тему?

У меня indexer.conf вот такой сейчас:

DBAddr  pgsql://логин:пароль@/mp3search/?dbmode=crc-multi
NewsExtensions no
AccentExtensions no
SyslogFacility local3
LocalCharset windows-1251
ForceIISCharset1251 yes
AspellExtensions yes
CrossWords yes
CollectLinks yes
DoStore no

Include stopwords.conf
Include langmap.conf

MinWordLength 2
MaxWordLength 32

MaxDocSize 16048576

MinDocSize 512

IndexDocSizeLimit 0
URLSelectCacheSize 10240

HTTPHeader "User-Agent: Opera/9.02"
HTTPHeader "Accept-Language: ru, en"

ServerTable pgsql://логин:пароль@/mp3search/server

UseDateHeader no

Allow *

Disallow *.b    *.sh   *.md5  *.rpm
Disallow *.arj  *.tar  *.zip  *.tgz  *.gz   *.z     *.bz2
Disallow *.lha  *.lzh  *.rar  *.zoo  *.ha   *.tar.Z
Disallow *.gif  *.jpg  *.jpeg *.bmp  *.tiff *.tif   *.xpm  *.xbm *.pcx
Disallow *.vdo  *.mpeg *.mpe  *.mpg  *.avi  *.movie *.mov  *.dat
#Disallow *.mid  *.mp3  *.rm   *.ram  *.wav  *.aiff  *.ra
Disallow *.vrml *.wrl  *.png  *.psd
Disallow *.exe  *.com  *.cab  *.dll  *.bin  *.class *.ex_
Disallow *.tex  *.texi *.xls  *.doc  *.texinfo
Disallow *.rtf  *.pdf  *.cdf  *.ps
Disallow *.ai   *.eps  *.ppt  *.hqx
Disallow *.cpt  *.bms  *.oda  *.tcl
Disallow *.o    *.a    *.la   *.so
Disallow *.pat  *.pm   *.m4   *.am   *.css
Disallow *.map  *.aif  *.sit  *.sea
Disallow *.m3u  *.qt   *.mov

Disallow *D=A *D=D *M=A *M=D *N=A *N=D *S=A *S=D *O=A *O=D

Disallow Regex \.r[0-9][0-9]$ \.a[0-9][0-9]$ \.so\.[0-9]$

CheckOnly *.b     *.sh   *.md5
CheckOnly *.arj  *.tar  *.zip  *.tgz  *.gz
CheckOnly *.lha  *.lzh  *.rar  *.zoo  *.tar*.Z
CheckOnly *.gif  *.jpg  *.jpeg *.bmp  *.tiff
CheckOnly *.vdo  *.mpeg *.mpe  *.mpg  *.avi  *.movie
#CheckOnly *.mid  *.mp3  *.rm   *.ram  *.wav  *.aiff
CheckOnly *.vrml *.wrl  *.png
CheckOnly *.exe  *.cab  *.dll  *.bin  *.class
CheckOnly *.tex  *.texi *.xls  *.doc  *.texinfo
CheckOnly *.rtf  *.pdf  *.cdf  *.ps
CheckOnly *.ai   *.eps  *.ppt  *.hqx
CheckOnly *.cpt  *.bms  *.oda  *.tcl
CheckOnly *.rpm  *.m3u  *.qt   *.mov
CheckOnly *.map  *.aif  *.sit  *.sea

CheckMP3Only *.* (тут пробовал и просто '*')

HoldBadHrefs 7d
DeleteOlder 900d

AddType image/x-xpixmap *.xpm
AddType image/x-xbitmap *.xbm
AddType image/gif       *.gif

AddType text/plain                      *.txt  *.pl *.js *.h *.c *.pm *.e
AddType text/html                       *.html *.htm

AddType text/rtf                        *.rtf
AddType application/pdf                 *.pdf
AddType application/msword              *.doc
AddType application/vnd.ms-excel        *.xls
AddType text/x-postscript               *.ps
AddType audio/mpeg                      *.mp3
AddType application/unknown *.*
ParserTimeOut 300

Period 14d
DefaultLang ru
VaryLang "ru en fr de"
MaxHops 256
TrackHops yes
MaxDocsPerServer -1
MaxNetErrors 16
ReadTimeOut 30s

DocTimeOut 1m30s

NetErrorDelayTime 1d
Robots no
Cookies no
DetectClones no
Include sections.conf

Index yes
RemoteCharset windows-1251

Server CheckMP3Only http://сайт/

в sections.conf

# Uncomment the following lines if you want index MP3 tags.
Section MP3.Song                22    128
Section MP3.Album               23    128
Section MP3.Artist              24    128
Section MP3.Year                25    128
Section MP3.Comment            26    128
# These are ID3v.2.2 tags
Section ID3.TT1                27    128
Section ID3.TT2                28    128
Section ID3.TT3                29    128
Section ID3.TP1                30    128
Section ID3.TP2                31    128
Section ID3.TP3                32    128
Section ID3.TP4                33    128
Section ID3.TCM                34    128
Section ID3.TXT                35    128
Section ID3.TLA                36    128
Section ID3.TAL                37    128
Section ID3.TYE                38    128
Section ID3.TCR                39    128
Section ID3.TPB                40    128
Section ID3.TOT                41    128
Section ID3.TOA                42    128
Section ID3.TOL                43    128
Section ID3.TOR                44    128








- - - - - - - - - - - - - - - - - - - - - - - - - - - -

Read the full topic here:
http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=05;post=

Reply via email to