- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Xit Subject: Поиск mp3
В локальной сети есть сайт, который раздаёт mp3. Хочу его проиндексировать, и проводить поиск по mp3. Правильный или нет content-type отдаёт сайт я незнаю, расширения файла в URL'е тоже не прослеживается, ссылки получаются такие вот: "http://сайт/c/m3u/?id=105714&cont=1". Пробовал по разному конфиг писать, ни один не работает... По запросу информация о mp3 файле находится в описание альбомов или там при ссылках на mp3, а мне надо чтобы индексировались информация внутри тагов mp3 и в результате поиска выдавалась прямая ссылка на файл. Может быть, у кого-нибудь есть готовый рецепт на эту тему? У меня indexer.conf вот такой сейчас: DBAddr pgsql://логин:пароль@/mp3search/?dbmode=crc-multi NewsExtensions no AccentExtensions no SyslogFacility local3 LocalCharset windows-1251 ForceIISCharset1251 yes AspellExtensions yes CrossWords yes CollectLinks yes DoStore no Include stopwords.conf Include langmap.conf MinWordLength 2 MaxWordLength 32 MaxDocSize 16048576 MinDocSize 512 IndexDocSizeLimit 0 URLSelectCacheSize 10240 HTTPHeader "User-Agent: Opera/9.02" HTTPHeader "Accept-Language: ru, en" ServerTable pgsql://логин:пароль@/mp3search/server UseDateHeader no Allow * Disallow *.b *.sh *.md5 *.rpm Disallow *.arj *.tar *.zip *.tgz *.gz *.z *.bz2 Disallow *.lha *.lzh *.rar *.zoo *.ha *.tar.Z Disallow *.gif *.jpg *.jpeg *.bmp *.tiff *.tif *.xpm *.xbm *.pcx Disallow *.vdo *.mpeg *.mpe *.mpg *.avi *.movie *.mov *.dat #Disallow *.mid *.mp3 *.rm *.ram *.wav *.aiff *.ra Disallow *.vrml *.wrl *.png *.psd Disallow *.exe *.com *.cab *.dll *.bin *.class *.ex_ Disallow *.tex *.texi *.xls *.doc *.texinfo Disallow *.rtf *.pdf *.cdf *.ps Disallow *.ai *.eps *.ppt *.hqx Disallow *.cpt *.bms *.oda *.tcl Disallow *.o *.a *.la *.so Disallow *.pat *.pm *.m4 *.am *.css Disallow *.map *.aif *.sit *.sea Disallow *.m3u *.qt *.mov Disallow *D=A *D=D *M=A *M=D *N=A *N=D *S=A *S=D *O=A *O=D Disallow Regex \.r[0-9][0-9]$ \.a[0-9][0-9]$ \.so\.[0-9]$ CheckOnly *.b *.sh *.md5 CheckOnly *.arj *.tar *.zip *.tgz *.gz CheckOnly *.lha *.lzh *.rar *.zoo *.tar*.Z CheckOnly *.gif *.jpg *.jpeg *.bmp *.tiff CheckOnly *.vdo *.mpeg *.mpe *.mpg *.avi *.movie #CheckOnly *.mid *.mp3 *.rm *.ram *.wav *.aiff CheckOnly *.vrml *.wrl *.png CheckOnly *.exe *.cab *.dll *.bin *.class CheckOnly *.tex *.texi *.xls *.doc *.texinfo CheckOnly *.rtf *.pdf *.cdf *.ps CheckOnly *.ai *.eps *.ppt *.hqx CheckOnly *.cpt *.bms *.oda *.tcl CheckOnly *.rpm *.m3u *.qt *.mov CheckOnly *.map *.aif *.sit *.sea CheckMP3Only *.* (тут пробовал и просто '*') HoldBadHrefs 7d DeleteOlder 900d AddType image/x-xpixmap *.xpm AddType image/x-xbitmap *.xbm AddType image/gif *.gif AddType text/plain *.txt *.pl *.js *.h *.c *.pm *.e AddType text/html *.html *.htm AddType text/rtf *.rtf AddType application/pdf *.pdf AddType application/msword *.doc AddType application/vnd.ms-excel *.xls AddType text/x-postscript *.ps AddType audio/mpeg *.mp3 AddType application/unknown *.* ParserTimeOut 300 Period 14d DefaultLang ru VaryLang "ru en fr de" MaxHops 256 TrackHops yes MaxDocsPerServer -1 MaxNetErrors 16 ReadTimeOut 30s DocTimeOut 1m30s NetErrorDelayTime 1d Robots no Cookies no DetectClones no Include sections.conf Index yes RemoteCharset windows-1251 Server CheckMP3Only http://сайт/ в sections.conf # Uncomment the following lines if you want index MP3 tags. Section MP3.Song 22 128 Section MP3.Album 23 128 Section MP3.Artist 24 128 Section MP3.Year 25 128 Section MP3.Comment 26 128 # These are ID3v.2.2 tags Section ID3.TT1 27 128 Section ID3.TT2 28 128 Section ID3.TT3 29 128 Section ID3.TP1 30 128 Section ID3.TP2 31 128 Section ID3.TP3 32 128 Section ID3.TP4 33 128 Section ID3.TCM 34 128 Section ID3.TXT 35 128 Section ID3.TLA 36 128 Section ID3.TAL 37 128 Section ID3.TYE 38 128 Section ID3.TCR 39 128 Section ID3.TPB 40 128 Section ID3.TOT 41 128 Section ID3.TOA 42 128 Section ID3.TOL 43 128 Section ID3.TOR 44 128 - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here: http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=05;post=
