- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Xit
Subject: Re: Поиск mp3
Вообщем делюсь своими соображениями....
1. Попробовал индексировать ещё другие сайты с mp3 - какие-то mp3 парсит, а
какие-то не хочет. Но что самое интересное, в режиме CheckMP3Only он
ИНДЕКСИРУЕТ СТРАНИЦЫ ТОЖЕ!
Даже если весь indexer.conf затыкать разными вариантами CheckMP3Only, он всё
равно будет индексировать инфу с html, проверено на поиске после индексирования.
Но вот что самое интересное, что в режиме HrefOnly он не индексирует... я не
настолько хорошо разобрался в исходниках, но в indexer.c есть такой кусок:
if (Doc->method != DPS_METHOD_HREFONLY) DpsPrepareWords(Indexer, Doc);
на самом деле, работа при HREFONLY отличается от других режимов, ещё и в db.c,
но на сколько я понял именно на индексирование html, то что есть в db.c не
влияет.
Насколько правильно будет, если изменить в indexer.c кусок с того что выше,
например, на такой:
if (Doc->method != DPS_METHOD_HREFONLY)
{
if (!(Doc->method == DPS_METHOD_CHECKMP3ONLY &&
mp3type == DPS_MP3_UNKNOWN))
{
DpsPrepareWords(Indexer, Doc);
}
}
Конечно этот фрагмент можно написать по другому, но моя мысль в том, что если у
нас стоит режими CHECKMP3ONLY и в то же самое время неопределённый mp3type, то
не надо вызывать DpsPrepareWords, так же как и в случае HREFONLY.
Что скажете, насколько такой вариант имеет право на жизнь?
2. Остаётся проблема в том, что какие-то mp3 он парсит нормально (на одних
сайтах), а на других нехочет. При этом, если смотреть информацию о mp3 файле,
например в WinAmp, то вроде бы что в одном, что в другом файле ID3 стоит и
заполненность полей примерно так же.
3. Какая-то непонятность...
Вот, например, mp3 файл:
http://disk.tom.ru/525670 - это его заголовок и так его определяет WinAmp
А вот так отображается поле $(MP3.Song):
Heavily Medicated Industrial Brutal Death/Grind Metal
Так и должно быть?
Жду ваших ответов! Заранее спасибо!
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=05;topic_id=1179311935;page=2