<> "Jerome" == Jerome ALET <[EMAIL PROTECTED]> writes:
Jerome> excuse my poor english.
Pas de probl�me, le mien est aussi tr�s poor
Jerome> now it works fine but I've got an NT Server with IIS and I want to index
Jerome> it all from my SparcLinux box.
Jerome> I do a smbmount to mount the web directories in my SparcLinux, hoping
Jerome> this will be quicker than via http.
Jerome> I want to index these directories even if there are no links from pages
Jerome> to pages.
htdig n'utilise que des requ�tes http pour acc�der aux pages a indexer, �a
veut dire que:
1/ quelque soit l'emplacement des pages html �a ne changera rien pour htdig
qui fera toujours ses requ�tes au serveur (�a peut changer effectivement les
perfs mais au niveau du serveur, rien a voir avec htdig)
2/ Si tes pages ne sont r�f�renc�es a partir de nulle part htdig ne les
trouvera pas ! Seule solution cr�er des liens !
Ce que fait htdig est: a partir des urls 'start_urls' il fait des requ�tes
http et r�cup�re les pages, les parse, en extrait les mots clefs mais aussi
les liens, puis suis ces liens et continue jusqu'� ce qu'il n'y ait plus rien
a suivre (en gros il construit dynamiquement une sorte de gros graphe des
pages, mais en virant des branches en fonction des 'exclude_urls' etc ).
bonne chance
a+
--
- heddy -
----------------------------------------------------------------------
To unsubscribe from the htdig mailing list, send a message to
[EMAIL PROTECTED] containing the single word "unsubscribe" in
the body of the message.