<> "Jerome" == Jerome ALET <[EMAIL PROTECTED]> writes:

 Jerome> excuse my poor english.
 
 Pas de probl�me, le mien est aussi tr�s poor
 
 Jerome> now it works fine but I've got an NT Server with IIS and I want to index
 Jerome> it all from my SparcLinux box.

 Jerome> I do a smbmount to mount the web directories in my SparcLinux, hoping
 Jerome> this will be quicker than via http.

 Jerome> I want to index these directories even if there are no links from pages
 Jerome> to pages.
 
 htdig n'utilise que des requ�tes http pour acc�der aux pages a indexer, �a
 veut dire que:
 
 1/ quelque soit l'emplacement des pages html �a ne changera rien pour htdig
 qui fera toujours ses requ�tes au serveur (�a peut changer effectivement les
 perfs mais au niveau du serveur, rien a voir avec htdig)
 
 2/ Si tes pages ne sont r�f�renc�es a partir de nulle part htdig ne les
 trouvera pas ! Seule solution cr�er des liens !
 
 Ce que fait htdig est: a partir des urls 'start_urls' il fait des requ�tes
 http et r�cup�re les pages, les parse, en extrait les mots clefs mais aussi
 les liens, puis suis ces liens et continue jusqu'� ce qu'il n'y ait plus rien
 a suivre (en gros il construit dynamiquement une sorte de gros graphe des
 pages, mais en virant des branches en fonction des 'exclude_urls' etc ).

 bonne chance
 
 a+
 
-- 

 - heddy -
----------------------------------------------------------------------
To unsubscribe from the htdig mailing list, send a message to
[EMAIL PROTECTED] containing the single word "unsubscribe" in
the body of the message.

Reply via email to