Veja em http://linux.trix.net/rede_htdig.htm e http://www.htdig.org/
O principal arquivo de configura��o � o /etc/htdig/htdig.conf .
sendo os principais par�metros
database_dir: /var/htdig/db -> aonde ficara seu "banco de dados "
start_url: http://meusite/meusarquivos/ -> aonde esta seus arquivos
(nota Apache tem que esta funcionando)
local_urls: http://meusite/meusarquivos/
=/home/httpd/html/meusarquivos/ -> pode ter mais de uma desta linha
bad_extensions: .gz .z .jpg .gif -> informa para n�o indexar este
arquivos
bad_word_list: badwords.txt ->arquivo com palavra que n�o deve ser
indexada (de por a � como etc...)
Para indexar Doc e pdf o htdig usa um conversor externo veja como
http://www.htdig.org/ FAQ.html aonde baixa-los e como instala-los
Prepare-se ha uma grade possibilidade de seu banco de dados ficara maior que
todos os seus textos juntos .
Estou neste momento tentando usar o programa swish ou o swish++ para
substituir o htdig que seriam mais rapidos e geram
uma "base de dados" menor.
> instalei o htdig, mas estou tendo dificuldades de fazer com que ele indexe
meus documentos...
> Na verdade nao sei e nao consegui achar direito onde tenho que colocar os
> documentos para indexar. O que eu preciso fazer eh indexar varios
documentos
> .doc do ruinword. Tentei colocar num diretorio, zerar a base de dados com
a
> opcao -i, rodei o htdig, mas nao tive sucesso..
> Alguem utiliza o htdig e ja passou por isso? Por favor me ajudem!!!
> Um abraco e obrigado a todos...
Assinantes em 25/09/2001: 2369
Mensagens recebidas desde 07/01/1999: 133994
Historico e [des]cadastramento: http://linux-br.conectiva.com.br
Assuntos administrativos e problemas com a lista:
mailto:[EMAIL PROTECTED]