gt; >
> > - Mensaje original -
> > > De: "Paul Escobar"
> > > Para: user@nutch.apache.org
> > > Enviados: Miércoles, 18 de Noviembre 2015 22:33:50
> > > Asunto: Re: [MASSMAIL]Crawling focused only over seed file
> > >
> > > Hi Roa
wse/NUTCH-1331 for more
> information.
>
> Regards.
>
> - Mensaje original -
> > De: "Paul Escobar"
> > Para: user@nutch.apache.org
> > Enviados: Miércoles, 18 de Noviembre 2015 22:33:50
> > Asunto: Re: [MASSMAIL]Crawling focused only over s
> Para: user@nutch.apache.org
> Enviados: Miércoles, 18 de Noviembre 2015 22:33:50
> Asunto: Re: [MASSMAIL]Crawling focused only over seed file
>
> Hi Roannel, the new URLs aren't from other domains, they are in the same
> domain, we want updatedb command avoid the update crawl
gt;
> > Change in your nutch-site.xml the property db.ignore.external.links to
> > true.
> >
> > Regards
> >
> > - Mensaje original -
> > > De: "Andrés Rincón Pacheco"
> > > Para: user@nutch.apache.org
> > > Enviados: Sábado, 14
t; Change in your nutch-site.xml the property db.ignore.external.links to
> true.
>
> Regards
>
> - Mensaje original -
> > De: "Andrés Rincón Pacheco"
> > Para: user@nutch.apache.org
> > Enviados: Sábado, 14 de Noviembre 2015 19:51:54
> &
Hi Andrés,
Change in your nutch-site.xml the property db.ignore.external.links to true.
Regards
- Mensaje original -
> De: "Andrés Rincón Pacheco"
> Para: user@nutch.apache.org
> Enviados: Sábado, 14 de Noviembre 2015 19:51:54
> Asunto: [MASSMAIL]Crawling focus
6 matches
Mail list logo