Update on the issue, we removed the scoring-opic plugin but Nutch is still 
adding <field name="boost" type="tdoubles"/> to Solr's manage-schema.xml file. 
Improvement is that we are getting a standardized boost of "boost": [ 1 ] in 
the document indexed now.

How do we prevent Nutch from adding a boost to the solr document?

-----Original Message-----
From: Megha Bhandari [mailto:mbhanda...@sapient.com] 
Sent: Wednesday, June 22, 2016 1:20 PM
To: user@nutch.apache.org
Subject: RE: Nutch 1.11 | scoring-opic plugin | influence on solr document score

Thanks, will try and search the forums but is it necessary to use a scoring 
plugin as some of the mailing list posts mention alternatives.
We don’t want Nutch to influence document score at all.

-----Original Message-----
From: Jigal van Hemert | alterNET internet BV [mailto:ji...@alternet.nl] 
Sent: Wednesday, June 22, 2016 1:09 PM
To: user
Subject: Re: Nutch 1.11 | scoring-opic plugin | influence on solr document score


On 22 June 2016 at 09:23, Megha Bhandari <mbhanda...@sapient.com> wrote:

> Does the scoring-opic plugin insert influence the score of the document
> Nutch inserts into Solr?
> Can we remove this plugin from nutch-site.xml ? We are suspecting that
> Nutch is introducing a higher score for documents that are freshly inserted
> to Solr and that is skewing results for us in search.

There are some posts in this list about this plugin. I don't remember that
actual details, but in the end the advice was to remove it form the
plugin.includes list as it does more harm than good.

> Thanks in advance for any insight into this plugin as I am unable to
> access this whitepaper link Abiteboul, Serge and Preda, Mihai and Cobena,
> Gregory (2003), Adaptive On-Line Page Importance Computation <
> http://www2003.org/cdrom/papers/refereed/p007/p7-abiteboul.html>  given
> in the java docs.
> Regards
> Megha


Met vriendelijke groet,

Jigal van Hemert | Ontwikkelaar

Langesteijn 124
3342LG Hendrik-Ido-Ambacht

T. +31 (0)78 635 1200
F. +31 (0)848 34 9697
KvK. 23 09 28 65


Dit bericht (inclusief eventuele bijlagen) kan vertrouwelijke informatie
bevatten. Als u niet de beoogde ontvanger bent van dit bericht, neem dan
direct per e-mail of telefoon contact op met de verzender en verwijder dit
bericht van uw systeem. Het is niet toegestaan de inhoud van dit bericht op
welke wijze dan ook te delen met derden of anderszins openbaar te maken
zonder schriftelijke toestemming van alterNET Internet BV. U wordt
geadviseerd altijd bijlagen te scannen op virussen. AlterNET kan op geen
enkele wijze verantwoordelijk worden gesteld voor geleden schade als gevolg
van virussen.

Alle eventueel genoemde prijzen S.E. & O., excl. 21% BTW, excl. reiskosten.
Op al onze prijsopgaven, offertes, overeenkomsten, en diensten zijn, met
uitzondering van alle andere voorwaarden, de Algemene Voorwaarden van
alterNET Internet B.V. van toepassing. Op al onze domeinregistraties en
hostingactiviteiten zijn tevens onze aanvullende hostingvoorwaarden van
toepassing. Dit bericht is uitsluitend bedoeld voor de geadresseerde. Aan
dit bericht kunnen geen rechten worden ontleend.

! Bedenk voordat je deze email uitprint, of dit werkelijk nodig is !

Reply via email to