Spellchecking and suggesting part numbers

Lochschmied, Alexander Wed, 24 Sep 2014 07:07:30 -0700

Hello Solr Users,

we are trying to get suggestions for part numbers using the spellchecker.


Problem scenario:

ABCD1234 // This is the search term
ABCE1234 // This is what we get from spellchecker
ABCD1244 // This is what we would like to get from spellchecker

Characters towards the left of our part numbers are more relevant.


The setup is:

        <searchComponent name="spellcheck_part" 
class="solr.SpellCheckComponent">
                <lst name="spellchecker">
                        <str name="classname">solr.IndexBasedSpellChecker</str>
                        <str name="spellcheckIndexDir">./spellchecker</str>
                        <str name="field">did_you_mean_part</str>
                </lst>
        </searchComponent>
        <requestHandler name="/spell_part" class="solr.SearchHandler" 
startup="lazy">
                <lst name="defaults">
                        <str name="df">did_you_mean_part</str>
                        <str name="spellcheck">on</str>
                </lst>
                <arr name="last-components">
                        <str>spellcheck_part</str>
                </arr>
        </requestHandler>


        <fieldType name="did_you_mean_part" class="solr.TextField" 
positionIncrementGap="100">
                <analyzer type="index">
                        <charFilter 
class="solr.PatternReplaceCharFilterFactory" pattern="[\s]+" replacement=""/>
                        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
                        <filter class="solr.LowerCaseFilterFactory"/>
                        <filter class="solr.EdgeNGramFilterFactory" 
minGramSize="1" maxGramSize="20" side="front"/>
                        <filter 
class="solr.RemoveDuplicatesTokenFilterFactory"/>
                </analyzer>
                <analyzer type="query">
                        <charFilter 
class="solr.PatternReplaceCharFilterFactory" pattern="[\s]+" replacement=""/>
                        <tokenizer class="solr.KeywordTokenizerFactory"/>
                        <filter class="solr.LowerCaseFilterFactory"/>
                        <filter class="solr.EdgeNGramFilterFactory" 
minGramSize="1" maxGramSize="20" side="front"/>
                </analyzer>
        </fieldType>

Can we tweak the setup such that we should get more relevant part numbers?

Thanks,
Alexander

Spellchecking and suggesting part numbers

Reply via email to