Hi,

 I'm having an issue with searching a term in german. Here's the keyword(s)
I'm trying to search --> Software und Downloads

I've a document indexed in German with the same title --> Software und
Downloads

I'm expecting that the search on "Software und Downloads" will return this
document, unfortunately it's not happening.

Here's my sample test scenario from my local machine.

In schema, I've defined these three fields.

<field name="title_deu" type="adsktext_deu" indexed="true" stored="true"
multiValued="true" />
<field name="name_deu" type="adsktext_deu" indexed="true" stored="true"
 termVectors="true" termPositions="true" termOffsets="true"/>
<field name="description_deu" type="adsktext_deu" indexed="true"
stored="true"  termVectors="true" termPositions="true" termOffsets="true"/>


Field Type definition :

<!-- German language specific definitions -->
<fieldType name="adsktext_deu" class="solr.TextField"
positionIncrementGap="100" autoGeneratePhraseQueries="true">
<analyzer type="index">
<charFilter class="solr.MappingCharFilterFactory"
mapping="mapping-ISOLatin1Accent.txt" />
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true"
words="lang/stopwords_de.txt" format="snowball" />
<filter class="solr.WordDelimiterFilterFactory" generateWordParts="1"
generateNumberParts="1" catenateWords="1" catenateNumbers="1"
catenateAll="0" splitOnCaseChange="0"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.DictionaryCompoundWordTokenFilterFactory"
dictionary="lang/dictionary_de.txt" />
 <filter class="solr.GermanNormalizationFilterFactory"/>
<filter class="solr.SnowballPorterFilterFactory" language="German2"/>
</analyzer>

<analyzer type="query">
<charFilter class="solr.MappingCharFilterFactory"
mapping="mapping-ISOLatin1Accent.txt" />
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true"
words="lang/stopwords_de.txt" format="snowball" />
<filter class="solr.WordDelimiterFilterFactory" generateWordParts="1"
generateNumberParts="1" catenateWords="1" catenateNumbers="1"
catenateAll="0" splitOnCaseChange="0"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.DictionaryCompoundWordTokenFilterFactory"
dictionary="lang/dictionary_de.txt" />
<filter class="solr.GermanNormalizationFilterFactory"/>
<filter class="solr.SnowballPorterFilterFactory" language="German2"/>
</analyzer>
</fieldType>


When I ran a sample analysis of "Software und Downloads",  the term is
indexed as

softwar     soft    oft   download   ad

During query, it's getting searched as

softwar  download

Not sure, why it's not returning the document.


Here's the sample data indexed through solr.xml under example docs.

<doc>
<field name="id">999912234!SOLR11092212</field>
<field name="name_deu">Test Name</field>
<field name="title_deu">Software und Downloads</field>
<field name="description_deu">div#actcontain { width: 100%; min-width:
220px; display: block; float: left; padding: 0 8px 0 0; } div#actcopy {
width: 48%; min-width: 230px; min-height: 120px; float: left; display:
inline-block; padding: 0 28px 0 0; margin: 10px 0 0 0; overflow: hidden; }
Häufige ThemenDownload-Verfahren im Autodesk-KontoDownload-Verfahren für
Education Community (Schüler, Studenten und Lehrkräfte)Suchen von Service
Packs, Hotfixes und SprachpaketenSoftware-Lizenzen im Autodesk-Store
kaufenSuchen kostenloser Testversion-Downloads
 Download-VerfahrenHerunterladen von Software aus verschiedenen
Speicherorten, abhängig von Ihrem Konto oder dem Subscription-TypenNutzung
am Heimarbeitsplatz für AbonnentenDesktop Subscription können lizenzierte
Software zur Verwendung auf ihrem Computer zu Hause
erhaltenProdukterweiterungen für AbonnentenExklusiver Zugriff auf die
neueste Software für einige Autodesk-ProdukteBestellen einer Software-DVDSo
bestellen Sie eine DVD oder einen USB-Stick für Ihre SoftwareAktuelle
Versionen für AbonnentenSubscription-Kunden haben Zugriff auf
Produkt-Updates, die während der Vertragslaufzeit verfügbar
sind.VorgängerversionenErfahren Sie, wie Sie eine Vorgängerversion Ihrer
Autodesk-Software erhaltenSprachoptionenHerunterladen der lizenzierten
Software in einer anderen Sprache oder Erhalten eines Sprachpakets.
</field>
<field name="author">Bob</field>
</doc>

Any pointers will be appreciated.

-Thanks,
Shamik

Reply via email to