[jira] [Commented] (SOLR-8496) Facet search count numbers are falsified by older document versions

JIRA Fri, 15 Jan 2016 06:18:53 -0800

    [ 
https://issues.apache.org/jira/browse/SOLR-8496?page=com.atlassian.jira.plugin.system.issuetabpanels:comment-tabpanel&focusedCommentId=15101815#comment-15101815
 ]


Andreas Müller commented on SOLR-8496:
--------------------------------------

We did a complete new index from scratch. There 48545 docs in the index. The 
effect only occurred if there are 10k docs in the index. In the following our 
solr configuration and scheme and the output of CacheIndex
 
{code:title=solrconfig.xml|borderStyle=solid}
<config>
  <luceneMatchVersion>4.5</luceneMatchVersion>
  <!--  The DirectoryFactory to use for indexes.
        solr.StandardDirectoryFactory, the default, is filesystem based.
        solr.RAMDirectoryFactory is memory based, not persistent, and doesn't 
work with replication. -->
  <directoryFactory name="DirectoryFactory" 
class="${solr.directoryFactory:solr.StandardDirectoryFactory}"/>

  <updateHandler class="solr.DirectUpdateHandler2">
   <autoSoftCommit>
        <maxTime>1000</maxTime>
    </autoSoftCommit>
    <autoCommit>
        <maxTime>60000</maxTime> 
        <openSearcher>false</openSearcher>
    </autoCommit>
  </updateHandler>


  <requestDispatcher handleSelect="true" >
    <requestParsers enableRemoteStreaming="false" 
multipartUploadLimitInKB="2048" />
  </requestDispatcher>
  
  <requestHandler name="standard" class="solr.StandardRequestHandler" 
default="true" />
  <requestHandler name="/update" class="solr.UpdateRequestHandler" />
  <requestHandler name="/admin/" 
class="org.apache.solr.handler.admin.AdminHandlers" />
      
  <!-- config for the admin interface --> 
  <admin>
    <defaultQuery>solr</defaultQuery>
  </admin>

</config>
{code}
{code:title=schema.xml|borderStyle=solid}
<schema name="company comptest3" version="1.1">

    <types>
        <fieldType name="string" class="solr.StrField" sortMissingLast="true" 
omitNorms="true"/>

        <!-- boolean type: "true" or "false" -->
        <fieldType name="boolean" class="solr.BoolField" sortMissingLast="true" 
omitNorms="true"/>

        <!-- Default numeric field types. For faster range queries, consider 
the tint/tfloat/tlong/tdouble types. -->
        <fieldType name="int" class="solr.TrieIntField" precisionStep="0" 
omitNorms="true" positionIncrementGap="0"/>
        <fieldType name="date" class="solr.TrieDateField" omitNorms="true" 
precisionStep="0" positionIncrementGap="0"/>
        <fieldType name="long" class="solr.TrieLongField" precisionStep="0" 
omitNorms="true" positionIncrementGap="0"/>

        <!-- lat long fields -->
        <fieldType name="double" class="solr.TrieDoubleField" precisionStep="0" 
omitNorms="true" positionIncrementGap="0"/>

        <!-- A Trie based date field for faster date range queries and date 
faceting. -->
        <fieldType name="tdate" class="solr.TrieDateField" omitNorms="true" 
precisionStep="6" positionIncrementGap="0"/>

        <!-- A text field that only splits on whitespace for exact matching of 
words -->
        <fieldType name="text_ws" class="solr.TextField" 
positionIncrementGap="100">
            <analyzer>
                <tokenizer class="solr.WhitespaceTokenizerFactory"/>
            </analyzer>
        </fieldType>

        <fieldType name="text" class="solr.TextField" 
positionIncrementGap="100">
            <analyzer type="index">
                <tokenizer class="solr.WhitespaceTokenizerFactory"/>
                <filter class="solr.WordDelimiterFilterFactory" 
generateWordParts="1" generateNumberParts="1" catenateWords="1" 
catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
                <filter class="solr.LowerCaseFilterFactory"/>
            </analyzer>
            <analyzer type="query">
                <tokenizer class="solr.WhitespaceTokenizerFactory"/>
                <filter class="solr.WordDelimiterFilterFactory" 
generateWordParts="1" generateNumberParts="1" catenateWords="0" 
catenateNumbers="0" catenateAll="0" splitOnCaseChange="1"/>
                <filter class="solr.LowerCaseFilterFactory"/>
            </analyzer>
        </fieldType>

        <fieldType name="text_rev" class="solr.TextField" 
positionIncrementGap="100">

            <analyzer type="index">
                <tokenizer class="solr.WhitespaceTokenizerFactory"/>
                <filter class="solr.WordDelimiterFilterFactory" 
generateWordParts="1" generateNumberParts="1" catenateWords="1" 
catenateNumbers="1" catenateAll="0" splitOnCaseChange="0"/>
                <filter class="solr.LowerCaseFilterFactory"/>
                <filter class="solr.ReversedWildcardFilterFactory" 
withOriginal="true" maxPosAsterisk="3" maxPosQuestion="2" 
maxFractionAsterisk="0.33"/>
            </analyzer>
            <analyzer type="query">
                <tokenizer class="solr.WhitespaceTokenizerFactory"/>
                <filter class="solr.WordDelimiterFilterFactory" 
generateWordParts="1" generateNumberParts="1" catenateWords="0" 
catenateNumbers="0" catenateAll="0" splitOnCaseChange="0"/>
                <filter class="solr.LowerCaseFilterFactory"/>
            </analyzer>

        </fieldType>

        <fieldtype name="phonetic" stored="true" indexed="true" 
class="solr.TextField" >
            <analyzer>
                <tokenizer class="solr.StandardTokenizerFactory"/>
                <filter class="solr.DoubleMetaphoneFilterFactory" 
inject="false"/>
            </analyzer>
        </fieldtype>

        <!-- lowercases the entire field value, keeping it as a single token.   
-->
        <fieldType name="lowercase" class="solr.TextField" 
positionIncrementGap="100">
            <analyzer>
                <tokenizer class="solr.KeywordTokenizerFactory"/>
                <filter class="solr.LowerCaseFilterFactory" />
            </analyzer>
        </fieldType>

        <fieldType name="location" class="solr.LatLonType" 
subFieldSuffix="_coordinate"/>

    </types>

    <fields>
        <!-- general -->
        <field name="id"                    type="int"           indexed="true" 
stored="true" multiValued="false" required="true"/>
        <field name="dummyask"              type="boolean"       indexed="true" 
stored="true" multiValued="false" />
        <field name="disabled"              type="boolean"       indexed="true" 
stored="true" multiValued="false" />
        <field name="closed"                type="boolean"       indexed="true" 
stored="true" multiValued="false" />
        <field name="show"                  type="boolean"       indexed="true" 
stored="true" multiValued="false" />
        <field name="pagecalls"             type="int"           indexed="true" 
stored="true" multiValued="false" />
        <field name="publicated"            type="tdate"         indexed="true" 
stored="true" multiValued="false" />

        <field name="name"                  type="text_rev"      indexed="true" 
stored="true" multiValued="false" />
        <field name="name_filtered"         type="lowercase"     indexed="true" 
stored="true" multiValued="false" />
        <field name="name_phonetic"         type="lowercase"     indexed="true" 
stored="true" multiValued="false" />
        <field name="manufacturer"          type="boolean"       indexed="true" 
stored="true" multiValued="false" />
        <field name="fulltext"              type="text_rev"      indexed="true" 
stored="true" multiValued="false" />
        <field name="owner"                 type="text_rev"      indexed="true" 
stored="true" multiValued="true" />
        <field name="member"                type="boolean"       indexed="true" 
stored="true" multiValued="false" />
        <field name="professions"           type="long"          indexed="true" 
stored="true" multiValued="true" />
        <field name="founding"              type="tdate"         indexed="true" 
stored="true" multiValued="false" />
        <field name="employee_number"       type="int"           indexed="true" 
stored="true" multiValued="false" />
        <field name="jobs"                  type="boolean"       indexed="true" 
stored="true" multiValued="false" />
        <field name="image"                 type="text"          
indexed="false" stored="true" multiValued="false" />

        <!-- geografic options -->
        <field name="ort"                   type="lowercase"     indexed="true" 
stored="true" multiValued="true" />
        <field name="plz"                   type="lowercase"     indexed="true" 
stored="true" multiValued="true" />
        <field name="land"                  type="lowercase"     indexed="true" 
stored="true" multiValued="true" />
        <field name="bundesland"            type="lowercase"     indexed="true" 
stored="true" multiValued="true" />
        <field name="lat"                   type="double"        indexed="true" 
stored="true" multiValued="true" />
        <field name="lon"                   type="double"        indexed="true" 
stored="true" multiValued="true" />
        <field name="geo"                   type="location"      indexed="true" 
stored="true" multiValued="false" />
        <field name="geo_0_coordinate"      type="double"        indexed="true" 
stored="true" multiValued="false" />
        <field name="geo_1_coordinate"      type="double"        indexed="true" 
stored="true" multiValued="false" />

        <!-- display fields -->
        <field name="profession_display"    type="text"          
indexed="false" stored="true" multiValued="true" />
        <field name="address_display"       type="text_rev"      indexed="true" 
 stored="true" multiValued="true" />

        <!-- realized projects -->
        <field name="done_projects"         type="lowercase"     indexed="true" 
 stored="true" multiValued="true"/>

        <!-- projects in planing / projects in construction -->
        <field name="projects"              type="long"          indexed="true" 
 stored="true" multiValued="true"/>

        <!-- references -->
        <field name="references"            type="lowercase"     indexed="true" 
stored="true" multiValued="true"/>

        <field name="reference_info"        type="text"          
indexed="false" stored="true" multiValued="false"/>
        <field name="relevance"             type="int"           indexed="true" 
stored="true" multiValued="false"/>

        <field name="_version_"             type="long"          indexed="true" 
stored="true"/>

    </fields>

    <!-- field to use to determine and enforce document uniqueness. -->
    <uniqueKey>id</uniqueKey>

    <!-- field for the QueryParser to use when an explicit fieldname is absent 
-->
    <defaultSearchField>name</defaultSearchField>

    <!-- SolrQueryParser configuration: defaultOperator="AND|OR" -->
    <solrQueryParser defaultOperator="OR"/>
</schema>
{code}

{code:title=java -cp 
../server/solr-webapp/webapp/WEB-INF/lib/lucene-core-5.4.0.jar 
-ea:org.apache.lucene... org.apache.lucene.index.CheckIndex 
../server/solr/companies/data/index
|borderStyle=solid}
Opening index @ ../server/solr/companies/data/index

Segments file=segments_4t numSegments=10 version=5.4.0 
id=8b82erk4sdq7dvuluswzgthh5 format= userData={commitTimeMSec=1452862011769}
  1 of 10: name=_3fw maxDoc=44624
    version=5.4.0
    id=8b82erk4sdq7dvuluswzgth5m
    codec=Lucene54
    compound=false
    numFiles=11
    size (MB)=54.18
    diagnostics = {os=Linux, java.vendor=Oracle Corporation, 
java.version=1.8.0_66-internal, java.vm.version=25.66-b17, 
lucene.version=5.4.0, mergeMaxNumSegments=-1, os.arch=amd64, 
java.runtime.version=1.8.0_66-internal-b17, source=merge, mergeFactor=10, 
os.version=3.11-2-amd64, timestamp=1452857890899}
    has deletions [delGen=5]
    test: open reader.........OK [took 1.244 sec]
    test: check integrity.....OK [took 0.148 sec]
    test: check live docs.....OK [500 deleted docs] [took 0.011 sec]
    test: field infos.........OK [35 fields] [took 0.001 sec]
    test: field norms.........OK [12 fields] [took 0.048 sec]
    test: terms, freq, prox...OK [1119766 terms; 5522980 terms/docs pairs; 
6617236 tokens] [took 5.664 sec]
    test: stored fields.......OK [1786969 total field count; avg 40.5 fields 
per doc] [took 2.215 sec]
    test: term vectors........OK [0 total term vector count; avg 0.0 term/freq 
vector fields per doc] [took 0.001 sec]
    test: docvalues...........OK [0 docvalues fields; 0 BINARY; 0 NUMERIC; 0 
SORTED; 0 SORTED_NUMERIC; 0 SORTED_SET] [took 0.001 sec]

  2 of 10: name=_3pc maxDoc=1476
    version=5.4.0
    id=8b82erk4sdq7dvuluswzgthf8
    codec=Lucene54
    compound=true
    numFiles=3
    size (MB)=1.988
    diagnostics = {os=Linux, java.vendor=Oracle Corporation, 
java.version=1.8.0_66-internal, java.vm.version=25.66-b17, 
lucene.version=5.4.0, mergeMaxNumSegments=-1, os.arch=amd64, 
java.runtime.version=1.8.0_66-internal-b17, source=merge, mergeFactor=10, 
os.version=3.11-2-amd64, timestamp=1452861829493}
    no deletions
    test: open reader.........OK [took 0.034 sec]
    test: check integrity.....OK [took 0.006 sec]
    test: check live docs.....OK [took 0.000 sec]
    test: field infos.........OK [35 fields] [took 0.000 sec]
    test: field norms.........OK [12 fields] [took 0.001 sec]
    test: terms, freq, prox...OK [67708 terms; 174468 terms/docs pairs; 204435 
tokens] [took 0.938 sec]
    test: stored fields.......OK [59440 total field count; avg 40.3 fields per 
doc] [took 0.052 sec]
    test: term vectors........OK [0 total term vector count; avg 0.0 term/freq 
vector fields per doc] [took 0.000 sec]
    test: docvalues...........OK [0 docvalues fields; 0 BINARY; 0 NUMERIC; 0 
SORTED; 0 SORTED_NUMERIC; 0 SORTED_SET] [took 0.001 sec]

  3 of 10: name=_3pw maxDoc=1426
    version=5.4.0
    id=8b82erk4sdq7dvuluswzgthfs
    codec=Lucene54
    compound=true
    numFiles=3
    size (MB)=2.08
    diagnostics = {os=Linux, java.vendor=Oracle Corporation, 
java.version=1.8.0_66-internal, java.vm.version=25.66-b17, 
lucene.version=5.4.0, mergeMaxNumSegments=-1, os.arch=amd64, 
java.runtime.version=1.8.0_66-internal-b17, source=merge, mergeFactor=10, 
os.version=3.11-2-amd64, timestamp=1452861864304}
    no deletions
    test: open reader.........OK [took 0.019 sec]
    test: check integrity.....OK [took 0.015 sec]
    test: check live docs.....OK [took 0.000 sec]
    test: field infos.........OK [35 fields] [took 0.000 sec]
    test: field norms.........OK [12 fields] [took 0.001 sec]
    test: terms, freq, prox...OK [67794 terms; 175792 terms/docs pairs; 216683 
tokens] [took 0.836 sec]
    test: stored fields.......OK [62036 total field count; avg 43.5 fields per 
doc] [took 0.056 sec]
    test: term vectors........OK [0 total term vector count; avg 0.0 term/freq 
vector fields per doc] [took 0.000 sec]
    test: docvalues...........OK [0 docvalues fields; 0 BINARY; 0 NUMERIC; 0 
SORTED; 0 SORTED_NUMERIC; 0 SORTED_SET] [took 0.000 sec]

  4 of 10: name=_3pm maxDoc=1398
    version=5.4.0
    id=8b82erk4sdq7dvuluswzgthfi
    codec=Lucene54
    compound=true
    numFiles=3
    size (MB)=2.035
    diagnostics = {os=Linux, java.vendor=Oracle Corporation, 
java.version=1.8.0_66-internal, java.vm.version=25.66-b17, 
lucene.version=5.4.0, mergeMaxNumSegments=-1, os.arch=amd64, 
java.runtime.version=1.8.0_66-internal-b17, source=merge, mergeFactor=10, 
os.version=3.11-2-amd64, timestamp=1452861844413}
    no deletions
    test: open reader.........OK [took 0.016 sec]
    test: check integrity.....OK [took 0.017 sec]
    test: check live docs.....OK [took 0.000 sec]
    test: field infos.........OK [35 fields] [took 0.000 sec]
    test: field norms.........OK [12 fields] [took 0.001 sec]
    test: terms, freq, prox...OK [67878 terms; 173372 terms/docs pairs; 213758 
tokens] [took 0.162 sec]
    test: stored fields.......OK [59498 total field count; avg 42.6 fields per 
doc] [took 0.048 sec]
    test: term vectors........OK [0 total term vector count; avg 0.0 term/freq 
vector fields per doc] [took 0.000 sec]
    test: docvalues...........OK [0 docvalues fields; 0 BINARY; 0 NUMERIC; 0 
SORTED; 0 SORTED_NUMERIC; 0 SORTED_SET] [took 0.000 sec]

  5 of 10: name=_3r1 maxDoc=114
    version=5.4.0
    id=8b82erk4sdq7dvuluswzgthgy
    codec=Lucene54
    compound=true
    numFiles=3
    size (MB)=0.658
    diagnostics = {os=Linux, java.vendor=Oracle Corporation, 
java.version=1.8.0_66-internal, java.vm.version=25.66-b17, 
lucene.version=5.4.0, mergeMaxNumSegments=-1, os.arch=amd64, 
java.runtime.version=1.8.0_66-internal-b17, source=merge, mergeFactor=10, 
os.version=3.11-2-amd64, timestamp=1452861925974}
    no deletions
    test: open reader.........OK [took 0.008 sec]
    test: check integrity.....OK [took 0.002 sec]
    test: check live docs.....OK [took 0.000 sec]
    test: field infos.........OK [35 fields] [took 0.000 sec]
    test: field norms.........OK [12 fields] [took 0.000 sec]
    test: terms, freq, prox...OK [18002 terms; 41857 terms/docs pairs; 64375 
tokens] [took 0.061 sec]
    test: stored fields.......OK [14505 total field count; avg 127.2 fields per 
doc] [took 0.018 sec]
    test: term vectors........OK [0 total term vector count; avg 0.0 term/freq 
vector fields per doc] [took 0.000 sec]
    test: docvalues...........OK [0 docvalues fields; 0 BINARY; 0 NUMERIC; 0 
SORTED; 0 SORTED_NUMERIC; 0 SORTED_SET] [took 0.000 sec]

  6 of 10: name=_3r2 maxDoc=1
    version=5.4.0
    id=8b82erk4sdq7dvuluswzgthgz
    codec=Lucene54
    compound=false
    numFiles=10
    size (MB)=0.026
    diagnostics = {java.runtime.version=1.8.0_66-internal-b17, 
java.vendor=Oracle Corporation, java.version=1.8.0_66-internal, 
java.vm.version=25.66-b17, lucene.version=5.4.0, os=Linux, os.arch=amd64, 
os.version=3.11-2-amd64, source=flush, timestamp=1452861930569}
    no deletions
    test: open reader.........OK [took 0.017 sec]
    test: check integrity.....OK [took 0.007 sec]
    test: check live docs.....OK [took 0.000 sec]
    test: field infos.........OK [34 fields] [took 0.000 sec]
    test: field norms.........OK [12 fields] [took 0.000 sec]
    test: terms, freq, prox...OK [809 terms; 809 terms/docs pairs; 1374 tokens] 
[took 0.010 sec]
    test: stored fields.......OK [324 total field count; avg 324.0 fields per 
doc] [took 0.001 sec]
    test: term vectors........OK [0 total term vector count; avg 0.0 term/freq 
vector fields per doc] [took 0.000 sec]
    test: docvalues...........OK [0 docvalues fields; 0 BINARY; 0 NUMERIC; 0 
SORTED; 0 SORTED_NUMERIC; 0 SORTED_SET] [took 0.001 sec]

  7 of 10: name=_3r3 maxDoc=1
    version=5.4.0
    id=8b82erk4sdq7dvuluswzgthh0
    codec=Lucene54
    compound=false
    numFiles=10
    size (MB)=0.046
    diagnostics = {java.runtime.version=1.8.0_66-internal-b17, 
java.vendor=Oracle Corporation, java.version=1.8.0_66-internal, 
java.vm.version=25.66-b17, lucene.version=5.4.0, os=Linux, os.arch=amd64, 
os.version=3.11-2-amd64, source=flush, timestamp=1452861931845}
    no deletions
    test: open reader.........OK [took 0.022 sec]
    test: check integrity.....OK [took 0.000 sec]
    test: check live docs.....OK [took 0.000 sec]
    test: field infos.........OK [35 fields] [took 0.000 sec]
    test: field norms.........OK [12 fields] [took 0.000 sec]
    test: terms, freq, prox...OK [1611 terms; 1611 terms/docs pairs; 2890 
tokens] [took 0.008 sec]
    test: stored fields.......OK [805 total field count; avg 805.0 fields per 
doc] [took 0.001 sec]
    test: term vectors........OK [0 total term vector count; avg 0.0 term/freq 
vector fields per doc] [took 0.000 sec]
    test: docvalues...........OK [0 docvalues fields; 0 BINARY; 0 NUMERIC; 0 
SORTED; 0 SORTED_NUMERIC; 0 SORTED_SET] [took 0.000 sec]

  8 of 10: name=_3r4 maxDoc=2
    version=5.4.0
    id=8b82erk4sdq7dvuluswzgthh1
    codec=Lucene54
    compound=false
    numFiles=10
    size (MB)=0.097
    diagnostics = {java.runtime.version=1.8.0_66-internal-b17, 
java.vendor=Oracle Corporation, java.version=1.8.0_66-internal, 
java.vm.version=25.66-b17, lucene.version=5.4.0, os=Linux, os.arch=amd64, 
os.version=3.11-2-amd64, source=flush, timestamp=1452861933112}
    no deletions
    test: open reader.........OK [took 0.024 sec]
    test: check integrity.....OK [took 0.001 sec]
    test: check live docs.....OK [took 0.000 sec]
    test: field infos.........OK [35 fields] [took 0.000 sec]
    test: field norms.........OK [12 fields] [took 0.000 sec]
    test: terms, freq, prox...OK [3333 terms; 3742 terms/docs pairs; 8204 
tokens] [took 0.010 sec]
    test: stored fields.......OK [1176 total field count; avg 588.0 fields per 
doc] [took 0.005 sec]
    test: term vectors........OK [0 total term vector count; avg 0.0 term/freq 
vector fields per doc] [took 0.000 sec]
    test: docvalues...........OK [0 docvalues fields; 0 BINARY; 0 NUMERIC; 0 
SORTED; 0 SORTED_NUMERIC; 0 SORTED_SET] [took 0.000 sec]

  9 of 10: name=_3r5 maxDoc=2
    version=5.4.0
    id=8b82erk4sdq7dvuluswzgthh2
    codec=Lucene54
    compound=false
    numFiles=10
    size (MB)=0.07
    diagnostics = {java.runtime.version=1.8.0_66-internal-b17, 
java.vendor=Oracle Corporation, java.version=1.8.0_66-internal, 
java.vm.version=25.66-b17, lucene.version=5.4.0, os=Linux, os.arch=amd64, 
os.version=3.11-2-amd64, source=flush, timestamp=1452861935365}
    no deletions
    test: open reader.........OK [took 0.010 sec]
    test: check integrity.....OK [took 0.001 sec]
    test: check live docs.....OK [took 0.000 sec]
    test: field infos.........OK [35 fields] [took 0.000 sec]
    test: field norms.........OK [12 fields] [took 0.001 sec]
    test: terms, freq, prox...OK [2346 terms; 2583 terms/docs pairs; 4660 
tokens] [took 0.010 sec]
    test: stored fields.......OK [1051 total field count; avg 525.5 fields per 
doc] [took 0.002 sec]
    test: term vectors........OK [0 total term vector count; avg 0.0 term/freq 
vector fields per doc] [took 0.000 sec]
    test: docvalues...........OK [0 docvalues fields; 0 BINARY; 0 NUMERIC; 0 
SORTED; 0 SORTED_NUMERIC; 0 SORTED_SET] [took 0.000 sec]

  10 of 10: name=_3r6 maxDoc=1
    version=5.4.0
    id=8b82erk4sdq7dvuluswzgthh4
    codec=Lucene54
    compound=false
    numFiles=10
    size (MB)=0.073
    diagnostics = {java.runtime.version=1.8.0_66-internal-b17, 
java.vendor=Oracle Corporation, java.version=1.8.0_66-internal, 
java.vm.version=25.66-b17, lucene.version=5.4.0, os=Linux, os.arch=amd64, 
os.version=3.11-2-amd64, source=flush, timestamp=1452861952782}
    no deletions
    test: open reader.........OK [took 0.008 sec]
    test: check integrity.....OK [took 0.001 sec]
    test: check live docs.....OK [took 0.000 sec]
    test: field infos.........OK [35 fields] [took 0.000 sec]
    test: field norms.........OK [12 fields] [took 0.000 sec]
    test: terms, freq, prox...OK [2581 terms; 2581 terms/docs pairs; 5101 
tokens] [took 0.011 sec]
    test: stored fields.......OK [1241 total field count; avg 1241.0 fields per 
doc] [took 0.001 sec]
    test: term vectors........OK [0 total term vector count; avg 0.0 term/freq 
vector fields per doc] [took 0.003 sec]
    test: docvalues...........OK [0 docvalues fields; 0 BINARY; 0 NUMERIC; 0 
SORTED; 0 SORTED_NUMERIC; 0 SORTED_SET] [took 0.000 sec]

No problems were detected with this index.
{code}

> Facet search count numbers are falsified by older document versions
> -------------------------------------------------------------------
>
>                 Key: SOLR-8496
>                 URL: https://issues.apache.org/jira/browse/SOLR-8496
>             Project: Solr
>          Issue Type: Bug
>    Affects Versions: 5.4
>         Environment: Linux 3.16.0-4-amd64 x86_64 Debian 8.2
> openjdk-7-jre-headless:amd64   version 7u91-2.6.3-1~deb8u1
> solr-5.4.0, extracted from official tar
> Default solr settings from install script:SOLR_HEAP="512m"
> GC_LOG_OPTS="-verbose:gc -XX:+PrintHeapAtGC -XX:+PrintGCDetails \
> -XX:+PrintGCDateStamps -XX:+PrintGCTimeStamps -XX:+PrintTenuringDistribution 
> -XX:+PrintGCApplicationStoppedTime"
> GC_TUNE="-XX:NewRatio=3 \
> -XX:SurvivorRatio=4 \
> -XX:TargetSurvivorRatio=90 \
> -XX:MaxTenuringThreshold=8 \
> -XX:+UseConcMarkSweepGC \
> -XX:+UseParNewGC \
> -XX:ConcGCThreads=4 -XX:ParallelGCThreads=4 \
> -XX:+CMSScavengeBeforeRemark \
> -XX:PretenureSizeThreshold=64m \
> -XX:+UseCMSInitiatingOccupancyOnly \
> -XX:CMSInitiatingOccupancyFraction=50 \
> -XX:CMSMaxAbortablePrecleanTime=6000 \
> -XX:+CMSParallelRemarkEnabled \
> -XX:+ParallelRefProcEnabled"
> SOLR_OPTS="$SOLR_OPTS -Xss256k"
>            Reporter: Andreas Müller
>
> Our setup is based on multiple cores. In One core we have a multi-filed with 
> integer values. and some other unimportant fields. We're using multi-faceting 
> for this field.
> We're querying a test scenario with:
> {code}
> http://localhost:8983/solr/core-name/select?q=dummyask: (true) AND 
> manufacturer: false AND id: (15039 16882 10850 
> 20781)&fq={!tag=professions}professions: 
> (59)&fl=id&wt=json&indent=true&facet=true&facet.field={!ex=professions}professions
> {code}
> - Query: (numDocs:48545, maxDoc:48545)
> {code:xml}
> <response>
> <lst name="responseHeader">
> <int name="status">0</int>
> <int name="QTime">1</int>
> </lst>
> <result name="response" numFound="4" start="0">
> <doc>
> <int name="id">10850</int>
> </doc>
> <doc>
> <int name="id">16882</int>
> </doc>
> <doc>
> <int name="id">15039</int>
> </doc>
> <doc>
> <int name="id">20781</int>
> </doc>
> </result>
> <lst name="facet_counts">
> <lst name="facet_queries"/>
> <lst name="facet_fields">
> <lst name="professions">
> <int name="59">4</int>
> </lst>
> </lst>
> <lst name="facet_dates"/>
> <lst name="facet_ranges"/>
> <lst name="facet_intervals"/>
> <lst name="facet_heatmaps"/>
> </lst>
> </response>
> {code}
> - Then we update one document and change some fields (numDocs:48545, 
> maxDoc:48546) *The number of maxDocs is increased*
> {code:xml}
> <response>
> <lst name="responseHeader">
> <int name="status">0</int>
> <int name="QTime">1</int>
> </lst>
> <result name="response" numFound="4" start="0">
> <doc>
> <int name="id">10850</int>
> </doc>
> <doc>
> <int name="id">16882</int>
> </doc>
> <doc>
> <int name="id">15039</int>
> </doc>
> <doc>
> <int name="id">20781</int>
> </doc>
> </result>
> <lst name="facet_counts">
> <lst name="facet_queries"/>
> <lst name="facet_fields">
> <lst name="professions">
> <int name="59">5</int>
> </lst>
> </lst>
> <lst name="facet_dates"/>
> <lst name="facet_ranges"/>
> <lst name="facet_intervals"/>
> <lst name="facet_heatmaps"/>
> </lst>
> </response>
> {code}
> *The Problem:*
> In the first query, we're getting a facet count of 4, which is correct. After 
> updating one document, we're getting 5 as a result wich is not correct.



--
This message was sent by Atlassian JIRA
(v6.3.4#6332)

---------------------------------------------------------------------
To unsubscribe, e-mail: [email protected]
For additional commands, e-mail: [email protected]

[jira] [Commented] (SOLR-8496) Facet search count numbers are falsified by older document versions

Reply via email to