[GitHub] spark pull request #21501: [SPARK-15064][ML] Locale support in StopWordsRemo...

mengxr Sat, 09 Jun 2018 21:25:59 -0700

Github user mengxr commented on a diff in the pull request:

    https://github.com/apache/spark/pull/21501#discussion_r194244802
  
    --- Diff: python/pyspark/ml/feature.py ---
    @@ -2582,25 +2582,31 @@ class StopWordsRemover(JavaTransformer, 
HasInputCol, HasOutputCol, JavaMLReadabl
                           typeConverter=TypeConverters.toListString)
         caseSensitive = Param(Params._dummy(), "caseSensitive", "whether to do 
a case sensitive " +
                               "comparison over the stop words", 
typeConverter=TypeConverters.toBoolean)
    +    locale = Param(Params._dummy(), "locale", "locale of the input. 
ignored when case sensitive " +
    +                   "is true", typeConverter=TypeConverters.toString)
     
         @keyword_only
    -    def __init__(self, inputCol=None, outputCol=None, stopWords=None, 
caseSensitive=False):
    +    def __init__(self, inputCol=None, outputCol=None, stopWords=None, 
caseSensitive=False,
    +                 locale=None):
             """
    -        __init__(self, inputCol=None, outputCol=None, stopWords=None, 
caseSensitive=false)
    +        __init__(self, inputCol=None, outputCol=None, stopWords=None, 
caseSensitive=false,
    +        locale=None)
             """
             super(StopWordsRemover, self).__init__()
             self._java_obj = 
self._new_java_obj("org.apache.spark.ml.feature.StopWordsRemover",
                                                 self.uid)
             
self._setDefault(stopWords=StopWordsRemover.loadDefaultStopWords("english"),
    -                         caseSensitive=False)
    +                         caseSensitive=False, locale=None)
    --- End diff --
    
    I think we just need to explain how we handle the default value in the doc.



---

---------------------------------------------------------------------
To unsubscribe, e-mail: reviews-unsubscr...@spark.apache.org
For additional commands, e-mail: reviews-h...@spark.apache.org

[GitHub] spark pull request #21501: [SPARK-15064][ML] Locale support in StopWordsRemo...

Reply via email to