Curiosamente hay un pueblo llamado De en Indonesia
http://nominatim.openstreetmap.org/details.php?place_id=14215103 que con
ese parche no se encontraría nunca.

No tengo el detalle de cómo está implementado Nominatim pero para mí la
solución pasa por usar funciones estadísticas de comparación de cadenas, de
manera que en vez de buscar una similitud exacta se busque aquello que
supere un cierto porcentaje de similitud. En Oracle estás funciones están
dentro del paquete UTL_MATCH [
https://docs.oracle.com/cd/E18283_01/appdev.112/e16760/u_match.htm ]. En
PostgreSQL existe el módulo *fuzzystrmatch* [
http://www.postgresql.org/docs/current/static/fuzzystrmatch.html ] que
parece más limitado y existe un proyecto [
http://pgsimilarity.projects.pgfoundry.org/ ] que implementa más funciones
pero no sé si es muy común su uso ni si está actualizado.

Yo tengo pendiente echarle un vistazo a Nominatim e intentar implementar
esto pero seguramente me lleve varios meses por falta de tiempo por lo que
si alguien se quiere animar a recoger el testigo bienvenido es.

El 2 de febrero de 2016, 12:02, Benjamín Valero Espinosa <
benjaval...@gmail.com> escribió:

> El problema con las "stop words" es que puedes sin querer capar una
> palabra que sí tiene sentido en otro idioma. El ejemplo típico es "die",
> que es un artículo definido en alemán pero es un verbo en inglés. ¿Esto se
> está controlando? Lo ideal sería listas de "stop words" por idioma, pero
> claro, para eso también habría que saber en qué idioma está la calle :-O
>
> El 2 de febrero de 2016, 9:16, Alejandro Moreno Calvo <almo...@gmail.com>
> escribió:
>
>> Hola Xavier.
>>
>> Hay que tener en cuenta que ese PR soluciona un caso muy concreto pero
>> que habría que hacer un análisis más profundo de los artículos que se
>> pueden dar. Así a bote pronto se me ocurre también habría que añadir "el",
>> "la", "las", "los".
>>
>> El 2 de febrero de 2016, 8:40, Xavier Barnada <xbarn...@gmail.com>
>> escribió:
>>
>>> Hola,
>>>
>>> Acabo de hacer una pull request que deberia solucionar este problema, he
>>> seguido el ejemplo de las otras stopwords  y este comentario
>>> https://trac.openstreetmap.org/ticket/4895#comment:4
>>>
>>> https://github.com/twain47/Nominatim/pull/358
>>>
>>> Saludos
>>>
>>> El dom., 31 ene. 2016 a las 11:57, Emilio Gómez Fernández (<
>>> emilio.gomez.f...@gmail.com>) escribió:
>>>
>>>> Hola a todos.
>>>>
>>>> Fui yo quien abrí ese ticket hace tiempo, tanto ahí como en GitHub [1],
>>>> y también lo comenté  en la reunión en Aguilar de Campoo en la que
>>>> estuvimos algunos de nosotros.
>>>> La respuesta viene a ser, en resumidas cuentas, que añadir nuevas
>>>> palabras vacías en español a las escasas que ya existen en Nominatim [2]
>>>> podría perjudicar las búsquedas en otros idiomas. La consecuencia es que en
>>>> nuestro caso usar la API de Nominatim para realizar, por ejemplo,
>>>> geocodificación inversa es de escasa utilidad aun a pesar de que los datos
>>>> existan en la base de datos.
>>>>
>>>> Lo único que se me ocurre es que esta discusión salte a la lista
>>>> General y tener un feedback de otros usuarios para que la cosa se mueva y
>>>> tenga más repercusión, porque este importante problema también afecta a
>>>> otros idiomas [3][4].
>>>>
>>>> Saludos.
>>>>
>>>> [1] https://github.com/twain47/Nominatim/issues/85
>>>> [2] https://github.com/twain47/Nominatim/blob/master/module/nominatim.c
>>>> [3] https://github.com/twain47/Nominatim/issues/333
>>>> [4] https://trac.openstreetmap.org/ticket/4961
>>>>
>>>>
>>>> El 30 de enero de 2016, 14:17, Alejandro Moreno Calvo <
>>>> almo...@gmail.com> escribió:
>>>>
>>>>> Este problema ya lleva reportado tiempo.
>>>>> https://trac.openstreetmap.org/ticket/4895
>>>>> El 30 ene. 2016 2:04 p. m., "Xavier Barnada" <xbarn...@gmail.com>
>>>>> escribió:
>>>>>
>>>>>> Hola,
>>>>>>
>>>>>> A parte de la ayuda que podamos prestar al buscador mediante mejor
>>>>>> etiquetado no veo mucho mas que se pueda hacer.
>>>>>> Si quereix podeis reportar los problemas que veais al repositorio de
>>>>>> Nominatim en github
>>>>>> https://github.com/twain47/Nominatim
>>>>>>
>>>>>> Saludos
>>>>>>
>>>>>> El sáb., 30 ene. 2016 a las 13:54, Jorge Sanz Sanfructuoso (<
>>>>>> sanc...@gmail.com>) escribió:
>>>>>>
>>>>>>> Hola.
>>>>>>>
>>>>>>> Son un desastre las búsquedas. Hace no mucho salio el tema, no se si
>>>>>>> por aqui o por el telegram y alguien comentó que está adaptado para el
>>>>>>> habla inglesa y que según Nominatim si se adapta para otros idiomas 
>>>>>>> podría
>>>>>>> hacer que fallara en el inglés.
>>>>>>>
>>>>>>> Ya no es escribir bien o mal, hay casos como los artículos que a
>>>>>>> veces los llevan las calles y a veces no. Es adivina adivinanza. jajaja
>>>>>>>
>>>>>>> Un saludo.
>>>>>>>
>>>>>>> El sáb., 30 ene. 2016 a las 13:12, Manuel Lladosa (<
>>>>>>> manolo...@gmail.com>) escribió:
>>>>>>>
>>>>>>>> Hace un rato he hecho estas búsquedas:
>>>>>>>>
>>>>>>>> - Calle san roNque, paiporta (con falta de ortografía por
>>>>>>>> descuido): no
>>>>>>>> me encuentra nada por la falta, vale, de acuerdo.
>>>>>>>> - Calle san roque, paiporta: no me encuentra nada. ¡Pues vaya!
>>>>>>>> - Calle de san roque, paiporta: ¡premio!
>>>>>>>>
>>>>>>>> ¡Que tiquismiquis! jeje. Tienes que poner la calle con precisión
>>>>>>>> milimétrica. Cuando alguien busca una calle no suele conocer el
>>>>>>>> nombre
>>>>>>>> con tanta exactitud y esto irrita un pelín :-), ya me ha pasado
>>>>>>>> varias
>>>>>>>> veces que no he encontrado calles, siendo que estaban en OSM.
>>>>>>>>
>>>>>>>> ¿Como podemos pedir que Nominatim sea más flexible, que no requiera
>>>>>>>> búsquedas tan precisas? Y tampoco estaría mal que corrigiera faltas
>>>>>>>> de
>>>>>>>> ortografía, vale, debemos escribir bien, pero es que a veces se
>>>>>>>> hacen
>>>>>>>> por descuido.
>>>>>>>>
>>>>>>>> Muchas gracias.
>>>>>>>>
>>>>>>>> _______________________________________________
>>>>>>>> Talk-es mailing list
>>>>>>>> Talk-es@openstreetmap.org
>>>>>>>> https://lists.openstreetmap.org/listinfo/talk-es
>>>>>>>>
>>>>>>> --
>>>>>>> Jorge Sanz Sanfructuoso - Sanchi
>>>>>>> Blog http://blog.jorgesanzs.com/
>>>>>>> _______________________________________________
>>>>>>> Talk-es mailing list
>>>>>>> Talk-es@openstreetmap.org
>>>>>>> https://lists.openstreetmap.org/listinfo/talk-es
>>>>>>>
>>>>>>
>>>>>> _______________________________________________
>>>>>> Talk-es mailing list
>>>>>> Talk-es@openstreetmap.org
>>>>>> https://lists.openstreetmap.org/listinfo/talk-es
>>>>>>
>>>>>>
>>>>> _______________________________________________
>>>>> Talk-es mailing list
>>>>> Talk-es@openstreetmap.org
>>>>> https://lists.openstreetmap.org/listinfo/talk-es
>>>>>
>>>>>
>>>> _______________________________________________
>>>> Talk-es mailing list
>>>> Talk-es@openstreetmap.org
>>>> https://lists.openstreetmap.org/listinfo/talk-es
>>>>
>>>
>>> _______________________________________________
>>> Talk-es mailing list
>>> Talk-es@openstreetmap.org
>>> https://lists.openstreetmap.org/listinfo/talk-es
>>>
>>>
>>
>> _______________________________________________
>> Talk-es mailing list
>> Talk-es@openstreetmap.org
>> https://lists.openstreetmap.org/listinfo/talk-es
>>
>>
>
> _______________________________________________
> Talk-es mailing list
> Talk-es@openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-es
>
>
_______________________________________________
Talk-es mailing list
Talk-es@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-es

Responder a