2014-03-22 22:13 GMT+02:00 Hermann Peifer <pei...@gmx.eu>:
>
> É mesmo: a qualidade dos dados do IBGE pode ser um problema.
>
> Acabei de abaixar todos os 1370 arquivos do RS com um total de 5 129 203
> endereços. Nemhum deles tem um acento e todos os nomes em letras
> maiúsculas :-( Alguns exemplos abaixo. Tambem já pensei no algoritmo
> Levenshtein, mas agora estou na dúvidas si vale a pena mesmo.
>
> Por outro lado: ainda acho que os "heat maps" poderiam fazer sentido,
> para ilustrar o estágio do mapeamento.
>

O que eu faria neste caso é normalizar os dados de ambas as bases de
dados (OSM e IBGE) colocando tudo minúsculo e sem acentos.

Me parece que os logradouros classificados como "rua" e "avenida" na
base do IBGE estão OK. Isto já cobre boa parte dos dados.

Eu poderia ajudar com este projeto assim, que eu terminar com os mapas do IBGE.

[]'s

_______________________________________________
Talk-br mailing list
Talk-br@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-br

Reply via email to