2014-03-22 22:13 GMT+02:00 Hermann Peifer <pei...@gmx.eu>: > > É mesmo: a qualidade dos dados do IBGE pode ser um problema. > > Acabei de abaixar todos os 1370 arquivos do RS com um total de 5 129 203 > endereços. Nemhum deles tem um acento e todos os nomes em letras > maiúsculas :-( Alguns exemplos abaixo. Tambem já pensei no algoritmo > Levenshtein, mas agora estou na dúvidas si vale a pena mesmo. > > Por outro lado: ainda acho que os "heat maps" poderiam fazer sentido, > para ilustrar o estágio do mapeamento. >
O que eu faria neste caso é normalizar os dados de ambas as bases de dados (OSM e IBGE) colocando tudo minúsculo e sem acentos. Me parece que os logradouros classificados como "rua" e "avenida" na base do IBGE estão OK. Isto já cobre boa parte dos dados. Eu poderia ajudar com este projeto assim, que eu terminar com os mapas do IBGE. []'s _______________________________________________ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br