Quando você diz "normalizar os dados", você diz para utilizar no seu processamento? Ou é para normalizar na base OSM?
Em 23 de março de 2014 09:30, Thiago Marcos P. Santos <tmpsan...@gmail.com>escreveu: > 2014-03-22 22:13 GMT+02:00 Hermann Peifer <pei...@gmx.eu>: > > > > É mesmo: a qualidade dos dados do IBGE pode ser um problema. > > > > Acabei de abaixar todos os 1370 arquivos do RS com um total de 5 129 203 > > endereços. Nemhum deles tem um acento e todos os nomes em letras > > maiúsculas :-( Alguns exemplos abaixo. Tambem já pensei no algoritmo > > Levenshtein, mas agora estou na dúvidas si vale a pena mesmo. > > > > Por outro lado: ainda acho que os "heat maps" poderiam fazer sentido, > > para ilustrar o estágio do mapeamento. > > > > O que eu faria neste caso é normalizar os dados de ambas as bases de > dados (OSM e IBGE) colocando tudo minúsculo e sem acentos. > > Me parece que os logradouros classificados como "rua" e "avenida" na > base do IBGE estão OK. Isto já cobre boa parte dos dados. > > Eu poderia ajudar com este projeto assim, que eu terminar com os mapas do > IBGE. > > []'s > > _______________________________________________ > Talk-br mailing list > Talk-br@openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-br >
_______________________________________________ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br