Quando você diz "normalizar os dados", você diz para utilizar no seu
processamento?  Ou é para normalizar na base OSM?


Em 23 de março de 2014 09:30, Thiago Marcos P. Santos
<tmpsan...@gmail.com>escreveu:

> 2014-03-22 22:13 GMT+02:00 Hermann Peifer <pei...@gmx.eu>:
> >
> > É mesmo: a qualidade dos dados do IBGE pode ser um problema.
> >
> > Acabei de abaixar todos os 1370 arquivos do RS com um total de 5 129 203
> > endereços. Nemhum deles tem um acento e todos os nomes em letras
> > maiúsculas :-( Alguns exemplos abaixo. Tambem já pensei no algoritmo
> > Levenshtein, mas agora estou na dúvidas si vale a pena mesmo.
> >
> > Por outro lado: ainda acho que os "heat maps" poderiam fazer sentido,
> > para ilustrar o estágio do mapeamento.
> >
>
> O que eu faria neste caso é normalizar os dados de ambas as bases de
> dados (OSM e IBGE) colocando tudo minúsculo e sem acentos.
>
> Me parece que os logradouros classificados como "rua" e "avenida" na
> base do IBGE estão OK. Isto já cobre boa parte dos dados.
>
> Eu poderia ajudar com este projeto assim, que eu terminar com os mapas do
> IBGE.
>
> []'s
>
> _______________________________________________
> Talk-br mailing list
> Talk-br@openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-br
>
_______________________________________________
Talk-br mailing list
Talk-br@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-br

Responder a