Pelo que entendi é no processamento, pra poder comparar as duas bases
tendo menos falsas diferenças.

2014-03-23 9:50 GMT-03:00 Paulo Carvalho <paulo.r.m.carva...@gmail.com>:
> Quando você diz "normalizar os dados", você diz para utilizar no seu
> processamento?  Ou é para normalizar na base OSM?
>
>
> Em 23 de março de 2014 09:30, Thiago Marcos P. Santos <tmpsan...@gmail.com>
> escreveu:
>
>> 2014-03-22 22:13 GMT+02:00 Hermann Peifer <pei...@gmx.eu>:
>> >
>> > É mesmo: a qualidade dos dados do IBGE pode ser um problema.
>> >
>> > Acabei de abaixar todos os 1370 arquivos do RS com um total de 5 129 203
>> > endereços. Nemhum deles tem um acento e todos os nomes em letras
>> > maiúsculas :-( Alguns exemplos abaixo. Tambem já pensei no algoritmo
>> > Levenshtein, mas agora estou na dúvidas si vale a pena mesmo.
>> >
>> > Por outro lado: ainda acho que os "heat maps" poderiam fazer sentido,
>> > para ilustrar o estágio do mapeamento.
>> >
>>
>> O que eu faria neste caso é normalizar os dados de ambas as bases de
>> dados (OSM e IBGE) colocando tudo minúsculo e sem acentos.
>>
>> Me parece que os logradouros classificados como "rua" e "avenida" na
>> base do IBGE estão OK. Isto já cobre boa parte dos dados.
>>
>> Eu poderia ajudar com este projeto assim, que eu terminar com os mapas do
>> IBGE.
>>
>> []'s
>>
>> _______________________________________________
>> Talk-br mailing list
>> Talk-br@openstreetmap.org
>> https://lists.openstreetmap.org/listinfo/talk-br
>
>
>
> _______________________________________________
> Talk-br mailing list
> Talk-br@openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-br
>



-- 
Fernando Trebien
+55 (51) 9962-5409

"The speed of computer chips doubles every 18 months." (Moore's law)
"The speed of software halves every 18 months." (Gates' law)

_______________________________________________
Talk-br mailing list
Talk-br@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-br

Responder a