Pelo que entendi é no processamento, pra poder comparar as duas bases tendo menos falsas diferenças.
2014-03-23 9:50 GMT-03:00 Paulo Carvalho <paulo.r.m.carva...@gmail.com>: > Quando você diz "normalizar os dados", você diz para utilizar no seu > processamento? Ou é para normalizar na base OSM? > > > Em 23 de março de 2014 09:30, Thiago Marcos P. Santos <tmpsan...@gmail.com> > escreveu: > >> 2014-03-22 22:13 GMT+02:00 Hermann Peifer <pei...@gmx.eu>: >> > >> > É mesmo: a qualidade dos dados do IBGE pode ser um problema. >> > >> > Acabei de abaixar todos os 1370 arquivos do RS com um total de 5 129 203 >> > endereços. Nemhum deles tem um acento e todos os nomes em letras >> > maiúsculas :-( Alguns exemplos abaixo. Tambem já pensei no algoritmo >> > Levenshtein, mas agora estou na dúvidas si vale a pena mesmo. >> > >> > Por outro lado: ainda acho que os "heat maps" poderiam fazer sentido, >> > para ilustrar o estágio do mapeamento. >> > >> >> O que eu faria neste caso é normalizar os dados de ambas as bases de >> dados (OSM e IBGE) colocando tudo minúsculo e sem acentos. >> >> Me parece que os logradouros classificados como "rua" e "avenida" na >> base do IBGE estão OK. Isto já cobre boa parte dos dados. >> >> Eu poderia ajudar com este projeto assim, que eu terminar com os mapas do >> IBGE. >> >> []'s >> >> _______________________________________________ >> Talk-br mailing list >> Talk-br@openstreetmap.org >> https://lists.openstreetmap.org/listinfo/talk-br > > > > _______________________________________________ > Talk-br mailing list > Talk-br@openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-br > -- Fernando Trebien +55 (51) 9962-5409 "The speed of computer chips doubles every 18 months." (Moore's law) "The speed of software halves every 18 months." (Gates' law) _______________________________________________ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br