[R-br] Base Geográfica de Coordenadas

2012-10-16 Por tôpico Listeiro 037
Olá a todos. Há algum tempo tinha perguntado sobre uma base geográfica de coordenadas. Lá no site do IBGE não consegui muita coisa, então continuei procurando. Daí encontrei este site: http://www.maxmind.com/en/worldcities E este link para download:

Re: [R-br] Informação sobre efeito marginal para Modelos Logit Ordenado Generalizado

2012-10-16 Por tôpico Walmes Zeviani
Sua definição de efeito marginal não foi clara. Qual a definição/conceito e qual a definição matemática e efeito marginal? Eu posso estar enganado, mas calcular média amostral de desvio padrão amostral não são os procedimentos corretos pois essas quantidades são estimativas/predições que possuem

[R-br] Trabalhar com muitos dados

2012-10-16 Por tôpico Roney Fraga
Caros, Estou trabalhando com os dados dos censos populacionais de 2000 e 2010. A minha dificuldade é o volume de dados, pois cada censo tem aproximadamente 20 milhões de linhas. Considerando os dados estão em arquivos .csv, um único aquivo de 12 GB para o censo de 2010 e um arquivo para cada

Re: [R-br] Trabalhar com muitos dados

2012-10-16 Por tôpico Diogo Ferrari
Trabalho com os dados dos censos usando R. A solução para processamento paralelo, big data, etc., usando R é o Revolution Analytics ( http://www.revolutionanalytics.com/). abs 2012/10/16 Roney Fraga roneyfr...@gmail.com Caros, Estou trabalhando com os dados dos censos populacionais de 2000 e

Re: [R-br] Trabalhar com muitos dados

2012-10-16 Por tôpico Rubem Kaipper Ceratti
Roney, eu escrevi um exemplo abaixo baseado em scripts que eu tenho aqui. Não sei se vai servir no seu caso, mas é um caminho. Essencialmente, para ler os dados, as opções apresentadas são os pacotes sqldf e ff (e ffbase para algumas funções úteis) e biglm para a regressão. Att., Rubem

[R-br] Função dist()

2012-10-16 Por tôpico Alisson Lucrecio
Caro colegas da lista r-br, Boa tarde. Eu preciso aplicar a função dist() para calcular a distancia euclidiana de uma planilha. Quando aplico a função ela considera a rownames, porem eu  nao quero que ela considere a rownames e considere uma coluna com os tratamento que estão na primeira coluna

Re: [R-br] Função dist()

2012-10-16 Por tôpico Walmes Zeviani
Mude o nome das linhas para que estão contidos na tal coluna, simples como rownames(matriz) - dados$tratamentos À disposição. Walmes. == Walmes Marques Zeviani LEG (Laboratório de Estatística e Geoinformação, 25.450418 S,

[R-br] RecordLinkage

2012-10-16 Por tôpico Fátima Lima Paula
Prezados, alguém que seja íntimo do pacote RecordLinkage para me dar uma luz? Tenho um banco de dados de internados e quero buscar reinternação. Quais os tratamentos que preciso fazer no banco? Como vou relacionar um banco com ele mesmo, vou usar o comando compare.dedup? Não sei quando usar

Re: [R-br] RecordLinkage

2012-10-16 Por tôpico Daniel C Bezerra
http://goo.gl/oR4MN 2012/10/16 Fátima Lima Paula fatima.lima.pa...@gmail.com Prezados, alguém que seja íntimo do pacote RecordLinkage para me dar uma luz? Tenho um banco de dados de internados e quero buscar reinternação. Quais os tratamentos que preciso fazer no banco? Como vou relacionar

Re: [R-br] RecordLinkage

2012-10-16 Por tôpico Fátima Lima Paula
Obrigada, Daniel. Em 16 de outubro de 2012 17:15, Daniel C Bezerra danielcbeze...@gmail.comescreveu: http://goo.gl/oR4MN 2012/10/16 Fátima Lima Paula fatima.lima.pa...@gmail.com Prezados, alguém que seja íntimo do pacote RecordLinkage para me dar uma luz? Tenho um banco de dados de

Re: [R-br] Trabalhar com muitos dados

2012-10-16 Por tôpico Fernando Mayer
Roney, quanto à sua 3a questão, talvez isso possa ajudar a liberar a memória 1) gc(reset = TRUE) # para o R liberar a memória para o SO 2) no terminal: sudo sync; echo 3 /proc/sys/vm/drop_caches (confira com free -m antes e depois desse comando) Isso vai liberar o cache da memória RAM e da

Re: [R-br] Trabalhar com muitos dados

2012-10-16 Por tôpico Fabio Mathias Corrêa
Veja os pacotes bigmemory, bigmatrix, entre outros big... Costumo abrir arquivos com 20Gb sem problema de Swap. Valeu!           Fábio Mathias Corrêa    Universidade Estadual de Santa Cruz Departamento de Ciências Exatas e da Terra - DCET Campus Soane Nazaré de Andrade, km 16 Rodovia

Re: [R-br] Trabalhar com muitos dados

2012-10-16 Por tôpico Benilton Carvalho
Curiosidade minha Por acaso, o resultado de .Machine$sizeof.pointer e' 4? b 2012/10/16 Roney Fraga roneyfr...@gmail.com: Caros, Estou trabalhando com os dados dos censos populacionais de 2000 e 2010. A minha dificuldade é o volume de dados, pois cada censo tem aproximadamente 20