Num note bem 'pobre' (Intel 2 core, 4Gb RAM) o exemplo abaixo funcionou sem problema
n <- 5e6 ### simula 20 grupos em 5 variaveis d <- cbind(runif(n)+1:10, rnorm(n,-2:2,0.3), rbinom(n,5,c(2,1,3,2,5)/7), runif(n)+1:0, runif(n)+20:1) require(cluster) cl <- clara(d, 20) table(cl$clustering, rep(1:20, n/20)) Att. Elias. On Wed, 2013-02-20 at 19:08 -0300, Vinicius Brito Rocha wrote: > Pessoal, > > > tenho uma base com 5 milhoes de registros e 20 variáveis. > > > preciso clusteriza-la. > > > alguém pode me ajudar. > > > Sera que o clara do pacote cluster resolve? > > > dentre os pacotes bigmemory e biganalytics tem funçoes de cluster? > > > > > > > > > Abs > > > -- > Vinicius Brito Rocha. > Estatístico e Atuário (IM / UFRJ) > Mestre em Pesquisa Operacional (COPPE / UFRJ) > > www.aplicademic.blogspot.com > http://twitter.com/viniciusbritor > > "Não se preocupe muito com as suas dificuldades em Matemática, posso > assegurar-lhe que as minhas são ainda maiores." - Albert Einstein. > > > _______________________________________________ > R-br mailing list > [email protected] > https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br > Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código > mínimo reproduzível. _______________________________________________ R-br mailing list [email protected] https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
