Elias, obrigado. tenho mais uma pergunta. Vc conhece alguma função de cluster, pode ser hierarquica ou nao que trabalhe com dados numericos e categoricos (fators) ao mesmo tempo?
na verdade a pergunta correta seria tem alguma função de distancia que faça isso? abs Vinicius Em 20 de fevereiro de 2013 19:26, Elias Teixeira Krainski < [email protected]> escreveu: > Num note bem 'pobre' (Intel 2 core, 4Gb RAM) o exemplo abaixo funcionou > sem problema > > n <- 5e6 > ### simula 20 grupos em 5 variaveis > d <- cbind(runif(n)+1:10, rnorm(n,-2:2,0.3), > rbinom(n,5,c(2,1,3,2,5)/7), runif(n)+1:0, runif(n)+20:1) > > require(cluster) > cl <- clara(d, 20) > table(cl$clustering, rep(1:20, n/20)) > > Att. > Elias. > > On Wed, 2013-02-20 at 19:08 -0300, Vinicius Brito Rocha wrote: > > Pessoal, > > > > > > tenho uma base com 5 milhoes de registros e 20 variáveis. > > > > > > preciso clusteriza-la. > > > > > > alguém pode me ajudar. > > > > > > Sera que o clara do pacote cluster resolve? > > > > > > dentre os pacotes bigmemory e biganalytics tem funçoes de cluster? > > > > > > > > > > > > > > > > > > Abs > > > > > > -- > > Vinicius Brito Rocha. > > Estatístico e Atuário (IM / UFRJ) > > Mestre em Pesquisa Operacional (COPPE / UFRJ) > > > > www.aplicademic.blogspot.com > > http://twitter.com/viniciusbritor > > > > "Não se preocupe muito com as suas dificuldades em Matemática, posso > > assegurar-lhe que as minhas são ainda maiores." - Albert Einstein. > > > > > > _______________________________________________ > > R-br mailing list > > [email protected] > > https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br > > Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça > código mínimo reproduzível. > > > _______________________________________________ > R-br mailing list > [email protected] > https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br > Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça > código mínimo reproduzível. > -- *Vinicius Brito Rocha.* *Estatístico e Atuário (IM / UFRJ)** Mestre em Pesquisa Operacional (COPPE / UFRJ)* www.aplicademic.blogspot.com http://twitter.com/viniciusbritor "Não se preocupe muito com as suas dificuldades em Matemática, posso assegurar-lhe que as minhas são ainda maiores." - Albert Einstein.
_______________________________________________ R-br mailing list [email protected] https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
