Roney, bom dia!
Agora pude ter uma ideia melhor do seu trabalho. Pelo volume de dados acho
que cai no que o pessoal se refere como 'big data'. Nessa área tem várias
recomendações de pacotes que já vi aqui na lista, sendo que já tive
oportunidade de ver alguma coisa com o pacote {data.table}.
Éder, bom dia!
Preciso terminar algumas análises para essa base de dados que estou trabalhando
com certa urgência, daí vou deixar esse problema para resolver no futuro. Mas
como você já indicou o caminho que devo seguir, esta mais fácil agora. Quando
conseguir algum resultado expressivo posto
Roney, bom dia!
Complementando o email anterior...
### code r
setwd(C:/LAB/Temp/Roney);getwd()
load(ver2.RData)
ver2.df - do.call(rbind, ver2)
row.names(ver2.df) - NULL
head(ver2.df)
str(ver2.df)
### ideia básica
table(ver2.df$name, ver2.df$grupo)
### transforma table em data.frame
tab -
Éder, bom dia!
Quanto ao código que mandei ontem, vi que estava criando um data.frame() dentro
de um for que não deveria, isso fez o código ficar excessivamente lento, foi
erro meu. Alterar isso permitiu melhorar a performance do código, mas ainda
assim não consegui fazer os cálculos com todos
Éder, utilizando a função intersect() o tempo de processamento reduziu pela
metade.
###
### início do código
###
load(‘ver2.RData”)
grupo - list()
system.time({
for(k in 2:length(ver2)){
grp - sort(unique((ver2[[k-1]]$grupo))) ### qtde de grupos no ano t-1
grp2 -
Pessoal, bom dia!
Estou com um pequeno problema de tempo de processamento e gostaria da opinião
de vocês para verificar se é possível diminuí-lo.
A questão que busco solucionar é a mesma descrita na primeira mensagem desse
post. Com a ajuda de Éder o problema foi previamente solucionado,
Pessoal, só para lembrar, estou rondado essa rotina em um macbook pro i7 com 16
gb de ram e em um desktop arch linux i7 tb com 16 gb de ram. Minha lista
original tem as seguintes dimensões:
lapply(ver2, dim)
[[1]]
[1] 36 4
[[2]]
[1] 101 4
[[3]]
[1] 170 4
[[4]]
[1] 237 4
[[5]]
[1]
Roney, boa tarde!
Sugiro trabalhar com um data.frame único ao invés da lista de data.frames.
ver2.df - do.call(rbind, ver2)
row.names(ver2.df) - NULL
ver2.df
str(ver2.df)
# 'data.frame': 37136 obs. of 4 variables:
# $ name : chr Charnes, 1978, V2, P429 Charnes, 1978, V2, P429
Éder, muito obrigado!
Era o que eu estava precisando.
Att
Roney
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código
Caro Roney, bom dia!
Segue uma primeira ideia. Verifique se atende...
### code
# setwd(choose.dir())
# load('dados.RData')
head(data1); head(data2)
grp - sort(unique(c(data1$grupo, data2$grupo))) ### grupos
{RES - LAB - list()
for (i in grp) {
for (j in grp) {
RES -
Caros,
Estou tentando resolver um problema que nem sei por onde começar.
Tenho dois data.frame()
data1
name grupo
1Banker, 1986, V32, P1613 1
2 Banker, 1986, V32, P30 1
3 Macmillan, 1986, V60, P41 1
4 Charnes, 1985, V30, P91 1
5
11 matches
Mail list logo