Caros,

Estou rodando um modelo de regressão quantílica com o pacote 'quantreg', onde 
os dados estão salvos como objeto 'ffdf', com 7035146 linhas e aproximadamente 
13 colunas. Para realizar um teste quanto a possibilidade computacional dessa 
regressão fiz o seguinte, rodei uma regressão com apenas 3 variáveis 
explicativas e todas as linhas, o modelo rodou, mas demorou 15 horas de 
processamento.

Questão: Como posso melhorar esse tempo de processameto?

Meu computador é um macbook pro i7, 10 gb ram com ssd.

> class(c2000)
[1] "ffdf"

> str(c2000[,])
'data.frame':   7035146 obs. of  13 variables:
 $ V0102: int  12 12 12 12 12 12 12 12 12 12 ...
 $ V0300: int  1339 1782 1782 2934 5534 5534 11305 11305 19520 19520 ...
 $ V1001: int  1 1 1 1 1 1 1 1 1 1 ...
 $ V1004: int  NA NA NA NA NA NA NA NA NA NA ...
 $ V0401: int  1 1 2 1 1 2 1 2 1 2 ...
 $ V0402: int  1 1 3 1 1 2 1 2 1 3 ...
 $ V4752: int  25 45 18 23 20 16 43 38 60 20 ...
 $ V0408: int  4 1 1 4 4 1 4 1 1 4 ...
 $ V0418: int  NA NA NA NA NA NA NA NA NA NA ...
 $ V4210: int  NA NA NA NA NA NA NA NA NA NA ...
 $ V4300: int  0 4 11 4 5 5 11 15 0 13 ...
 $ V4513: int  182 182 136 182 182 36 733 865 316 380 ...
 $ V0453: int  20 48 48 45 49 24 40 25 44 25 ...

> system.time( r <- rq(V4513 ~ V0453 + V4752 + V0401, tau=c(0.1,0.5,0.9), 
> data=c2000) )
     user    system   elapsed 
56258.453   165.855 56123.961 


Atenciosamente
Roney
_______________________________________________
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Responder a