Olá Daniel, obrigado pela ajuda!
Sou economista sem estudo formal de algoritmo, daí a chance de fazer cagada é
grande. Segue link do código:
https://gist.github.com/roneyfraga/debb242d919d9fdb3412
https://gist.github.com/roneyfraga/debb242d919d9fdb3412
Quanto ao sort(), eu preciso fazer ele
Se vc tiver interesse em salvar o código tex desse gráfico pode usar o pacote
tikz. Ele vai gerar um arquivo tex que vc pode dar \input no latex. Não testei
essa solução, é apenas um caminho.
Sent from my iPhone
___
R-br mailing list
É uma questão complicada de ser comparada. Por exemplo, se um pesquisador
consegue trabalhar com:
Latex
R +
tikz = gerar códigos tex das figuras
tables = gerar tabelas com dados que estão no R
Hmisc::latex = converter as tabelas geradas com o tables em tex
ou knitr
e consegue ainda editar tudo
Mauro, eu testei aqui em uma máquina virtual com Windows e funcionou. segue o
código:
http://dpaste.com/0Y260HW http://dpaste.com/0Y260HW
Contudo, eu instalei o programa MonetDB no Windows. Segue link:
https://www.monetdb.org/Home https://www.monetdb.org/Home
Att
Pessoal, eu fiz um teste com o MonetDB importando um arquivo csv do censo
demográfico 2010 do estado de São Paulo, que tem 2.2 gb, 224 colunas e 4038218
linhas. Importou em 109.1149 segundos.
Meu computador (MacBook Pro) tem processador i7 da primeira geração, 16 gb de
ram e ssd.
Pessoal,
Estou fazendo um gráfico no ggplot2() com o seguinte código:
#
# inicio do código
#
library(ggplot2)
library(grid)
mydf - read.csv(file='http://dpaste.com/24KGSW9.txt', sep=',')
head(mydf)
g - ggplot(data=mydf, aes( x=t.ano, y=nn.t.grupo, size=t.ttgrupo)) +
Algumas coisas básicas tem aqui: http://www.rdocumentation.org/
Att
Roney
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
Eu não faria isso. Criaria uma classe sem declaração de renda, e contabilizaria
quantas pessoas não declararam renda, ou excluiria essas observações que não
declararam renda.
Att
Roney
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
Boa tarde.
Concordo com Leonardo, criar uma categoria a parte é um bom caminho, pelo menos
para estatísticas descritivas. Para análise de regressão fica mais difícil,
creio que deletar as rendas nulas é o que boa parte dos pesquisadores fazem.
Carlos, pelo pouco que vi sobre o assunto, acho
Esse link pode ser útil.
http://roneyfraga.tumblr.com/post/51043730168/microdados-no-r-parte-1
A maneira mais fácil de baixar os microdados é com as funções criadas por
Anthony Damico, que baixa os microdados e salva em um arquivo de sqlite. Vale
notar que as funções de Damico consideram a
Leonardo,
Sei que já tem uma boa solução, mas algo possível é alterar o encoding no
terminal do mac/linux.
file -i arquivo_desejado.csv # linux
file -I arquivo_desejado.csv # Mac
iconv -f ISO-8859-1 -t UTF-8 arquivo-iso.csv arquivo-utf.csv
Como seu arquivo é grande isso iria demorar muito.
Éder, bom dia!
Preciso terminar algumas análises para essa base de dados que estou trabalhando
com certa urgência, daí vou deixar esse problema para resolver no futuro. Mas
como você já indicou o caminho que devo seguir, esta mais fácil agora. Quando
conseguir algum resultado expressivo posto
Éder, bom dia!
Quanto ao código que mandei ontem, vi que estava criando um data.frame() dentro
de um for que não deveria, isso fez o código ficar excessivamente lento, foi
erro meu. Alterar isso permitiu melhorar a performance do código, mas ainda
assim não consegui fazer os cálculos com todos
Éder, utilizando a função intersect() o tempo de processamento reduziu pela
metade.
###
### início do código
###
load(‘ver2.RData”)
grupo - list()
system.time({
for(k in 2:length(ver2)){
grp - sort(unique((ver2[[k-1]]$grupo))) ### qtde de grupos no ano t-1
grp2 -
Pessoal, bom dia!
Estou com um pequeno problema de tempo de processamento e gostaria da opinião
de vocês para verificar se é possível diminuí-lo.
A questão que busco solucionar é a mesma descrita na primeira mensagem desse
post. Com a ajuda de Éder o problema foi previamente solucionado,
Pessoal, só para lembrar, estou rondado essa rotina em um macbook pro i7 com 16
gb de ram e em um desktop arch linux i7 tb com 16 gb de ram. Minha lista
original tem as seguintes dimensões:
lapply(ver2, dim)
[[1]]
[1] 36 4
[[2]]
[1] 101 4
[[3]]
[1] 170 4
[[4]]
[1] 237 4
[[5]]
[1]
Éder, essa dica é daquelas que economiza horas de trabalho.
Minha dúvida é, será que sempre esteve aí, ou passou a existir recentemente?
Valeu!
Roney
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
Éder, muito obrigado pelo código e pela dica.
Parece que os pacotes como o RefManageR organizam as referências com intuito de
permitir fazer citações e referências bibliográficas. Para fazer as tarefas
ligadas a bibliometria, como baixar os arquivos do Web of Science e tirar
métricas como
Caros,
Tenho o seguinte arquivo:
https://gist.github.com/roneyfraga/ca682b6193c75e7be4bf
Quero manter apenas as linhas que começam com AU, DT, PY, VL e BP no arquivo. O
resultado seria:
AU Lin, TH
DT Article
PY 2012
VL 116
BP 314
AU Brodeur-Campbell, M
DT Article
PY 2012
VL 116
BP 320
Agora
Obrigado pelas contribuições.
Att
Roney
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código
mínimo reproduzível.
Éder, muito obrigado!
Era o que eu estava precisando.
Att
Roney
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código
Caros,
Estou tentando resolver um problema que nem sei por onde começar.
Tenho dois data.frame()
data1
name grupo
1Banker, 1986, V32, P1613 1
2 Banker, 1986, V32, P30 1
3 Macmillan, 1986, V60, P41 1
4 Charnes, 1985, V30, P91 1
5
Pessoal,
Utilizando o pacote survey resolvi estratificar a amostra de uma base de dados
de com as seguintes dimensões:
dim(mydata)
[1] 202744124
com o seguinte comando:
monom00.svy - svydesign(id=~V0300, strata=~AREAP, weights=~P001p, data=mydata)
obtive a seguinte mensagem de
Caros,
Estou tentando aprimorar a visualização de uma rede grande onde possa
identificar a evolução de grupos. A menor rede que tenho tem 5000 vértices e
4 edges,
sendo que a maior tem 24 vertices e mais de 2 milhões de edges (ainda não
sei como trabalhar com essa rede no R, mas isso
Caros,
Tenho um arquivo em formato txt com abstracts de artigos científicos, segue
exemplo:
We examine the productive efficiency of 70 Indian commercial banks during the
early stages (1986-1991) of the ongoing period of liberalization. We use data
envelopment analysis to calculate radial
Cleber, muito obrigado. Problema resolvido!!
Abraço
Roney
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código
mínimo
Éder Comunello,
Muito, muito obrigado! Estava empacado nesse cálculo.
Roney___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
Caros,
Considerando os dados:
#--
# Carregar arquivo csv no Dropbox
#install.packages('repmis')
library(repmis)
FinURL -
paste0(https://dl.dropboxusercontent.com/u/61883020/2013-08-25-r-br.csv;)
data - repmis::source_data(FinURL, sep = ,, header = TRUE)
dim(data)
Alberto Gaidys,
Funcionou.
Muito obrigado pela ajuda!
Roney___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código
mínimo
Caros,
Estou rodando um modelo de regressão quantílica com o pacote 'quantreg', onde
os dados estão salvos como objeto 'ffdf', com 7035146 linhas e aproximadamente
13 colunas. Para realizar um teste quanto a possibilidade computacional dessa
regressão fiz o seguinte, rodei uma regressão com
Bruno, muito obrigado pela ajuda.
Usando pfn deu o seguinte erro:
system.time( rpfn -rq(V4513 ~ V0453 + V4752 + V0401, tau=c(0.1,0.5,0.9),
data=c2000, method=pfn))
Error in rq.fit.fnb(xx, yy, tau = tau, eps = eps) :
NA/NaN/Inf in foreign function call (arg 4)
In addition: Warning message:
Olá Luciane,
A vantagem de utilizar o pacote 'SAScii' é o fato dele importar os dados com o
dicionário do SAS.
Att
Roney
##
# instalando o pacote 'SAScii' elaborado por Anthony Joseph Damico
install.packages('SAScii')
# carregando o pacote
Jackson, obrigado pela ajuda.
Para solucionar a primeira pergunta usei o software science of science
(sci2) tool.
--
Roney
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem
Caros,
Pretendo fazer uma rede de citação e co-citação, a mesma terá mais de
15 nós ou (vértices, indivíduos, etc.). Estou buscando as informações
no Web of Science. Para exemplificar fiz uma busca de 50 artigos, e
exportei para o seguinte endereço:
Acredito ser possível criar grupos regionais. Contudo, a maior dificuldade
na minha opinião é que as pessoas não conhecem a lista R–br. Pelo menos
essa é a realidade entre os economistas.
Abraço
Roney
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
Richard,
Como estão os seus dados do Censo Demográfico, em qual formato? Você deseja
uma função para importar ou para trabalhar no dia-a-dia com grande volume
de dados?
Talvez os seguintes posts possam ajudar:
http://r-br.2285057.n4.nabble.com/R-br-Trabalhar-com-muitos-dados-td4656568.html
Vinicius,
Se o problema for a quantidade de eventos desproporcionais acredito que os
capítulos 4, 5 e 6 dessa dissertação pode ajudar.
http://www.dca.fee.unicamp.br/~vonzuben/research/semolini_mest.html
Abraço
--
Roney
___
R-br mailing list
Muito obrigado a todos pelas contribuições, já tenho material para estudar
algumas semanas.
Benilton, é 64 bit.
.Machine$sizeof.pointer
[1] 8
Abraço
Roney
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
Caros,
Estou trabalhando com os dados dos censos populacionais de 2000 e 2010. A
minha dificuldade é o volume de dados, pois cada censo tem aproximadamente
20 milhões de linhas. Considerando os dados estão em arquivos .csv,
um único aquivo de 12 GB para o censo de 2010 e um arquivo para cada
Caros,
É possível trabalhar com o R usando banco de dados orientado a objetos
(db4o)? Caso positivo, qual pacote que faz essa conexão?
Atenciosamente
--
Roney
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
Jakson,
Tinha instalado o vim-r-plugin pelo yaourt do Arch Linux, que é uma
instalação via terminal, simples e fácil. Pressupondo que o erro
poderia ter origem na forma de instalação, resolvi seguir passo a
passo o material elaborado por você e por Jose Claudio Faria, que por
sinal está muito bem
Caros,
Visto que o RStudio em meu computador as vezes apresenta problemas no
cursor do mouse, ele fica umas 3 letras a frente de onde deveria
estar, tanto no Linux quanto no Windows, estou migrando para o
GVim-R-plugin. Achei a curva de aprendizado pequena e gostei muito do
resultado, contudo,
Dificuldade em baixar os dados do site do IBGE ou de importar o arquivo
.txt para o R?
Att
Roney
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem
Cleyton Fábio,
Já utilizei o pacote Benchmarking, segue link com alguns exemplos:
http://r-br.2285057.n4.nabble.com/R-br-Analise-Envoltoria-de-Dados-DEA-td3741096.html#a3747317
utilizei os dados do livro:
EVALUACION DE LA EFICIENCIA MEDIANTE EL ANALISIS ENVOLVENTE DE DATOS
dos autores Vicente
Manoel,
O Marcos F Silva criou algunas funções maravilhosas para ajudar a
trablhar com microdados no R. No endereço:
https://sites.google.com/site/marcosfs2006/textos
baixar o arquivo
Usando R para Importar Microdados.pdf
e as funções no link .zip.
Com base no censo de 2000, onde apenas a tabela
Obrigado a todos pela ajuda. O caminho que segui foi esse
http://sites.google.com/site/marcosfs2006/microdados
e em seguida utilizar a função read.fwf().
Att
--
Roney
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
Caros,
Diante da necessidade de importar microdados, principalmente do IBGE, por
meio do pacote IBGEPesq()* *que vem apresentando alguns problemas, pergunto
se algum usuário tem alguma sugestão para importar microdados alternativa
ao pacote IBGEPesq().
Microdados consiste geralmente em grandes
Fernando, talvez as dicas contidas neste endereço ajude.
http://ecologia.ib.usp.br/labtrop/doku.php?id=labtrop:dicas:intalarunbutu
Att
--
Roney
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia
Daniel,
Fiz o procedimento que vc deseja com a PNAD 2009. Não obtive problema, o
arquivo .csv ficou com 42 MB e o PSPP (alternativa livre ao SPSS) importou
normalmente. Meu computador é um mac, c2d (64bits) com 2gb de ram e utilizo o R
no Eclipse.
load('PNAD2009.RData')
Daniel, bom dia!
Ainda não trabalhei com DEA SBM sem orientação, contudo estou aqui pensando se
vc utilizar no comando dea() as opções ORIENTATION='in-out' com DIRECT
diferente de NULL será que chega perto do seu objetivo?
Outra dúvida, em um tópico anterior também sobre DEA, no link,
Eder,
Tentei abrir esse arquivo (ST-26-E.rtf) no Mac OS pelo TextEdit, Word,
LibreOffice, Pages e Xcode, alguns apresentaram que o arquivo pode estar
corrompido e outros não deram mensagem de erro, mas também não abrem. Só
visualizei o conteúdo do documento pelo Komodo Edit, ou quando
Leandro,
Acredito que esse post será útil para esclarecer suas dúvidas.
http://r-br.2285057.n4.nabble.com/R-br-Eclipse-R-interface-grafica-para-R-td3669992.html
Att
Roney
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
Caros,
Estou com um problema que não consegui resolver, caso alguém saiba um caminho
para solucioná-lo será uma grande ajuda.
Vamos lá, no data.frame (inv):
inv - data.frame(
seq=c(1,1,1,1,1,1,1,2,2,2,2,2,2),
dv=c(9,9,9,9,9,9,9,7,7,7,7,7,7),
Caros,
Reescrevendo o problema da mensagem anterior, procurei ser mais preciso nos
exemplos. Segue as dúvidas:
Objetivo I:
Considerando XX,
XX - data.frame(A=c(8,11,14,11,11,8))
XX
A
1 8
2 11
3 14
4 11
5 11
6 8
quero criar uma nova variável em XX, que retorne 1 quando um determinado
beniltoncarvalho,
Muito obrigado pela ajuda.
att
Roney
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código
mínimo
Olá a todos.
Essa não é uma dúvida, mas uma sugestão para aqueles que desejam trabalhar no R
em um ambiente que permita aumentar a produtividade.
Já analisando o resultado final, veja as seguintes imagens:
http://i.imgur.com/twBWw.png
http://i.imgur.com/CzuLC.png
É necessário integrar o R a
56 matches
Mail list logo