Re: [R-br] Web Scraping Lattes com R

2015-03-24 Por tôpico Paulo Nogueira Starzynski
Olá Leonardo, montei um rápido exemplo que, acredito, possa te inspirar. library(rvest) lattes.extract - function(id){ # Extração do código fonte url.fonte - html(paste(http://lattes.cnpq.br/;, id, sep=)) # Nome nome - html_text(html_nodes(url.fonte,

Re: [R-br] Coincidências entre vetores

2015-03-24 Por tôpico Rodrigo Coster
Davi, Assim ainda não tem a concordância dos índice: 3:1 %in% 1:3 [1] TRUE TRUE TRUE Para ter concordância por índice só consigo pensar no ==, mas como os vetores são de tamanho diferente tem que ver como ele quer fazer (com ou sem reciclagem) n1 - 1:3 n2 - c(3:1, 1) n1 == n2 # Com

[R-br] leitura dados PNAD 2003 - variáveis V1701 a V1377

2015-03-24 Por tôpico Luciane Maria Pilotto
Bom dia, estou tentando ler as variáveis da PNAD de 2003 - V1701 a V1377- relacionadas ao suplemento Saúde- e as mesmas aparecem como NA. O banco está disponível no site do IBGE http://www.ibge.gov.br/home/estatistica/populacao/trabalhoerendimento/pnad2013/microdados.shtm. Também podem ser

Re: [R-br] Web Scraping Lattes com R

2015-03-24 Por tôpico Jakson Alves de Aquino
Não estou acompanhando a discussão, mas gostaria de fazer uma observação que pode ser útil: no topo de cada página de currículo Lattes há um link para uma versão do currículo em xml. Talvez seja mais fácil escrever um algoritmo para leitura do xml do que do html. -- Jakson Alves de Aquino

Re: [R-br] leitura dados PNAD 2003 - variáveis V1701 a V1377

2015-03-24 Por tôpico Marcos Silva
Olá Luciane, A idéia da função selectvar() é permitir ao usuário selecionar as variáveis com base na descrição das mesmas. No seu caso, vi que diversas variáveis não possuem uma descrição, o que torna o uso desta função um pouco sem sentido. Uma abordagem pode ser a seguinte: # Definir o

Re: [R-br] leitura dados PNAD 2003 - variáveis V1701 a V1377

2015-03-24 Por tôpico Luciane Maria Pilotto
Olá pessoal, a função read.fwf funciona para estes dados. Todos os comandos que descrevi funcionaram com os microdados da PNAD de outros anos, já selecionei variáveis da PNAD de 2008 e 1998. O problema está nas variáveis referentes ao suplemento saúde do banco de pessoas de 2003 que aparecem

Re: [R-br] Reduzir a distância entre código e output no knitr

2015-03-24 Por tôpico Marcus Nunes
Oi Fernando Obrigado pelas dicas. Tentei usar o caminho do pdfcrop no Mac OS, mas não fui bem sucedido. Entretanto, tuas sugestões me deram ideia para pesquisar termos diferentes e Google. Acabei descobrindo que, ao colocar as linhas knit_hooks$set(small.mar = function(before, options, envir) {

Re: [R-br] leitura dados PNAD 2003 - variáveis V1701 a V1377

2015-03-24 Por tôpico Rodrigo Coster
Duas postagens que falam a respeito: http://analisereal.com/2014/09/26/carregando-dados-da-pnad-no-r/ 2015-03-24 13:24 GMT-03:00 Leonardo Ferreira Fontenelle leonar...@leonardof.med.br: Para ler o arquivo, você poderia em princípio usar a função read.fwf. Mas essa função não é otimizada para

[R-br] Diferença entre dados coletados do yahoo usando diferentes funções.

2015-03-24 Por tôpico Michelle Bau Graczyk
Boa tarde, Eu estava verificando os diferentes modos de coletar dados intraday do yahoo e percebi que para cada função que eu uso, os dados obtidos são diferentes. Por exemplo, se eu uso: dados - readLines('

Re: [R-br] Diferença entre dados coletados do yahoo usando diferentes funções.

2015-03-24 Por tôpico Rodrigo Coster
A diferença se deve que o arquivo muda com o passar do tempo (diria que a cada 5 minutos, mas é apenas um chute). E para esse caso eu usaria read.csv com os parâmetros *skip = 17* para ignorar as 17 primeiras linhas e *header = FALSE*, já que a tabela nao possui cabeçalho. read.csv('

Re: [R-br] leitura dados PNAD 2003 - variáveis V1701 a V1377

2015-03-24 Por tôpico Leonardo Ferreira Fontenelle
Para ler o arquivo, você poderia em princípio usar a função read.fwf. Mas essa função não é otimizada para dados grandes, então você vai preferir alguma alternativa. Uma opção é importar com o comando laf.open do pacote LaF, e outra é transformar de largura fixa para csv com o comando fwf2csv do

[R-br] friedman - agricolae - between blocks

2015-03-24 Por tôpico Daniela Recchia
Boa tarde pessoal, meu experimento a ser analisado é com medidas repetidas, por exemplo: Bloco1  Trat1   Valor1Bloco1  Trat1   Valor2Bloco1  Trat1   Valor3Bloco1  Trat2   Valor1Bloco1  Trat2   Valor2 Bloco1  Trat2   Valor3 Bloco2  Trat1   Valor1 Bloco2  Trat1   Valor2 usando a função friedman

[R-br] Reduzir a distância entre código e output no knitr

2015-03-24 Por tôpico Marcus Nunes
Olá Fiz esta pergunta há alguns minutos no StackExchange, mas ainda não obtive resposta. (aliás, se alguém quiser ler ela no contexto original e responder por lá ou, quem sabe, vê-la identada corretamente etc, o link é

Re: [R-br] Coincidências entre vetores

2015-03-24 Por tôpico Ze Henrique
Muito obrigado a ajuda de todos, foram muito validas. Em 24 de março de 2015 09:44, Rodrigo Coster rcos...@gmail.com escreveu: Davi, Assim ainda não tem a concordância dos índice: 3:1 %in% 1:3 [1] TRUE TRUE TRUE Para ter concordância por índice só consigo pensar no ==, mas como os

Re: [R-br] Reduzir a distância entre código e output no knitr

2015-03-24 Por tôpico Fernando Mayer
Uma opção, especialmente útil para slides, é remover automaticamente o espaço em branco ao redor (das bordas externas) da figura em PDF. Você pode setar isso com par(mar = ...). Mas uma ferramenta mais bruta e rápida para fazer isso, se você usa Linux, é usar o pdfcrop (precisa ser instalado a