Em 5 de dezembro de 2012 23:43, Marcos Silva <[email protected]>escreveu:
> Caros amigos,
>
> Estou tentando usar o pacote XML para ler alguns dados em tabelas
> existentes em páginas html.
> Especificamente, estou tentando ler páginas da previdência social contendo
> informações sobre o CRP (Certificado de Regularidade Previdenciária)
> O problema é que estou obtendo uns caracteres estranhos, coisas do tipo
> "Situação".
> Estou fazendo da seguinte forma:
>
> library(XML)
> html <- readHTMLTable("F:\\Regime
> Próprio\\html\\ExtratoPrevidenciario.htm")
> html <- html[[3]][, c('V1', 'V2')]
>
> Já tentei o iconv() sem resultado. Já tentei ler após mudar a opção
> "encoding" em options().
>
> Ah, estou usando o windows velho de guerra... sorry... :)
>
> A página pode ser vista no seguinte link:
>
>
> http://www1.previdencia.gov.br/sps/app/crp/ExtratoRegularidadeRegimes.asp?CD_CNPJ=28695658000184&time=23:24:56&Rel=N-L-R-D-S-E-P
>
> Se alguém tiver alguma idéia de corrigir...
>
> Desde já obrigado.
>
> Abs.
>
> --
> Marcos F. Silva
> http://sites.google.com/site/marcosfs2006
>
--
Marcos F. Silva
http://sites.google.com/site/marcosfs2006
_______________________________________________
R-br mailing list
[email protected]
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código
mínimo reproduzível.