[R-es] Tablas - resultados - stargazer

2016-05-10 Por tema Javier Marcuzzi
En LinkedIn aparece esto que es bueno compartir. Puede ser útil a varios de 
nosotros.

http://jakeruss.com/cheatsheets/stargazer.html#report-t-statistics-or-p-values-instead-of-standard-errors

Javier Rubén Marcuzzi


[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Codificacion de caracteres

2016-05-10 Por tema Gilsanz, Jose Luis
Javier.

Los ficheros que descargo del INE contienen todas las agregaciones posibles en 
varias de las magnitudes (datos a nivel Nacional, por CCAA y por Provincias) 
pero no están organizados en columnas si no que una determinada columna 
(pongamos que se llama Localizacion la columna) contiene, a nivel de fila datos 
nacionales, por CCAA y Provincias por lo que elimino las agregaciones con menos 
detalle (Nacional y por CCAA) y me quedo solo con las de menor detalle (en este 
caso las provincias).

La tabla sería algo similar a esto:

Periodo   Localización  
 Numero
--- 
  ---
2016M01 España  
  4.578.596
2016M01 Galicia 
1.000.000
2016M01 A Coruña
200.000
2016M01 Lugo
 300.000
2016M01 Ourense 
500.000
2016M01 Pontevedra  
 200.000
…. ..  …….
…. ..  …….
…. ..  …….

Los datos acumulados de la columna Numero de las 4 provincias que componen 
Galicia (A Coruña, Lugo, Ourense  y Pontevedra) dan como resultado el registro 
de la segunda fila, a su vez si acumulásemos el resultado de las otras 16 CCAA 
que hay en España (además de Galicia) tendríamos el resultado de la primera 
fila que también coincidiría si sumásemos las otras 48 provincias españoles 
(además de A Coruña, Lugo, Ourense  y Pontevedra)  a las provincias de Galicia.

Por eso tengo que hacer un subset a los datos originales para guardar solo los 
registros a nivel provincial y ahí es donde viene la incidencia porque R me 
transforma Andalucía, o Cataluña en otros caracteres que no son correctos y el 
subset entonces no elimina los datos que quiero obviar.

Saludos





José Luis Gilsanz Gómez
Estadística
Departamento Técnico Entidades Financieras
JLL Valoraciones S.A. (Jones Lang LaSalle España S.A.)
Paseo de la Castellana 130 - 1ª; 28046 Madrid
Tel: +34 91 454 96 94
Fax +34 91 541 42 64
jll.es

Síguenos en: Twitter I 
Linkedin
 I Youtube I 
Blog
PPiense en el medio ambiente antes de imprimir este e-mail

Los datos personales que en esta comunicación aparecen, así como los que 
nuestra empresa mantiene de Vd. y de su empresa, son tratados con la finalidad 
de mantener el contacto así como realizar las gestiones que en esta aparecen 
(Ley Orgánica 15/1999, de 13 de diciembre, de Protección de Datos de Carácter 
Personal).
Puede ejercer sus derechos de acceso, rectificación, cancelación y oposición 
dirigiéndose a 
atencion.cliente...@tasacionesh.com.
La utilización de su dirección de correo electrónico por parte de nuestra 
empresa queda sujeta a las disposiciones de la Ley 34/2002, de Servicios de la 
Sociedad de la Información y el Comercio Electrónico. Si Vd. recibe 
comunicación comercial por nuestra parte y desea dejar de recibirla, rogamos 
nos lo comunique por vía electrónica a través de la dirección 
atencion.cliente...@tasacionesh.com 
 .

De: Javier Marcuzzi [mailto:javier.ruben.marcu...@gmail.com]
Enviado el: martes, 10 de mayo de 2016 16:41
Para: Gilsanz, Jose Luis
CC: r-help-es@r-project.org
Asunto: RE: [R-es] Codificacion de caracteres

Estimado José Luis

Nunca trabaje con fichero px del INE, nos separa un océano.

Se me ocurre, por las dudas, cambiando el sabe with encoding desde Rstudio, por 
ahí eso solo.

No comprendo bien ¿quieres limpiar algo los datos para no cargar todos sql 
server? Para mi, la forma más sencilla es cargar en la base de datos y luego 
desde sql eliminar las columnas que no quiero.

Tendría que pensar en su código, yo con sqlserver 2014 y R no tengo problemas 
(pero uso windows 10).

Javier Rubén Marcuzzi

De: Gilsanz, Jose Luis
Enviado: martes, 10 de mayo de 2016 11:17
Para: Javier Marcuzzi
CC: r-help-es@r-project.org
Asunto: RE: [R-es] Codificacion de caracteres

Hola Javier:

Me alegra saber que no soy el único cenutrio que se ha topado con esto. ☹

Se trata de un proceso de R que extrae datos de un fichero px descargado del 
INE y que contiene 

Re: [R-es] Codificacion de caracteres

2016-05-10 Por tema Gilsanz, Jose Luis
Hola Javier:

Me alegra saber que no soy el único cenutrio que se ha topado con esto. ☹

Se trata de un proceso de R que extrae datos de un fichero px descargado del 
INE y que contiene datos a nivel de municipio y de Comunidad Autónoma (que 
intento eliminar) antes de hacer la carga en el SQL Server porque solo me 
interesan las provincias.

La BD no es ningún problema (el error se produce al tratar R las cadenas de 
texto) y trabajo en Windows 7 .
Como acertadamente supones Rstudio tiene como codificación por defecto  
ISO8859-1.

El Sys.getlocale() es:
[1] 
"LC_COLLATE=Spanish_Spain.1252;LC_CTYPE=Spanish_Spain.1252;LC_MONETARY=Spanish_Spain.1252;LC_NUMERIC=C;LC_TIME=Spanish_Spain.1252"

Y getOption("encoding") es:
[1] "native.enc"

Utilizando esta simple función consigo pasar las cadenas a codificación UTF-8 
con sus enies, tildes y demás:
autf8 <- function(texto)
{
Encoding(texto)<-"UTF-8"
return(texto)
}


De manera que en Rscript :
x <- as.character("Espàñiá")
x
[1] "Espà ñiá"

y <- utf8(x)
y
[1] " Espàñiá”

Es decir la variable y (tras pasarle la función) ya si que tendría la 
codificación correcta mientras que x no seria correcta.

La cuestión ahora es como decirle a Rscript (o a R mas genéricamente) que tome 
siempre las cadenas como codificadas en UTF-8 y no como las toma ahora.


Estadistica
José Luis Gilsanz Gómez
Estadística
Departamento Técnico Entidades Financieras
JLL Valoraciones S.A. (Jones Lang LaSalle España S.A.)
Paseo de la Castellana 130 - 1ª; 28046 Madrid
Tel: +34 91 454 96 94
Fax +34 91 541 42 64
jll.es

Síguenos en: Twitter I 
Linkedin
 I Youtube I 
Blog
PPiense en el medio ambiente antes de imprimir este e-mail

Los datos personales que en esta comunicación aparecen, así como los que 
nuestra empresa mantiene de Vd. y de su empresa, son tratados con la finalidad 
de mantener el contacto así como realizar las gestiones que en esta aparecen 
(Ley Orgánica 15/1999, de 13 de diciembre, de Protección de Datos de Carácter 
Personal).
Puede ejercer sus derechos de acceso, rectificación, cancelación y oposición 
dirigiéndose a 
atencion.cliente...@tasacionesh.com.
La utilización de su dirección de correo electrónico por parte de nuestra 
empresa queda sujeta a las disposiciones de la Ley 34/2002, de Servicios de la 
Sociedad de la Información y el Comercio Electrónico. Si Vd. recibe 
comunicación comercial por nuestra parte y desea dejar de recibirla, rogamos 
nos lo comunique por vía electrónica a través de la dirección 
atencion.cliente...@tasacionesh.com 
 .

De: Javier Marcuzzi [mailto:javier.ruben.marcu...@gmail.com]
Enviado el: martes, 10 de mayo de 2016 15:58
Para: Gilsanz, Jose Luis
Asunto: RE: [R-es] Codificacion de caracteres

Estimado José Luis

Ese problema es conocido, cuándo se sufre da dolores de cabeza. La solución 
puede ser sencilla o complicada, comencemos por los datos, ¿Sistema operativo, 
codificación, base de datos?, luego estos parámetros deben estar correctos en 
R. Se me ocurre que tiene especificado una codificación en RStudio que no es la 
misma que usa por defecto es Rscript en bat. Yo miraría primero las opciones de 
la base de datos (pero estas están generalmente de acuerdo con el sistema 
operativo).

Javier Rubén Marcuzzi

De: Gilsanz, Jose Luis
Enviado: martes, 10 de mayo de 2016 6:17
Para: r-help-es@r-project.org
Asunto: [R-es] Codificacion de caracteres

Hola:

Me estoy volviendo loco con algo que seguro que es una tonter�a pero no doy con 
la tecla.

En un script que tengo, necesito especificar (en una consulta SQL) valores con 
caracteres "espa�oles " (�,�, � ,�, etc)

Ejecutando el script en RStudio y en la consola de R no hay problemas pero a la 
hora de ejecutarlo mediante Rscript en un proceso bat me encuentro con que 
estas cadenas no las "reconoce"
Por ejemplo:
x<-as.character("Espa��a")
x

Me lo pone como:
Españía

�Existe alguna manera de forzar a R a reconocer los caracteres "espa�oles" o de 
efectuar alg�n tipo de conversi�n?

Muchas gracias

Saludos


Jos� Luis Gilsanz G�mez
Estad�stica
Departamento T�cnico Entidades Financieras
JLL Valoraciones S.A. (Jones Lang LaSalle Espa�a S.A.)
Paseo de la Castellana 130 - 1�; 28046 Madrid
Tel: +34 91 454 96 94
Fax +34 91 541 42 64
jll.es

S�guenos en: Twitter I 
Linkedin
 I Youtube I 
Blog
PPiense en el medio ambiente antes de imprimir este e-mail

Los datos personales que en esta comunicaci�n aparecen, as� como los que 
nuestra empresa 

Re: [R-es] Codificacion de caracteres

2016-05-10 Por tema Gilsanz, Jose Luis
Hola Javier:

El problema no está tanto en la codificación de la BD el problema era en R ya 
que yo ponía:

Consulta <- “SELECT Municipios FROM MUNI WHERE CCAA = ‘Andalucía’”  (la i con 
una tilde)

Y R me guardaba consulta como:
“SELECT Municipios FROM MUNI WHERE CCAA = 'Andalucía'”

Sustituyendo la i con tilde con dos caracteres: í

Lógicamente al pasar esa consulta “modificada por R”no salían datos y el resto 
del script dejaba de funcionar correctamente al no recuperarse los datos.


Creo haber encontrado una solución sencilla y que funciona tanto en Rstudio 
como ejecutándolo vía Rscript, (me falta probar en la consola de R) mediante la 
siguiente función:
autf <- function(texto)
{
return(enc2utf8(texto))
}

Pasando la cadena por esta función en Rstudio no afecta (allí no tengo 
problemas con ñ y vocales con tildes) y usando el scrip via Rscript.exe me 
“convierte” mi cadena a formato UTF-8 que tambien comprende esos caracteres.

Ahora bien el motivo que hace que en Rsutio y la consola de R se reconozcan sin 
problemas estos caracteres y via Rscript.exe no lo haga me es completamente 
ajeno :-\

Gracias por tu interés.

Un saludo


José Luis Gilsanz Gómez
Estadística
Departamento Técnico Entidades Financieras
JLL Valoraciones S.A. (Jones Lang LaSalle España S.A.)
Paseo de la Castellana 130 - 1ª; 28046 Madrid
Tel: +34 91 454 96 94
Fax +34 91 541 42 64
jll.es

Síguenos en: Twitter I 
Linkedin
 I Youtube I 
Blog
PPiense en el medio ambiente antes de imprimir este e-mail

Los datos personales que en esta comunicación aparecen, así como los que 
nuestra empresa mantiene de Vd. y de su empresa, son tratados con la finalidad 
de mantener el contacto así como realizar las gestiones que en esta aparecen 
(Ley Orgánica 15/1999, de 13 de diciembre, de Protección de Datos de Carácter 
Personal).
Puede ejercer sus derechos de acceso, rectificación, cancelación y oposición 
dirigiéndose a 
atencion.cliente...@tasacionesh.com.
La utilización de su dirección de correo electrónico por parte de nuestra 
empresa queda sujeta a las disposiciones de la Ley 34/2002, de Servicios de la 
Sociedad de la Información y el Comercio Electrónico. Si Vd. recibe 
comunicación comercial por nuestra parte y desea dejar de recibirla, rogamos 
nos lo comunique por vía electrónica a través de la dirección 
atencion.cliente...@tasacionesh.com 
 .

De: Javier Villacampa González [mailto:javier.villacampa.gonza...@gmail.com]
Enviado el: martes, 10 de mayo de 2016 12:51
Para: R ayuda; Gilsanz, Jose Luis
Asunto: Codificacion de caracteres

imagino que te está guardando tu BD en UTF-8 y por lo que sea la necesitas en 
latin1 (utilizas Windows?)

Esto lo deduzco de esta prueba
iconv(x = "España", from = "latin1", to = "UTF-8") # Pone españa con enie.No sé 
si me hará la faena el email.

Lo que deberia hacer es esto.
df$col1 <- iconv(x = df$col1, from = "UTF-8", to = "latin1")

Y espero que funcione



--
[https://lh6.googleusercontent.com/-OmJSTAIo4J4/UW01N1mJAeI/ABk/NYyJQ0fT4B4/h120/526620_580124745341874_542437733_n.jpg]

JLL Valoraciones, S.A.
Registration number: A-28806222.
Registered Office: Pº de la Castellana, 130 - 1ª ; 28046 Madrid

This e-mail is for the use of the intended recipient(s) only. If you have 
received this e-mail in error, please notify the sender immediately and then 
delete it. If you are not the intended recipient, you must not use, disclose or 
distribute this e-mail without the author's prior permission. We have taken 
precautions to minimise the risk of transmitting software viruses, but we 
advise you to carry out your own virus checks on any attachment to this 
message. We cannot accept liability for any loss or damage caused by software 
viruses. If you are the intended recipient and you do not wish to receive 
similar electronic messages from us in future then please respond to the sender 
to this effect

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

[R-es] Codificacion de caracteres

2016-05-10 Por tema Javier Villacampa González
imagino que te está guardando tu BD en UTF-8 y por lo que sea la necesitas
en latin1 (utilizas Windows?)

Esto lo deduzco de esta prueba
iconv(x = "España", from = "latin1", to = "UTF-8") # Pone españa con
enie.No sé si me hará la faena el email.

Lo que deberia hacer es esto.
df$col1 <- iconv(x = df$col1, from = "UTF-8", to = "latin1")

Y espero que funcione



--

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es