Re: [R-es] libreria(s) preparar datos

2017-02-06 Por tema Carlos Ortega
Hola Pedro,

La opción de "vtreat" es buena, de un tirón (con una sola función) puedes
ajustar múltiples cosas. Pero también ahí está el problema que quizás esté
un tanto sobre-parametrizada y hay ciertas cosas que tienes que conocer muy
bien para no liarla. Pero vaya, para imputar missings, hacer hot-encoding
(crear variables dummy) y tratar alta cardinalidad (esto creo que es de lo
último que están metiendo) está muy bien.

Pero también con "caret" puedes hacer estas cosas, con varias funciones por
separado. Casi te preguntaría por el problema que tienes con "caret" por si
es que hay algo que quieras hacer para lo que no has encontrado una forma
fácil

Gracias,
Carlos.

El 6 de febrero de 2017, 13:02, Pedro Concejero Cerezo <
pedro.concejerocer...@telefonica.com> escribió:

> Amigos eRReros
> Tengo (como todos) el problema de preparar datos si es posible de forma
> automatica. He estado usando caret para quitar near-zero-variance y
> otras, pero resulta pesado y hay cosas que no hace o no se como hacer.
> Sobre todo reagrupar niveles de factores...
> He encontrado vtreat
> https://cran.r-project.org/web/packages/vtreat/index.html
>
> Pero estoy seguro que teneis experiencia en muchos otros paquetes y me
> gustaria saber si teneis alguno preferido.
>
> Gracias y saludos!!
>
> --
> *Pedro Concejero
> E-mail: pedro.concejerocer...@telefonica.com
> skype: pedro.concejero
> twitter @ConcejeroPedro 
> linkedin pedroconcejero 
> Entusiasta R, me encontrareis aqui gRupo R madRid
> 
> (sin acentos a proposito)
>
> *
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] libreria(s) preparar datos

2017-02-06 Por tema Pedro Concejero Cerezo
Amigos eRReros
Tengo (como todos) el problema de preparar datos si es posible de forma 
automatica. He estado usando caret para quitar near-zero-variance y 
otras, pero resulta pesado y hay cosas que no hace o no se como hacer. 
Sobre todo reagrupar niveles de factores...
He encontrado vtreat
https://cran.r-project.org/web/packages/vtreat/index.html

Pero estoy seguro que teneis experiencia en muchos otros paquetes y me 
gustaria saber si teneis alguno preferido.

Gracias y saludos!!

-- 
*Pedro Concejero
E-mail: pedro.concejerocer...@telefonica.com
skype: pedro.concejero
twitter @ConcejeroPedro 
linkedin pedroconcejero 
Entusiasta R, me encontrareis aqui gRupo R madRid 

(sin acentos a proposito)

*

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es