El mar, 28-11-2017 a las 03:42 +0100, miriam.alz...@unavarra.es escribió: > Tengo un vector de 40 palabras (marca) y necesito saber si en una de > las > variables del data.frame (datos) se incluye alguna de esas 40 > palabras. Si > se incluye alguna de ellas, me gustaría crear una variable dummy > siendo 1 > que incluye alguna palabra y 0 que no incluye. > > ¿Qué paquete me recomendáis? ¿Cuál sería el comando a ejecutar?
Lo que describes luce como minería de texto y lo que parece que quieres es una porción de la matriz que llaman Term-Document Matrix. El paquete por excelencia para estos menesteres es tm: https://cran.r-project.org/web/packages/tm/ que tiene su buena viñeta https://cran.r-project.org/web/packages/tm/vignettes/tm.pdf Ojalá sirva. Saludos. -- «...homines autem hominum causa esse generatos...» Cicero [[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es