Re: [R-es] Búsqueda de palabras en una variable de R
readLines() El mié., 29 nov. 2017 5:51, escribió: > Muchas gracias, > > Estoy intentado ejecutar el paquete y necesito importar el archivo txt, > pero necesito importarlo de modo que cada línea sea una observación y no > un texto único (tengo unas 63,000 lineas). No encuentro la solución en los > enlaces. ¿Sabrías como hacerlo? > > Gracias! > El Mar, 28 de Noviembre de 2017, 3:50, Freddy Omar López Quintero escribió: > > El mar, 28-11-2017 a las 03:42 +0100, miriam.alz...@unavarra.es > > escribió: > >> Tengo un vector de 40 palabras (marca) y necesito saber si en una de > >> las > >> variables del data.frame (datos) se incluye alguna de esas 40 > >> palabras. Si > >> se incluye alguna de ellas, me gustaría crear una variable dummy > >> siendo 1 > >> que incluye alguna palabra y 0 que no incluye. > >> > >> ¿Qué paquete me recomendáis? ¿Cuál sería el comando a ejecutar? > > > > Lo que describes luce como minería de texto y lo que parece que quieres > > es una porción de la matriz que llaman Term-Document Matrix. El paquete > > por excelencia para estos menesteres es tm: > > > > https://cran.r-project.org/web/packages/tm/ > > > > que tiene su buena viñeta > > > > https://cran.r-project.org/web/packages/tm/vignettes/tm.pdf > > > > Ojalá sirva. > > > > Saludos. > > > > > > -- > > «...homines autem hominum causa esse generatos...» > > > > Cicero > > ___ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
Re: [R-es] Búsqueda de palabras en una variable de R
Muchas gracias, Estoy intentado ejecutar el paquete y necesito importar el archivo txt, pero necesito importarlo de modo que cada línea sea una observación y no un texto único (tengo unas 63,000 lineas). No encuentro la solución en los enlaces. ¿Sabrías como hacerlo? Gracias! El Mar, 28 de Noviembre de 2017, 3:50, Freddy Omar López Quintero escribió: > El mar, 28-11-2017 a las 03:42 +0100, miriam.alz...@unavarra.es > escribió: >> Tengo un vector de 40 palabras (marca) y necesito saber si en una de >> las >> variables del data.frame (datos) se incluye alguna de esas 40 >> palabras. Si >> se incluye alguna de ellas, me gustaría crear una variable dummy >> siendo 1 >> que incluye alguna palabra y 0 que no incluye. >> >> ¿Qué paquete me recomendáis? ¿Cuál sería el comando a ejecutar? > > Lo que describes luce como minería de texto y lo que parece que quieres > es una porción de la matriz que llaman Term-Document Matrix. El paquete > por excelencia para estos menesteres es tm: > > https://cran.r-project.org/web/packages/tm/ > > que tiene su buena viñeta > > https://cran.r-project.org/web/packages/tm/vignettes/tm.pdf > > Ojalá sirva. > > Saludos. > > > -- > «...homines autem hominum causa esse generatos...» > > Cicero ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
Re: [R-es] Búsqueda de palabras en una variable de R
Hola, Si te he entendido bien, este sería un ejemplo y una solución: > > marcas <- c('en', 'lugar')> > mydf <- data.frame(+ x = 1:10,+ y = c('en', 'un', 'lugar', 'de', 'la', 'Mancha', 'de', 'cuyo', 'nombre', 'no'),+ z = letters[1:10]+ )> > mydf$dum <- ifelse( mydf$y %in% marcas, 1, 0)> mydfx y z dum 1 1 en a 1 2 2 un b 0 3 3 lugar c 1 4 4 de d 0 5 5 la e 0 6 6 Mancha f 0 7 7 de g 0 8 8 cuyo h 0 9 9 nombre i 0 10 10 no j 0 > Saludos, Carlos Ortega www.qualityexcellence.es El 28 de noviembre de 2017, 3:42, escribió: > Buenas, > > Tengo un vector de 40 palabras (marca) y necesito saber si en una de las > variables del data.frame (datos) se incluye alguna de esas 40 palabras. Si > se incluye alguna de ellas, me gustaría crear una variable dummy siendo 1 > que incluye alguna palabra y 0 que no incluye. > > ¿Qué paquete me recomendáis? ¿Cuál sería el comando a ejecutar? > > Gracias! > > ___ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > -- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
Re: [R-es] Búsqueda de palabras en una variable de R
grep o grepl El mar., 28 nov. 2017 a las 3:42, escribió: > Buenas, > > Tengo un vector de 40 palabras (marca) y necesito saber si en una de las > variables del data.frame (datos) se incluye alguna de esas 40 palabras. Si > se incluye alguna de ellas, me gustaría crear una variable dummy siendo 1 > que incluye alguna palabra y 0 que no incluye. > > ¿Qué paquete me recomendáis? ¿Cuál sería el comando a ejecutar? > > Gracias! > > ___ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
Re: [R-es] Búsqueda de palabras en una variable de R
El mar, 28-11-2017 a las 03:42 +0100, miriam.alz...@unavarra.es escribió: > Tengo un vector de 40 palabras (marca) y necesito saber si en una de > las > variables del data.frame (datos) se incluye alguna de esas 40 > palabras. Si > se incluye alguna de ellas, me gustaría crear una variable dummy > siendo 1 > que incluye alguna palabra y 0 que no incluye. > > ¿Qué paquete me recomendáis? ¿Cuál sería el comando a ejecutar? Lo que describes luce como minería de texto y lo que parece que quieres es una porción de la matriz que llaman Term-Document Matrix. El paquete por excelencia para estos menesteres es tm: https://cran.r-project.org/web/packages/tm/ que tiene su buena viñeta https://cran.r-project.org/web/packages/tm/vignettes/tm.pdf Ojalá sirva. Saludos. -- «...homines autem hominum causa esse generatos...» Cicero [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
[R-es] Búsqueda de palabras en una variable de R
Buenas, Tengo un vector de 40 palabras (marca) y necesito saber si en una de las variables del data.frame (datos) se incluye alguna de esas 40 palabras. Si se incluye alguna de ellas, me gustaría crear una variable dummy siendo 1 que incluye alguna palabra y 0 que no incluye. ¿Qué paquete me recomendáis? ¿Cuál sería el comando a ejecutar? Gracias! ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es