Re: [R-es] Pasar palabras de una lista a una variable del dataframe

2018-05-22 Por tema miriam . alzate
Muchas gracias Carlos,

Me da error al hacerlo. Mi variable donde quiero que localice las palabras
de la lista tiene más de una palabra, no se si puede ser por eso.

Gracias
El Mar, 22 de Mayo de 2018, 20:15, Carlos Ortega escribió:
> Hola,
>
> Aquí tienes un ejemplo (reproducible)...
>
> #---
>> # Generar nombres de mujer
>> library(randNames)
>> val_tmp <- rand_names(1000, nationality = 'ES', gender = 'female')
>> head(val_tmp)
> # A tibble: 6 x 25
>   gender email dob registered   phone  cell  nat   name.title
> name.first name.last location.street  location.city location.state
> 
> 
> 1 female angeles.… 1958-0… 2004-05-06 … 932-2… 683-… ESms
>  angelesvega  3550 calle del … lugo  cataluña
> 2 female esther.s… 1947-0… 2004-04-16 … 982-5… 674-… ESmrs
> esther santos9690 calle de l… toledoislas baleares
> 3 female eva.parr… 1967-0… 2013-04-02 … 902-3… 644-… ESmiss   eva
>   parra 2484 calle de t… la palma  melilla
> 4 female sandra.p… 1957-0… 2005-03-28 … 919-8… 642-… ESms
>  sandra prieto9084 calle de á… parla castilla y le…
> 5 female veronica… 1952-0… 2004-03-20 … 959-4… 609-… ESmrs
> veronica   moreno9672 calle del … elche la rioja
> 6 female alejandr… 1973-0… 2005-03-28 … 907-9… 680-… ESmiss
>  alejandra  saez  1507 calle de p… san sebastián castilla la m…
> # ... with 12 more variables: location.postcode , login.username
> , login.password , login.salt , login.md5 ,
> #   login.sha1 , login.sha256 , id.name , id.value ,
> picture.large , picture.medium ,
> #   picture.thumbnail 
>> val_end <- val_tmp$name.first
>>
>> # Como ejemplo elijo los 10 primeros de esos nombres.
>> my_lista <- val_end[1:10]
>> my_lista
>  [1] "angeles"   "esther""eva"   "sandra""veronica"
> "alejandra" "irene" "lidia" "vanesa""mercedes"
>>
>> # Hago efectiva la comparación.
>> library(stringr)
>> res_coincide <- str_match_all(val_end, my_lista)
>> res_end <- table(unlist(res_coincide))
>> res_end
>
> alejandra   angelesesther   eva irene lidia  mercedes
> sandravanesa  veronica
> 2 3 3 1 2 1 1
>3 2 1
>>
> #---
>
>
> Gracias,
> Carlos.
>
> El 22 de mayo de 2018, 18:45, Miriam Alzate 
> escribió:
>
>> Buenas tardes,
>>
>> Tengo una lista de 600 palabras. Quiero saber cuántas de esas palabras
>> aparecen en cada observación de mi variable "texto". La variable "texto"
>> es
>> de tipo caracter. ¿Cómo lo haríais?
>>
>> Muchas gracias.
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Pasar palabras de una lista a una variable del dataframe

2018-05-22 Por tema Javier Marcuzzi
Estimados

Estoy de acuerdo con lo que ustedes dicen, en mi caso estoy utilizando c#
por comodidad porque tengo fuentes de datos con más de un millón de
palabras, lógicamente hay repetidas, pero lo que habría que tener en cuenta
y sucede en mi caso particular, lo que no quiere decir que a Mirian Alzate
le ocurra, son las palabras compuestas, voy a dar un ejemplo, infarto,
miocardio y infarto de miocardio, en mi caso particular para el análisis
infarto de miocardio es una palabra compuesta.

La lista de palabras puede llegar a requerir un recorrido por cada elemento
para descomponer palabras compuestas, desconozco el término en español, yo
en mi algoritmo lo llamo palabra compuesta.

No difiere mucho de lo expuesto, es solo un caso que me tocó.

Javier Rubén Marcuzzi

El mar., 22 may. 2018 a las 16:05, Jorge I Velez ()
escribió:

> Una forma es con %in%.  —JIV
>
> El El mar, 22 de may. de 2018 a las 11:46 a. m., Miriam Alzate <
> miriam.alz...@unavarra.es> escribió:
>
> > Buenas tardes,
> >
> > Tengo una lista de 600 palabras. Quiero saber cuántas de esas palabras
> > aparecen en cada observación de mi variable "texto". La variable "texto"
> > es de tipo caracter. ¿Cómo lo haríais?
> >
> > Muchas gracias.
> >
> > ___
> > R-help-es mailing list
> > R-help-es@r-project.org
> > https://stat.ethz.ch/mailman/listinfo/r-help-es
> >
> --
> Sent from my phone. Please excuse my brevity and misspelling.
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Pasar palabras de una lista a una variable del dataframe

2018-05-22 Por tema Jorge I Velez
Una forma es con %in%.  —JIV

El El mar, 22 de may. de 2018 a las 11:46 a. m., Miriam Alzate <
miriam.alz...@unavarra.es> escribió:

> Buenas tardes,
>
> Tengo una lista de 600 palabras. Quiero saber cuántas de esas palabras
> aparecen en cada observación de mi variable "texto". La variable "texto"
> es de tipo caracter. ¿Cómo lo haríais?
>
> Muchas gracias.
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
-- 
Sent from my phone. Please excuse my brevity and misspelling.

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Pasar palabras de una lista a una variable del dataframe

2018-05-22 Por tema Carlos Ortega
Hola,

Aquí tienes un ejemplo (reproducible)...

#---
> # Generar nombres de mujer
> library(randNames)
> val_tmp <- rand_names(1000, nationality = 'ES', gender = 'female')
> head(val_tmp)
# A tibble: 6 x 25
  gender email dob registered   phone  cell  nat   name.title
name.first name.last location.street  location.city location.state


1 female angeles.… 1958-0… 2004-05-06 … 932-2… 683-… ESms
 angelesvega  3550 calle del … lugo  cataluña
2 female esther.s… 1947-0… 2004-04-16 … 982-5… 674-… ESmrs
esther santos9690 calle de l… toledoislas baleares
3 female eva.parr… 1967-0… 2013-04-02 … 902-3… 644-… ESmiss   eva
  parra 2484 calle de t… la palma  melilla
4 female sandra.p… 1957-0… 2005-03-28 … 919-8… 642-… ESms
 sandra prieto9084 calle de á… parla castilla y le…
5 female veronica… 1952-0… 2004-03-20 … 959-4… 609-… ESmrs
veronica   moreno9672 calle del … elche la rioja
6 female alejandr… 1973-0… 2005-03-28 … 907-9… 680-… ESmiss
 alejandra  saez  1507 calle de p… san sebastián castilla la m…
# ... with 12 more variables: location.postcode , login.username
, login.password , login.salt , login.md5 ,
#   login.sha1 , login.sha256 , id.name , id.value ,
picture.large , picture.medium ,
#   picture.thumbnail 
> val_end <- val_tmp$name.first
>
> # Como ejemplo elijo los 10 primeros de esos nombres.
> my_lista <- val_end[1:10]
> my_lista
 [1] "angeles"   "esther""eva"   "sandra""veronica"
"alejandra" "irene" "lidia" "vanesa""mercedes"
>
> # Hago efectiva la comparación.
> library(stringr)
> res_coincide <- str_match_all(val_end, my_lista)
> res_end <- table(unlist(res_coincide))
> res_end

alejandra   angelesesther   eva irene lidia  mercedes
sandravanesa  veronica
2 3 3 1 2 1 1
   3 2 1
>
#---


Gracias,
Carlos.

El 22 de mayo de 2018, 18:45, Miriam Alzate 
escribió:

> Buenas tardes,
>
> Tengo una lista de 600 palabras. Quiero saber cuántas de esas palabras
> aparecen en cada observación de mi variable "texto". La variable "texto" es
> de tipo caracter. ¿Cómo lo haríais?
>
> Muchas gracias.
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] Pasar palabras de una lista a una variable del dataframe

2018-05-22 Por tema Miriam Alzate

Buenas tardes,

Tengo una lista de 600 palabras. Quiero saber cuántas de esas palabras 
aparecen en cada observación de mi variable "texto". La variable "texto" 
es de tipo caracter. ¿Cómo lo haríais?


Muchas gracias.

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es