Hola, buenas tardes,
Estoy usando *rvest* para hacer webscraping y me surge una duda con el
siguiente codigo:
*x <- '<h2>Alerta Cobra <span class="title">(Alarm für Cobra 11 - Die
Autobahnpolizei)</span>\n</h2>'*
*x %>% read_html() %>% html_nodes(xpath = "//h2")*
Me gustaria quedarme con lo que contiene el tag *h2*, pero quitando *span*.
En este ejemplo seria solo *Alerta Cobra. *He probado usando los
típicos operadores como *!* o *:not(span)*, pero no ha resultado bien.
Una orientación de como hacerlo me vendría bien, muchas gracias de antemano.
--
Rubén.
[[alternative HTML version deleted]]
_______________________________________________
R-help-es mailing list
[email protected]
https://stat.ethz.ch/mailman/listinfo/r-help-es