Re: [R-es] help: boxplot multivariables

2019-09-24 Por tema Dario Manzoli via R-help-es
Hola Lorena:

Fijate si con el siguiente script podes realizar lo que estás buscando.



library(reshape2)# en este paquete esta la función melt

ldatos1<-melt(ldatos) # a partir de la base de datos ldatos, y con la función 
melt, se transformaron los nombres de las columnas en una nueva variable 
llamada “variable”.



library(dplyr) #este paquete es para manipular la base de datos

library(ggplot2)



ldatos1%>%

  filter(variable%in%c("Z1","Z2","Z3","Z4"))%>% #aquí estoy comparando las 4 
categorías de la variable #“variable”

  ggplot(.,aes(Ep,value,color=variable))+ #a través del argumento 
color=variable, podes comparar #gráficamente  distintas categorías a un mismo 
nivel de Ep.

  geom_boxplot()



Bueno, espero que se entienda y que sea, al menos en parte, el resultado que 
estás buscando.



Saludos

Darío



De: R-help-es [mailto:r-help-es-boun...@r-project.org] En nombre de Lorena 
Saavedra Aracena
Enviado el: martes, 24 de septiembre de 2019 20:57
Para: Diego Martín 
CC: r-help-es@r-project.org
Asunto: Re: [R-es] help: boxplot multivariables



Gracias Diego, que bello.
En realidad no es lo que quería hacer pero de todas formas tu script me sirve 
para mejorar mis gráficos, sobretodo el anterior para poner los gráficos juntos 
(lo había intentado sin éxito también).

Estoy dudando un poco ahora de si es correcto hacer lo de poder comparar, o si 
tengo mis datos bien ordenados para esto.

en mi mente es algo así (en paint ja):





Lo del punto muestral son los valores que están dentro de las columnas GS y GI 
respectivamente, i.e. cuántas veces sucede ese comportamiento. ¿Debiera crear 
una nueva columna q los contenga a ambos?

Avanzaré mientras con emparejar mis gráficos con los pasos que me dijiste.
Gracias nuevamente



El mar., 24 sept. 2019 a las 16:53, Diego Martín (mailto:ako.siste...@gmail.com> >) escribió:

Hola Lorena:



Lo prometido es deuda. Dije que miraría si iba este asunto:



ggplot(data = dLSaa,

   aes(x = factor(AA), y = AD, colour = factor(AA))) +

  geom_boxplot() +

  xlab( "AA" ) +

  ylab( "AD" ) +

  labs(colour = "Leyenda") +

  ggtitle(label = "Comparación de AD frente a AA")



   Y este es el resultado:





¿Te sirve así?.

 Saludos.








--

Lorena Saavedra A.
Ing. Recursos Naturales Renovables

+56 9 9880 2972



--
El software de antivirus Avast ha analizado este correo electrónico en busca de 
virus.
https://www.avast.com/antivirus
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Consulta

2019-09-24 Por tema Emilio L. Cano
No es un error: es un warning. Es posible que los haya instalado. Comprueba en 
la pestaña “Packages” del panel inferior derecho de RStudio si están 
instalados. Si no, instala como te indica Carlos.

Saludos,
Emilio

> El 24 sept 2019, a las 17:58, BERENICE DOMINGUEZ SANCHEZ 
>  escribió:
> 
> Carlos-Emilio
> 
> Una pregunta porque ahora me solicita eso ¿será que yo le modifique un 
> parámetro ?
> 
> Saludos
> 
> De: Carlos Ortega  >
> Enviado: martes, 24 de septiembre de 2019 10:44 a. m.
> Para: BERENICE DOMINGUEZ SANCHEZ 
> CC: Emilio L. Cano ; Lista R 
> Asunto: Re: [R-es] Consulta
>  
> Hola,
> En Windows, tienes que instalarte una aplicación que permitirá compilar los 
> paquetes...
> 
> Esta aplicación se llama "RTools" y la puedes conseguir aquí:
> https://cran.r-project.org/bin/windows/Rtools/ 
> 
> 
> Instala la versión 34...
> 
> Gracias,
> Carlos Ortega
> www.qualityexcellence.es 
> 
> El mar., 24 sept. 2019 a las 17:42, BERENICE DOMINGUEZ SANCHEZ 
> (mailto:ds_b...@hotmail.com>>) escribió:
> Emilio
> 
> Ahora cuando quiero instalar los paquetes pdftools, magick y otros más me 
> salen
> el siguiente error
> 
> 
> WARNING: Rtools is required to build R packages but is not currently 
> installed. Please download and install the appropriate version of Rtools 
> before proceeding:
> 
> https://cran.rstudio.com/bin/windows/Rtools/ 
> 
> Installing package into ‘C:/Users/bdominguez/Documents/R/win-library/3.6’
> (as ‘lib’ is unspecified)
> trying URL 'https://cran.rstudio.com/bin/windows/contrib/3.6/magick_2.2.zip 
> '
> Content type 'application/zip' length 20112845 bytes (19.2 MB)
> downloaded 19.2 MB
> 
> package ‘magick’ successfully unpacked and MD5 sums checked
> 
> The downloaded binary packages are in
> C:\Users\bdominguez\AppData\Local\Temp\RtmpsrfGjz\downloaded_packages
> 
> 
> 
> 
> 
> De: Emilio L. Cano mailto:emilopezc...@gmail.com>>
> Enviado: martes, 24 de septiembre de 2019 10:19 a. m.
> Para: BERENICE DOMINGUEZ SANCHEZ  >
> CC: Lista R mailto:r-help-es@r-project.org>>
> Asunto: Re: [R-es] Consulta
> 
> Hola,
> Estos mensajes de error no son por el paquete pdftools. Las funciones 
> image_read_pdf e image_ocr son del paquete magick. ¿Lo tienes instalado? ¿Lo 
> tienes cargado? Según el script sí, pero asegúrate de que library(magick) no 
> da ningún error.
> La otra función “str_split” es del paquete stringr, pasa lo mismo: tiene que 
> estar cargado para poder utilizar sus funciones.
> 
> Saludos,
> Emilio
> 
> El 24 sept 2019, a las 16:20, BERENICE DOMINGUEZ SANCHEZ   >> escribió:
> 
> Emilio
> 
> Buen día, si me manda un error muy especifico que no reconoce una función de 
> pdftools
> 
> 
> 
> Adjunto el archivo, respecto a la versión fue solo una hipótesis
> 
> Hice dos cosas:
> 
> Lo volví a instalar pero no tuve éxito, adjunto archivo.
> 
> Saludos.
> 
> 
> 
> De: Emilio L. Cano   >>
> Enviado: lunes, 23 de septiembre de 2019 11:56 p. m.
> Para: BERENICE DOMINGUEZ SANCHEZ   >>
> CC: Lista R   >>
> Asunto: Re: [R-es] Consulta
> 
> Hola Berenice,
> 
> ¿Qué quires decir con que no reconoce el paquete? ¿Te da algún mensaje de 
> error?
> No sé si has probado a instalar de nuevo el paquete, si no hazlo.
> 
> Para poder reproducir el error con tu código haría falta alguno de los pdfs 
> que utilizas (puedes compartir un enlace a dropbox o similar).
> 
> Un saludo,
> Emilio
> 
> > El 24 sept 2019, a las 1:49, BERENICE DOMINGUEZ SANCHEZ 
> >  >  > >> escribió:
> >
> > Buenas tarde a todo@s:
> >
> > Tenia la versión de R 3.6 y utilizaba la paquetería de pdftools para 
> > extraer información de archivos en pdf actualice la versión 3.6.1 y ya no 
> > reconoce la paquetería alguien que me pueda ayudar. Prácticamente no 
> > reconoce las funciones de pdftools
> >
> > library(pdftools)
> > library(stringr)​
> > library(NLP)​
> > library(tm)​
> > library(tesseract)​
> > library(magick)​
> > install.packages("magick")​
> > install.packages("pdftools")​
> > ​
> > txt <- system.file("texts", "txt", package = "tm")​
> > ​
> > rfc_rg <- "([A-Z]{3,})([0-9]{6})([A-Z]|[0-9]){0,3}"​
> > #poliza_rg <- 
> > "(34|36|37|39)(ME|MEC|CH|MB|TF|GI|VE|TS|IM|ER|VE)*([0-9]{6,})[-]([0-9]){2}[-][A-Z]"​
> > poliza_rg <- "(ME|CH|MB|TF|GI|gi|VE|TS|IM|E

Re: [R-es] Consulta

2019-09-24 Por tema BERENICE DOMINGUEZ SANCHEZ
Carlos-Emilio

Una pregunta porque ahora me solicita eso ¿será que yo le modifique un 
parámetro ?

Saludos


De: Carlos Ortega 
Enviado: martes, 24 de septiembre de 2019 10:44 a. m.
Para: BERENICE DOMINGUEZ SANCHEZ 
CC: Emilio L. Cano ; Lista R 
Asunto: Re: [R-es] Consulta

Hola,
En Windows, tienes que instalarte una aplicación que permitirá compilar los 
paquetes...

Esta aplicación se llama "RTools" y la puedes conseguir aquí:
https://cran.r-project.org/bin/windows/Rtools/

Instala la versión 34...

Gracias,
Carlos Ortega
www.qualityexcellence.es

El mar., 24 sept. 2019 a las 17:42, BERENICE DOMINGUEZ SANCHEZ 
(mailto:ds_b...@hotmail.com>>) escribió:
Emilio

Ahora cuando quiero instalar los paquetes pdftools, magick y otros más me salen
el siguiente error


WARNING: Rtools is required to build R packages but is not currently installed. 
Please download and install the appropriate version of Rtools before proceeding:

https://cran.rstudio.com/bin/windows/Rtools/
Installing package into ‘C:/Users/bdominguez/Documents/R/win-library/3.6’
(as ‘lib’ is unspecified)
trying URL 'https://cran.rstudio.com/bin/windows/contrib/3.6/magick_2.2.zip'
Content type 'application/zip' length 20112845 bytes (19.2 MB)
downloaded 19.2 MB

package ‘magick’ successfully unpacked and MD5 sums checked

The downloaded binary packages are in
C:\Users\bdominguez\AppData\Local\Temp\RtmpsrfGjz\downloaded_packages





De: Emilio L. Cano mailto:emilopezc...@gmail.com>>
Enviado: martes, 24 de septiembre de 2019 10:19 a. m.
Para: BERENICE DOMINGUEZ SANCHEZ 
mailto:ds_b...@hotmail.com>>
CC: Lista R mailto:r-help-es@r-project.org>>
Asunto: Re: [R-es] Consulta

Hola,
Estos mensajes de error no son por el paquete pdftools. Las funciones 
image_read_pdf e image_ocr son del paquete magick. ¿Lo tienes instalado? ¿Lo 
tienes cargado? Según el script sí, pero asegúrate de que library(magick) no da 
ningún error.
La otra función “str_split” es del paquete stringr, pasa lo mismo: tiene que 
estar cargado para poder utilizar sus funciones.

Saludos,
Emilio

El 24 sept 2019, a las 16:20, BERENICE DOMINGUEZ SANCHEZ 
mailto:ds_b...@hotmail.com>>>
 escribió:

Emilio

Buen día, si me manda un error muy especifico que no reconoce una función de 
pdftools



Adjunto el archivo, respecto a la versión fue solo una hipótesis

Hice dos cosas:

Lo volví a instalar pero no tuve éxito, adjunto archivo.

Saludos.



De: Emilio L. Cano 
mailto:emilopezc...@gmail.com>>>
Enviado: lunes, 23 de septiembre de 2019 11:56 p. m.
Para: BERENICE DOMINGUEZ SANCHEZ 
mailto:ds_b...@hotmail.com>>>
CC: Lista R 
mailto:r-help-es@r-project.org>>>
Asunto: Re: [R-es] Consulta

Hola Berenice,

¿Qué quires decir con que no reconoce el paquete? ¿Te da algún mensaje de error?
No sé si has probado a instalar de nuevo el paquete, si no hazlo.

Para poder reproducir el error con tu código haría falta alguno de los pdfs que 
utilizas (puedes compartir un enlace a dropbox o similar).

Un saludo,
Emilio

> El 24 sept 2019, a las 1:49, BERENICE DOMINGUEZ SANCHEZ 
> mailto:ds_b...@hotmail.com>>>
>  escribió:
>
> Buenas tarde a todo@s:
>
> Tenia la versión de R 3.6 y utilizaba la paquetería de pdftools para extraer 
> información de archivos en pdf actualice la versión 3.6.1 y ya no reconoce la 
> paquetería alguien que me pueda ayudar. Prácticamente no reconoce las 
> funciones de pdftools
>
> library(pdftools)
> library(stringr)​
> library(NLP)​
> library(tm)​
> library(tesseract)​
> library(magick)​
> install.packages("magick")​
> install.packages("pdftools")​
> ​
> txt <- system.file("texts", "txt", package = "tm")​
> ​
> rfc_rg <- "([A-Z]{3,})([0-9]{6})([A-Z]|[0-9]){0,3}"​
> #poliza_rg <- 
> "(34|36|37|39)(ME|MEC|CH|MB|TF|GI|VE|TS|IM|ER|VE)*([0-9]{6,})[-]([0-9]){2}[-][A-Z]"​
> poliza_rg <- "(ME|CH|MB|TF|GI|gi|VE|TS|IM|ER|VE)*([0-9]{8,})[-]([0-9]){2}"​
> registro_rg <- "(CNSF-H0711-)([0-9]{4})[- ]([0-9]){4}"​
> subgrupo_rg <- "_([0-9]){1,3}."​
> mon_rg <- "SMGM|UMAM|MN"​
> ​
> ​
> ruta <- 'C:/Users/bdominguez/Documents/H0711/Bond/1909/'​
> archivos<-list.files(path=ruta,pattern = '*.pdf')​
> ​
> ​
> imagen <- image_read_pdf(path=paste(ruta,"/",nombre,".pdf",sep=""))​
> prueba <-image_ocr(imagen, language = 'eng')​
> lineas<-unlist(str_split(prueba,pattern = "\n"))​
> lineasp<-unlist(str_split(prueba[2],pattern = "\r\n"))​
> ​
> newnom <- NULL​
> renglones <- NULL​
> for (nombre in archivos){​
>  subgrupo <- str_extract(str_extract(nombre,pattern = subgrupo_rg),pattern = 
> "[0-9]{1,3}")​
>  imagen <- image_read_pdf(path=paste(ruta,"/",nombre,".pdf",sep=""))​
>  prueba <-imag

Re: [R-es] Consulta

2019-09-24 Por tema Carlos Ortega
La secuencia de instalación que haría sería esta:
1. RTools.
2. R.
3. RStudio.

Si no te crea mucho problema... desinstala todo y vuelve a instalar en este
orden...

Gracias,
Carlos Ortega
www.qualityexcellence.es

El mar., 24 sept. 2019 a las 17:58, BERENICE DOMINGUEZ SANCHEZ (<
ds_b...@hotmail.com>) escribió:

> Carlos-Emilio
>
> Una pregunta porque ahora me solicita eso ¿será que yo le modifique un
> parámetro ?
>
> Saludos
>
> --
> *De:* Carlos Ortega 
> *Enviado:* martes, 24 de septiembre de 2019 10:44 a. m.
> *Para:* BERENICE DOMINGUEZ SANCHEZ 
> *CC:* Emilio L. Cano ; Lista R <
> r-help-es@r-project.org>
> *Asunto:* Re: [R-es] Consulta
>
> Hola,
> En Windows, tienes que instalarte una aplicación que permitirá compilar
> los paquetes...
>
> Esta aplicación se llama "RTools" y la puedes conseguir aquí:
> https://cran.r-project.org/bin/windows/Rtools/
>
> Instala la versión 34...
>
> Gracias,
> Carlos Ortega
> www.qualityexcellence.es
>
> El mar., 24 sept. 2019 a las 17:42, BERENICE DOMINGUEZ SANCHEZ (<
> ds_b...@hotmail.com>) escribió:
>
> Emilio
>
> Ahora cuando quiero instalar los paquetes pdftools, magick y otros más me
> salen
> el siguiente error
>
>
> WARNING: Rtools is required to build R packages but is not currently
> installed. Please download and install the appropriate version of Rtools
> before proceeding:
>
> https://cran.rstudio.com/bin/windows/Rtools/
> Installing package into ‘C:/Users/bdominguez/Documents/R/win-library/3.6’
> (as ‘lib’ is unspecified)
> trying URL '
> https://cran.rstudio.com/bin/windows/contrib/3.6/magick_2.2.zip'
> Content type 'application/zip' length 20112845 bytes (19.2 MB)
> downloaded 19.2 MB
>
> package ‘magick’ successfully unpacked and MD5 sums checked
>
> The downloaded binary packages are in
>
> C:\Users\bdominguez\AppData\Local\Temp\RtmpsrfGjz\downloaded_packages
>
>
>
>
> 
> De: Emilio L. Cano 
> Enviado: martes, 24 de septiembre de 2019 10:19 a. m.
> Para: BERENICE DOMINGUEZ SANCHEZ 
> CC: Lista R 
> Asunto: Re: [R-es] Consulta
>
> Hola,
> Estos mensajes de error no son por el paquete pdftools. Las funciones
> image_read_pdf e image_ocr son del paquete magick. ¿Lo tienes instalado?
> ¿Lo tienes cargado? Según el script sí, pero asegúrate de que
> library(magick) no da ningún error.
> La otra función “str_split” es del paquete stringr, pasa lo mismo: tiene
> que estar cargado para poder utilizar sus funciones.
>
> Saludos,
> Emilio
>
> El 24 sept 2019, a las 16:20, BERENICE DOMINGUEZ SANCHEZ <
> ds_b...@hotmail.com> escribió:
>
> Emilio
>
> Buen día, si me manda un error muy especifico que no reconoce una función
> de pdftools
>
> 
>
> Adjunto el archivo, respecto a la versión fue solo una hipótesis
>
> Hice dos cosas:
>
> Lo volví a instalar pero no tuve éxito, adjunto archivo.
>
> Saludos.
>
>
> 
> De: Emilio L. Cano mailto:emilopezc...@gmail.com>>
> Enviado: lunes, 23 de septiembre de 2019 11:56 p. m.
> Para: BERENICE DOMINGUEZ SANCHEZ  ds_b...@hotmail.com>>
> CC: Lista R mailto:r-help-es@r-project.org>>
> Asunto: Re: [R-es] Consulta
>
> Hola Berenice,
>
> ¿Qué quires decir con que no reconoce el paquete? ¿Te da algún mensaje de
> error?
> No sé si has probado a instalar de nuevo el paquete, si no hazlo.
>
> Para poder reproducir el error con tu código haría falta alguno de los
> pdfs que utilizas (puedes compartir un enlace a dropbox o similar).
>
> Un saludo,
> Emilio
>
> > El 24 sept 2019, a las 1:49, BERENICE DOMINGUEZ SANCHEZ <
> ds_b...@hotmail.com> escribió:
> >
> > Buenas tarde a todo@s:
> >
> > Tenia la versión de R 3.6 y utilizaba la paquetería de pdftools para
> extraer información de archivos en pdf actualice la versión 3.6.1 y ya no
> reconoce la paquetería alguien que me pueda ayudar. Prácticamente no
> reconoce las funciones de pdftools
> >
> > library(pdftools)
> > library(stringr)​
> > library(NLP)​
> > library(tm)​
> > library(tesseract)​
> > library(magick)​
> > install.packages("magick")​
> > install.packages("pdftools")​
> > ​
> > txt <- system.file("texts", "txt", package = "tm")​
> > ​
> > rfc_rg <- "([A-Z]{3,})([0-9]{6})([A-Z]|[0-9]){0,3}"​
> > #poliza_rg <-
> "(34|36|37|39)(ME|MEC|CH|MB|TF|GI|VE|TS|IM|ER|VE)*([0-9]{6,})[-]([0-9]){2}[-][A-Z]"​
> > poliza_rg <-
> "(ME|CH|MB|TF|GI|gi|VE|TS|IM|ER|VE)*([0-9]{8,})[-]([0-9]){2}"​
> > registro_rg <- "(CNSF-H0711-)([0-9]{4})[- ]([0-9]){4}"​
> > subgrupo_rg <- "_([0-9]){1,3}."​
> > mon_rg <- "SMGM|UMAM|MN"​
> > ​
> > ​
> > ruta <- 'C:/Users/bdominguez/Documents/H0711/Bond/1909/'​
> > archivos<-list.files(path=ruta,pattern = '*.pdf')​
> > ​
> > ​
> > imagen <- image_read_pdf(path=paste(ruta,"/",nombre,".pdf",sep=""))​
> > prueba <-image_ocr(imagen, language = 'eng')​
> > lineas<-unlist(str_split(prueba,pattern = "\n"))​
> > lineasp<-unlist(str_split(prueba[2],pattern = "\r\n"))​
> > ​
> > newnom <- NULL​
> > renglones <- NULL​
> > for (nombr

Re: [R-es] Consulta

2019-09-24 Por tema Carlos Ortega
Hola,
En Windows, tienes que instalarte una aplicación que permitirá compilar los
paquetes...

Esta aplicación se llama "RTools" y la puedes conseguir aquí:
https://cran.r-project.org/bin/windows/Rtools/

Instala la versión 34...

Gracias,
Carlos Ortega
www.qualityexcellence.es

El mar., 24 sept. 2019 a las 17:42, BERENICE DOMINGUEZ SANCHEZ (<
ds_b...@hotmail.com>) escribió:

> Emilio
>
> Ahora cuando quiero instalar los paquetes pdftools, magick y otros más me
> salen
> el siguiente error
>
>
> WARNING: Rtools is required to build R packages but is not currently
> installed. Please download and install the appropriate version of Rtools
> before proceeding:
>
> https://cran.rstudio.com/bin/windows/Rtools/
> Installing package into ‘C:/Users/bdominguez/Documents/R/win-library/3.6’
> (as ‘lib’ is unspecified)
> trying URL '
> https://cran.rstudio.com/bin/windows/contrib/3.6/magick_2.2.zip'
> Content type 'application/zip' length 20112845 bytes (19.2 MB)
> downloaded 19.2 MB
>
> package ‘magick’ successfully unpacked and MD5 sums checked
>
> The downloaded binary packages are in
>
> C:\Users\bdominguez\AppData\Local\Temp\RtmpsrfGjz\downloaded_packages
>
>
>
>
> 
> De: Emilio L. Cano 
> Enviado: martes, 24 de septiembre de 2019 10:19 a. m.
> Para: BERENICE DOMINGUEZ SANCHEZ 
> CC: Lista R 
> Asunto: Re: [R-es] Consulta
>
> Hola,
> Estos mensajes de error no son por el paquete pdftools. Las funciones
> image_read_pdf e image_ocr son del paquete magick. ¿Lo tienes instalado?
> ¿Lo tienes cargado? Según el script sí, pero asegúrate de que
> library(magick) no da ningún error.
> La otra función “str_split” es del paquete stringr, pasa lo mismo: tiene
> que estar cargado para poder utilizar sus funciones.
>
> Saludos,
> Emilio
>
> El 24 sept 2019, a las 16:20, BERENICE DOMINGUEZ SANCHEZ <
> ds_b...@hotmail.com> escribió:
>
> Emilio
>
> Buen día, si me manda un error muy especifico que no reconoce una función
> de pdftools
>
> 
>
> Adjunto el archivo, respecto a la versión fue solo una hipótesis
>
> Hice dos cosas:
>
> Lo volví a instalar pero no tuve éxito, adjunto archivo.
>
> Saludos.
>
>
> 
> De: Emilio L. Cano mailto:emilopezc...@gmail.com>>
> Enviado: lunes, 23 de septiembre de 2019 11:56 p. m.
> Para: BERENICE DOMINGUEZ SANCHEZ  ds_b...@hotmail.com>>
> CC: Lista R mailto:r-help-es@r-project.org>>
> Asunto: Re: [R-es] Consulta
>
> Hola Berenice,
>
> ¿Qué quires decir con que no reconoce el paquete? ¿Te da algún mensaje de
> error?
> No sé si has probado a instalar de nuevo el paquete, si no hazlo.
>
> Para poder reproducir el error con tu código haría falta alguno de los
> pdfs que utilizas (puedes compartir un enlace a dropbox o similar).
>
> Un saludo,
> Emilio
>
> > El 24 sept 2019, a las 1:49, BERENICE DOMINGUEZ SANCHEZ <
> ds_b...@hotmail.com> escribió:
> >
> > Buenas tarde a todo@s:
> >
> > Tenia la versión de R 3.6 y utilizaba la paquetería de pdftools para
> extraer información de archivos en pdf actualice la versión 3.6.1 y ya no
> reconoce la paquetería alguien que me pueda ayudar. Prácticamente no
> reconoce las funciones de pdftools
> >
> > library(pdftools)
> > library(stringr)​
> > library(NLP)​
> > library(tm)​
> > library(tesseract)​
> > library(magick)​
> > install.packages("magick")​
> > install.packages("pdftools")​
> > ​
> > txt <- system.file("texts", "txt", package = "tm")​
> > ​
> > rfc_rg <- "([A-Z]{3,})([0-9]{6})([A-Z]|[0-9]){0,3}"​
> > #poliza_rg <-
> "(34|36|37|39)(ME|MEC|CH|MB|TF|GI|VE|TS|IM|ER|VE)*([0-9]{6,})[-]([0-9]){2}[-][A-Z]"​
> > poliza_rg <-
> "(ME|CH|MB|TF|GI|gi|VE|TS|IM|ER|VE)*([0-9]{8,})[-]([0-9]){2}"​
> > registro_rg <- "(CNSF-H0711-)([0-9]{4})[- ]([0-9]){4}"​
> > subgrupo_rg <- "_([0-9]){1,3}."​
> > mon_rg <- "SMGM|UMAM|MN"​
> > ​
> > ​
> > ruta <- 'C:/Users/bdominguez/Documents/H0711/Bond/1909/'​
> > archivos<-list.files(path=ruta,pattern = '*.pdf')​
> > ​
> > ​
> > imagen <- image_read_pdf(path=paste(ruta,"/",nombre,".pdf",sep=""))​
> > prueba <-image_ocr(imagen, language = 'eng')​
> > lineas<-unlist(str_split(prueba,pattern = "\n"))​
> > lineasp<-unlist(str_split(prueba[2],pattern = "\r\n"))​
> > ​
> > newnom <- NULL​
> > renglones <- NULL​
> > for (nombre in archivos){​
> >  subgrupo <- str_extract(str_extract(nombre,pattern =
> subgrupo_rg),pattern = "[0-9]{1,3}")​
> >  imagen <- image_read_pdf(path=paste(ruta,"/",nombre,".pdf",sep=""))​
> >  prueba <-image_ocr(imagen, language = 'eng')​
> >  lineas<-unlist(str_split(prueba,pattern = "\n"))​
> >  poliza <- NULL​
> >  poliza<-str_extract(lineas[1],poliza_rg)​
> >  newnom <- c(newnom,paste(poliza[1],substr(nombre,5,6),".pdf",sep=''))​
> >  ​
> >  registro <- NULL​
> >  registro<-str_extract(lineas[49],registro_rg)​
> >  ​
> >  rfc <- NULL​
> >  rfc <- str_extract(lineas[5],rfc_rg)​
> >  ​
> >  ​
> >  #lineasnew<-unlist(str_split(lineas[2],pattern = "\r\n"))​
> >  #lineasdosnew<-unlist(str_split(line

Re: [R-es] Consulta

2019-09-24 Por tema BERENICE DOMINGUEZ SANCHEZ
Emilio

Ahora cuando quiero instalar los paquetes pdftools, magick y otros más me salen
el siguiente error


WARNING: Rtools is required to build R packages but is not currently installed. 
Please download and install the appropriate version of Rtools before proceeding:

https://cran.rstudio.com/bin/windows/Rtools/
Installing package into ‘C:/Users/bdominguez/Documents/R/win-library/3.6’
(as ‘lib’ is unspecified)
trying URL 'https://cran.rstudio.com/bin/windows/contrib/3.6/magick_2.2.zip'
Content type 'application/zip' length 20112845 bytes (19.2 MB)
downloaded 19.2 MB

package ‘magick’ successfully unpacked and MD5 sums checked

The downloaded binary packages are in
C:\Users\bdominguez\AppData\Local\Temp\RtmpsrfGjz\downloaded_packages





De: Emilio L. Cano 
Enviado: martes, 24 de septiembre de 2019 10:19 a. m.
Para: BERENICE DOMINGUEZ SANCHEZ 
CC: Lista R 
Asunto: Re: [R-es] Consulta

Hola,
Estos mensajes de error no son por el paquete pdftools. Las funciones 
image_read_pdf e image_ocr son del paquete magick. ¿Lo tienes instalado? ¿Lo 
tienes cargado? Según el script sí, pero asegúrate de que library(magick) no da 
ningún error.
La otra función “str_split” es del paquete stringr, pasa lo mismo: tiene que 
estar cargado para poder utilizar sus funciones.

Saludos,
Emilio

El 24 sept 2019, a las 16:20, BERENICE DOMINGUEZ SANCHEZ 
mailto:ds_b...@hotmail.com>> escribió:

Emilio

Buen día, si me manda un error muy especifico que no reconoce una función de 
pdftools



Adjunto el archivo, respecto a la versión fue solo una hipótesis

Hice dos cosas:

Lo volví a instalar pero no tuve éxito, adjunto archivo.

Saludos.



De: Emilio L. Cano mailto:emilopezc...@gmail.com>>
Enviado: lunes, 23 de septiembre de 2019 11:56 p. m.
Para: BERENICE DOMINGUEZ SANCHEZ 
mailto:ds_b...@hotmail.com>>
CC: Lista R mailto:r-help-es@r-project.org>>
Asunto: Re: [R-es] Consulta

Hola Berenice,

¿Qué quires decir con que no reconoce el paquete? ¿Te da algún mensaje de error?
No sé si has probado a instalar de nuevo el paquete, si no hazlo.

Para poder reproducir el error con tu código haría falta alguno de los pdfs que 
utilizas (puedes compartir un enlace a dropbox o similar).

Un saludo,
Emilio

> El 24 sept 2019, a las 1:49, BERENICE DOMINGUEZ SANCHEZ 
> mailto:ds_b...@hotmail.com>> escribió:
>
> Buenas tarde a todo@s:
>
> Tenia la versión de R 3.6 y utilizaba la paquetería de pdftools para extraer 
> información de archivos en pdf actualice la versión 3.6.1 y ya no reconoce la 
> paquetería alguien que me pueda ayudar. Prácticamente no reconoce las 
> funciones de pdftools
>
> library(pdftools)
> library(stringr)​
> library(NLP)​
> library(tm)​
> library(tesseract)​
> library(magick)​
> install.packages("magick")​
> install.packages("pdftools")​
> ​
> txt <- system.file("texts", "txt", package = "tm")​
> ​
> rfc_rg <- "([A-Z]{3,})([0-9]{6})([A-Z]|[0-9]){0,3}"​
> #poliza_rg <- 
> "(34|36|37|39)(ME|MEC|CH|MB|TF|GI|VE|TS|IM|ER|VE)*([0-9]{6,})[-]([0-9]){2}[-][A-Z]"​
> poliza_rg <- "(ME|CH|MB|TF|GI|gi|VE|TS|IM|ER|VE)*([0-9]{8,})[-]([0-9]){2}"​
> registro_rg <- "(CNSF-H0711-)([0-9]{4})[- ]([0-9]){4}"​
> subgrupo_rg <- "_([0-9]){1,3}."​
> mon_rg <- "SMGM|UMAM|MN"​
> ​
> ​
> ruta <- 'C:/Users/bdominguez/Documents/H0711/Bond/1909/'​
> archivos<-list.files(path=ruta,pattern = '*.pdf')​
> ​
> ​
> imagen <- image_read_pdf(path=paste(ruta,"/",nombre,".pdf",sep=""))​
> prueba <-image_ocr(imagen, language = 'eng')​
> lineas<-unlist(str_split(prueba,pattern = "\n"))​
> lineasp<-unlist(str_split(prueba[2],pattern = "\r\n"))​
> ​
> newnom <- NULL​
> renglones <- NULL​
> for (nombre in archivos){​
>  subgrupo <- str_extract(str_extract(nombre,pattern = subgrupo_rg),pattern = 
> "[0-9]{1,3}")​
>  imagen <- image_read_pdf(path=paste(ruta,"/",nombre,".pdf",sep=""))​
>  prueba <-image_ocr(imagen, language = 'eng')​
>  lineas<-unlist(str_split(prueba,pattern = "\n"))​
>  poliza <- NULL​
>  poliza<-str_extract(lineas[1],poliza_rg)​
>  newnom <- c(newnom,paste(poliza[1],substr(nombre,5,6),".pdf",sep=''))​
>  ​
>  registro <- NULL​
>  registro<-str_extract(lineas[49],registro_rg)​
>  ​
>  rfc <- NULL​
>  rfc <- str_extract(lineas[5],rfc_rg)​
>  ​
>  ​
>  #lineasnew<-unlist(str_split(lineas[2],pattern = "\r\n"))​
>  #lineasdosnew<-unlist(str_split(lineas[1],pattern = "\r\n"))​
>  ​
>  cobertura <- NA​
>  extranjera <- NA​
>  suma_str   <- NA​
>  deducible_str <- NA​
>  ​
>  suma <- NA​
>  coaseguro <- NA​
>  deducible <- NA​
>  tope <- NA​
>  mon <- NA​
>  mondedu <- NA​
>  ​
>  cobertura  <- grep("Cobertura en el Extranjero",lineas,value=TRUE)​
>  extranjera <- grep("Emergencia en el Extranjero",lineas,value=TRUE)​
>  suma_str   <- grep("SUMA ASEGURADA:",lineas,value=TRUE)​
>  deducible_str   <- grep("DEDUCIBLE:",lineas,value=TRUE)​
>  sumacob <- NA​
>  sumaext <- NA​
>  ​
>  pprimaria <- grep("Numero de Póliza:", lineas, value = TRUE)​
>  dnprimariaa <- grep("Nombre de la Aseguradora

Re: [R-es] Consulta

2019-09-24 Por tema Emilio L. Cano
Hola,
Estos mensajes de error no son por el paquete pdftools. Las funciones 
image_read_pdf e image_ocr son del paquete magick. ¿Lo tienes instalado? ¿Lo 
tienes cargado? Según el script sí, pero asegúrate de que library(magick) no da 
ningún error.
La otra función “str_split” es del paquete stringr, pasa lo mismo: tiene que 
estar cargado para poder utilizar sus funciones.

Saludos,
Emilio

> El 24 sept 2019, a las 16:20, BERENICE DOMINGUEZ SANCHEZ 
>  escribió:
> 
> Emilio
> 
> Buen día, si me manda un error muy especifico que no reconoce una función de 
> pdftools
> 
> 
> 
> Adjunto el archivo, respecto a la versión fue solo una hipótesis
> 
> Hice dos cosas:
> 
> Lo volví a instalar pero no tuve éxito, adjunto archivo.
> 
> Saludos.
>   
> 
> De: Emilio L. Cano mailto:emilopezc...@gmail.com>>
> Enviado: lunes, 23 de septiembre de 2019 11:56 p. m.
> Para: BERENICE DOMINGUEZ SANCHEZ 
> CC: Lista R 
> Asunto: Re: [R-es] Consulta
>  
> Hola Berenice,
> 
> ¿Qué quires decir con que no reconoce el paquete? ¿Te da algún mensaje de 
> error?
> No sé si has probado a instalar de nuevo el paquete, si no hazlo.
> 
> Para poder reproducir el error con tu código haría falta alguno de los pdfs 
> que utilizas (puedes compartir un enlace a dropbox o similar).
> 
> Un saludo,
> Emilio
> 
> > El 24 sept 2019, a las 1:49, BERENICE DOMINGUEZ SANCHEZ 
> >  escribió:
> > 
> > Buenas tarde a todo@s:
> > 
> > Tenia la versión de R 3.6 y utilizaba la paquetería de pdftools para 
> > extraer información de archivos en pdf actualice la versión 3.6.1 y ya no 
> > reconoce la paquetería alguien que me pueda ayudar. Prácticamente no 
> > reconoce las funciones de pdftools
> > 
> > library(pdftools)
> > library(stringr)​
> > library(NLP)​
> > library(tm)​
> > library(tesseract)​
> > library(magick)​
> > install.packages("magick")​
> > install.packages("pdftools")​
> > ​
> > txt <- system.file("texts", "txt", package = "tm")​
> > ​
> > rfc_rg <- "([A-Z]{3,})([0-9]{6})([A-Z]|[0-9]){0,3}"​
> > #poliza_rg <- 
> > "(34|36|37|39)(ME|MEC|CH|MB|TF|GI|VE|TS|IM|ER|VE)*([0-9]{6,})[-]([0-9]){2}[-][A-Z]"​
> > poliza_rg <- "(ME|CH|MB|TF|GI|gi|VE|TS|IM|ER|VE)*([0-9]{8,})[-]([0-9]){2}"​
> > registro_rg <- "(CNSF-H0711-)([0-9]{4})[- ]([0-9]){4}"​
> > subgrupo_rg <- "_([0-9]){1,3}."​
> > mon_rg <- "SMGM|UMAM|MN"​
> > ​
> > ​
> > ruta <- 'C:/Users/bdominguez/Documents/H0711/Bond/1909/'​
> > archivos<-list.files(path=ruta,pattern = '*.pdf')​
> > ​
> > ​
> > imagen <- image_read_pdf(path=paste(ruta,"/",nombre,".pdf",sep=""))​
> > prueba <-image_ocr(imagen, language = 'eng')​
> > lineas<-unlist(str_split(prueba,pattern = "\n"))​
> > lineasp<-unlist(str_split(prueba[2],pattern = "\r\n"))​
> > ​
> > newnom <- NULL​
> > renglones <- NULL​
> > for (nombre in archivos){​
> >  subgrupo <- str_extract(str_extract(nombre,pattern = subgrupo_rg),pattern 
> > = "[0-9]{1,3}")​
> >  imagen <- image_read_pdf(path=paste(ruta,"/",nombre,".pdf",sep=""))​
> >  prueba <-image_ocr(imagen, language = 'eng')​
> >  lineas<-unlist(str_split(prueba,pattern = "\n"))​
> >  poliza <- NULL​
> >  poliza<-str_extract(lineas[1],poliza_rg)​
> >  newnom <- c(newnom,paste(poliza[1],substr(nombre,5,6),".pdf",sep=''))​
> >  ​
> >  registro <- NULL​
> >  registro<-str_extract(lineas[49],registro_rg)​
> >  ​
> >  rfc <- NULL​
> >  rfc <- str_extract(lineas[5],rfc_rg)​
> >  ​
> >  ​
> >  #lineasnew<-unlist(str_split(lineas[2],pattern = "\r\n"))​
> >  #lineasdosnew<-unlist(str_split(lineas[1],pattern = "\r\n"))​
> >  ​
> >  cobertura <- NA​
> >  extranjera <- NA​
> >  suma_str   <- NA​
> >  deducible_str <- NA​
> >  ​
> >  suma <- NA​
> >  coaseguro <- NA​
> >  deducible <- NA​
> >  tope <- NA​
> >  mon <- NA​
> >  mondedu <- NA​
> >  ​
> >  cobertura  <- grep("Cobertura en el Extranjero",lineas,value=TRUE)​
> >  extranjera <- grep("Emergencia en el Extranjero",lineas,value=TRUE)​
> >  suma_str   <- grep("SUMA ASEGURADA:",lineas,value=TRUE)​
> >  deducible_str   <- grep("DEDUCIBLE:",lineas,value=TRUE)​
> >  sumacob <- NA​
> >  sumaext <- NA​
> >  ​
> >  pprimaria <- grep("Numero de Póliza:", lineas, value = TRUE)​
> >  dnprimariaa <- grep("Nombre de la Aseguradora Primaria:", lineas, value = 
> > TRUE)​
> >  ​
> >  #cer<- grep("Certificado No. ",lineas, value=TRUE)​
> >  #ntit<- grep("Ramo", lineas, value=TRUE)​
> >  ​
> >  sumacob<-as.numeric(str_extract(cobertura[1],pattern = "[0-9]{1,}"))​
> >  if (length(sumacob)==0){​
> >sumacob = NA​
> >  }​
> >  ​
> >  sumaext<-as.numeric(str_extract(extranjera[17],pattern = "[0-9]{1,}"))​
> >  if (length(sumaext)==0){​
> >sumaext = NA​
> >  }​
> >  valores <- NULL​
> >  monedas <- NULL​
> >  valores <- str_extract_all(suma_str[17],pattern = 
> > "[0-9]{0,3},*[0-9]{0,3},*[0-9]{1,3}(.[0-9]{1,}){0,1}",simplify=TRUE)​
> >  monedas <- str_extract(suma_str,pattern = mon_rg)​
> >  if (length(valores[1])==0){​
> >suma = NA​
> >mon = NA​
> >  }else{​
> >suma = as.numeric(gsub(pattern = ",*",replacement = "",valores[1]))​
> >mon <- as.cha

Re: [R-es] Consulta

2019-09-24 Por tema Carlos J. Gil Bellosta
Parece que la variable `nombre` no está [bien] definida. De ahí el primer
error:

Error in normalizePath(path.expand(path), winslash, mustWork) :
  path[1]="C:\Users\bdominguez\Documents\H0711\Bond\1907\2\.pdf": El
sistema no puede encontrar el archivo especificado

En cuanto al segundo,

Error in normalizePath(path.expand(path), winslash, mustWork) :

path[1]="C:\Users\bdominguez\Documents\H0711\Bond\1907\2\caratula_340007195-01-C_6158_22_07_2019_162916.
*pdf.pdf*": El sistema no puede encontrar el archivo especificad

fíjate en lo que he marcado en negritas.

El mar., 24 sept. 2019 a las 16:50, BERENICE DOMINGUEZ SANCHEZ (<
ds_b...@hotmail.com>) escribió:

> Emilio
>
> Buen día, si me manda un error muy especifico que no reconoce una función
> de pdftools
>
> > imagen <- image_read_pdf(path=paste(ruta,"/",nombre,".pdf",sep=""))
> Error in normalizePath(path.expand(path), winslash, mustWork) : ​
>   path[1]="C:\Users\bdominguez\Documents\H0711\Bond\1907\2\.pdf": El
> sistema no puede encontrar el archivo especificado​
> > prueba <-image_ocr(imagen, language = 'eng')​
> Error in assert_image(image) : object 'imagen' not found​
> > lineas<-unlist(str_split(prueba,pattern = "\n"))​
> Error in stri_split_regex(string, pattern, n = n, simplify = simplify,  : ​
>   object 'prueba' not found​
> > lineasp<-unlist(str_split(prueba[2],pattern = "\r\n"))​
> Error in stri_split_regex(string, pattern, n = n, simplify = simplify,  : ​
>   object 'prueba' not found
>
>   Error in normalizePath(path.expand(path), winslash, mustWork) :
>
> path[1]="C:\Users\bdominguez\Documents\H0711\Bond\1907\2\caratula_340007195-01-C_6158_22_07_2019_162916.pdf.pdf":
> El sistema no puede encontrar el archivo especificad​
>
>
> Adjunto el archivo, respecto a la versión fue solo una hipótesis
>
> Hice dos cosas:
>
> Lo volví a instalar pero no tuve éxito, adjunto archivo.
>
> Saludos.
>
> 
> De: Emilio L. Cano 
> Enviado: lunes, 23 de septiembre de 2019 11:56 p. m.
> Para: BERENICE DOMINGUEZ SANCHEZ 
> CC: Lista R 
> Asunto: Re: [R-es] Consulta
>
> Hola Berenice,
>
> ¿Qué quires decir con que no reconoce el paquete? ¿Te da algún mensaje de
> error?
> No sé si has probado a instalar de nuevo el paquete, si no hazlo.
>
> Para poder reproducir el error con tu código haría falta alguno de los
> pdfs que utilizas (puedes compartir un enlace a dropbox o similar).
>
> Un saludo,
> Emilio
>
> > El 24 sept 2019, a las 1:49, BERENICE DOMINGUEZ SANCHEZ <
> ds_b...@hotmail.com> escribió:
> >
> > Buenas tarde a todo@s:
> >
> > Tenia la versión de R 3.6 y utilizaba la paquetería de pdftools para
> extraer información de archivos en pdf actualice la versión 3.6.1 y ya no
> reconoce la paquetería alguien que me pueda ayudar. Prácticamente no
> reconoce las funciones de pdftools
> >
> > library(pdftools)
> > library(stringr)​
> > library(NLP)​
> > library(tm)​
> > library(tesseract)​
> > library(magick)​
> > install.packages("magick")​
> > install.packages("pdftools")​
> > ​
> > txt <- system.file("texts", "txt", package = "tm")​
> > ​
> > rfc_rg <- "([A-Z]{3,})([0-9]{6})([A-Z]|[0-9]){0,3}"​
> > #poliza_rg <-
> "(34|36|37|39)(ME|MEC|CH|MB|TF|GI|VE|TS|IM|ER|VE)*([0-9]{6,})[-]([0-9]){2}[-][A-Z]"​
> > poliza_rg <-
> "(ME|CH|MB|TF|GI|gi|VE|TS|IM|ER|VE)*([0-9]{8,})[-]([0-9]){2}"​
> > registro_rg <- "(CNSF-H0711-)([0-9]{4})[- ]([0-9]){4}"​
> > subgrupo_rg <- "_([0-9]){1,3}."​
> > mon_rg <- "SMGM|UMAM|MN"​
> > ​
> > ​
> > ruta <- 'C:/Users/bdominguez/Documents/H0711/Bond/1909/'​
> > archivos<-list.files(path=ruta,pattern = '*.pdf')​
> > ​
> > ​
> > imagen <- image_read_pdf(path=paste(ruta,"/",nombre,".pdf",sep=""))​
> > prueba <-image_ocr(imagen, language = 'eng')​
> > lineas<-unlist(str_split(prueba,pattern = "\n"))​
> > lineasp<-unlist(str_split(prueba[2],pattern = "\r\n"))​
> > ​
> > newnom <- NULL​
> > renglones <- NULL​
> > for (nombre in archivos){​
> >  subgrupo <- str_extract(str_extract(nombre,pattern =
> subgrupo_rg),pattern = "[0-9]{1,3}")​
> >  imagen <- image_read_pdf(path=paste(ruta,"/",nombre,".pdf",sep=""))​
> >  prueba <-image_ocr(imagen, language = 'eng')​
> >  lineas<-unlist(str_split(prueba,pattern = "\n"))​
> >  poliza <- NULL​
> >  poliza<-str_extract(lineas[1],poliza_rg)​
> >  newnom <- c(newnom,paste(poliza[1],substr(nombre,5,6),".pdf",sep=''))​
> >  ​
> >  registro <- NULL​
> >  registro<-str_extract(lineas[49],registro_rg)​
> >  ​
> >  rfc <- NULL​
> >  rfc <- str_extract(lineas[5],rfc_rg)​
> >  ​
> >  ​
> >  #lineasnew<-unlist(str_split(lineas[2],pattern = "\r\n"))​
> >  #lineasdosnew<-unlist(str_split(lineas[1],pattern = "\r\n"))​
> >  ​
> >  cobertura <- NA​
> >  extranjera <- NA​
> >  suma_str   <- NA​
> >  deducible_str <- NA​
> >  ​
> >  suma <- NA​
> >  coaseguro <- NA​
> >  deducible <- NA​
> >  tope <- NA​
> >  mon <- NA​
> >  mondedu <- NA​
> >  ​
> >  cobertura  <- grep("Cobertura en el Extranjero",lineas,value=TRUE)​
> >  extranjera <- grep("Emergencia en el Extranjero",lineas,value=TRUE)​
> >

Re: [R-es] Consulta

2019-09-24 Por tema BERENICE DOMINGUEZ SANCHEZ
Emilio

Buen día, si me manda un error muy especifico que no reconoce una función de 
pdftools

> imagen <- image_read_pdf(path=paste(ruta,"/",nombre,".pdf",sep=""))
Error in normalizePath(path.expand(path), winslash, mustWork) : ​
  path[1]="C:\Users\bdominguez\Documents\H0711\Bond\1907\2\.pdf": El sistema no 
puede encontrar el archivo especificado​
> prueba <-image_ocr(imagen, language = 'eng')​
Error in assert_image(image) : object 'imagen' not found​
> lineas<-unlist(str_split(prueba,pattern = "\n"))​
Error in stri_split_regex(string, pattern, n = n, simplify = simplify,  : ​
  object 'prueba' not found​
> lineasp<-unlist(str_split(prueba[2],pattern = "\r\n"))​
Error in stri_split_regex(string, pattern, n = n, simplify = simplify,  : ​
  object 'prueba' not found

  Error in normalizePath(path.expand(path), winslash, mustWork) :
  
path[1]="C:\Users\bdominguez\Documents\H0711\Bond\1907\2\caratula_340007195-01-C_6158_22_07_2019_162916.pdf.pdf":
 El sistema no puede encontrar el archivo especificad​


Adjunto el archivo, respecto a la versión fue solo una hipótesis

Hice dos cosas:

Lo volví a instalar pero no tuve éxito, adjunto archivo.

Saludos.


De: Emilio L. Cano 
Enviado: lunes, 23 de septiembre de 2019 11:56 p. m.
Para: BERENICE DOMINGUEZ SANCHEZ 
CC: Lista R 
Asunto: Re: [R-es] Consulta

Hola Berenice,

¿Qué quires decir con que no reconoce el paquete? ¿Te da algún mensaje de error?
No sé si has probado a instalar de nuevo el paquete, si no hazlo.

Para poder reproducir el error con tu código haría falta alguno de los pdfs que 
utilizas (puedes compartir un enlace a dropbox o similar).

Un saludo,
Emilio

> El 24 sept 2019, a las 1:49, BERENICE DOMINGUEZ SANCHEZ  
> escribió:
>
> Buenas tarde a todo@s:
>
> Tenia la versión de R 3.6 y utilizaba la paquetería de pdftools para extraer 
> información de archivos en pdf actualice la versión 3.6.1 y ya no reconoce la 
> paquetería alguien que me pueda ayudar. Prácticamente no reconoce las 
> funciones de pdftools
>
> library(pdftools)
> library(stringr)​
> library(NLP)​
> library(tm)​
> library(tesseract)​
> library(magick)​
> install.packages("magick")​
> install.packages("pdftools")​
> ​
> txt <- system.file("texts", "txt", package = "tm")​
> ​
> rfc_rg <- "([A-Z]{3,})([0-9]{6})([A-Z]|[0-9]){0,3}"​
> #poliza_rg <- 
> "(34|36|37|39)(ME|MEC|CH|MB|TF|GI|VE|TS|IM|ER|VE)*([0-9]{6,})[-]([0-9]){2}[-][A-Z]"​
> poliza_rg <- "(ME|CH|MB|TF|GI|gi|VE|TS|IM|ER|VE)*([0-9]{8,})[-]([0-9]){2}"​
> registro_rg <- "(CNSF-H0711-)([0-9]{4})[- ]([0-9]){4}"​
> subgrupo_rg <- "_([0-9]){1,3}."​
> mon_rg <- "SMGM|UMAM|MN"​
> ​
> ​
> ruta <- 'C:/Users/bdominguez/Documents/H0711/Bond/1909/'​
> archivos<-list.files(path=ruta,pattern = '*.pdf')​
> ​
> ​
> imagen <- image_read_pdf(path=paste(ruta,"/",nombre,".pdf",sep=""))​
> prueba <-image_ocr(imagen, language = 'eng')​
> lineas<-unlist(str_split(prueba,pattern = "\n"))​
> lineasp<-unlist(str_split(prueba[2],pattern = "\r\n"))​
> ​
> newnom <- NULL​
> renglones <- NULL​
> for (nombre in archivos){​
>  subgrupo <- str_extract(str_extract(nombre,pattern = subgrupo_rg),pattern = 
> "[0-9]{1,3}")​
>  imagen <- image_read_pdf(path=paste(ruta,"/",nombre,".pdf",sep=""))​
>  prueba <-image_ocr(imagen, language = 'eng')​
>  lineas<-unlist(str_split(prueba,pattern = "\n"))​
>  poliza <- NULL​
>  poliza<-str_extract(lineas[1],poliza_rg)​
>  newnom <- c(newnom,paste(poliza[1],substr(nombre,5,6),".pdf",sep=''))​
>  ​
>  registro <- NULL​
>  registro<-str_extract(lineas[49],registro_rg)​
>  ​
>  rfc <- NULL​
>  rfc <- str_extract(lineas[5],rfc_rg)​
>  ​
>  ​
>  #lineasnew<-unlist(str_split(lineas[2],pattern = "\r\n"))​
>  #lineasdosnew<-unlist(str_split(lineas[1],pattern = "\r\n"))​
>  ​
>  cobertura <- NA​
>  extranjera <- NA​
>  suma_str   <- NA​
>  deducible_str <- NA​
>  ​
>  suma <- NA​
>  coaseguro <- NA​
>  deducible <- NA​
>  tope <- NA​
>  mon <- NA​
>  mondedu <- NA​
>  ​
>  cobertura  <- grep("Cobertura en el Extranjero",lineas,value=TRUE)​
>  extranjera <- grep("Emergencia en el Extranjero",lineas,value=TRUE)​
>  suma_str   <- grep("SUMA ASEGURADA:",lineas,value=TRUE)​
>  deducible_str   <- grep("DEDUCIBLE:",lineas,value=TRUE)​
>  sumacob <- NA​
>  sumaext <- NA​
>  ​
>  pprimaria <- grep("Numero de Póliza:", lineas, value = TRUE)​
>  dnprimariaa <- grep("Nombre de la Aseguradora Primaria:", lineas, value = 
> TRUE)​
>  ​
>  #cer<- grep("Certificado No. ",lineas, value=TRUE)​
>  #ntit<- grep("Ramo", lineas, value=TRUE)​
>  ​
>  sumacob<-as.numeric(str_extract(cobertura[1],pattern = "[0-9]{1,}"))​
>  if (length(sumacob)==0){​
>sumacob = NA​
>  }​
>  ​
>  sumaext<-as.numeric(str_extract(extranjera[17],pattern = "[0-9]{1,}"))​
>  if (length(sumaext)==0){​
>sumaext = NA​
>  }​
>  valores <- NULL​
>  monedas <- NULL​
>  valores <- str_extract_all(suma_str[17],pattern = 
> "[0-9]{0,3},*[0-9]{0,3},*[0-9]{1,3}(.[0-9]{1,}){0,1}",simplify=TRUE)​
>  monedas <- str_extract(suma_str,pattern = mon_rg)​
>  

Re: [R-es] VI Xornada de Usuarios de R en Galicia [10/10/2019]

2019-09-24 Por tema Carlos Ortega
Hey Juan,

Que no solo hemos colgado las últimas... las tenemos todas...(salvo algún
error técnico puntual)... :-).
En el portal puedes ver ya cerca de 6 años de historia...


El mar., 24 sept. 2019 a las 14:17, Juan Abasolo ()
escribió:

> Yo me anoto al pedido de Carlos, pero menos educadamente:
> Avisá cuando las cuelguen!
>
> Si saco un momento, suelo intentar verlas.
>
> Gracias, Carlos, por colgar las últimas, que saqué tiempo para abrir miras
> escuchandolos.
>
> Juan
>
> Mezu hau jaso duzu  helbidetik
> (2019 ira. 24, ar. (13:30)):
>
>> Hola Carlos.
>>
>>
>> Muchas gracias.
>>
>> Ya sabes que aquí solemos hacer una "xuntanza" anual, por temas
>> organizativos, básicamente.
>>
>> La idea es juntarnos para ver qué se está haciendo y por dónde vamos
>> tirando cada uno (y socializar un rato)... lo que son unas Jornadas, vamos!
>>
>> :-)
>>
>>
>> Espero poder hacer lo mismo en las XI Jornadas de Usuarios de R en
>> Madrid  http://r-es.org/XIjuR/ .. a ver si me da la agenda para todo!
>>
>> (por cierto, buen trabajo; veo que estáis muy "pro" con las ponencias
>> invitadas)
>>
>>
>> Respondiendo a tu pregunta, si navegas por el menú "PROGRAMA" (
>> https://www.r-users.gal/) tendrás acceso a todas las presentaciones y
>> vídeos de las jornadas anteriores. Las de este año se publicarán en su
>> momento (unos días después,por temas de montaje).
>>
>> ?
>>
>> Un saludo.
>>
>>
>>
>> 
>> De: Carlos Ortega 
>> Enviado: martes, 24 de septiembre de 2019 12:49
>> Para: Rodríguez Muíños, Miguel Ángel
>> Cc: Lista R
>> Asunto: Re: [R-es] VI Xornada de Usuarios de R en Galicia [10/10/2019]
>>
>> Gracias!
>> Que os salga todo muy bien!.
>>
>> ¿Soléis colgar las presentaciones/videos luego?.
>> He visto en el pragrama varias cosas que me interesan especialmente.
>>
>> Gracias!
>> Carlos.
>>
>>
>>
>> El mar., 24 sept. 2019 a las 11:41, <
>> miguel.angel.rodriguez.mui...@sergas.es> miguel.angel.rodriguez.mui...@sergas.es>> escribió:
>> Hola.
>>
>>
>> Por si fuera de vuestro interés, os informo de que ya está disponible el
>> Programa de la Jornada de usuarios de R en Galicia.
>>
>>
>> Podéis consultarlo aquí -> https://www.r-users.gal/Programa%202019
>>
>>
>> Tendrá lugar, el jueves 10 de octubre, en la Facultad de Matemáticas de
>> la Universidad de Santiago de Compostela.
>>
>>
>> Un saludo,
>>
>> Miguel Rodríguez.
>>
>>
>>
>>
>>
>>
>>
>>
>>
>> 
>>
>> Nota: A información contida nesta mensaxe e os seus posibles documentos
>> adxuntos é privada e confidencial e está dirixida únicamente ó seu
>> destinatario/a. Se vostede non é o/a destinatario/a orixinal desta mensaxe,
>> por favor elimínea. A distribución ou copia desta mensaxe non está
>> autorizada.
>>
>> Nota: La información contenida en este mensaje y sus posibles documentos
>> adjuntos es privada y confidencial y está dirigida únicamente a su
>> destinatario/a. Si usted no es el/la destinatario/a original de este
>> mensaje, por favor elimínelo. La distribución o copia de este mensaje no
>> está autorizada.
>>
>> See more languages: http://www.sergas.es/aviso-confidencialidad
>>
>> [[alternative HTML version deleted]]
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>>
>> --
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>> 
>>
>> Nota: A información contida nesta mensaxe e os seus posibles documentos
>> adxuntos é privada e confidencial e está dirixida únicamente ó seu
>> destinatario/a. Se vostede non é o/a destinatario/a orixinal desta mensaxe,
>> por favor elimínea. A distribución ou copia desta mensaxe non está
>> autorizada.
>>
>> Nota: La información contenida en este mensaje y sus posibles documentos
>> adjuntos es privada y confidencial y está dirigida únicamente a su
>> destinatario/a. Si usted no es el/la destinatario/a original de este
>> mensaje, por favor elimínelo. La distribución o copia de este mensaje no
>> está autorizada.
>>
>> See more languages: http://www.sergas.es/aviso-confidencialidad
>>
>> [[alternative HTML version deleted]]
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
> --
> Juan Abasolo
>
> Hizkuntzaren eta Literaturaren Didaktika Saila | EUDIA ikerketa taldea
> Bilboko Hezkuntza Fakultatea
> Euskal Herriko Unibertsitatea
> UPV/EHU
>
> Sarriena auzoa z/g 48940 - Leioa (Bizkaia)
>
> T: (+34) 94 601 7567
> Telegram: @JuanAbasolo
> Skype: abasolo72
>
> Tutoretza ordutegia 
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.

Re: [R-es] VI Xornada de Usuarios de R en Galicia [10/10/2019]

2019-09-24 Por tema Juan Abasolo
Yo me anoto al pedido de Carlos, pero menos educadamente:
Avisá cuando las cuelguen!

Si saco un momento, suelo intentar verlas.

Gracias, Carlos, por colgar las últimas, que saqué tiempo para abrir miras
escuchandolos.

Juan

Mezu hau jaso duzu  helbidetik
(2019 ira. 24, ar. (13:30)):

> Hola Carlos.
>
>
> Muchas gracias.
>
> Ya sabes que aquí solemos hacer una "xuntanza" anual, por temas
> organizativos, básicamente.
>
> La idea es juntarnos para ver qué se está haciendo y por dónde vamos
> tirando cada uno (y socializar un rato)... lo que son unas Jornadas, vamos!
>
> :-)
>
>
> Espero poder hacer lo mismo en las XI Jornadas de Usuarios de R en Madrid
> http://r-es.org/XIjuR/ .. a ver si me da la agenda para todo!
>
> (por cierto, buen trabajo; veo que estáis muy "pro" con las ponencias
> invitadas)
>
>
> Respondiendo a tu pregunta, si navegas por el menú "PROGRAMA" (
> https://www.r-users.gal/) tendrás acceso a todas las presentaciones y
> vídeos de las jornadas anteriores. Las de este año se publicarán en su
> momento (unos días después,por temas de montaje).
>
> ?
>
> Un saludo.
>
>
>
> 
> De: Carlos Ortega 
> Enviado: martes, 24 de septiembre de 2019 12:49
> Para: Rodríguez Muíños, Miguel Ángel
> Cc: Lista R
> Asunto: Re: [R-es] VI Xornada de Usuarios de R en Galicia [10/10/2019]
>
> Gracias!
> Que os salga todo muy bien!.
>
> ¿Soléis colgar las presentaciones/videos luego?.
> He visto en el pragrama varias cosas que me interesan especialmente.
>
> Gracias!
> Carlos.
>
>
>
> El mar., 24 sept. 2019 a las 11:41, <
> miguel.angel.rodriguez.mui...@sergas.es miguel.angel.rodriguez.mui...@sergas.es>> escribió:
> Hola.
>
>
> Por si fuera de vuestro interés, os informo de que ya está disponible el
> Programa de la Jornada de usuarios de R en Galicia.
>
>
> Podéis consultarlo aquí -> https://www.r-users.gal/Programa%202019
>
>
> Tendrá lugar, el jueves 10 de octubre, en la Facultad de Matemáticas de la
> Universidad de Santiago de Compostela.
>
>
> Un saludo,
>
> Miguel Rodríguez.
>
>
>
>
>
>
>
>
>
> 
>
> Nota: A información contida nesta mensaxe e os seus posibles documentos
> adxuntos é privada e confidencial e está dirixida únicamente ó seu
> destinatario/a. Se vostede non é o/a destinatario/a orixinal desta mensaxe,
> por favor elimínea. A distribución ou copia desta mensaxe non está
> autorizada.
>
> Nota: La información contenida en este mensaje y sus posibles documentos
> adjuntos es privada y confidencial y está dirigida únicamente a su
> destinatario/a. Si usted no es el/la destinatario/a original de este
> mensaje, por favor elimínelo. La distribución o copia de este mensaje no
> está autorizada.
>
> See more languages: http://www.sergas.es/aviso-confidencialidad
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
> 
>
> Nota: A información contida nesta mensaxe e os seus posibles documentos
> adxuntos é privada e confidencial e está dirixida únicamente ó seu
> destinatario/a. Se vostede non é o/a destinatario/a orixinal desta mensaxe,
> por favor elimínea. A distribución ou copia desta mensaxe non está
> autorizada.
>
> Nota: La información contenida en este mensaje y sus posibles documentos
> adjuntos es privada y confidencial y está dirigida únicamente a su
> destinatario/a. Si usted no es el/la destinatario/a original de este
> mensaje, por favor elimínelo. La distribución o copia de este mensaje no
> está autorizada.
>
> See more languages: http://www.sergas.es/aviso-confidencialidad
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Juan Abasolo

Hizkuntzaren eta Literaturaren Didaktika Saila | EUDIA ikerketa taldea
Bilboko Hezkuntza Fakultatea
Euskal Herriko Unibertsitatea
UPV/EHU

Sarriena auzoa z/g 48940 - Leioa (Bizkaia)

T: (+34) 94 601 7567
Telegram: @JuanAbasolo
Skype: abasolo72

Tutoretza ordutegia 

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] VI Xornada de Usuarios de R en Galicia [10/10/2019]

2019-09-24 Por tema miguel.angel.rodriguez.muinos
Hola Carlos.


Muchas gracias.

Ya sabes que aqu� solemos hacer una "xuntanza" anual, por temas organizativos, 
b�sicamente.

La idea es juntarnos para ver qu� se est� haciendo y por d�nde vamos tirando 
cada uno (y socializar un rato)... lo que son unas Jornadas, vamos!

:-)


Espero poder hacer lo mismo en las XI Jornadas de Usuarios de R en Madrid  
http://r-es.org/XIjuR/ .. a ver si me da la agenda para todo!

(por cierto, buen trabajo; veo que est�is muy "pro" con las ponencias invitadas)


Respondiendo a tu pregunta, si navegas por el men� "PROGRAMA" 
(https://www.r-users.gal/) tendr�s acceso a todas las presentaciones y v�deos 
de las jornadas anteriores. Las de este a�o se publicar�n en su momento (unos 
d�as despu�s,por temas de montaje).

?

Un saludo.




De: Carlos Ortega 
Enviado: martes, 24 de septiembre de 2019 12:49
Para: Rodr�guez Mu��os, Miguel �ngel
Cc: Lista R
Asunto: Re: [R-es] VI Xornada de Usuarios de R en Galicia [10/10/2019]

Gracias!
Que os salga todo muy bien!.

�Sol�is colgar las presentaciones/videos luego?.
He visto en el pragrama varias cosas que me interesan especialmente.

Gracias!
Carlos.



El mar., 24 sept. 2019 a las 11:41, 
mailto:miguel.angel.rodriguez.mui...@sergas.es>>
 escribi�:
Hola.


Por si fuera de vuestro inter�s, os informo de que ya est� disponible el 
Programa de la Jornada de usuarios de R en Galicia.


Pod�is consultarlo aqu� -> https://www.r-users.gal/Programa%202019


Tendr� lugar, el jueves 10 de octubre, en la Facultad de Matem�ticas de la 
Universidad de Santiago de Compostela.


Un saludo,

Miguel Rodr�guez.











Nota: A informaci�n contida nesta mensaxe e os seus posibles documentos 
adxuntos � privada e confidencial e est� dirixida �nicamente � seu 
destinatario/a. Se vostede non � o/a destinatario/a orixinal desta mensaxe, por 
favor elim�nea. A distribuci�n ou copia desta mensaxe non est� autorizada.

Nota: La informaci�n contenida en este mensaje y sus posibles documentos 
adjuntos es privada y confidencial y est� dirigida �nicamente a su 
destinatario/a. Si usted no es el/la destinatario/a original de este mensaje, 
por favor elim�nelo. La distribuci�n o copia de este mensaje no est� autorizada.

See more languages: http://www.sergas.es/aviso-confidencialidad

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


--
Saludos,
Carlos Ortega
www.qualityexcellence.es



Nota: A informaci�n contida nesta mensaxe e os seus posibles documentos 
adxuntos � privada e confidencial e est� dirixida �nicamente � seu 
destinatario/a. Se vostede non � o/a destinatario/a orixinal desta mensaxe, por 
favor elim�nea. A distribuci�n ou copia desta mensaxe non est� autorizada.

Nota: La informaci�n contenida en este mensaje y sus posibles documentos 
adjuntos es privada y confidencial y est� dirigida �nicamente a su 
destinatario/a. Si usted no es el/la destinatario/a original de este mensaje, 
por favor elim�nelo. La distribuci�n o copia de este mensaje no est� autorizada.

See more languages: http://www.sergas.es/aviso-confidencialidad

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] VI Xornada de Usuarios de R en Galicia [10/10/2019]

2019-09-24 Por tema Carlos Ortega
Gracias!
Que os salga todo muy bien!.

¿Soléis colgar las presentaciones/videos luego?.
He visto en el pragrama varias cosas que me interesan especialmente.

Gracias!
Carlos.



El mar., 24 sept. 2019 a las 11:41, 
escribió:

> Hola.
>
>
> Por si fuera de vuestro interés, os informo de que ya está disponible el
> Programa de la Jornada de usuarios de R en Galicia.
>
>
> Podéis consultarlo aquí -> https://www.r-users.gal/Programa%202019
>
>
> Tendrá lugar, el jueves 10 de octubre, en la Facultad de Matemáticas de la
> Universidad de Santiago de Compostela.
>
>
> Un saludo,
>
> Miguel Rodríguez.
>
>
>
>
>
>
>
>
>
> 
>
> Nota: A información contida nesta mensaxe e os seus posibles documentos
> adxuntos é privada e confidencial e está dirixida únicamente ó seu
> destinatario/a. Se vostede non é o/a destinatario/a orixinal desta mensaxe,
> por favor elimínea. A distribución ou copia desta mensaxe non está
> autorizada.
>
> Nota: La información contenida en este mensaje y sus posibles documentos
> adjuntos es privada y confidencial y está dirigida únicamente a su
> destinatario/a. Si usted no es el/la destinatario/a original de este
> mensaje, por favor elimínelo. La distribución o copia de este mensaje no
> está autorizada.
>
> See more languages: http://www.sergas.es/aviso-confidencialidad
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] VI Xornada de Usuarios de R en Galicia [10/10/2019]

2019-09-24 Por tema miguel.angel.rodriguez.muinos
Hola.


Por si fuera de vuestro inter�s, os informo de que ya est� disponible el 
Programa de la Jornada de usuarios de R en Galicia.


Pod�is consultarlo aqu� -> https://www.r-users.gal/Programa%202019


Tendr� lugar, el jueves 10 de octubre, en la Facultad de Matem�ticas de la 
Universidad de Santiago de Compostela.


Un saludo,

Miguel Rodr�guez.











Nota: A informaci�n contida nesta mensaxe e os seus posibles documentos 
adxuntos � privada e confidencial e est� dirixida �nicamente � seu 
destinatario/a. Se vostede non � o/a destinatario/a orixinal desta mensaxe, por 
favor elim�nea. A distribuci�n ou copia desta mensaxe non est� autorizada.

Nota: La informaci�n contenida en este mensaje y sus posibles documentos 
adjuntos es privada y confidencial y est� dirigida �nicamente a su 
destinatario/a. Si usted no es el/la destinatario/a original de este mensaje, 
por favor elim�nelo. La distribuci�n o copia de este mensaje no est� autorizada.

See more languages: http://www.sergas.es/aviso-confidencialidad

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Consulta

2019-09-24 Por tema Carlos Ortega
Hola,

Una cosa que puedes hacer temporalmente es desinstalar la versión 3.6.1 y
volver a  la anterior 3.6.0.
Los paquetes tardan un tiempo, suele ser poco, en adaptarse a las nuevas
versiones.

Pero vaya, en cualquier caso, 3.6.1 ya lleva un tiempo liberada y esta
adaptación se debiera de haber producido.
Si nos das más detalles del error que tienes y en qué paso de tu script
aparece el error, podríamos ayudarte más.

Gracias,
Carlos Ortega
www.qualityexcellence.es

El mar., 24 sept. 2019 a las 1:49, BERENICE DOMINGUEZ SANCHEZ (<
ds_b...@hotmail.com>) escribió:

> Buenas tarde a todo@s:
>
> Tenia la versión de R 3.6 y utilizaba la paquetería de pdftools para
> extraer información de archivos en pdf actualice la versión 3.6.1 y ya no
> reconoce la paquetería alguien que me pueda ayudar. Prácticamente no
> reconoce las funciones de pdftools
>
> library(pdftools)
> library(stringr)​
> library(NLP)​
> library(tm)​
> library(tesseract)​
> library(magick)​
> install.packages("magick")​
> install.packages("pdftools")​
> ​
> txt <- system.file("texts", "txt", package = "tm")​
> ​
> rfc_rg <- "([A-Z]{3,})([0-9]{6})([A-Z]|[0-9]){0,3}"​
> #poliza_rg <-
> "(34|36|37|39)(ME|MEC|CH|MB|TF|GI|VE|TS|IM|ER|VE)*([0-9]{6,})[-]([0-9]){2}[-][A-Z]"​
> poliza_rg <- "(ME|CH|MB|TF|GI|gi|VE|TS|IM|ER|VE)*([0-9]{8,})[-]([0-9]){2}"​
> registro_rg <- "(CNSF-H0711-)([0-9]{4})[- ]([0-9]){4}"​
> subgrupo_rg <- "_([0-9]){1,3}."​
> mon_rg <- "SMGM|UMAM|MN"​
> ​
> ​
> ruta <- 'C:/Users/bdominguez/Documents/H0711/Bond/1909/'​
> archivos<-list.files(path=ruta,pattern = '*.pdf')​
> ​
> ​
> imagen <- image_read_pdf(path=paste(ruta,"/",nombre,".pdf",sep=""))​
> prueba <-image_ocr(imagen, language = 'eng')​
> lineas<-unlist(str_split(prueba,pattern = "\n"))​
> lineasp<-unlist(str_split(prueba[2],pattern = "\r\n"))​
> ​
> newnom <- NULL​
> renglones <- NULL​
> for (nombre in archivos){​
>   subgrupo <- str_extract(str_extract(nombre,pattern =
> subgrupo_rg),pattern = "[0-9]{1,3}")​
>   imagen <- image_read_pdf(path=paste(ruta,"/",nombre,".pdf",sep=""))​
>   prueba <-image_ocr(imagen, language = 'eng')​
>   lineas<-unlist(str_split(prueba,pattern = "\n"))​
>   poliza <- NULL​
>   poliza<-str_extract(lineas[1],poliza_rg)​
>   newnom <- c(newnom,paste(poliza[1],substr(nombre,5,6),".pdf",sep=''))​
>   ​
>   registro <- NULL​
>   registro<-str_extract(lineas[49],registro_rg)​
>   ​
>   rfc <- NULL​
>   rfc <- str_extract(lineas[5],rfc_rg)​
>   ​
>   ​
>   #lineasnew<-unlist(str_split(lineas[2],pattern = "\r\n"))​
>   #lineasdosnew<-unlist(str_split(lineas[1],pattern = "\r\n"))​
>   ​
>   cobertura <- NA​
>   extranjera <- NA​
>   suma_str   <- NA​
>   deducible_str <- NA​
>   ​
>   suma <- NA​
>   coaseguro <- NA​
>   deducible <- NA​
>   tope <- NA​
>   mon <- NA​
>   mondedu <- NA​
>   ​
>   cobertura  <- grep("Cobertura en el Extranjero",lineas,value=TRUE)​
>   extranjera <- grep("Emergencia en el Extranjero",lineas,value=TRUE)​
>   suma_str   <- grep("SUMA ASEGURADA:",lineas,value=TRUE)​
>   deducible_str   <- grep("DEDUCIBLE:",lineas,value=TRUE)​
>   sumacob <- NA​
>   sumaext <- NA​
>   ​
>   pprimaria <- grep("Numero de Póliza:", lineas, value = TRUE)​
>   dnprimariaa <- grep("Nombre de la Aseguradora Primaria:", lineas, value
> = TRUE)​
>   ​
>   #cer<- grep("Certificado No. ",lineas, value=TRUE)​
>   #ntit<- grep("Ramo", lineas, value=TRUE)​
>   ​
>   sumacob<-as.numeric(str_extract(cobertura[1],pattern = "[0-9]{1,}"))​
>   if (length(sumacob)==0){​
> sumacob = NA​
>   }​
>   ​
>   sumaext<-as.numeric(str_extract(extranjera[17],pattern = "[0-9]{1,}"))​
>   if (length(sumaext)==0){​
> sumaext = NA​
>   }​
>   valores <- NULL​
>   monedas <- NULL​
>   valores <- str_extract_all(suma_str[17],pattern =
> "[0-9]{0,3},*[0-9]{0,3},*[0-9]{1,3}(.[0-9]{1,}){0,1}",simplify=TRUE)​
>   monedas <- str_extract(suma_str,pattern = mon_rg)​
>   if (length(valores[1])==0){​
> suma = NA​
> mon = NA​
>   }else{​
> suma = as.numeric(gsub(pattern = ",*",replacement = "",valores[1]))​
> mon <- as.character(monedas[1])​
>   }​
>   ​
>   if (length(valores[2])==0){​
> coaseguro = NA​
>   }else{​
> coaseguro = as.numeric(valores[2])​
>   }​
>   valores <- NULL​
>   valores <- str_extract_all(deducible_str[1],pattern =
> "[0-9]{0,3},*[0-9]{0,3},*[0-9]{1,3}(.[0-9]{1,}){0,1}",simplify=TRUE)​
>   ​
>   if (length(valores[1])==0){​
> deducible <- NA​
>   }else{​
> deducible <- as.numeric(gsub(pattern = ",",replacement =
> "",valores[1]))​
>   }​
>   ​
>   monedas <- NULL  ​
>   monedas <- str_extract(deducible_str[1],pattern = mon_rg)​
>   ​
>   if (length(monedas)==0){​
> mondedu <- NA​
>   }else{​
> mondedu <- monedas​
>   }​
>   ​
>   ​
>   if (length(valores[2])==0){​
> tope = NA​
>   }else{​
> tope = as.numeric(gsub(pattern = ",",replacement = "",valores[2]))​
>   }​
>   ​
>   renglon <-
> data.frame(archivo=nombre,poliza=as.character(poliza[1]),cobertura=sumacob,emergencia=sumaext,registro=registro[1],suma=suma,coa