Re: [R-es] Leer parquet files desde R

2017-10-04 Por tema Carlos Ortega
Acabo de recordar que con "h2o.importFile()" también puedes importar
ficheros en parquet...

http://docs.h2o.ai/h2o/latest-stable/h2o-docs/getting-data-into-h2o.html#supported-file-formats


El 4 de octubre de 2017, 23:02, Carlos Ortega 
escribió:

> Sí, disculpa no había visto que estaba en la página de sparklyr...
> ¿Y esto?...
>
> https://github.com/hrbrmstr/sergeant
>
> Pasas a depender de Drill...
>
>
>
> El 4 de octubre de 2017, 22:28, José Luis Cañadas 
> escribió:
>
>> Hola Carlos.
>>
>> spark_read_parquet es de sparklyr y necesita un sparkcontext inicializado
>> para leer el fichero de parquet.
>>
>> El mié., 4 oct. 2017 22:11, Carlos Ortega 
>> escribió:
>>
>>> Hola José Luis,
>>>
>>> ¿Has probado directamente con "dplyr"?...
>>>
>>> spark_read_parquet
>>> 
>>>
>>> Saludos,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>>
>>> El 4 de octubre de 2017, 21:33, José Luis Cañadas <
>>> canadasre...@gmail.com> escribió:
>>>
 Buenas a todos.
 Ya sé que con sparkR o sparklyr puedo leer fácilmente ficheros con
 formato
 parquet, pero ¿hay alguna forma de leerlos sin tener que arrancar spark?

 Mi situación es que tengo unos ficheros en formato parquet en s3 y
 quiero
 leerlos desde una instancia pequeñita de amazon EC2 que quiero mantener
 sin
 instalarle spark.

 Estoy bicheando la librería https://github.com/cloudyr/aws.s3 y va
 bien,
 pero no encuentro como leer ficheros parquet.

 Un saludo

 [[alternative HTML version deleted]]

 ___
 R-help-es mailing list
 R-help-es@r-project.org
 https://stat.ethz.ch/mailman/listinfo/r-help-es

>>>
>>>
>>>
>>> --
>>> Saludos,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Leer parquet files desde R

2017-10-04 Por tema Carlos Ortega
Sí, disculpa no había visto que estaba en la página de sparklyr...
¿Y esto?...

https://github.com/hrbrmstr/sergeant

Pasas a depender de Drill...



El 4 de octubre de 2017, 22:28, José Luis Cañadas 
escribió:

> Hola Carlos.
>
> spark_read_parquet es de sparklyr y necesita un sparkcontext inicializado
> para leer el fichero de parquet.
>
> El mié., 4 oct. 2017 22:11, Carlos Ortega 
> escribió:
>
>> Hola José Luis,
>>
>> ¿Has probado directamente con "dplyr"?...
>>
>> spark_read_parquet
>> 
>>
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>>
>> El 4 de octubre de 2017, 21:33, José Luis Cañadas > > escribió:
>>
>>> Buenas a todos.
>>> Ya sé que con sparkR o sparklyr puedo leer fácilmente ficheros con
>>> formato
>>> parquet, pero ¿hay alguna forma de leerlos sin tener que arrancar spark?
>>>
>>> Mi situación es que tengo unos ficheros en formato parquet en s3 y quiero
>>> leerlos desde una instancia pequeñita de amazon EC2 que quiero mantener
>>> sin
>>> instalarle spark.
>>>
>>> Estoy bicheando la librería https://github.com/cloudyr/aws.s3 y va bien,
>>> pero no encuentro como leer ficheros parquet.
>>>
>>> Un saludo
>>>
>>> [[alternative HTML version deleted]]
>>>
>>> ___
>>> R-help-es mailing list
>>> R-help-es@r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>
>>
>>
>>
>> --
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Leer parquet files desde R

2017-10-04 Por tema José Luis Cañadas
Hola Carlos.

spark_read_parquet es de sparklyr y necesita un sparkcontext inicializado
para leer el fichero de parquet.

El mié., 4 oct. 2017 22:11, Carlos Ortega 
escribió:

> Hola José Luis,
>
> ¿Has probado directamente con "dplyr"?...
>
> spark_read_parquet
> 
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
>
> El 4 de octubre de 2017, 21:33, José Luis Cañadas 
> escribió:
>
>> Buenas a todos.
>> Ya sé que con sparkR o sparklyr puedo leer fácilmente ficheros con formato
>> parquet, pero ¿hay alguna forma de leerlos sin tener que arrancar spark?
>>
>> Mi situación es que tengo unos ficheros en formato parquet en s3 y quiero
>> leerlos desde una instancia pequeñita de amazon EC2 que quiero mantener
>> sin
>> instalarle spark.
>>
>> Estoy bicheando la librería https://github.com/cloudyr/aws.s3 y va bien,
>> pero no encuentro como leer ficheros parquet.
>>
>> Un saludo
>>
>> [[alternative HTML version deleted]]
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Leer parquet files desde R

2017-10-04 Por tema Carlos Ortega
Hola José Luis,

¿Has probado directamente con "dplyr"?...

spark_read_parquet


Saludos,
Carlos Ortega
www.qualityexcellence.es


El 4 de octubre de 2017, 21:33, José Luis Cañadas 
escribió:

> Buenas a todos.
> Ya sé que con sparkR o sparklyr puedo leer fácilmente ficheros con formato
> parquet, pero ¿hay alguna forma de leerlos sin tener que arrancar spark?
>
> Mi situación es que tengo unos ficheros en formato parquet en s3 y quiero
> leerlos desde una instancia pequeñita de amazon EC2 que quiero mantener sin
> instalarle spark.
>
> Estoy bicheando la librería https://github.com/cloudyr/aws.s3 y va bien,
> pero no encuentro como leer ficheros parquet.
>
> Un saludo
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] Leer parquet files desde R

2017-10-04 Por tema José Luis Cañadas
Buenas a todos.
Ya sé que con sparkR o sparklyr puedo leer fácilmente ficheros con formato
parquet, pero ¿hay alguna forma de leerlos sin tener que arrancar spark?

Mi situación es que tengo unos ficheros en formato parquet en s3 y quiero
leerlos desde una instancia pequeñita de amazon EC2 que quiero mantener sin
instalarle spark.

Estoy bicheando la librería https://github.com/cloudyr/aws.s3 y va bien,
pero no encuentro como leer ficheros parquet.

Un saludo

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] problema con paquete "tibbletime"

2017-10-04 Por tema Javier Valdes Cantallopts (DGA)
Estimado:
He intentado probar le paquete para nalisis de series de tiempo TIBBLETIME. Sin 
embargo, al querer transformar mi data a tabletime (as_tbl_time) me entreg el 
siguiente error:
Error: assert_that: assertion must return a logical value
La forma que lo hago es la siguiente;
Data : A
A<-as_table_time(A,index=date)

Date=columna de fechas.

No he podido encontrar a que se debe dicho error. A Alguien le ha pasado 
también?
Saludos.


[Descripción: FIRMA3]




CONFIDENCIALIDAD: La información contenida en este mensaje y/o en los archivos 
adjuntos es de carácter confidencial o privilegiada y está destinada al uso 
exclusivo del emisor y/o de la persona o entidad a quien va dirigida. Si usted 
no es el destinatario, cualquier almacenamiento, divulgación, distribución o 
copia de esta información está estrictamente prohibido y sancionado por la ley. 
Si recibió este mensaje por error, por favor infórmenos inmediatamente 
respondiendo este mismo mensaje y borre todos los archivos adjuntos. Gracias.

CONFIDENTIAL NOTE: The information transmitted in this message and/or 
attachments is confidential and/or privileged and is intented only for use of 
the person or entity to whom it is addressed. If you are not the intended 
recipient, any retention, dissemination, distribution or copy of this 
information is strictly prohibited and sanctioned by law. If you received this 
message in error, please reply us this same message and delete this message and 
all attachments. Thank you.
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] [EXTERNAL]Re: Procesamiento de Lenguaje Natural

2017-10-04 Por tema Gilsanz, Jose Luis
Muchas gracias Rubén¡¡

Voy a empaparme bien esos enlaces que enviás a ver si consigo ir clarificando 
el enfoque.

Gracias¡


De: Rubén Fernández Casal [mailto:rubenfca...@gmail.com]
Enviado el: martes, 03 de octubre de 2017 21:56
Para: Gilsanz, Jose Luis 
CC: r-help-es@r-project.org
Asunto: [EXTERNAL]Re: [R-es] Procesamiento de Lenguaje Natural

Hola Jose,
Yo también estoy interesado en el tema, especialmente en el caso de castellano. 
Algunos enlaces:
http://r-es.org/tiki/GITPLN#main=cssmenu0-4
https://cran.r-project.org/web/views/NaturalLanguageProcessing.html
http://156.35.138.29/

Por si resulta de utilidad, un TFM introductorio para el tratamiento de texto 
en inglés es este 
http://eio.usc.es/pub/mte/descargas/ProyectosFinMaster/Proyecto_1475.pdf.

Un saludo, Rubén.

El 3/10/2017 8:43, "Gilsanz, Jose Luis" 
> escribió:
Hola:

Me gustaría que me recomendarais paquetes o alguna forma de "hincarle el 
diente" para empezar a investigar en la siguiente cuestión.

El proyecto trata de que, a partir de un numero grande de documentos pdf que 
contienen, básicamente, Notas Simples del Registro de la Propiedad deseamos 
extraer para cada uno de esos documentos una serie de ítems de información, a 
saber:
-Finca Registral
-Registro de la Propiedad
-Referencia Catastral (si la hubiera)
-IDUFIR o CUR (identificadores únicos de finca registral, si las hubiera)

Los documentos provienen de muy diversas fuentes por lo que la información no 
se podría extraer con minería de textos "pura" ya que, por ejemplo, la finca 
registral puede venir especificada como:
-FINCA DE TOLEDO Nº: XXX
-Nº Finca: FINCA DE PILAR DE LA HORADADA Nº: XXX
-Finca registral: XXX
-REGISTRAL XX
-FINCA DE MARBELLA (Sección 03) Nº: XX
-Finca: XX

Siendo un total profano en la materia, creo que se puede definir como un 
proyecto a tratar usando un Procesamiento de Lenguaje Natural, en tanto que se 
necesita de un análisis semántico de los textos vista la variedad de formas que 
hay de expresar el mismo concepto con textos distintos. Desconozco si existe 
algún tipo de proceso de Aprendizaje Automático que se pueda también aplicar 
para que el proceso vaya "aprendiendo" como se puede ir encontrando la 
información de los distintos ítems de forma complementaria al PLN.

He localizado esta web:  
https://cran.r-project.org/web/views/NaturalLanguageProcessing.html en la que 
hay multitud de paquetes/herramientas para análisis de este tipo pero me 
gustaría que me indicarais cual o cuales creéis que son los más apropiados para 
este caso concreto o si tengo que enfocar el tema por otro lado completamente 
distinto.

Mil gracias por vuestros consejos.

Un saludo


JLL Valoraciones, S.A.
Registration number: A-28806222.
Registered Office: Pº de la Castellana, 130 - 1ª ; 28046 Madrid

This e-mail is for the use of the intended recipient(s) only. If you have 
received this e-mail in error, please notify the sender immediately and then 
delete it. If you are not the intended recipient, you must not use, disclose or 
distribute this e-mail without the author's prior permission. We have taken 
precautions to minimise the risk of transmitting software viruses, but we 
advise you to carry out your own virus checks on any attachment to this 
message. We cannot accept liability for any loss or damage caused by software 
viruses. If you are the intended recipient and you do not wish to receive 
similar electronic messages from us in future then please respond to the sender 
to this effect

[[alternative HTML version deleted]]


___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es