El mié, 04-11-2015 a las 16:42 +0000, Edwin Quijada escribió: > Pentaho lo use pero para DataWarehouse con BigData no se mucho ahora > me estoy leyendo el asunto de de MapReduce pero desgraciadamente > Postgres no tiene el asunto de las query en paralelo todavia.
Ya existen gran parte de los cimientos para ello. https://commitfest.postgresql.org/7/17/ > > Seguire investigando a ver como me va en esto > > > > > > ______________________________________________________________________ > From: Mario Soto Cordones <marioa.soto.cordo...@gmail.com> > Sent: Wednesday, November 4, 2015 1:39 PM > To: 'Edwin Quijada' > Cc: pgsql-es-ayuda@postgresql.org > Subject: RE: [pgsql-es-ayuda] BigData con PostgreSQL > > Hola Edwin > > > > Mira éste link, acá encontrarás una explicación de las diferencias > entre BigData y DataWareHouse. Básicamente la implementación entre uno > y otro va a depender de lo que se requiere. > > > > Por lo general La gente quiere una solución de BigData, porque en > muchas empresas existe una gran cantidad de datos. Y en aquellas > corporaciones los datos pueden contener mucha información valiosa que > puede conducir a mejores decisiones que, a su vez, puede conducir a > mayores ingresos, mayor rentabilidad y más clientes. Y eso es lo que > quiere la mayoría de las corporaciones. > > > > Por otro lado, generalmente se quiere una solución de DataWareHouse , > con el fin de tomar decisiones informadas. Con el fin de saber > realmente lo que está pasando en su empresa, necesita datos que es > confiable, creíble y accesible para todos. > > > > Cuando se quiere comparar una solución de BigData y otra de > DataWareHpuse, nos encontramos que una solución de BigData es una > tecnología y que el DataWareHouse es una arquitectura. Son dos cosas > muy diferentes. Una tecnología es sólo eso - un medio para almacenar y > gestionar grandes cantidades de datos. Un DataWareHouse es una forma > de organizar los datos para que haya credibilidad. Cuando alguien toma > los datos de un DataWareHouse, esa persona sabe que otras personas > están usando los mismos datos para otros fines. > > > > El DataWareHouse viene acompañado de otros conceptos como etl, > hechos, dimensiones, modelo estralla, copo de nieve, cubos de > información ,etc. > > > > Ahora bien PostgreSQL permite de buena forma implementar tanto BigData > como DataWareHose, también te puedes ayudar de herramientas como por > ejemplo Pentaho entre otras. > > > > Saludos Cordiales > > > > Mario Soto > > > > De: pgsql-es-ayuda-ow...@postgresql.org > [mailto:pgsql-es-ayuda-ow...@postgresql.org] En nombre de Edwin > Quijada > Enviado el: martes, 03 de noviembre de 2015 20:28 > Para: Lennin Caro <lennin.c...@yahoo.com>; > pgsql-es-ayuda@postgresql.org > Asunto: RE: [pgsql-es-ayuda] BigData con PostgreSQL > > > > > So pena de ser fusilado, que diferencias encontrarias entre BigData y > DataWarehouse, solamente el uso de JSON ?? > La pregunta viene porque he implementado warehouse con Postgres y > Mondrian y me ha ido bien pero ahora este concepto aun no acabo de > digerirlo por mas que lo leo, sigo pensando que es warehouse con JSON, > ignorancia mia talvez, pero ahora como todo es nuevo pues no se > > > > > ______________________________________________________________________ > Date: Tue, 3 Nov 2015 22:08:02 +0000 > From: lennin.c...@yahoo.com > To: listas_quij...@hotmail.com; pgsql-es-ayuda@postgresql.org > Subject: Re: [pgsql-es-ayuda] BigData con PostgreSQL > > > > > > > On Tuesday, November 3, 2015 4:41 PM, Edwin Quijada > <listas_quij...@hotmail.com> wrote: > > > > > Estoy tratando de implementar BigData en un cliente usando Postgres. > Su bases de ddatos estan en MSSQL y PostgreSQL necesito informacion > sobre BigData con Postgres. Anteriormente use mucho Mondrian para > Warehouse con Postgres pero al parecer hay diferencias con BigData. > Alguien tiene algun material sobre Postgres con BigData que me pueda > facilitar o algun caso de exito sobre esto. > > > Voy arriesgarme a responder en base a mi experiencia. > > > > > > He trabajado con PostgreSQL para tener algo parecido a BigData, no es > realmente BigData en PostgreSQL ya que muchas de las cosas que se > necesitan para el analisis de los datos los hago con herramientas > externas como pyhton. Ahora he usado tipos de datos JSONB para > almacenar los datos en tablas logrando mezclar SQL con NoSQL, esto me > a dado muy buenos resultados en cuestion de tiempos de respuesta, los > problemas que he encontrado hasta el momento son: > > > > > > Los indices en los campos tipo JSON no siempre son eficientes > > > No he enontrado una manera de aplicar procesamiento en cluster al > estilos MongoDB o Hadoop > > > Los objetos JSONB no tiene un metodo de actualizcion por nodos del > arreglo, hay que actualizar el campo completo lo cual genera una > recarga de I/O > > > > > > Para la version 9.5 hay mejoras para estos puntos ademas de funciones > (ROLLUP, CUBE y GROUPING SETS) para manipular los datos OLAP, > adicionalmente un nuevo tipo de indices de nombre BRIN aportado por > Alvaro Herrera con lo cual mejorara el consumo de recursoso al usar > los indices. > > > > > > Aun sigo trabajando e investigando con esto, cualquier cosa te ayudo > en lo posible > > > > > - Enviado a la lista de correo pgsql-es-ayuda (pgsql-es-ayuda@postgresql.org) Para cambiar tu suscripci�n: http://www.postgresql.org/mailpref/pgsql-es-ayuda