Tiago
Prefiro puxar os dados para a Staging Area através de uma ferramenta de
integração de dados e ETL.
No Pentaho ela está presente através do Kettle que usa JDBC como interface.
http://www.pentaho.com/products/data_integration/
[]'s Pedrosinho
- Original Message -
From: Tiago José Adami
To: Comunidade PostgreSQL Brasileira
Sent: Tuesday, June 05, 2007 9:11 AM
Subject: Re: [pgbr-geral] Alimentação de ODS para Data Mining
Certo amigos, a discussão foi ótima. Vocês já responderam as perguntas que eu
iria fazer na seqüência ;).
Entretanto, estou ainda projetando uma base OLAP e a dúvida esta na forma de
replicar as informações do banco de dados OLTP para o ODS ou o banco de dados
OLAP.
Estou usando como referência uma ótima literatura sobre bancos de dados
distribuídos (Özsu e Valduriez [1]), mas mesmo mencionando situações de
distribuição entre bases OLTP e/ou arquivos, não há explicação de como as
informações devem ser transportadas em um ODS.
Procurei algumas referências a mais na internet [2] e acho que entendi.
Vou citar um exemplo: para informações de faturamento, tenho uma VIEW que
compõe várias tabelas, entre elas: NOTAS, ESTOQUE, CLIENTE, PRODUTO. O
resultado da View é um cubo de informações (repetindo o numero da nota e o nome
do cliente, por exemplo, para cada item da nota fiscal).
A minha dúvida era se, para armazenar as informações em um ODS, eu teria que
replicar todas as tabelas na forma original até o ODS, ou se deveria criar
tabelas com a estrutura das VIEWS, e replicá-las criando uma éspecie de view
materializada (como foi citado).
Mas... eu havia esquecido do Staging Area.
Me corrijam se eu estiver errado, mas o Staging Area é onde eu recebo as
informações das diversas fontes de dados, não importando a forma (se são views
materializadas, cópias das tabelas de um OLTP ou tabelas geradas a partir de
.XLS) e a partir deste SA eu condenso e trabalho as informações de forma a
dimensiona-las conforme as necessidades do DW, para somente depois alimentar o
ODS, certo? É como trabalhar em camadas em um DW.
Resta saber a forma de trabalhar estas informações e como transportá-las, se
eu poderia utilizar o PostgreSQL para fazer isso através do Slony, ou se as
ferramentas de DW já o fazem (Pentaho, por exemplo).
Eu dei uma olhada no Pentaho [3], mas não encontrei resposta para esta dúvida.
E obrigado a todos que contribuíram com esta thread, foram contribuições
muito valiosas.
[1]
http://www.livrariacultura.com.br/scripts/cultura/resenha/resenha.asp?isbn=0136597076sid=125186254965322314451732
[2] http://www.dwbrasil.com.br/html/artbi_20030602.html
[3] http://www.pentaho.com/
--
Tiago J. Adami
Dois Vizinhos - PR
Brazil
Use linux, and set your soul free!
--
___
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral
___
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral