Tiago

Prefiro puxar os dados para a Staging Area através de uma ferramenta de 
integração de dados e ETL.

No Pentaho ela está presente através do Kettle que usa JDBC como interface.

http://www.pentaho.com/products/data_integration/

[]'s Pedrosinho



  ----- Original Message ----- 
  From: Tiago José Adami 
  To: Comunidade PostgreSQL Brasileira 
  Sent: Tuesday, June 05, 2007 9:11 AM
  Subject: Re: [pgbr-geral] Alimentação de ODS para Data Mining


  Certo amigos, a discussão foi ótima. Vocês já responderam as perguntas que eu 
iria fazer na seqüência ;).

  Entretanto, estou ainda projetando uma base OLAP e a dúvida esta na forma de 
replicar as informações do banco de dados OLTP para o ODS ou o banco de dados 
OLAP. 

  Estou usando como referência uma ótima literatura sobre bancos de dados 
distribuídos (Özsu e Valduriez [1]), mas mesmo mencionando situações de 
distribuição entre bases OLTP e/ou arquivos, não há explicação de como as 
informações devem ser transportadas em um ODS. 

  Procurei algumas referências a mais na internet [2] e acho que entendi.

  Vou citar um exemplo: para informações de faturamento, tenho uma VIEW que 
compõe várias tabelas, entre elas: NOTAS, ESTOQUE, CLIENTE, PRODUTO. O 
resultado da View é um cubo de informações (repetindo o numero da nota e o nome 
do cliente, por exemplo, para cada item da nota fiscal). 

  A minha dúvida era se, para armazenar as informações em um ODS, eu teria que 
replicar todas as tabelas na forma original até o ODS, ou se deveria criar 
tabelas com a estrutura das VIEWS, e replicá-las criando uma éspecie de "view 
materializada" (como foi citado). 

  Mas... eu havia esquecido do Staging Area.

  Me corrijam se eu estiver errado, mas o Staging Area é onde eu recebo as 
informações das diversas fontes de dados, não importando a forma (se são views 
materializadas, cópias das tabelas de um OLTP ou tabelas geradas a partir de 
.XLS) e a partir deste SA eu condenso e trabalho as informações de forma a 
dimensiona-las conforme as necessidades do DW, para somente depois alimentar o 
ODS, certo? É como trabalhar em camadas em um DW. 

  Resta saber a forma de trabalhar estas informações e como transportá-las, se 
eu poderia utilizar o PostgreSQL para fazer isso através do Slony, ou se as 
ferramentas de DW já o fazem (Pentaho, por exemplo).

  Eu dei uma olhada no Pentaho [3], mas não encontrei resposta para esta dúvida.

  E obrigado a todos que contribuíram com esta thread, foram contribuições 
muito valiosas.

  [1] 
http://www.livrariacultura.com.br/scripts/cultura/resenha/resenha.asp?isbn=0136597076&sid=125186254965322314451732
  [2] http://www.dwbrasil.com.br/html/artbi_20030602.html 
  [3] http://www.pentaho.com/

  -- 
  Tiago J. Adami

  Dois Vizinhos - PR
  Brazil

  "Use linux, and set your soul free!" 


------------------------------------------------------------------------------


  _______________________________________________
  pgbr-geral mailing list
  pgbr-geral@listas.postgresql.org.br
  https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral
_______________________________________________
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral

Responder a