Oi é possivel criar uma fila usando um feed rss ou criando arquivos em um diretorio. basta ver o que é mais interessante para o teu projeto. Por exemplo, se vc publicar um feed e tiver do outro lado um consumidor fazendo pooling vai ser tão bom quanto um ActiveMQ se vc não estiver com um volume muito grande de dados E se puder esperar uns segundos. Isso pode simplificar a tua infra num primeiro momento.
On Tue, Mar 13, 2012 at 11:33 PM, Daniel de Oliveira Mantovani <daniel.oliveira.mantov...@gmail.com> wrote: > Shonorio, o Gearman não é um sistema de fila, ele funciona como um > distribuid system. > > Você deva usar o AMPQ[1] ou o Apache ActiveMQ[2] para criar a fila e o > Gearman para processar a informação. O Worker não sabe da existência > do Client, quem faz esse intermédio é o Gearman Server[3]. > > "A Gearman powered application consists of three parts: a client, a > worker, and a job server. The client is responsible for creating a job > to be run and sending it to a job server. The job server will find a > suitable worker that can run the job and forwards the job on. The > worker performs the work requested by the client and sends a response > to the client through the job server. Gearman provides client and > worker APIs that your applications call to talk with the Gearman job > server (also known as gearmand) so you don't need to deal with > networking or mapping of jobs. Internally, the gearman client and > worker APIs communicate with the job server using TCP sockets. To > explain how Gearman works in more detail, lets look at a simple > application that will reverse the order of characters in a string. " > > [User Interface] <===>[RDBMS]<===> [Queue System] > /\ > || > || > [Distribuid > System] <===> [Document-oriented database] > > > Se baseando nesse arquitetura o Queue System vai mandando "jobs" de > acordo com número de workers que você tem disponível, evitando um > overhead e criando um sistema "auto scalability". > > Se eu fosse você eu me preocuparia com a forma de armazenamento dos > dados, as redes sociais já garantem a integridade dos dados, sendo > assim uma solução Document-oriented database te pouparia muito > processamento e trabalho. Existem várias opções, eu recomendo o > MongoDB[4] mesmo com o Eden Cardim me crucificando por isso. > > Guarde os dados dos usuários e do site num RDBMS, se você estiver > pensando num RDBMS open source eu te recomendo o PostgreSQL, ele tem > um ótimo suporte ao paradigma temporal. > Se você usar o PostgreSQL, eu te recomendo usar o Pgpool[5] para > replication, clustering, load balance etc. > > [1] - http://www.amqp.org/about/what > [2] - http://activemq.apache.org/ > [3] - http://gearman.org/ > [4] - http://www.mongodb.org/display/DOCS/Sharding+Introduction > [5] - http://www.pgpool.net/mediawiki/index.php/Main_Page > > Grande Abraço. > > 2012/3/13 Solli Honorio <shono...@gmail.com>: >> Pessoal, >> >> Estou iniciando um projeto de monitoramento de mídias sociais e fazer algum >> processamento com estas informações, e acredito que utilizar esquemas de >> fila serviria muito bem para este ambiente. >> >> Basicamente o esquema que estou imaginando para o ambiente é : >> >> [ Interface com o usuário ] <===> [Banco de Dados] <====> [Sistema de Fila] >> >> || || >> >> || +- [Executa a pesquisa] >> >> || >> >> +-- [ Processa o resultado da pesquisa] >> >> As ações que eu imagino nisto são : >> >> * interface com o usuário não é meu problema, tem um webdeveloper >> trabalhando nisto; >> * não quero de maneira alguma fazer os 'agentes' interagir diretamente com o >> banco de dados, por isto penso em criar um cliente que leia o banco de dados >> e coloque os dados formatados para o agente na fila do agente. O caminho >> contrário também, ler o resultado do agente e gravar no banco de dados; >> >> Estou avaliando a possibilidade de utilizar o Gearman (na verdade não tenho >> certeza se esta é a melhor alternativa mesmo), na verdade o >> AnyEvent::Gearman. Mas algumas coisas me chamaram no Gearman do qual eu >> acho meio estranho para o ambiente sistema de fila que eu tenho na minha >> cabeça. >> >> 1. o worker (aparentemente o cara que executará o serviço) não fica em loop >> lendo uma fila, parece que ele está sendo acionado pelo cliente; >> 2. o parece que o cliente fica 'preso' aguardando o final da execução do >> worker. >> >> Ainda não tenho código (que o meu cliente não leia isto, pois estou muito >> atrasado), mas eu gostaria de obter recomendações de vocês sobre a >> arquitetura que estou imaginando. >> >> Obrigado, >> >> Solli Honorio >> >> >> -- >> "o animal satisfeito dorme". - Guimarães Rosa >> >> =begin disclaimer >> Sao Paulo Perl Mongers: http://sao-paulo.pm.org/ >> SaoPaulo-pm mailing list: SaoPaulo-pm@pm.org >> L<http://mail.pm.org/mailman/listinfo/saopaulo-pm> >> =end disclaimer >> > > > > -- > "If you’ve never written anything thoughtful, then you’ve never had > any difficult, important, or interesting thoughts. That’s the secret: > people who don’t write, are people who don’t think." > =begin disclaimer > Sao Paulo Perl Mongers: http://sao-paulo.pm.org/ > SaoPaulo-pm mailing list: SaoPaulo-pm@pm.org > L<http://mail.pm.org/mailman/listinfo/saopaulo-pm> > =end disclaimer -- Tiago B. Peczenyj Linux User #405772 http://pacman.blog.br =begin disclaimer Sao Paulo Perl Mongers: http://sao-paulo.pm.org/ SaoPaulo-pm mailing list: SaoPaulo-pm@pm.org L<http://mail.pm.org/mailman/listinfo/saopaulo-pm> =end disclaimer