Re: [Python] Migliorare le prestazioni usando i core?

Daniele Varrazzo Mon, 01 Apr 2013 07:55:02 -0700

On 2013-03-31 22:58, Aplemaser wrote:

Attualmente il tempo di importazione è di 4 ore o poco meno. Voglioridurreil tempo, ma non so fino a quanto posso arrivare. Tutto è nato perchèhonotato che 3 core su 4 dormono i sonni dei giusti mentre l'altrocorselavora come un pazzo e quindi vorrei impegnare la CPU per ridurrequesti
tempi.

Hai ragione: facendo andare in parallelo i core sfrutteresti meglio lamacchina, e il tuo problema non è I/O bound altrimenti non vedrestineanche quel singolo core maxxato.

Come farlo non è gratis e non c'è una ricetta generica. Se il tuo inputè su tanti file, lancia 4 processi in parallelo e fai lavorare ognuno su1/4 dell'input. Se il file di input è uno solo puoi spezzare il processoin due parti: uno che legge l'input, lo spezza e ne manda i pezzi in unacoda; altri 3-4 processi che leggono dalla coda in round-robin e fannoil loro lavoro sul pezzetto. Per questo tipo di lavori ZeroMQ èperfetto: ha poco overhead e le primitive giuste per questo tipo dicoordinazione. Come detto non esistono ricette generiche, ma esistonodei pattern generici, e 0MQ rende abbastanza semplice implementarli.

Tieni conto che, dopo l'elaborazione, passare i dati a MySQL come staiprobabilmente facendo (con delle INSERT) non è il modo più efficiente.Su PostgreSQL usare COPY è almeno 20 volte più efficiente di INSERT peril bulk-load dei dati. Se MySQL è opzionale come dici, abbandonalo e usapostgres: psycopg offre supporto a COPY da Python<http://initd.org/psycopg/docs/usage.html#copy>. Se resti in MySQL pensotu possa usare LOAD DATA INFILE per velocizzare il caricamento, ma è unpo' più articolato (devi salvare i dati in un file temporaneo o creareuna pipe).



--
Daniele Varrazzo - Develer S.r.l.
http://www.develer.com
_______________________________________________
Python mailing list
Python@lists.python.it
http://lists.python.it/mailman/listinfo/python

Re: [Python] Migliorare le prestazioni usando i core?

Rispondere a