Re: [Python] web: sync vs. async

Daniele Varrazzo Fri, 02 Dec 2011 07:18:48 -0800

On Fri, 2 Dec 2011 15:36:50 +0100, Alessandro Dentella wrote:

un cliente mi ha chiesto di aiutare a capire come rendere più veloceuna
applicazione web che raccoglie dati da molti utenti differenti in
contemporanea (qualche centinaio) e si ingolfa in particolari momenti
del mese di maggior accesso.
Attualmente usano Tornado [1], un incrocio fra un server web ed unpiccolo
framework (che tramite un decoratore permette di rendere una funzione
asincrona).

Non ho alcuna esperienza di Tornado, qualche esperienza con twisted e
qualche dubbio sul fatto che quel particolare problema abbia grandivantaggidall'approccio asincrono. L'applicazione lato client usa intensamenteajax emolte chiamate al server che fanno pochi conti ed una manciata diselect
semplici o di piccole join. La macchina ha 4 processori e 4 GB di RAM
(principalmente libera). Ogni chiamata dallo stesso client cambiadati nellasessione che devono quindi essere sincronizzati fra una chiamata el'altra.
Mi pare di capire che non tutte le applicazioni beneficiano del fattodi
funzionare in modalità asincrona: qui non esiste tempo di attesa
significativo di dati dalla rete e pare poco (forse migliorabile inognicaso) dal database. Avete qualche suggerimento? Qualche opinione (olink
utile) sulla opportunità di usare un server così rispetto ad una
configurazione classica apache + mod_wsgi? Chiaramente l'obiettivo èdidistribuire il carico di lavoro su tutti i processori esuccessivamente su
più macchine.

Io ho risolto da poco un problema del genere su un server che non ce lafaceva più a scalare.

Prima nota che, sync con multithread, o async con green thread, più diuna cpu non riesci a usarla bene in Python. Con i green thread la usimeglio che con i thread se il problema è I/O bound, ma resti sempre inun processo singolo.

Io ho messo 4 server in ascolto su 4 porte diverse: il primo sullastandard https 443 e altre 8444, 8445, 8446 (la bella copia sarebbeavere 4 sub-domain, ma per ora abbiamo solo un certificato ssh).

Quando un utente si connette, viene rediretto ad un certo nodo (idutente % n. nodi, per esempio). Da lì in poi tutti i link del programmasono relativi, per cui una volta che è andato sul serverhttps://host:8445, ci resta. Il suo nodo di appartenenza è anchememorizzato al momento del login nella sua sessione del server: ad ognirichiesta viene controllato che sia sul server giusto e, se non lo è,gli viene servito un redirect per mandarcelo.

Questa soluzione consente di usare tutte le cpu sulla macchina nellamaniera migliore possibile: con diversi processi. Perché funzioni siassume che gli utenti non si scambino dati tra loro se non attraverso ildatabase. Invece poiché un utente resta sempre sullo stesso server, isuoi dati di sessione sono sempre disponibili. Per scalare di piùpossiamo aggiungere nuovi processi (la nostra macchina ha 16 cpu) oanche aggiungere nuove macchine.

Abbiamo messo in piedi il tutto in brevissimo tempo, senza modificarel'architettura di un applicativo che è un mammuth e nel quale ogniutente ha uno stato complicatissimo. È una soluzione completamente privadi magie (tipo sperare che la parola magica async risolva tutti iproblemi...)


--
Daniele Varrazzo - Develer S.r.l.
http://www.develer.com
_______________________________________________
Python mailing list
Python@lists.python.it
http://lists.python.it/mailman/listinfo/python

Re: [Python] web: sync vs. async

Reply via email to