Ciao a tutti, sono nuovo della mailing list e mi scuso in anticipo se violo qualche norma della netiquette l :)
Scrapy è un ottimo modulo per lo scaping, specie perchè implementa nativamente la ricerca mediante XPATH, anche ricorsiva e ramificata, all'interno del codice html prelevato. La documentazione è buona ma dovrai smanettarci un poco perchè pecca in alcuni punti. Fabio Toscano -------- Messaggio originale -------- Da: Davide Muzzarelli <d.muzzare...@dav-muz.net> Data:17/06/2015 11:51 (GMT+01:00) A: python@lists.python.it Oggetto: Re: [Python] Consiglio per l' implementazione Il 17/06/2015 11:35, Matteo Scarpa ha scritto: > Il lato server che fa il parsing lo farei in python perché lavora meglio > del Java con i file html ma oltre a Beautifullsoup non conosco moduli > per questo genere di cose. Ci sono alternative migliori? Sto sbagliando > tutto? Esiste un modulo python che fa il parsing e lo esporta > direttamente in json? Ciao Matteo, puoi usare Scrapy ed esportare in JSON o in qualsiasi altro formato. http://scrapy.org/ Fare lo scraping più richiedere diversi minuti, a seconda delle condizioni della rete, dei tempi di risposta e del numero di pagine da scaricare. A meno che tu non debba scaricare i dati da poche semplici pagine, conviene che questa operazione venga fatta in maniera asincrona. A fine scraping devi quindi avvisare l'app che i dati sono pronti. Davide Muzzarelli _______________________________________________ Python mailing list Python@lists.python.it http://lists.python.it/mailman/listinfo/python
_______________________________________________ Python mailing list Python@lists.python.it http://lists.python.it/mailman/listinfo/python