Volevo ringraziarvi per il suggerimento datomi nella mia precedente mail. Grazie al vostro consiglio io ora uso Scrapy per il parsing e riesco a fare il parsing, elaborazione, pulizia e inserimento nel db di 128 pagine in 30 secondi, cosa prima impensabile.

Ora invece ho un altro problema: devo confrontare due stringhe di grosse dimensioni su due programmi differenti (server python e app in java) e dire se sono uguali. Per fare ció ho copiato il metodo di confronto di Git: produco una stringa SHA-1 sia su python che su java e le confronto. Questo mi permette di avere i messaggi inviati dall'applicazione decisamente piú piccoli rispetto all'invio dell'intero testo. Peró mi sorge un dubbio: dando per scontato che entrambe le implementazioni del SHA-1 siano corette le due stringhe dovrebbero essere uguali o devo comunque controllare che usino la stessa codifica (tipo entrambe in ASCII)?

--
MS

_______________________________________________
Python mailing list
Python@lists.python.it
http://lists.python.it/mailman/listinfo/python

Rispondere a