On 01 Mar 2014, at 13:15, Marco Ippolito <ippolito.ma...@gmail.com> wrote:
> A questo punto viene da capire come mai nel libro nltk ci siano > riferimenti espliciti al 'cannone':http://www.nltk.org/book/ch03.html Beh, direi per casi ben più complessi di quello che consideravi. Se già, ad esempio, la stringa fosse stata '5,300 full time employees', avresti avuto il problema di dover fare il join di 'full' e 'time' utilizzando il metodo `split()`. Le espressioni regolari hanno il vantaggio di essere flessibili, definendo una soluzione adatta al caso specifico. Tale flessibilità, però, si paga in maggiore overhead di risoluzione (le regexp in generale sono costose) e in una maggiore difficoltà nella definizione (considera, ad esempio, l'espressione regolare che avevi definito). Di contro, il caso generale (i.e., CSV et similia) lo risolvi in maniera diretta e immediata, ma il tutto sta in piedi se esiste un pattern unico e semplice per processare il dato. m2c. Ciao, Valerio _______________________________________________ Python mailing list Python@lists.python.it http://lists.python.it/mailman/listinfo/python