On 01 Mar 2014, at 13:15, Marco Ippolito <ippolito.ma...@gmail.com> wrote:

> A questo punto viene da capire come mai nel libro nltk ci siano
> riferimenti espliciti al 'cannone':http://www.nltk.org/book/ch03.html

Beh, direi per casi ben più complessi di quello che consideravi.
Se già, ad esempio, la stringa fosse stata '5,300 full time employees', avresti 
avuto il problema di dover fare il join di 'full' e 'time' utilizzando il 
metodo `split()`.

Le espressioni regolari hanno il vantaggio di essere flessibili, definendo una 
soluzione adatta al caso specifico.
Tale flessibilità, però, si paga in maggiore overhead di risoluzione (le regexp 
in generale sono costose) e in una maggiore difficoltà nella definizione 
(considera, ad esempio,
l'espressione regolare che avevi definito).

Di contro, il caso generale (i.e., CSV et similia) lo risolvi in maniera 
diretta e immediata, ma il tutto sta in piedi se esiste un pattern unico e 
semplice per processare il dato.

m2c.

Ciao,
Valerio




_______________________________________________
Python mailing list
Python@lists.python.it
http://lists.python.it/mailman/listinfo/python

Rispondere a