Re: [Python] Un aiuto su RegEx

2014-03-04 Per discussione enrico franchi
2014-03-01 13:08 GMT+00:00 Dario Bertini : > Sinceramente, dubito anche che CSV sia un linguaggio regolare A me quello descritto nel file sembra regolare, in effetti. Ce la si dovrebbe fare usando le proprieta' di composizione dei linguaggi regolari. Essenzialmente tutti i building blocks sono

Re: [Python] Un aiuto su RegEx

2014-03-01 Per discussione Valerio Maggio
> On 01/mar/2014, at 14:38, Dario Bertini wrote: > > Beh, il mio nome non lo avrei messo per primo... anzi, non lo avrei > messo proprio, visto che ha scritto tutto Valerio :P Ma figurati... considera l'ordine alfabetico (nome o cognome non fa differenza :-) ed è ok :) In ogni caso anche il t

Re: [Python] Un aiuto su RegEx

2014-03-01 Per discussione Valerio Maggio
> On 01/mar/2014, at 14:08, Dario Bertini wrote: > > Sinceramente, dubito anche che CSV sia un linguaggio regolare Non ci giurerei, ma non riesco a pensare ad un contro esempio... ___ Python mailing list Python@lists.python.it http://lists.python.it/m

Re: [Python] Un aiuto su RegEx

2014-03-01 Per discussione Marco Ippolito
comunque Dario ti fa onore non prendere i meriti di qualcun altro. aggiusto il tiro: ringrazio in toto Valerio. Marco ___ Python mailing list Python@lists.python.it http://lists.python.it/mailman/listinfo/python

Re: [Python] Un aiuto su RegEx

2014-03-01 Per discussione Dario Bertini
Beh, il mio nome non lo avrei messo per primo... anzi, non lo avrei messo proprio, visto che ha scritto tutto Valerio :P -- xmpp: berda...@gmail.com bitmessage: BM-2cTYXfGiSTsnx3righ6aHcJSWe4MV17jDP gpg fingerprint: 3F8D53518012716C4EEF7DF67B498306B3BF75A0 (used just for signing commits)

Re: [Python] Un aiuto su RegEx

2014-03-01 Per discussione Marco Ippolito
Grazie Dario e Valerio, per le vostre utili e chiare spiegazioni. Marco ___ Python mailing list Python@lists.python.it http://lists.python.it/mailman/listinfo/python

Re: [Python] Un aiuto su RegEx

2014-03-01 Per discussione Dario Bertini
2014-03-01 13:43 GMT+01:00 Valerio Maggio : > Di contro, il caso generale (i.e., CSV et similia) lo risolvi in maniera > diretta e immediata Coi CSV, è diretto ed immediato solo se sai che ciò che devi parsare ha un formato molto limitato http://tools.ietf.org/html/rfc4180 Sinceramente, dubito

Re: [Python] Un aiuto su RegEx

2014-03-01 Per discussione Valerio Maggio
On 01 Mar 2014, at 13:15, Marco Ippolito wrote: > A questo punto viene da capire come mai nel libro nltk ci siano > riferimenti espliciti al 'cannone':http://www.nltk.org/book/ch03.html Beh, direi per casi ben più complessi di quello che consideravi. Se già, ad esempio, la stringa fosse stata '

Re: [Python] Un aiuto su RegEx

2014-03-01 Per discussione Marco Ippolito
Ciao Valerio grazie dell'aiuto. In effetti la 'cerbottana' che mi hai gentilmente passato è funzionalmente più adatta rispetto al 'cannone' RegExp. A questo punto viene da capire come mai nel libro nltk ci siano riferimenti espliciti al 'cannone':http://www.nltk.org/book/ch03.html Ciao e grazie.

Re: [Python] Un aiuto su RegEx

2014-03-01 Per discussione Valerio Maggio
On 01 Mar 2014, at 11:19, Valerio Maggio wrote: > >>> t = '5,300 full-time employess' >>> t.split() Scusa, ho inserito una parentesi angolare in meno e il mio client di posta fa sembrare il testo come un quoting. Riporto da capo per chiarezza (tra l'altro c'era anche un typo :-) >>> t = '5,

Re: [Python] Un aiuto su RegEx

2014-03-01 Per discussione Valerio Maggio
On 01 Mar 2014, at 09:04, Marco Ippolito wrote: > Ciao a tutti, > > con NLTK sto provando a correttamente suddividere '5,300 full-time employees' > in: '5,300', 'full-time', 'employees' > > […] > > Avete qualche consiglio da darmi per riuscire a mettere insieme '5', > ',', '300 : '5,300' ?

[Python] Un aiuto su RegEx

2014-03-01 Per discussione Marco Ippolito
Ciao a tutti, con NLTK sto provando a correttamente suddividere '5,300 full-time employees' in: '5,300', 'full-time', 'employees' Come vedete, ho provato diverse soluzioni, ma il risultato riguardante il numero '5,300' è sempre scorretto: '5', ',' ,'300' : '5', ',', '300', 'full-time', 'employee