2014-03-01 13:08 GMT+00:00 Dario Bertini :
> Sinceramente, dubito anche che CSV sia un linguaggio regolare
A me quello descritto nel file sembra regolare, in effetti.
Ce la si dovrebbe fare usando le proprieta' di composizione dei linguaggi
regolari.
Essenzialmente tutti i building blocks sono
> On 01/mar/2014, at 14:38, Dario Bertini wrote:
>
> Beh, il mio nome non lo avrei messo per primo... anzi, non lo avrei
> messo proprio, visto che ha scritto tutto Valerio :P
Ma figurati... considera l'ordine alfabetico (nome o cognome non fa differenza
:-) ed è ok :)
In ogni caso anche il t
> On 01/mar/2014, at 14:08, Dario Bertini wrote:
>
> Sinceramente, dubito anche che CSV sia un linguaggio regolare
Non ci giurerei, ma non riesco a pensare ad un contro esempio...
___
Python mailing list
Python@lists.python.it
http://lists.python.it/m
comunque Dario ti fa onore non prendere i meriti di qualcun altro.
aggiusto il tiro: ringrazio in toto Valerio.
Marco
___
Python mailing list
Python@lists.python.it
http://lists.python.it/mailman/listinfo/python
Beh, il mio nome non lo avrei messo per primo... anzi, non lo avrei
messo proprio, visto che ha scritto tutto Valerio :P
--
xmpp: berda...@gmail.com
bitmessage: BM-2cTYXfGiSTsnx3righ6aHcJSWe4MV17jDP
gpg fingerprint: 3F8D53518012716C4EEF7DF67B498306B3BF75A0 (used just
for signing commits)
Grazie Dario e Valerio,
per le vostre utili e chiare spiegazioni.
Marco
___
Python mailing list
Python@lists.python.it
http://lists.python.it/mailman/listinfo/python
2014-03-01 13:43 GMT+01:00 Valerio Maggio :
> Di contro, il caso generale (i.e., CSV et similia) lo risolvi in maniera
> diretta e immediata
Coi CSV, è diretto ed immediato solo se sai che ciò che devi parsare
ha un formato molto limitato
http://tools.ietf.org/html/rfc4180
Sinceramente, dubito
On 01 Mar 2014, at 13:15, Marco Ippolito wrote:
> A questo punto viene da capire come mai nel libro nltk ci siano
> riferimenti espliciti al 'cannone':http://www.nltk.org/book/ch03.html
Beh, direi per casi ben più complessi di quello che consideravi.
Se già, ad esempio, la stringa fosse stata '
Ciao Valerio
grazie dell'aiuto.
In effetti la 'cerbottana' che mi hai gentilmente passato è
funzionalmente più adatta rispetto al 'cannone' RegExp.
A questo punto viene da capire come mai nel libro nltk ci siano
riferimenti espliciti al 'cannone':http://www.nltk.org/book/ch03.html
Ciao e grazie.
On 01 Mar 2014, at 11:19, Valerio Maggio wrote:
>
>>> t = '5,300 full-time employess'
>>> t.split()
Scusa, ho inserito una parentesi angolare in meno e il mio client di posta fa
sembrare il testo come un quoting. Riporto da capo per chiarezza (tra l'altro
c'era anche un typo :-)
>>> t = '5,
On 01 Mar 2014, at 09:04, Marco Ippolito wrote:
> Ciao a tutti,
>
> con NLTK sto provando a correttamente suddividere '5,300 full-time employees'
> in: '5,300', 'full-time', 'employees'
>
> […]
>
> Avete qualche consiglio da darmi per riuscire a mettere insieme '5',
> ',', '300 : '5,300' ?
Ciao a tutti,
con NLTK sto provando a correttamente suddividere '5,300 full-time employees'
in: '5,300', 'full-time', 'employees'
Come vedete, ho provato diverse soluzioni, ma il risultato riguardante
il numero '5,300' è sempre scorretto: '5', ',' ,'300' :
'5', ',', '300', 'full-time', 'employee
12 matches
Mail list logo