Re: [Python] Una dritta sulle espressioni regolari

2011-06-01 Thread Lorenzo Sutton
Nicola Larosa wrote:
> Cesco wrote:
>> Ciao, scusate se vi rompo le scatole... qualcuno di voi ha
>> dimestichezza con le espressioni regolari?
>> Ho del codice HTML e dovrei cercare il contenuto dell'attributo
>> "name" all'interno di un tag  o di un tag 
> [...]

> P.S.: Purtroppo non posso convertire il codice HTML in XML, poichè
>> devo fare questo lavoro con la clipboard e selezionando il codice
>> HTML non sempre mi arriva ben formattato (es: può arrivarmi una cosa
>> del tipo "ciao a Tutti qua..." in cui non c'è il tag 
>> di chiusura, per cui per l'XML viene giustamente considerato
>> invalido)
> Esistono appositi parser per l'HTML malformato. Quello più conosciuto è
> BeautifulSoup, ma non usarlo, è lento e poco manutenuto.
Peraltro se non ricordo male usa internamente le regexp...
> Ti conviene usare lxml.html: ,
> .
Concordo con Nicola. Se ce la fai con lxml (che comunque prova a parsare
l'html anche non valido) è la cosa migliore.

Altrimenti mi chiedo se non potresti direttamente farlo con le
operazioni su stringhe che il linguaggio ti offre?

Lorenzo.
___
Python mailing list
Python@lists.python.it
http://lists.python.it/mailman/listinfo/python


Re: [Python] Una dritta sulle espressioni regolari

2011-06-01 Thread Simone Federici
2011/6/1 Lorenzo Sutton 

> Altrimenti mi chiedo se non potresti direttamente farlo con le
> operazioni su stringhe che il linguaggio ti offre?
>

questo è peggio delle espressioni regolari :-)
per l'HTML serve un parser HTML
i tre che sono stati suggeriti sono tutti ottimi.
io ho sempre usato BeautifulSoup
___
Python mailing list
Python@lists.python.it
http://lists.python.it/mailman/listinfo/python


Re: [Python] Una dritta sulle espressioni regolari

2011-06-01 Thread Raffaele Salmaso
2011/5/31 Alessandro Dentella :
>  d = PyQuery('')
>  print d('input')[0].name
Sembra carinocarino
E ho giusto un progetto su cui testarlo oggi, che "farmi" un parser
mica ne ho voglia :)

-- 
()_() | That said, I didn't actually _test_ my patch.      | +
(o.o) | That's what users are for!                         | +---+
'm m' |                                   (Linus Torvalds) |  O  |
(___) |                        raffaele at salmaso dot org |
___
Python mailing list
Python@lists.python.it
http://lists.python.it/mailman/listinfo/python


Re: [Python] Una dritta sulle espressioni regolari

2011-06-01 Thread Cesco
On Tue, 31 May 2011 18:29:20 +0200, Andrea Spadaccini 
 wrote:

Usa BeautifulSoup.


Grazie mille, nel pomeriggio vedo di darci un'occhiata :-)
___
Python mailing list
Python@lists.python.it
http://lists.python.it/mailman/listinfo/python


Re: [Python] Una dritta sulle espressioni regolari

2011-06-01 Thread Cesco
On Tue, 31 May 2011 18:33:46 +0200 (CEST), "Nicola Larosa" 
 wrote:

Ti conviene usare lxml.html: ,
.


Grazie mille, nel pomeriggio provo a dare un'occhiata anche a LXML :-)

___
Python mailing list
Python@lists.python.it
http://lists.python.it/mailman/listinfo/python


Re: [Python] Una dritta sulle espressioni regolari

2011-06-01 Thread Cesco
On Tue, 31 May 2011 18:57:13 +0200, Alessandro Dentella 
 wrote:
Reputo che il parser più comodo per html sia pyquery come ho già 
avuto modo

di dire in questa list:


Grazie mille anche a te, nel pomeriggio vedrò di provarlo :-)
___
Python mailing list
Python@lists.python.it
http://lists.python.it/mailman/listinfo/python


Re: [Python] Una dritta sulle espressioni regolari

2011-06-01 Thread Cesco
On Wed, 01 Jun 2011 09:47:03 +0200, Lorenzo Sutton  
wrote:

Altrimenti mi chiedo se non potresti direttamente farlo con le
operazioni su stringhe che il linguaggio ti offre?


In pratica lo faccio, ma in parecchi passaggi. Speravo di trovare un 
sistema più semplice e potente (=meno incline ai bug) del mio :-)

Grazie per la risposta comunque
___
Python mailing list
Python@lists.python.it
http://lists.python.it/mailman/listinfo/python


Re: [Python] Una dritta sulle espressioni regolari

2011-06-01 Thread Raffaele Salmaso
> 2011/5/31 Alessandro Dentella :
>>  d = PyQuery('')
ha vinto a mani basse senza fare prigionieri...

-- 
()_() | That said, I didn't actually _test_ my patch.      | +
(o.o) | That's what users are for!                         | +---+
'm m' |                                   (Linus Torvalds) |  O  |
(___) |                        raffaele at salmaso dot org |
___
Python mailing list
Python@lists.python.it
http://lists.python.it/mailman/listinfo/python