lucio pineda ha scritto:
Ciao, come da oggetto devo ricavare dal sito pagine gialle
1. ragione sociale,
2. indirizzo anagrafico e
3. codice avviamento postale
OpenOffice puo' collegarsi direttamente a una sorgente dati esterna
purche' i dati siano organizzati come tabella (purtroppo non e' il tuo
caso, ma magari riesci a farli mostrare in qualche altro formato e
risolvi). Ad esempio, da Calc Inserisci - Collegamento a dati esterni,
inserisci come URL: http://www.w3schools.com/html/html_tables.asp ,
aspetti un attimo per la lettura del file, poi scegli (sotto) la tabella
HTML_1 e ti trovi i dati importati in Calc.
Vedendo la struttura del sito delle Pagine Gialle, che e' tipo
http://www.paginegialle.it/pgol/4-pizzerie/3-Milano%20%28MI%29
non penso che questo ti funzioni subito. Ma dato che e' tutto annotato
bene in CSS, puoi farlo con JavaScript.
Non c'entra nulla con OpenOffice, quindi ti dico solo come cominciare e
poi devi cavartela da solo o chiedere in un forum di JavaScript. In
Firefox crei un nuovo segnalibro nella barra dei segnalibri con titolo
"Estrai" e nell'indirizzo copi e incolli quanto segue:
javascript:%20alert('Inizio%20Analisi');%20var%20found=new%20Array();%20for(var%20i=0;i%20<%20window.document.getElementsByTagName("h2").length;i++)%20{if(document.getElementsByTagName("h2")[i].className=="rgs"){found.push(document.getElementsByTagName("h2")[i].childNodes[1].childNodes[0].wholeText);}%20}%20alert('Trovati:'%20+%20found);
Poi apri la pagina indicata sopra, fai clic su "Estrai" e ti elenca le
ragioni sociali, con varie limitazioni; aggiustarlo in modo che funzioni
bene e' un lavoro complesso e off-topic per questa lista; indirizzo e
CAP invece dovrebbero essere un po' piu' semplici perche' sono meglio
identificabili. Se fai bene l'estrazione l'importazione in OpenOffice
poi e' indolore.
Ciao,
Andrea.
---------------------------------------------------------------------
Per cancellarsi: [email protected]
Per informazioni: http://www.openoffice.org/it/
Per avviare una nuova discussione: [email protected]
Archivi: http://mail-archives.apache.org/mod_mbox/incubator-ooo-utenti-it